martes, 10 de noviembre de 2015

Gauss vs Legendre y el descubrimiento de la regresión estadística


El legendario matemático Carl Friedrich Gauss consideró su descubrimiento de la regresión estadística como "trivial". El método parecía tan obvio para Gauss que él pensó que no había sido el primero en utilizarlo. Él no publicitó su hallazgo hasta muchos años más tarde, después que Adrien-Marie Legendre publicó el descubrimiento del mismo. Cuando Gauss sugirió que lo había descubierto y usado antes que Legendre se desató una de las más famosas disputas de la historia de la ciencia. Gauss finalmente obtuvo el reconocimiento del descubrimiento pero no sin lucha.

Gauss  FUENTE

La regresión estadística es una herramienta para la investigación de la relación entre las variables. Se utiliza con frecuencia para predecir el futuro y entender qué factores provocan un resultado. Si quieres saber el ganador de las próximas elecciones, o averiguar el impacto de un nuevo medicamento, seguramente utilizarás la regresión.

En el siglo XVIII, la mejora de la navegación oceánica fue quizás el problema científico práctico más importante. Los viajes por mar seguían siendo peligroso, la mejora en esta área daba mucho dinero. Con una mayor precisión en la navegación, los barcos y sus cargas, llegarían a su destino con mayor rapidez y seguridad. La Geodesia, el estudio de la medición de la tierra, estaba en pleno auge. Una herramienta clave era el estudio de los movimientos de los otros planetas y cometas, en relación a la Tierra. Esto conducía a una mejor cartografía y un mejor conocimiento de la ubicación, que a su vez hacía más fácil encontrar el camino más rápido y seguro.

Fue en este contexto histórico en el que los matemáticos Carl Friedrich Gauss y Adrien-Marie Legendre descubrieron de forma independiente el método de los mínimos cuadrados, la característica esencial de la regresión estadística. Los mínimos cuadrados es una manera de utilizar los datos para hacer predicciones cuantitativas. Estas predicciones se han optimizado de modo que, para cualquier punto en el conjunto de datos, el error del modelo multiplicado por sí mismo (al cuadrado) se reduce al mínimo. Tanto Gauss y Legendre utilizan el método de los mínimos cuadrados para entender las órbitas de los cometas, en base a mediciones inexactas de las ubicaciones anteriores.

Hay dos razones principales para que el error al cuadrado fue casi inmediatamente aceptado por la comunidad matemática. En primer lugar, en ese momento y en menor grado hoy, era relativamente fácil de calcular. Si bien no existe una fórmula sencilla que se puede utilizar para obtener la mejor estimación para minimizar el error al cuadrado, es una prueba seria para calcular la mejor estimación para casi cualquier otro criterio de optimalidad, incluyendo el error absoluto. En segundo lugar, la estimación basada en mínimos cuadrados tiene algunas propiedades estadísticas ingeniosas.

Legendre  FUENTE

Legendre fue el primero en hacer público su descubrimiento del método de mínimos cuadrados. En su documento de 1805, "Nuevos métodos para la determinación de las órbitas de los cometas",

Carl Friedrich Gauss llamado el "Príncipe de los matemáticos." En un movimiento de indecencia académica, le "robó" el crédito del descubrimiento a Legendre. En 1809 en el tratado de Gauss, "Teoría del movimiento de los cuerpos celestes en movimiento alrededor del sol en las secciones cónicas," el matemático fue capaz de resolver el problema aparentemente irresoluble del cálculo de las órbitas planetarias. La manifestación central de su teoría era la capacidad de Gauss de adivinar cuándo y dónde el asteroide Ceres aparecería en el cielo, un logro que ningún otro científico podría reclamar. Tenía una gran cantidad de complejas matemáticas y geometría, incluyendo el uso del método de los mínimos cuadrados.

Gauss escribió: "Nuestro principio, del que hemos hecho uso de desde 1795, últimamente ha sido publicado por Legendre ...." Legendre se horrorizó. La decisión de Gauss de reclamar un descubrimiento que otro matemático había publicado antes que él era sin duda un comportamiento cuestionable. Legendre envió una carta a Gauss para expresar su profunda decepción.

Gauss nunca se retractó de su afirmación. La evidencia sugiere que Gauss estaba diciendo la verdad. Gauss había explicado la teoría de mínimos cuadrados a algunos matemáticos anteriormente a la publicación de Legendre, y hay cálculos en sus cuadernos, que no se podrían haber hecho por otro método.

Gauss no había publicado su hallazgo debido a su preferencia por desarrollar sus ideas antes de hacerlas públicas. Gauss tenía un lema, "Pocos, pero maduros." Hoy en día, a Gauss se le atribuye la invención de los mínimos cuadrados, y por lo tanto de la regresión estadística. Esto se debe principalmente a que la explicación de Gauss fue mucho más desarrollada que la de Legendre.

A pesar de que fueron los creadores de la característica principal de la regresión, ni Gauss ni Legendre utilizaron la palabra "regresión" para referirse a su método. El término fue aplicado por primera vez a las estadísticas por Francis Galton. Galton es una figura importante en el desarrollo de las estadísticas y la genética. Por desgracia, sus estudios sobre la herencia le llevaron a inventar el término "eugenesia" y a abogar por la cría de una sociedad "mejor".

Francis Galton 1850s.jpg
Galton  FUENTE

El análisis de regresión como lo conocemos hoy en día es principalmente trabajo de Ronald Fisher, uno de los estadistas más reconocidos del siglo XX. Fisher combina el trabajo de Gauss y de Karl Pearson para desarrollar una teoría plenamente efectiva de las propiedades de estimación por mínimos cuadrados. D

En la década de 1920, IBM creó tabuladores de tarjetas mecánicas perforadas que podrían ser utilizadas para calcular las respuestas a los análisis estadísticos computacionalmente pesados ​​como regresiones. Aún así, hasta la década de 1970, los cálculos para completar una regresión podría tomar días y la tecnología sólo estaba disponible para los investigadores.

Biologist and statistician Ronald Fisher.jpg
Ronald Fisher  FUENTE

No fue sino hasta la aparición del ordenador de sobremesa cuando el uso del análisis de regresión fue verdaderamente democratizado. Hoy en día, cualquier persona con acceso a una computadora puede ejecutar una regresión para un conjunto de datos de tamaño moderado en menos de un segundo.

Vía: Priceonomics



No hay comentarios:

Publicar un comentario

Archivo del blog