EnglishSpanish

Compartir este artículo:

Importancia de los fundamentos matemáticos en la ciencia de datos

Los engranajes de un amplio campo interdisciplinario

Lo que hoy por hoy conocemos como Ciencia de Datos es un campo interdisciplinar, en el que convergen varias ramas del conocimiento tales como la Matemática, la Estadística, las Ciencias de la Computación y el conocimiento específico en el área de aplicación (Salud, Ciencia Sociales, Logística, etc). Dentro de la sinergia existentes entre estas áreas nacen otras como es el caso de la Inteligencia Artificial (IA), con un impacto vasto y significativo en los últimos años, ya que ha sido utilizada desde el reconocimiento de patrones para identificación facial y de imágenes, la analítica predictiva para procesos de mejoramiento continuo, el procesamiento de lenguaje natural para la extracción de características, hasta en máquinas autónomas que integren la inteligencia artificial para la toma de decisiones en sus procesos. Así pues, en contexto, cuando hablamos de las bases de la IA y la ciencia de datos debemos remontarnos mucho antes de que estos términos existieran, ya que fue desde el desarrollo de la estadística en general que se sientan las bases de desarrollo para estas áreas.
Vemos que por un lado, desde la estadística descriptiva se brindan las herramientas para organizar, presentar, visualizar los datos, esto únicamente a lo que se tiene como observaciones, sin supuesto de que exista una población más grande. Por otro lado, nos encontramos la estadística inferencial en donde se agrupan los análisis y las pruebas que en conjunto nos ayuda a comprender el comportamiento de una muestra cuando esta se extiende al concepto de población. Es también desde la estadística que se han desarrollado otras áreas que al día de hoy son muy útiles en el ejercicio de la ciencia de datos, tales como la minería de datos que es un conjunto de técnicas que nos permiten buscar patrones en bases de datos o la estadística multivariada que son un conjunto de técnicas que busca analizar la dependencia e interdependencia a más de una variable de respuesta. Sin desconocer que todos estos avances se han cimentado con toda la teoría desarrollada en lo que hoy conocemos como Álgebra Lineal.
Lo cierto es que todo esta cantidad de técnicas, métodos y modelos que nos brindan las matemáticas en conjunto con la estadística son útiles en aplicación y abarcan desde los problemas más simple hasta los más sofisticados, aunque en este sentido no todo este escrito, ya que por ejemplo ramas que se creían tan lejanas como el álgebra abstracta y el aprendizaje automático, encuentren un punto convergencia, esto se da dentro de lo que se conoce como álgebras de Lie, en donde a partir de datos sin aparente estructura por medio de lo que se conoce como espacio de aprendizaje (Diagrama de Dynkin), y su correspondiente grupo de Lie, se obtengan clasificaciones [1]. Aunque en este aspecto, en relación a los avances, no todo tiene que ser nuevo o disruptivo, un caso de esto son el incremento en la popularidad de los métodos de la estadística bayesiana, en donde se puede ver como un teorema propuesto hace más de 250 años aún tiene implicaciones al día de hoy, pues propone escenarios de estudios distintos para las técnicas comúnmente utilizadas, este es el caso del estimador en un modelo de regresión, en particular, regresión lineal, brindando un cambio enfoque pues extiende este concepto ya no con lo que se conoce como intervalo de confianza, sino asociado a distribuciones de probabilidad, dando gran flexibilidad a los modelos que necesitaban una gran cantidad de datos para llegar a resultados positivos y óptimos.
Así pues, desde esta perspectiva completa podemos ver la importancia que tiene la matemática en relación con la solución de problemas que se presentan en las diferentes áreas del conocimiento, en particular en la ciencia de datos, brindando herramientas útiles para la construcción de nuevo conocimiento o implementando conceptos propios de la matemática que aún no han sido explorados en este campo.

Realizado por: Anderson Ruiz Delgado

Bibliografía: [1] González Cornejo, J., 2021. Algebra de Lie~ Aplicaciones ~ Formalización. [Online] Docirs.cl. Disponible en: https://docirs.cl/algebra_de_lie_formalizacion.asp.



«
»

Menu principal
×