Con el uso de la minería de datos en la Universidad Nacional Autónoma de México (UNAM) se llevan a cabo estudios integrales y multidisciplinarios en el país sobre poblaciones humanas y animales, acerca de interacciones ecológicas entre diversas especies y zonas de enfermedades como el dengue.
Se trata de una serie de técnicas matemáticas y estadísticas que busca relacionar varias bases de este tipo, explicó Constantino González Salazar, investigador del Centro de Ciencias de la Atmósfera (CCA) y del Centro de Ciencias de la Complejidad (C3) de la UNAM.
“Las correlaciona para, a partir de los datos, generar hipótesis de investigación. Se trata de explorar los datos para extraer información que está contenida en ellos”.
Esta selección de información a veces funciona, incluso sin tener la hipótesis previa; pues al extraerla permite generar nuevas preguntas e hipótesis de trabajo científico, explicó el experto.
Desarrolló una metodología para hacer exploración de datos geográficos ligados a estudios de biodiversidad
A partir de 2009, González Salazar trabaja con la minería de datos y, junto con colegas de la UNAM desarrolló una metodología propia que está disponible en la plataforma web “Especies”, disponible en el servidor de la Comisión Nacional para el Conocimiento y Uso de la Biodiversidad, para hacer exploración sobre todo de datos geográficos ligados a estudios de biodiversidad.
“Esa metodología permite hacer análisis de datos geográficos y con eso generar áreas de distribución para especies, una de las aplicaciones de interés; y permite generar redes de asociación a partir de tomar en cuenta que las especies no están solas en la naturaleza, que son parte de un ecosistema. Estos estudios nos permiten combinar una serie de especies y determinar de qué manera se asocian entre ellas”, detalló.
En otros estudios con minería de datos, González Salazar y sus colegas analizan cómo los factores de origen ambiental o climático participan en la relación: entre depredador y presa; entre plantas y animales; y cómo influyen en la distribución de una especie en particular.
“Esto lo hacemos en un contexto nacional. Hemos generado modelos de distribución para especies con base en la combinación de distintos factores y hemos modelado comunidades en su conjunto; detallando cómo se asocian las especies y cómo una especie nos puede dar información de otras especies que la acompañan”.
Atlas de Enfermedades
En otra aplicación de la minería de datos, González Salazar y sus colegas trabajan también con enfermedades emergentes como leishmaniasis, dengue, zika y la enfermedad de Chagas: las cuales se propagan por un mosquito y que se creían exclusivas de regiones tropicales del país.
Con las indagaciones de minería de datos, que reúnen gran cantidad de información en la llamada ciencia de datos; descubrieron nuevas zonas de distribución de esos padecimientos.
“Estamos estudiando la distribución de estas zoonosis y acabamos de comenzar a realizar un Atlas de Enfermedades que estará listo a fines de 2021”, comentó.
En estos estudios además de la densidad de datos se busca una mirada integral y multidisciplinaria en la que participan expertos de física; matemáticas; biología y veterinaria; entre otras especialidades, finalizó González Salazar[.]