Minería de datos para la extracción de conocimiento de la biodiversidad

Fecha: 7 de julio de 2016 a las 11:00 hrs.
LugarT-223
Presenta: Dr. Alejandro Molina Villegas
Afiliación: Comisión nacional para el conocimiento y uso de la biodiversidad (CONABIO)

Resumen: La biodiversidad constituye un patrimonio de un gran valor económico, estético y cultural en México. El conocimiento de este patrimonio ha sido transmitido por generaciones a través de la literatura y es gracias a esto que contamos con cantidades enormes de información. Además, miles de nuevos documento son publicados cada mes y a pesar de los esfuerzos para mantener registro de este conocimiento, la necesidad de utilizar métodos automatizados para extraer la información pertinente de manera eficaz es inminente. Actualmente, la Comisión Nacional para el Conocimiento y Uso de la Biodiversidad, a través de la Coordinación de Bioinformática, desarrolla la Biblioteca para la minería de textos de biodiversidad en español que consiste en es un conjunto de programas de código libre para procesar y extraer información relevante de manera automática a partir de grandes cantidades de documentos digitales en español. En esta plática describiremos la aplicación de diversas técnicas de Procesamiento del Lenguaje Natural (PLN) para extraer conocimiento de las especies.

Semblanza del ponente: El Dr. Alejandro Molina realizó sus estudios universitarios en la UAM-Iztapalapa egresando como Licenciado en Computación, posteriormente obtuvo el grado de Maestro en Ciencias de la Computación por parte de la Universidad Nacional Autónoma de México y el grado de Doctor en Computación por parte de l’Université d’Avignon et des Pays de Vaucluse (UAPV), Francia. Actualmente es miembro del SNI y labora en la Comisión Nacional para el Conocimiento y Uso de la Biodiversidad, siendo su principal función la de generar productos de investigación de calidad internacional y ejecutar proyectos de desarrollo tecnológico orientados a la solución práctica de problemas en materia de procesamiento de datos de biodiversidad. Entre los proyectos que el Dr. Alejandro Molina ha coordinado se encuentran: Proyecto de minería de texto para la extracción automática de relaciones semánticas de usos de especies mexicanas, Biblioteca para la minería de textos de biodiversidad en español – Herramientas de software con algoritmos de última generación para analizar grandes colecciones de documentos (https://bitbucket.org/conabio_cmd/text-mining ). Repertorio de plantas de México – Extracción automática del primer repertorio de árboles del bosque mesófilo mexicano mediante la API Babelnet (http://molina.talne.eu/plantas), Recopilación y gestión del corpus de biodiversidad de México, Conclusión del primer estudio de compresión de frases en español y recopilación del corpus de frases comprimidas en español con más de 60 mil anotaciones (http://molina.talne.eu/compress4/man/ ), etc.

Búsqueda en protocolos IPv4/6
Cifrado de datos de alto nivel por medio de Memorias Asociativas Evolutivas

Regresar a Seminario

P C y T I