Proyectos de investigación – Maestría

  • -

Reconocimiento de incendios en video comprimido

2012

 Descargar versión PDF

ProfesoresDr. John Goddard Close y Dr. Luis Martín Rojas Cárdenas

Resumen: La detección de incendios en video representa una solución alternativa, con respecto a los métodos “clásicos” basados en sensores, la cual ofrece diversas ventajas tales como la posibilidad de detectar incendios a distancias mayores, con mayor velocidad y sobretodo en espacios abiertos; condiciones bajo las cuales los sensores de partículas presentan un bajo desempeño. Además, el uso de esta tecnología se ve motivado por la gran infraestructura de telemonitoreo ya presente en muchos edificios y otro tipo de instalación. La investigación para desarrollar métodos de análisis y reconocimiento de incendios en video ha sido desarrollada desde hace ya varios años y los resultados han sido alentadores. Sin embargo, hay mucho por hacer. Entre otros, el caso de la detección en video comprimido ha sido pocas veces abordado. En efecto, la gran mayoría de trabajos se centra en el video no comprimido o en bruto (raw video). Múltiples razones motivan esta posición. Entre otras, i) el video comprimido
no presenta toda la información captada al momento de ser adquirido debido a los métodos de cuantización presentes en todo algoritmo de compresión, 2) las herramientas creadas para el análisis de imágenes no comprimidas no han sido probadas, en forma exhaustiva, para el caso del video comprimido. Finalmente, el video comprimido no es considerado completamente por herramientas para el análisis y procesamiento de señales tales como MATLAB. Por ejemplo, obtener elementos básicos del video tales como coeficientes frecuenciales y vectores de movimiento, entre otros, no es posible. En este trabajo de tesis se busca desarrollar un algoritmo para la detección temprana de incendios que trabaje directamente en secuencias de video de alta resolución codificadas bajo alguna norma de compresión de video. Es importante mencionar que hemos desarrollado diversas herramientas para trabajar con video comprimido, producto de algunos trabajos de tesis.

Objetivo general

  • Desarrollar un algoritmo para la detección de incendios en video comprimido

Objetivos específicos

  • Comprender diferentes tecnologías para efectuar la codificación de video
  • Conocer diferentes técnicas para el análisis de imágenes
  • Obtener un algoritmode bajo costo computacional para la detección de incendios basado en la información frecuencial y temporal, ambas presentes en el flujo de video comprimido.

  • -

Síntesis de voz basada en modelos markovianos ocultos

2012

 Descargar versión PDF

ProfesoresDr. John Goddard Close y Fabiola Margarita Martínez Licona

Resumen: La síntesis de voz es la producción artificial del habla humana, y un sintetizador de habla es el sistema computacional que lo realiza. Usualmente el sintetizador de habla se encuentra como la parte final (back-end) de un sistema del texto-a-habla (TTS). Para ir del texto al habla en un TTS, el back-end tiene que producir una forma de onda sintetizada de la voz usando información lingüistica del texto. Hay varias arquitecturas que se han utilizado para lograr la onda sintetizada: síntesis articulatoria, síntesis de formantes, síntesis concatenativa, y síntesis basada en modelos markovianos ocultos (HMM). Mientras que los sistemas comerciales actuales usualmente usan síntesis concatenativa, en los últimos años la síntesis basada en HMM (también conocido como síntesis basada en parámetros estadísticos) ha ido ganando importancia por el potencial que ofrece. Previamente los HMM han jugado un papel importante en el reconocimiento automático del habla (RAH).Los HMM son empleados para modelar y generar información sobre el espectro, la frecuencia fundamental, y la duración del habla. La información parametrizada es suficiente para generar la forma de onda correspondiente. Una ventaja que presenta el modelo es que usa poco espacio de almacenamiento comparado con la síntesis concatenativa. Este proyecto pretende desarrollar un sistema de síntesis de voz basada en HMM para el español.

Objetivo general

  • Desarrollar un sistema de síntesis de voz basada en HMM para el español

Objetivos específicos

  • Conocer y aplicar técnicas para procesamiento de la señal de voz.
  • Conocer información básica sobre la fonética, prosodia, y la lingüistica del español
  • Conocer los HMM y su la aplicación a la síntesis de voz
  • Aplicar los sistemas HTS y HTK a la síntesis basada en HMM

  • -

Clasificación de objetos en movimiento en video comprimido

2012

 Descargar versión PDF

ProfesoresDr. John Goddard Close y Dr. Luis Martín Rojas Cárdenas

Resumen: El conteo de objetos es una actividad orientada a la obtención de datos estadísticos y útil para llevar, entre otros, un control del número de productos fabricados en una cadena de producción, del número de vehículos circulando por una avenida a determinada hora del día o de la cantidad de personas que hacen uso de un sistema de transporte en particular. En el pasado esta actividad se desarrollaba en forma manual, pero ahora, con la gran cobertura de sistemas de video vigilancia, la tendencia es automatizar esta actividad con la ayuda de sistemas de cómputo dotados con algoritmos para el reconocimiento de patrones. El funcionamiento de los cuales se basa en el uso de técnicas de segmentación, de estimación de movimiento, de extracción del fondo de la escena, etc. Es importante mencionar que la gran mayoría de estas técnicas operan sobre conjuntos de píxeles, es decir en flujos de video no comprimidos o video en bruto (e inglés: raw video). Aquí surge un detalle a considerar, las cámaras de video vigilancia convencionales no generan video en bruto sino video comprimido, el cual presenta, entre otros, distorsiones y pérdida de información. Así, aplicar estos algoritmos al video comprimido requiere, primeramente, descomprimir totalmente el video, después, evaluar si las imperfecciones del video comprimido no afectan el desempeño de los algoritmos propuestos. En esta tesis de maestría se propone utilizar informaciones directamente disponibles en el video comprimido, que no son píxeles, sino informaciones particulares (coeficientes frecuenciales y vectores de movimiento), para realizar la clasificación de objetos que aparecen en la escena de video, tales como personas, vehículos, animales, etc. El uso de estas informaciones debe beneficiar considerablemente el ahorro de recursos de cómputo y hacer más directo el proceso de reconocimiento en video comprimido. Además, el trabajo que aquí se propone toma como referencia un trabajo previo.

Objetivo general

  • Encontrar un algoritmo que permita distinguir y clasificar los diferentes objetos que aparecen en una escena de video comprimido

Objetivos específicos

  • Comprender diferentes tecnologías para efectuar la codificación de video
  • Conocer diferentes técnicas para el análisis de imágenes
  • Obtener un algoritmode bajo costo computacional para clasificar objetos basado en la información frecuencial y temporal, ambas presentes en el flujo de video comprimido

  • -

Análisis del zapoteco mediante técnicas de reconocimiento de patrones

2012

 Descargar versión PDF

ProfesoresFabiola Margarita Martínez Licona y Alma Edith Martínez Licona

Resumen: La forma de comunicación oral es considerada como la más trascendental para el intercambio de ideas, pensamientos y hasta emociones; el lenguaje se forma a partir de un conjunto de unidades básicas para la comunicación denomindas fonema. Por sí mismos los fonemas carecen de significado, pero en combinación y presentados secuencialmente dan lugar a las palabras, con la particularidad de que un cambio en el orden de los fonemas da lugar a un cambio en el significado de la palabra. Para el español los fonemas se dividen en dos grandes grupos bien diferenciados: vocales y consonantes. Desde el punto de vista acústico la vocal se origina a partir de un solo generador periódico situado en un extremo del resonador bucal (cuerdas vocales) y se caracteriza por carecer de obstáculos ya que presenta una regularidad en los formantes de frecuencia y, desde el punto de vista perceptivo, por ser un sonido muy claro. La consonante se origina o se modifica a partir de un generador localizado en un lugar distinto al de las vocales y presenta antiresonancias que influyen en la amplitud y distribución de los formantes de frecuencia; sus características son la presencia de obstáculos en la articulación y la irregularidad en la distribución de los formantes. Los sonidos del español se pueden clasificar de otras maneras atendiendo criterios acústicos, de articulación, de percepción, etc.  Si bien se conoce al detalle las características del español para desarrollar sistemas de análisis, esto no se cumple para otros lenguajes que se hablan en México y que forman parte de la herencia precolombina. Los zapotecos se llaman a sí mismos binnizá (binni, gente; zá, nube: gente que proviene de las nubes), bene xon, o ben’zaa, dependiendo de la región en que habiten. Fueron los mexicas quienes los denominaron zapotecatl, término que se deformó con la presencia española en su territorio y derivó en zapotecos. Se concentran principalmente en el Estado de Oaxaca, distribuidos en cuatro áreas geográfico-culturales: el Istmo de Tehuantepec, los Valles Centrales, la Sierra Norte de Oaxaca y la Sierra Madre del Sur. Son asimismo el grupo étnico más profuso de la entidad, y el tercer grupo indígena más numeroso del país. La lengua zapoteca se deriva del otomangue, por lo que está emparentada con algunas de las lenguas habladas en el centro del país, como el otomí, mazahua y pame. El zapoteco es una lengua tonal, es decir, que mediante la emisión de tonos altos, medios y bajos o bien ascendentes y descendentes, se establecen los diversos significados. Dada su característica acústica así como a su importancia dentro de las lenguas indígenas su estudio desde la prespectiva del análisis del habla resulta atractivo para la aplicación de métodos de análisis de señales. El proyecto se avocará al estudio del zapoteco como lenguaje a partir del análisis de la señal de habla de manera análoga al caso del español. Para tal fin se harán uso de técnicas de procesamiento de señales y de reconocimiento de patrones a fin de obtener información relevante del lenguaje desde la perspectiva de las tecnologías del habla.

Objetivo general

  • Analizar el lenguaje zapoteco desde la perspectiva de las tecnologías del habla

Objetivos específicos

  • Desarrollar una base de datos en zapoteca para el análisis de la señal de habla
  • Seleccionar los componentes acústicos, frecuenciales y paralingüísticos de la señal del habla en zapoteco para el análisis
  • Desarrollar el análisis del zapoteco como señal del habla a partir de los componentes seleccionados

  • -

Sistemas de recomendación

2012

 Descargar versión PDF

ProfesorDr. John Goddard Close

Resumen: En Internet existen muchos sitios especializados que ofrecen una gran cantidad de productos y/o servicios para su consumo, lo cual causa conflictos al usuario cuando requiere adquirir uno de ellos de entre tantas opciones; una buena opción para resolverlos son los sistemas de recomendación (SR). Los SR son herramientas y técnicas de software que proporcionan sugerencias a un usuario sobre artículos que le pueden servir. El tipo de sugerencia que ofrecen los SR podría ser acerca de qué película ver, qué música escuchar, qué bien comprar, o qué noticia en línea leer. Los sistemas de recomendación generan información personalizada para cada uno de sus usuarios, mediante el supuesto de que las personas que tuvieron una opinión similar en el pasado continuarán teniendo los mismos gustos en el futuro. Los SR están creciendo rápidamente en Internet, y han evolucionado de ser meras adiciones interesantes de sitios dedicados al comercio electrónico, a convertirse a veces en el negocio principal. Algunos retos que se presentan en los sistemas de recomendación son: producir una recomendación exacta, manejar varias recomendaciones eficientemente y enfrentar el crecimiento del número de participantes en el sistema, obteniendo así un sistema de recomendación de calidad.

Objetivo general

  • Encontrar métodos adecuados para los sistemas de recomendación mediante la aplicación de técnicas de aprendizaje maquinal

Objetivos específicos

  • Evaluar el desempeño de distintas técnicas de aprendizaje maquinal en el contexto de sistemas de recomendación
  • Desarrollar e implementar algún modelo híbrido para mejorar la calidad de recomendación en un SR

  • -

Un sistema de texto-a-habla expresivo en español

2012

 Descargar versión PDF

ProfesoresDr. John Goddard Close y Alma Edith Martínez Licona

Resumen: Un sistema texto-a-habla (TTS) es un sistema computacional que convierte texto en habla; para realizar esta función el TTS requiere dos etapas: al principio un módulo (llamado front end) que analiza el texto y lo convierte en una especificación lingüística, y posteriormente otro módulo que toma esta especificación lingüística y la cambia a una forma de onda sintetizada. La especificación lingüística contiene información fonémica y prosódica, usualmente dando una lista de los fonemas que aparecen en el texto y un conjunto de detalles sobre cómo se debe pronunciar. Estos detalles vienen en forma de valores de ciertos parámetros importantes como son la frecuencia fundamental f0 (llamada pitch), la duración, la calidad de voz y la articulación. A la fecha, los TTS han sido utilizados en muchas aplicaciones como son la lectura de correos electrónicos y libros, y prometen formar parte importante en una interacción máquina-humana más natural. Sin embargo, los humanos no hablan sin emoción, y hasta el momento, los sintetizadores actuales usualmente no la incorporan quizá en gran medida por la complejidad de expresión vocal humana. El hecho de añadir emoción, como felicidad, tristeza o enojo al habla sintetizada favorece la experimentación con la emulación del habla para hacerla más agradable y además ofrece la posibilidad de generar señal de voz con emoción para fines del reconocimiento de emoción en el habla. Este proyecto pretende desarrollar un sistema de TTS expresivo en español usando parámetros prosódicos modelados con técnicas de aprendizaje maquinal, como los árboles de decisión, aplicado a una base de datos emocionales en español.

Objetivo general

  • Desarrollar un sistema TTS expresivo en español

Objetivos específicos

  • Implementar en python el <em>front end</em> de un TTS en español
  • Aplicar técnicas de aprendizaje maquinal para modelar ciertos parámetros prosódicos importantes para lograr la incorporación de emociones en un TTS
  • Integrar lo anterior en una versión modificada de emofilt

  • -

Apoyo en la toma de decisiones en redes inalámbricas cognitivas

2012

 Descargar versión PDF.

ProfesoresDra. Reyna Carolina Medina Ramírez y Dr. Enrique Rodríguez de la Colina

Resumen: Actualmente existe una administración del espectro radioeléctrico que otorga licencias para operar en frecuencias fijas. Esta asignación fija de frecuencias, ha provocado escasez de bandas de frecuencia libres para operar nuevos servicios. La optimización de la distribución del espectro se ha planteado con el desarrollo de Radios Cognitivos, que es un modelo de las comunicaciones inalámbricas, en donde los dispositivos de comunicación adaptan sus parámetros de operación para comunicarse eficientemente, evitando interferencias con otros dispositivos. La toma de decisiones para la movilidad y compartición de información son fundamentales en un sistema de radio inteligente.

Objetivo general

  • Diseñar y construir una aplicación como apoyo a la toma de decisiones en la transmisión de datos en redes inalámbricas cognitivas.

Objetivos específicos

  • Proponer los criterios necesarios para seleccionar una interfaz de comunicación inalámbrica para una aplicación de redes inalámbricas cognitivas
  • Diseñar y programar un algoritmo para la toma de decisiones
  • Identificar y programar en Android las interfaces de los dispositivos de hardware de comunicación (Wi-Fi, bluetooth, celular)

  • -

Codificación digital y técnicas de espectro expandido para redes inalámbricas cognitivas

2012

 Descargar versión PDF

ProfesorDr. Enrique Rodríguez de la Colina

Resumen: Actualmente existe una administración del espectro radioeléctrico que otorga licencias para operar en frecuencias fijas. Esta asignación fija de frecuencias, ha provocado escasez de bandas de frecuencia libres para operar nuevos servicios. La optimización de la distribución del espectro se ha planteado con el desarrollo de Radios Cognitivos, que es un modelo de las comunicaciones inalámbricas, en donde los dispositivos de comunicación adaptan sus parámetros de operación para comunicarse eficientemente, evitando interferencias con otros dispositivos. El uso de técnicas de espectro expandido se ha utilizado como una opción de coexistencia entre usuarios licenciados y sistemas de radio cognitivo. Estas técnicas permiten una transmisión con niveles de potencia más bajo que las modulaciones convencionales al expenderse en el dominio de la frecuencia. Las redes de radios cognitivas dependen del aprovechamiento dinámico del espectro y por lo tanto deben de adaptar sus parámetros correspondientes al espectro radioelectrico utilizando técnicas digitales entre otras.

Objetivo general

  • Diseñar y explorar técnicas de comunicación digital de espectro expandido para su uso en el acceso dinámico del espectro

Objetivos específicos

  • Explorar distintas técnicas para compartir de forma más eficiente el espectro radioeléctrico

  • -

Simulación de algoritmo para acceso al medio en redes inalámbricas cognitivas

2012

 Descargar versión PDF

ProfesoresDr. Enrique Rodríguez de la Colina y Dr. Michael Pascoe Chalke

Resumen: Actualmente existe una administración del espectro radioeléctrico que otorga licencias para operar en frecuencias fijas. Esta asignación fija de frecuencias, ha provocado escasez de bandas de frecuencia libres para operar nuevos servicios. La optimización de la distribución del espectro se ha planteado con el desarrollo de Radios Cognitivos, que es un modelo de las comunicaciones inalámbricas, en donde los dispositivos de comunicación adaptan sus parámetros de operación para comunicarse eficientemente, evitando interferencias con otros dispositivos. Asimismo se requiere de nuevas técnicas de acceso al medio (MAC) para optimizar los recursos de espectro libre cuando se comparte entre varios usuarios.

Objetivo general

  • Optimizar y programar un modelo de acceso al medio (MAC) para Redes Inalámbricas Cognitivas en el tema específico de acceso oportunista y dinámico del espectro (DSA)

Objetivos específicos

  • Estudiar estrategias para compartir de forma eficiente el espectro radioeléctrico
  • Simular algoritmos de acceso al medio para redes inalámbricas cognitivas

  • -

Manejo de la calidad de servicio de extremo a extremo en una arquitectura multimedia basada en ontologías

2012

 Descargar versión PDF

ProfesoresDr. Ernesto Expósito (INSA, Toulouse, Francia) y Dr. Luis Martín Rojas Cárdenas

Resumen: Las Home Network (HN) son redes de datos de uso casero en donde cohabitan dispositivos de diferente naturaleza y sobre los cuales operan usuarios con requerimientos variados. Una característica común, en la mayor parte de los casos, es que las comunicaciones externas a la HN pasan por un solo enlace, el cual no distingue, ni la naturaleza, ni los requerimientos de comunicación intrínsecos a cada flujo de datos. Bajo estas condiciones, las aplicaciones comprometidas a respetar tiempos precisos de presentación (o time constrained applications) son incapaces de funcionar correctamente cuando sus datos comparten los recursos del enlace con datos de aplicaciones sin compromisos temporales de presentación; también llamadas aplicaciones elásticas. En efecto, en un ambiente regido por protocolos clásicos, no hay mecanismos para repartir los recursos a favor de quien requiere una mejor calidad de servicio (QoS: Quality of Service), es decir, a favor de las aplicaciones a tiempo de presentación comprometido. El problema ha sido abordado desde hace un tiempo utilizando modelos semánticos, también conocidos como ontologías, los cuales caracterizan las tanto las necesidades de QoS de las aplicaciones, como de la Calidad de Experiencia (QoE: Quality of Experience) percibida por el usuario. Estos modelos se emplean para crear mecanismos de mapeo y de control de la QoS con el fin de balancear y distribuir de una manera inteligente los recursos de comunicación comunes a la HN. El trabajo de tesis que se propone en este documento adopta la arquitectura conocida como MODA (Multimedia Ontology Driven Architecture) para abordar el caso del control de la QoS entre HN.

Objetivo general

  • Estudiar el manejo de la calidad de servicio de extremo a extremo en una Arquitectura Multimedia basada en Ontologías

Objetivos específicos

  • Proponer una arquitectura para el control de la QoS de comunicaciones entre dos HN
  • Evaluar la propuesta por medio de simulación.

Menú de navegación:
2023 | 2022 | 2021 | 2020 | 2019 | 2018 | 2017 | 2016 | 2015 | 2014 | 2013 | 2012