2012

  • -

Mecanismos para la administración de discos en una celda de almacenamiento distribuido

2012

 Descargar versión PDF

ProfesoresDr. Ricardo Marcelín Jiménez y Dra. Reyna Carolina Medina Ramírez

Resumen: Un sistema de almacenamiento distribuido (SAD) es una colección de dispositivos individuales que se interconectan para compartir sus capacidades locales y, de esta forma, ofrecer un sistema con funciones mejoradas. Aún cuando en su operación más simple consiste en repartir una colección de archivos sobre los componentes de la red, existen atributos de calidad que deben cuidarse, tales como la confiabilidad, la disponibilidad de la información, su integridad y privacidad, entre muchos otros. El propósito de este proyecto es extender las capacidades de la celda de almacenamiento incorporando mecanismos con los que se soporten los eventos del ciclo de vida de un disco tales como la sustitución o adición de dispositivos, considerando el impacto que estos pueden tener en el desempeño del sistema.

Objetivo general

  • Implementar los mecanismos para el manejo dinámico de los discos que integran una celda de almacenamiento

Objetivos específicos

  • Definir los procedimientos que den soporte al ciclo de vida de los discos que componen una celda de almacenamiento
  • Reconocer el impacto que estos tienen en los parámetros de desempeño del sistema
  • Evaluar las soluciones existentes
  • Construir una solución a la medida

  • -

Algoritmos coevolutivos para resolver problemas dinámicos de rutas de vehículos

2012

 Descargar versión PDF

ProfesoresDr. Miguel Alfonso Castro García y Dr. Abel García Nájera

Resumen: Los problemas de rutas de vehículos están relacionados con los servicios de reparto y transporte, en donde el proveedor tiene que diseñar rutas específicas para cada vehículo en respuesta a las necesidades de los clientes. Cuando los clientes tienen cierta demanda de algún producto y éstas son conocidas de antemano, las rutas se pueden diseñar a priori. Sin embargo, las rutas planeadas son susceptibles al tráfico, a nuevas solicitudes y a algunos otros componentes no contemplados inicialmente. En estos casos, las rutas deben modificarse lo más rápido posible (de forma dinámica), con el fin de satisfacer las demandas de todos los clientes sin afectar la calidad del servicio. Los algoritmos evolutivos han dado buenos resultados para este tipos de problemas dinámicos, sin embargo su tiempo de ejecución es una desventaja. Por el contrario, los algoritmos coevolutivos consideran varias poblaciones que evolucionan de manera independiente y por consiguiente esperaríamos un mejor tiempo de respuesta. Por otro lado, el cómputo paralelo ha sido una alternativa para reducir los tiempos de respuesta de diversos tipos de aplicaciones. Ya sea mediante una programación bajo el modelo de memoria compartida o paso de mensajes, aunado al uso de arquitecturas paralelas como los multicores, los GPUs (Unidades de Procesamiento Gráfico) y/o los clusters, es posible reducir el tiempo de ejecución de las aplicaciones.

Objetivo general

  • Proponer un sistema paralelo que resuelva problemas dinámicos de rutas de vehículos

Objetivos específicos

  • Resolver casos de prueba del problema dinámico de rutas de vehículos con ventanas de tiempo

  • -

Diseño de un sistema adaptable para resolver problemas de asignación de recursos mediante algoritmos genéticos

2012

 Descargar versión PDF

ProfesoresDr. Abel García Nájera y Dr. Humberto Cervantes Maceda

Resumen: Un problema de calendarización considera la asignación de recursos, que son limitados, a tareas específicas. Por ejemplo, en un proceso de producción, los recursos pueden ser las máquinas con las que se cuenta y las tareas son las operaciones propias del proceso. Otro ejemplo lo encontramos en las organizaciones, en donde las tareas son las etapas de un proyecto, mientras que los recursos humanos son los que las llevan a cabo. Los problemas de calendarización tienen como finalidad la optimización de uno o más objetivos, por ejemplo, minimizar el tiempo de utilización de la última tarea, minimizar el número de tareas finalizadas después de una fecha de entrega acordada, minimizar el costo total del proyecto e, inclusive, el mejor aprovechamiento de recursos. Dado que los problemas de calendarización aparecen en distintos contextos, sería deseable disponer de una aplicación de software cuyo diseño permitiera adaptarla de forma relativamente simple a contextos distintos.

Objetivo general

  • Diseñar e implementar una solución de software que se pueda adaptar a distintos contextos, con el fin de apoyar en la resolución de problemáticas como las mencionadas arriba mediante el uso de técnicas heurísticas

Objetivos específicos

  • Elegir un problema específico que involucra asignación de recursos y cuya resolución requiera de técnicas heurísticas
  • Diseñar, implementar y evaluar un algoritmo genético para resolver el problema elegido
  • Identificar requerimentos, diseñar, documentar y evaluar la arquitectura que incorpore el algoritmo diseñado y que, además, permita adaptar el sistema a otro tipo de problemáticas similares de forma relativamente simple
  • Implementar un prototipo del sistema sobre la arquitectura propuesta, que incorpore la implementación del algoritmo y demostrar su funcionalidad

  • -

Reconocimiento de emociones usando técnicas de aprendizaje maquinal

2012

 Descargar versión PDF

ProfesoresDr. John Goddard Close y Fabiola Margarita Martínez Licona

Resumen: El habla es la herramienta que se reconoce como el medio de comunicación por excelencia; su capacidad de comunicar ideas, pensamientos y hasta emociones permite la interacción entre los seres humanos a un alto nivel. Dada la naturaleza de la señal de habla, ésta se caracteriza por su alta variabilidad: su producción queda condicionada por la ubicación y movimiento de los elementos de la cavidad oral y el rostro, y por variantes en parámetros como el acento regional, la condición social o el estilo personal. Uno de los elementos que enriquecen la comunicación humana es la expresión de emociones en el mensaje. Se ha establecido que las palabras aportan menos del 10% del significado del mensaje para un escucha por lo que el análisis de los componentes paralingüísticos (prosodia, calidad de la voz, ritmo, etc.) se ha vuelto importante. Este proyecto abordará el problema del análisis y reconocimiento de emociones a partir de la señal del habla con la finalidad de aportar elementos que permitan desarrollar aplicaciones con una calidad de voz más natural utilizando técnicas de extracción de datos y aprendizaje maquinal. Para tal fin se hará uso de métodos de computación afectiva, la cual desde la perspectiva de la interacción hombre-máquina, se enfoca en la detección, análisis y reconocimiento automático de las emociones a partir del comportamiento humano.

Objetivo general

  • Desarrollar un sistema de reconocimiento de emociones a partir de la señal del habla

Objetivos específicos

  • Seleccionar los componentes acústicos, frecuenciales y paralingüísticos de la señal del habla que se puedan utilizar en un sistema de clasificación de emociones
  • Desarrollar un sistema de clasificación para el reconocimiento de estados emocionales en el habla mediante redes de creencia profunda
  • Evaluar el sistema de clasificación para obtener un porcentaje correcto de al menos 70% en general

  • -

Reconocimiento de incendios en video comprimido

2012

 Descargar versión PDF

ProfesoresDr. John Goddard Close y Dr. Luis Martín Rojas Cárdenas

Resumen: La detección de incendios en video representa una solución alternativa, con respecto a los métodos “clásicos” basados en sensores, la cual ofrece diversas ventajas tales como la posibilidad de detectar incendios a distancias mayores, con mayor velocidad y sobretodo en espacios abiertos; condiciones bajo las cuales los sensores de partículas presentan un bajo desempeño. Además, el uso de esta tecnología se ve motivado por la gran infraestructura de telemonitoreo ya presente en muchos edificios y otro tipo de instalación. La investigación para desarrollar métodos de análisis y reconocimiento de incendios en video ha sido desarrollada desde hace ya varios años y los resultados han sido alentadores. Sin embargo, hay mucho por hacer. Entre otros, el caso de la detección en video comprimido ha sido pocas veces abordado. En efecto, la gran mayoría de trabajos se centra en el video no comprimido o en bruto (raw video). Múltiples razones motivan esta posición. Entre otras, i) el video comprimido
no presenta toda la información captada al momento de ser adquirido debido a los métodos de cuantización presentes en todo algoritmo de compresión, 2) las herramientas creadas para el análisis de imágenes no comprimidas no han sido probadas, en forma exhaustiva, para el caso del video comprimido. Finalmente, el video comprimido no es considerado completamente por herramientas para el análisis y procesamiento de señales tales como MATLAB. Por ejemplo, obtener elementos básicos del video tales como coeficientes frecuenciales y vectores de movimiento, entre otros, no es posible. En este trabajo de tesis se busca desarrollar un algoritmo para la detección temprana de incendios que trabaje directamente en secuencias de video de alta resolución codificadas bajo alguna norma de compresión de video. Es importante mencionar que hemos desarrollado diversas herramientas para trabajar con video comprimido, producto de algunos trabajos de tesis.

Objetivo general

  • Desarrollar un algoritmo para la detección de incendios en video comprimido

Objetivos específicos

  • Comprender diferentes tecnologías para efectuar la codificación de video
  • Conocer diferentes técnicas para el análisis de imágenes
  • Obtener un algoritmode bajo costo computacional para la detección de incendios basado en la información frecuencial y temporal, ambas presentes en el flujo de video comprimido.

  • -

Síntesis de voz basada en modelos markovianos ocultos

2012

 Descargar versión PDF

ProfesoresDr. John Goddard Close y Fabiola Margarita Martínez Licona

Resumen: La síntesis de voz es la producción artificial del habla humana, y un sintetizador de habla es el sistema computacional que lo realiza. Usualmente el sintetizador de habla se encuentra como la parte final (back-end) de un sistema del texto-a-habla (TTS). Para ir del texto al habla en un TTS, el back-end tiene que producir una forma de onda sintetizada de la voz usando información lingüistica del texto. Hay varias arquitecturas que se han utilizado para lograr la onda sintetizada: síntesis articulatoria, síntesis de formantes, síntesis concatenativa, y síntesis basada en modelos markovianos ocultos (HMM). Mientras que los sistemas comerciales actuales usualmente usan síntesis concatenativa, en los últimos años la síntesis basada en HMM (también conocido como síntesis basada en parámetros estadísticos) ha ido ganando importancia por el potencial que ofrece. Previamente los HMM han jugado un papel importante en el reconocimiento automático del habla (RAH).Los HMM son empleados para modelar y generar información sobre el espectro, la frecuencia fundamental, y la duración del habla. La información parametrizada es suficiente para generar la forma de onda correspondiente. Una ventaja que presenta el modelo es que usa poco espacio de almacenamiento comparado con la síntesis concatenativa. Este proyecto pretende desarrollar un sistema de síntesis de voz basada en HMM para el español.

Objetivo general

  • Desarrollar un sistema de síntesis de voz basada en HMM para el español

Objetivos específicos

  • Conocer y aplicar técnicas para procesamiento de la señal de voz.
  • Conocer información básica sobre la fonética, prosodia, y la lingüistica del español
  • Conocer los HMM y su la aplicación a la síntesis de voz
  • Aplicar los sistemas HTS y HTK a la síntesis basada en HMM

  • -

Clasificación de objetos en movimiento en video comprimido

2012

 Descargar versión PDF

ProfesoresDr. John Goddard Close y Dr. Luis Martín Rojas Cárdenas

Resumen: El conteo de objetos es una actividad orientada a la obtención de datos estadísticos y útil para llevar, entre otros, un control del número de productos fabricados en una cadena de producción, del número de vehículos circulando por una avenida a determinada hora del día o de la cantidad de personas que hacen uso de un sistema de transporte en particular. En el pasado esta actividad se desarrollaba en forma manual, pero ahora, con la gran cobertura de sistemas de video vigilancia, la tendencia es automatizar esta actividad con la ayuda de sistemas de cómputo dotados con algoritmos para el reconocimiento de patrones. El funcionamiento de los cuales se basa en el uso de técnicas de segmentación, de estimación de movimiento, de extracción del fondo de la escena, etc. Es importante mencionar que la gran mayoría de estas técnicas operan sobre conjuntos de píxeles, es decir en flujos de video no comprimidos o video en bruto (e inglés: raw video). Aquí surge un detalle a considerar, las cámaras de video vigilancia convencionales no generan video en bruto sino video comprimido, el cual presenta, entre otros, distorsiones y pérdida de información. Así, aplicar estos algoritmos al video comprimido requiere, primeramente, descomprimir totalmente el video, después, evaluar si las imperfecciones del video comprimido no afectan el desempeño de los algoritmos propuestos. En esta tesis de maestría se propone utilizar informaciones directamente disponibles en el video comprimido, que no son píxeles, sino informaciones particulares (coeficientes frecuenciales y vectores de movimiento), para realizar la clasificación de objetos que aparecen en la escena de video, tales como personas, vehículos, animales, etc. El uso de estas informaciones debe beneficiar considerablemente el ahorro de recursos de cómputo y hacer más directo el proceso de reconocimiento en video comprimido. Además, el trabajo que aquí se propone toma como referencia un trabajo previo.

Objetivo general

  • Encontrar un algoritmo que permita distinguir y clasificar los diferentes objetos que aparecen en una escena de video comprimido

Objetivos específicos

  • Comprender diferentes tecnologías para efectuar la codificación de video
  • Conocer diferentes técnicas para el análisis de imágenes
  • Obtener un algoritmode bajo costo computacional para clasificar objetos basado en la información frecuencial y temporal, ambas presentes en el flujo de video comprimido

  • -

Análisis del zapoteco mediante técnicas de reconocimiento de patrones

2012

 Descargar versión PDF

ProfesoresFabiola Margarita Martínez Licona y Alma Edith Martínez Licona

Resumen: La forma de comunicación oral es considerada como la más trascendental para el intercambio de ideas, pensamientos y hasta emociones; el lenguaje se forma a partir de un conjunto de unidades básicas para la comunicación denomindas fonema. Por sí mismos los fonemas carecen de significado, pero en combinación y presentados secuencialmente dan lugar a las palabras, con la particularidad de que un cambio en el orden de los fonemas da lugar a un cambio en el significado de la palabra. Para el español los fonemas se dividen en dos grandes grupos bien diferenciados: vocales y consonantes. Desde el punto de vista acústico la vocal se origina a partir de un solo generador periódico situado en un extremo del resonador bucal (cuerdas vocales) y se caracteriza por carecer de obstáculos ya que presenta una regularidad en los formantes de frecuencia y, desde el punto de vista perceptivo, por ser un sonido muy claro. La consonante se origina o se modifica a partir de un generador localizado en un lugar distinto al de las vocales y presenta antiresonancias que influyen en la amplitud y distribución de los formantes de frecuencia; sus características son la presencia de obstáculos en la articulación y la irregularidad en la distribución de los formantes. Los sonidos del español se pueden clasificar de otras maneras atendiendo criterios acústicos, de articulación, de percepción, etc.  Si bien se conoce al detalle las características del español para desarrollar sistemas de análisis, esto no se cumple para otros lenguajes que se hablan en México y que forman parte de la herencia precolombina. Los zapotecos se llaman a sí mismos binnizá (binni, gente; zá, nube: gente que proviene de las nubes), bene xon, o ben’zaa, dependiendo de la región en que habiten. Fueron los mexicas quienes los denominaron zapotecatl, término que se deformó con la presencia española en su territorio y derivó en zapotecos. Se concentran principalmente en el Estado de Oaxaca, distribuidos en cuatro áreas geográfico-culturales: el Istmo de Tehuantepec, los Valles Centrales, la Sierra Norte de Oaxaca y la Sierra Madre del Sur. Son asimismo el grupo étnico más profuso de la entidad, y el tercer grupo indígena más numeroso del país. La lengua zapoteca se deriva del otomangue, por lo que está emparentada con algunas de las lenguas habladas en el centro del país, como el otomí, mazahua y pame. El zapoteco es una lengua tonal, es decir, que mediante la emisión de tonos altos, medios y bajos o bien ascendentes y descendentes, se establecen los diversos significados. Dada su característica acústica así como a su importancia dentro de las lenguas indígenas su estudio desde la prespectiva del análisis del habla resulta atractivo para la aplicación de métodos de análisis de señales. El proyecto se avocará al estudio del zapoteco como lenguaje a partir del análisis de la señal de habla de manera análoga al caso del español. Para tal fin se harán uso de técnicas de procesamiento de señales y de reconocimiento de patrones a fin de obtener información relevante del lenguaje desde la perspectiva de las tecnologías del habla.

Objetivo general

  • Analizar el lenguaje zapoteco desde la perspectiva de las tecnologías del habla

Objetivos específicos

  • Desarrollar una base de datos en zapoteca para el análisis de la señal de habla
  • Seleccionar los componentes acústicos, frecuenciales y paralingüísticos de la señal del habla en zapoteco para el análisis
  • Desarrollar el análisis del zapoteco como señal del habla a partir de los componentes seleccionados

  • -

Sistemas de recomendación

2012

 Descargar versión PDF

ProfesorDr. John Goddard Close

Resumen: En Internet existen muchos sitios especializados que ofrecen una gran cantidad de productos y/o servicios para su consumo, lo cual causa conflictos al usuario cuando requiere adquirir uno de ellos de entre tantas opciones; una buena opción para resolverlos son los sistemas de recomendación (SR). Los SR son herramientas y técnicas de software que proporcionan sugerencias a un usuario sobre artículos que le pueden servir. El tipo de sugerencia que ofrecen los SR podría ser acerca de qué película ver, qué música escuchar, qué bien comprar, o qué noticia en línea leer. Los sistemas de recomendación generan información personalizada para cada uno de sus usuarios, mediante el supuesto de que las personas que tuvieron una opinión similar en el pasado continuarán teniendo los mismos gustos en el futuro. Los SR están creciendo rápidamente en Internet, y han evolucionado de ser meras adiciones interesantes de sitios dedicados al comercio electrónico, a convertirse a veces en el negocio principal. Algunos retos que se presentan en los sistemas de recomendación son: producir una recomendación exacta, manejar varias recomendaciones eficientemente y enfrentar el crecimiento del número de participantes en el sistema, obteniendo así un sistema de recomendación de calidad.

Objetivo general

  • Encontrar métodos adecuados para los sistemas de recomendación mediante la aplicación de técnicas de aprendizaje maquinal

Objetivos específicos

  • Evaluar el desempeño de distintas técnicas de aprendizaje maquinal en el contexto de sistemas de recomendación
  • Desarrollar e implementar algún modelo híbrido para mejorar la calidad de recomendación en un SR

  • -

Un sistema de texto-a-habla expresivo en español

2012

 Descargar versión PDF

ProfesoresDr. John Goddard Close y Alma Edith Martínez Licona

Resumen: Un sistema texto-a-habla (TTS) es un sistema computacional que convierte texto en habla; para realizar esta función el TTS requiere dos etapas: al principio un módulo (llamado front end) que analiza el texto y lo convierte en una especificación lingüística, y posteriormente otro módulo que toma esta especificación lingüística y la cambia a una forma de onda sintetizada. La especificación lingüística contiene información fonémica y prosódica, usualmente dando una lista de los fonemas que aparecen en el texto y un conjunto de detalles sobre cómo se debe pronunciar. Estos detalles vienen en forma de valores de ciertos parámetros importantes como son la frecuencia fundamental f0 (llamada pitch), la duración, la calidad de voz y la articulación. A la fecha, los TTS han sido utilizados en muchas aplicaciones como son la lectura de correos electrónicos y libros, y prometen formar parte importante en una interacción máquina-humana más natural. Sin embargo, los humanos no hablan sin emoción, y hasta el momento, los sintetizadores actuales usualmente no la incorporan quizá en gran medida por la complejidad de expresión vocal humana. El hecho de añadir emoción, como felicidad, tristeza o enojo al habla sintetizada favorece la experimentación con la emulación del habla para hacerla más agradable y además ofrece la posibilidad de generar señal de voz con emoción para fines del reconocimiento de emoción en el habla. Este proyecto pretende desarrollar un sistema de TTS expresivo en español usando parámetros prosódicos modelados con técnicas de aprendizaje maquinal, como los árboles de decisión, aplicado a una base de datos emocionales en español.

Objetivo general

  • Desarrollar un sistema TTS expresivo en español

Objetivos específicos

  • Implementar en python el <em>front end</em> de un TTS en español
  • Aplicar técnicas de aprendizaje maquinal para modelar ciertos parámetros prosódicos importantes para lograr la incorporación de emociones en un TTS
  • Integrar lo anterior en una versión modificada de emofilt