Minería de datos usando Hadoop y MapReduce

  • -

Minería de datos usando Hadoop y MapReduce

2013

 Descargar versión PDF

ProfesorDr. René MacKinney Romero

Resumen: El aprendizaje maquinal es un área de investigación que ha tratado de emular las actividades del aprendizaje humano con sistemas computacionales. La meta principal del aprendizaje maquinal es lograr emular las habilidades cognitivas de los humanos con un sistema computacional. La minería de datos se ha convertido en un campo importante de estudios dado el gran volumen de información que se tiene en forma digital. Este proyecto se inscribe dentro de la minería de datos a fin de estudiarla utilizando como plataforma de desarrollo sistemas para manejarlo de grandes bases de datos como son Hadoop y MapReduce.

Objetivo general

  • Realizar tareas de la minería de datos, como clasificación, agrupamiento y sumarización en un sistema para grandes conjuntos de datos (Hadoop, MapReduce).

Objetivos específicos

  • Conocer el esquema Hadoop asi como MapReduce para realizar operaciones sobre grandes bases de datos
  • Estudiar cómo realizar clasificación, agrupamiento y clasificación en grandes conjuntos de datos asi como las herramientas existentes
  • Conocer, analizar y seleccionar algoritmos para implantarlos en las plataformas Hadoop y MapReduce

  • -

Localización y mapeo simultáneo

2013

 Descargar versión PDF

ProfesoresDr. René MacKinney Romero y Omar Lucio Cabrera Jiménez

Resumen: Los problemas de localización y mapeo de un robot son los más importantes a resolver en el contexto de la robótica ya que sin ellos un robot no es capaz de tener movilidad y autonomía. La localización y mapeo simultáneo (LMS) resultó ser una avenida de investigación muy fructífera que ha permitido dotar de autonomía desde robots muy pequeños hasta vehículos autónomos. Este proyecto tiene como objetivo utilizar técnicas de LMS a fin de proveer de autonomia a Ludovico.

Objetivo general

  • El objetivo general del proyecto es el de implementar técnicas adecuadas para la localización y mapeo simultáneo (LMS) de un robot

Objetivos específicos

  • Evaluacion y analisis de las técnicas de LMS más recientes
  • Implantación de dichas técnicas utilizando los robots comerciales (mindstorms) con los que se cuenta
  • Utilizar dichas técnicas para resolver el problema de navegación de Ludovico, robot diseñado y construido en la UAM

  • -

Mecanismos eficientes para la transformación de prefijos de una tabla de ruteo IP

2013

 Descargar versión PDF

ProfesoresDr. Miguel Ángel Ruiz Sánchez y Dr. César Jalpa Villanueva

Resumen: Internet es una red mundial de computadoras que intercambian información por medio de paquetes definidos por el protocolo IP. Dichas computadoras pueden ser de 2 tipos. Un primer tipo se caracteriza por ejecutar aplicaciones de propósito general y usan la red para enviar o recibir información; las computadoras que pertenecen a este tipo se les conoce como Hosts. El segundo tipo de computadoras de Internet se caracteriza por estar exclusivamente dedicadas a encaminar los paquetes de información del Host de origen al Host destino final; estas computadoras se conocen con el nombre de ruteadores. El número de usuarios y de aplicaciones de Internet no ha dejado de crecer. Esto ha provocado un rápido crecimiento del tráfico de paquetes que circula por los enlaces y ruteadores de Internet. El cuello de botella principal en los ruteadores es la busqueda de información en sus tablas de ruteo; proceso que tiene que realizar con cada uno de los paquetes que recibe un ruteador. Más específicamente, cuando un ruteador recibe un paquete, el ruteador debe decidir el próximo destino intermedio o final en el camino del Host origen al Host destino final. Esta decisión toma en cuenta, por un lado la dirección destino final que lleva el propio paquete, y por otro lado la información contenida en la tabla de ruteo del ruteador en cuestión. A este proceso que efectuan los ruteadores se le conoce como proceso de reexpedición de paquetes.

Objetivo general

  • Diseñar un algoritmo para realizar la transformación del conjunto de prefijos de una tabla de ruteo en otro conjunto de prefijos disjuntos pero que preserve la información de ruteo original

Objetivos específicos

  • Diseñar e implementar un método para obtener un conjunto de prefijos disjuntos de una tabla de ruteo
  • Estudiar el impacto que este paso de transformación provoca en por lo menos uno de los esquemas propuestos en la literatura

  • -

Uso eficiente de tarjetas gráficas para la visualización volumétrica de campos escalares.

2013

 Descargar versión PDF

ProfesoresOscar Yañez Suárez y Dr. Jorge Garza Olguín (Química, UAM-I) 

Resumen: El despliegue gráfico de campos escalares ha estado dominado por el uso intensivo del CPU al tiempo que mediante el uso de bibliotecas gráficas se hace uso básico de la tarjeta gráfica. En años recientes la industria de las tarjetas gráficas ha diversificado su uso. Una limitante de las tarjetas gráficas para su uso en cómputo de alto rendimiento es la memoria física de la que disponen estos dispositivos ya que no pueden compartir la memoria del sistema a la que tiene acceso el CPU. Se está perdiendo la cualidad de la tarjeta gráfica de hacer operaciones de punto flotante, además es necesario hacer transferencia de datos del CPU a la tarjeta gráfica para generar el despliegue gráfico. He aquí la necesidad de contar con el software adecuado para explotar todas las facetas de una tarjeta gráfica de última generación.

Objetivo general

  • Generar una aplicación que permita evaluar campos escalares sobre una tarjeta gráfica y visualizar en tiempo real el campo escalar generado

Objetivos específicos

  • Distribución eficiente de una malla tridimensional sobre los hilos contenidos en una tarjeta gráfica
  • Evaluación de la densidad electrónica de una molécula de tamaño mediano sobre la malla generada
  • Producción de isosuperficies de densidad para su visualización
  • Generación de una interfaz de programación de aplicaciones para generar el despliegue gráfico de las isosuperficies del campo escalar

  • -

Optimización global heurística de modelos estructurados de programación no lineal

2013

 Descargar versión PDF

ProfesoresDr. Miguel Ángel Gutiérrez Andrade y Dr. Juan Manuel Zamora Mata (Ingeniería de Procesos e Hidráulica, UAM-I)

Resumen: Algunos modelos y técnicas de programación no lineal son ampliamente utilizados en diseño y toma de decisiones en ingeniería. Sin embargo, la presencia de funciones no convexas en dichos modelos de optimización dificulta su solución, y frecuentemente da lugar a múltiples óptimos locales. El problema de determinar soluciones óptimas globales para modelos no convexos, con enfoque tanto determinista como estocástica, ha despertado en años recientes mucho interés en la comunidad de matemáticas aplicadas e ingeniería.

Objetivo general

  • Desarrollar y aplicar un algoritmo estocástico eficiente para la optimización global de modelos de programación no lineal que incluya no convexidades provengan exclusivamente de términos bilineales

Objetivos específicos

  • Investigar, valorar y seleccionar un algoritmo heurístico eficiente para la optimización de modelos de programación no lineal que incluyan una función objetivo y restricciones con términos bilineales
  • IDesarrollar una implementación computacional eficiente del algoritmo seleccionado
  • IValidar y evaluar los alcances y limitaciones del software desarrollado a través de la solución de un conjunto de casos de estudio y problemas representativos

  • -

Elaboración de una base de datos emotiva multimedia y su clasificación

2013

 Descargar versión PDF

ProfesoresDr. John Goddard Close y Fabiola Margarita Martínez Licona

Resumen: Este proyecto abordará el problema del análisis y reconocimiento de emociones a partir de la analizar la señal del habla y los cambios en la expresión facial mediante la generación de una base de datos de audio y video en español que denote emociones, y la clasificación de las mismas a partir de la elección de conjunto de características acústicas y de imágenes. El habla es la herramienta que se reconoce como el medio de comunicación por excelencia; su capacidad de comunicar ideas, pensamientos y hasta emociones permite la interacción entre los seres humanos a un alto nivel. Dada la naturaleza de la señal de habla, ésta se caracteriza por su alta variabilidad: su producción queda condicionada por la ubicación y movimiento de los elementos de la cavidad oral y el rostro, y por variantes en parámetros como el acento regional, la condición social o el estilo persona.

Objetivo general

  • Desarrollar una base de datos en audio y video de habla en español con emociones y su clasificación

Objetivos específicos

  • Desarrollar una base de datos de señales de audio y video de habla en español que se utilice para el reconocimiento de emociones
  • Seleccionar los componentes acústicos, frecuenciales y temporales de la señal del habla que se puedan utilizar en un sistema de clasificación de emociones
  • Seleccionar los componentes geométricos y de localización en las imágenes de video que se puedan utilizar en un sistema de clasificación de emociones
  • Desarrollar un sistema de clasificación para el reconocimiento de estados emocionales en el habla mediante el análisis de la señal compuesta de audio y video
  • Evaluar el sistema de clasificación para obtener un porcentaje aceptable con respecto a lo reportado en la literatura

  • -

Síntesis estadística paramétrica de voz

2013

 Descargar versión PDF

ProfesoresDr. John Goddard Close y Fabiola Margarita Martinez Licona

Resumen: La síntesis de voz es la producción artificial del habla humana, y un sintetizador de habla es el sistema computacional que lo realiza. Usualmente el sintetizador de habla se encuentra como la parte final (back-end) de un sistema del texto-a-habla (TTS). Hay varias arquitecturas que se han utilizado para lograr la onda sintetizada: síntesis articulatoria, síntesis de formantes, síntesis concatenativa, y síntesis basada en modelos markovianos ocultos (HMM). Este proyecto pretende desarrollar un sistema de síntesis de voz basada en HMM y el vocoder STRAIGHT para el español.

Objetivo general

  • Desarrollar un sistema de síntesis de voz basada en HMM para el español

Objetivos específicos

  • Conocer y aplicar técnicas para procesamiento de la señal de voz
  • Conocer información básica sobre la fonética, prosodia, y la lingüistica del español
  • Conocer los HMM y su la aplicación a la síntesis de voz
  • Aplicar los sistemas HTS, HTK y STRAIGHT a la síntesis basada en HMM

  • -

Detección de objetos perdidos en sistemas RFID

2013

 Descargar versión PDF

ProfesorDr. Víctor Manuel Ramos Ramos

Resumen: Hoy en día, la tecnología de identificación por radiofrecuencia (RFID, Radio Frequency IDentification) está involucrada en diversas actividades de la vida cotidiana, como son el transporte público, el rastreo y seguimiento de activos, el manejo de inventarios automatizados, solo por mencionar algunos. En los últimos años, se ha observado una tendencia hacia modificar la arquitectura centralizada de las redes RFID por arquitecturas distribuidas. Dichas arquitecturas introducen nuevos elementos en la red para distribuir los procesos realizados por la misma, como es el caso del proceso de identificación. De esta manera, las nuevas arquitecturas pretenden mejorar el uso del ancho de banda para escenarios RFID densos; sin embargo, se pueden utilizar igualmente para aplicaciones de detección y rastreo de activos. Hasta nuestro mejor conocimiento, no existen trabajos que demuestren que el enfoque distribuido para escenarios RFID sea de beneficio para aplicaciones tales como la detección de activos. En consecuencia, en este trabajo de investigación proponemos comparar, mediante simulación de eventos discretos, el rendimiento del nuevo paradigma distribuido para tareas de rastreo y detección de activos.

Objetivo general

  • Analizar las ventajas y desventajas del enfoque distribuido para sistemas RFID

Objetivos específicos

  • Realizar un estudio del estado del arte del paradigma distribuido en redes RFID
  • Implementar un escenario distribuido de red RFID en un simulador de eventos discretos
  • Adaptar un protocolo de detección de marcas pérdidas al enfoque distribuido
  • Evaluar el desempeño del protocolo diseñado y compararlo con el enfoque tradicional

  • -

Estudio de la dinámica estructural de las redes libres de escala

2013

 Descargar versión PDF

ProfesorDr. Ricardo Marcelín Jiménez

Resumen: Al finalizar el proyecto el alumno habrá construido un conjunto de herramientas computacionales para evaluar parámetros tales como la distribución de los grados, ó el diámetro de una gráfica. De igual forma, habrá construido otro conjunto de herramientas para simular los procesos dinámicos de formación y degradación de una red compleja.

Objetivo general

  • Estudiar las propiedades estructurales de las redes libres de escala, bajo condiciones dinámicas

Objetivos específicos

  • Reconocer un conjunto de medidas que caractericen el estado de una red
  • Proponer una serie de mecanismos que puedan describir la degradación de una red
  • Evaluar el estado de una red mientras es sometida a alguno de estos mecanismos
  • Proponer una serie de mecanismos que puedan describir la formación de una red

  • -

Diseño de un algoritmo multi-objetivo bio-inspirado para generar zonas electorales

2013

 Descargar versión PDF

ProfesoresDr. Miguel Ángel Gutiérrez Andrade y Dr. Eric Alfredo Rincón García (UAM Azcapotzalco)

Resumen: El diseño de zonas es un problema que consiste en agrupar unidades geográficas en un número predeterminado de zonas que minimizan una función objetivo, al tiempo que se satisfacen ciertas restricciones, principalmente relacionadas con su topografía. Dentro de sus aplicaciones más frecuentes se encuentran el diseño de distritos electorales, diseño de zonas de ventas, diseño de zonas escolares y el uso de tierras. Puede presentar objetivos múltiples, posiblemente en competencia entre sí, lo cual hace necesario llegar a una solución en la que todos los objetivos sean satisfechos en un grado aceptable. En esta propuesta de trabajo de investigación se diseñará un algoritmo multi-objetivo basado en una técnica bio-inspirada como colonia de abejas artificiales, optimización por colonia de hormigas, optimización por enjambre de partículas, entre otras, para el diseño de zonas electorales con 2 objetivos, equilibrio poblacional y compacidad geométrica.

Objetivo general

  • Diseñar un algoritmo para construir zonas que promuevan el equilibrio poblacional y la compacidad geométrica

Objetivos específicos

  • Realizar el estado del arte de las diferentes técnicas multi-objetivo bio-inspiradas
  • Diseñar un algoritmo multi-objetivo basado en técnicas bio-inspiradas para construir zonas que promuevan el equilibrio poblacional y la compacidad geométrica
  • Aplicar el algoritmo diseñado en instancias reales
  • Comparar los resultados obtenidos con los reportados en la literatura especializada