{"id":2035,"date":"2022-07-25T22:16:57","date_gmt":"2022-07-25T22:16:57","guid":{"rendered":"https:\/\/pcyti.izt.uam.mx\/?p=2035"},"modified":"2022-07-25T22:16:57","modified_gmt":"2022-07-25T22:16:57","slug":"sintesis-de-voz-basada-en-modelos-ocultos-de-markov-y-algoritmos-de-aprendizaje-profundo","status":"publish","type":"post","link":"https:\/\/pcyti.izt.uam.mx\/?p=2035","title":{"rendered":"S\u00edntesis de voz basada en Modelos Ocultos de Markov y algoritmos de aprendizaje profundo"},"content":{"rendered":"\n<p class=\"wp-block-paragraph\"><strong>Alumno<\/strong>:\u00a0Marvin Coto Jim\u00e9nez<br><strong>Profesor<\/strong>:\u00a0<a href=\"https:\/\/pcyti.izt.uam.mx\/?page_id=514&amp;singleproduct=1219\">Dr.\u00a0John Goddard Close<\/a><\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>Resumen<\/strong>:&nbsp;La s\u00edntesis de voz es una t\u00e9cnica de producci\u00f3n de habla artificial por medio de computadoras, la cual tiene como finalidad potenciar la interacci\u00f3n humano-computador en todo tipo de dispositivos, desarrollar sistemas de asistencia para personas con necesidades especiales, incorporarse a sistemas de entretenimiento, entre otras muchas aplicaciones. A partir de la d\u00e9cada del a\u00f1o 2000, surge como modelo matem\u00e1tico dominante para realizar la s\u00edntesis, los Modelos Ocultos de Markov (HMM) para representar y reproducir de forma param\u00e9trica la informaci\u00f3n del habla. Esto permite que una voz pueda ser codificada utilizando par\u00e1metros espectrales, de frecuencia fundamental y de duraci\u00f3n de sus unidades fon\u00e9ticas, para luego entrenar los modelos matem\u00e1ticos que permitan producir nuevas frases con habla de caracter\u00edsticas semejantes a la humana.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">En esta tesis se aborda la adaptaci\u00f3n de esta t\u00e9cnica para producir voces y su mejora con la introducci\u00f3n de algoritmos de aprendizaje profundo, los cuales pretenden aprender directamente de los datos la manera de producir sonido m\u00e1s natural y cercano al humano.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>Objetivo&nbsp;general<\/strong><\/p>\n\n\n\n<ul class=\"wp-block-list\"><li>Incorporar t\u00e9cnicas de inteligencia computacional a la creaci\u00f3n de voces artificiales creadas&nbsp;con t\u00e9cnicas estad\u00edsticas param\u00e9tricas para mejorar su calidad<\/li><\/ul>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>Objetivos espec\u00edficos<\/strong><\/p>\n\n\n\n<ul class=\"wp-block-list\"><li>Estudiar la aplicaci\u00f3n de t\u00e9cnicas de inteligencia computacional que puedan mejorar procesos&nbsp;de entrenamiento de los HMM en la s\u00edntesis de voz.<\/li><li>Experimentar con nuevas unidades fon\u00e9ticas y sistemas h\u00edbridos para crear voces en espa\u00f1ol.<\/li><li>Desarrollar m\u00e9todos de evaluaci\u00f3n autom\u00e1tica de voces sint\u00e9ticas.<\/li><li>Desarrollar m\u00e9todos de experimentaci\u00f3n donde sea posible incorporar heur\u00edsticas para la&nbsp;optimizaci\u00f3n de resultados.<\/li><\/ul>\n","protected":false},"excerpt":{"rendered":"<p>Alumno:\u00a0Marvin Coto Jim\u00e9nezProfesor:\u00a0Dr.\u00a0John Goddard Close Resumen:&nbsp;La s\u00edntesis de voz es una t\u00e9cnica de producci\u00f3n de habla artificial por medio de computadoras, la cual tiene como finalidad potenciar la interacci\u00f3n humano-computador en todo tipo de dispositivos, desarrollar sistemas de asistencia para personas con necesidades especiales, incorporarse a sistemas de entretenimiento, entre otras muchas aplicaciones. A partir<\/p>\n","protected":false},"author":2,"featured_media":2032,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_lmt_disableupdate":"","_lmt_disable":"","footnotes":""},"categories":[97],"tags":[],"class_list":["post-2035","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-14-o"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v27.2 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>S\u00edntesis de voz basada en Modelos Ocultos de Markov y algoritmos de aprendizaje profundo - Posgrado en Ciencias y Tecnolog\u00edas de la Informaci\u00f3n<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/pcyti.izt.uam.mx\/?p=2035\" \/>\n<meta property=\"og:locale\" content=\"es_MX\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"S\u00edntesis de voz basada en Modelos Ocultos de Markov y algoritmos de aprendizaje profundo - Posgrado en Ciencias y Tecnolog\u00edas de la Informaci\u00f3n\" \/>\n<meta property=\"og:description\" content=\"Alumno:\u00a0Marvin Coto Jim\u00e9nezProfesor:\u00a0Dr.\u00a0John Goddard Close Resumen:&nbsp;La s\u00edntesis de voz es una t\u00e9cnica de producci\u00f3n de habla artificial por medio de computadoras, la cual tiene como finalidad potenciar la interacci\u00f3n humano-computador en todo tipo de dispositivos, desarrollar sistemas de asistencia para personas con necesidades especiales, incorporarse a sistemas de entretenimiento, entre otras muchas aplicaciones. A partir\" \/>\n<meta property=\"og:url\" content=\"https:\/\/pcyti.izt.uam.mx\/?p=2035\" \/>\n<meta property=\"og:site_name\" content=\"Posgrado en Ciencias y Tecnolog\u00edas de la Informaci\u00f3n\" \/>\n<meta property=\"article:publisher\" content=\"https:\/\/www.facebook.com\/pcyti\/\" \/>\n<meta property=\"article:published_time\" content=\"2022-07-25T22:16:57+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/pcyti.izt.uam.mx\/wp-content\/uploads\/2022\/07\/deep-learning.png\" \/>\n\t<meta property=\"og:image:width\" content=\"568\" \/>\n\t<meta property=\"og:image:height\" content=\"107\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/png\" \/>\n<meta name=\"author\" content=\"pcyti\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Escrito por\" \/>\n\t<meta name=\"twitter:data1\" content=\"pcyti\" \/>\n\t<meta name=\"twitter:label2\" content=\"Tiempo de lectura\" \/>\n\t<meta name=\"twitter:data2\" content=\"1 minuto\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\/\/pcyti.izt.uam.mx\/?p=2035#article\",\"isPartOf\":{\"@id\":\"https:\/\/pcyti.izt.uam.mx\/?p=2035\"},\"author\":{\"name\":\"pcyti\",\"@id\":\"https:\/\/pcyti.izt.uam.mx\/#\/schema\/person\/9d093e256d84249d175f986d409d857d\"},\"headline\":\"S\u00edntesis de voz basada en Modelos Ocultos de Markov y algoritmos de aprendizaje profundo\",\"datePublished\":\"2022-07-25T22:16:57+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\/\/pcyti.izt.uam.mx\/?p=2035\"},\"wordCount\":315,\"publisher\":{\"@id\":\"https:\/\/pcyti.izt.uam.mx\/#organization\"},\"image\":{\"@id\":\"https:\/\/pcyti.izt.uam.mx\/?p=2035#primaryimage\"},\"thumbnailUrl\":\"https:\/\/pcyti.izt.uam.mx\/wp-content\/uploads\/2022\/07\/deep-learning.png\",\"articleSection\":[\"14-O\"],\"inLanguage\":\"es\"},{\"@type\":\"WebPage\",\"@id\":\"https:\/\/pcyti.izt.uam.mx\/?p=2035\",\"url\":\"https:\/\/pcyti.izt.uam.mx\/?p=2035\",\"name\":\"S\u00edntesis de voz basada en Modelos Ocultos de Markov y algoritmos de aprendizaje profundo - Posgrado en Ciencias y Tecnolog\u00edas de la Informaci\u00f3n\",\"isPartOf\":{\"@id\":\"https:\/\/pcyti.izt.uam.mx\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\/\/pcyti.izt.uam.mx\/?p=2035#primaryimage\"},\"image\":{\"@id\":\"https:\/\/pcyti.izt.uam.mx\/?p=2035#primaryimage\"},\"thumbnailUrl\":\"https:\/\/pcyti.izt.uam.mx\/wp-content\/uploads\/2022\/07\/deep-learning.png\",\"datePublished\":\"2022-07-25T22:16:57+00:00\",\"breadcrumb\":{\"@id\":\"https:\/\/pcyti.izt.uam.mx\/?p=2035#breadcrumb\"},\"inLanguage\":\"es\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/pcyti.izt.uam.mx\/?p=2035\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"es\",\"@id\":\"https:\/\/pcyti.izt.uam.mx\/?p=2035#primaryimage\",\"url\":\"https:\/\/pcyti.izt.uam.mx\/wp-content\/uploads\/2022\/07\/deep-learning.png\",\"contentUrl\":\"https:\/\/pcyti.izt.uam.mx\/wp-content\/uploads\/2022\/07\/deep-learning.png\",\"width\":568,\"height\":107},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/pcyti.izt.uam.mx\/?p=2035#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Inicio\",\"item\":\"https:\/\/pcyti.izt.uam.mx\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"S\u00edntesis de voz basada en Modelos Ocultos de Markov y algoritmos de aprendizaje profundo\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/pcyti.izt.uam.mx\/#website\",\"url\":\"https:\/\/pcyti.izt.uam.mx\/\",\"name\":\"Posgrado en Ciencias y Tecnolog\u00edas de la Informaci\u00f3n\",\"description\":\"\",\"publisher\":{\"@id\":\"https:\/\/pcyti.izt.uam.mx\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/pcyti.izt.uam.mx\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"es\"},{\"@type\":\"Organization\",\"@id\":\"https:\/\/pcyti.izt.uam.mx\/#organization\",\"name\":\"Posgrado en Ciencias y Tecnolog\u00edas de la Informaci\u00f3n\",\"url\":\"https:\/\/pcyti.izt.uam.mx\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"es\",\"@id\":\"https:\/\/pcyti.izt.uam.mx\/#\/schema\/logo\/image\/\",\"url\":\"https:\/\/pcyti.izt.uam.mx\/wp-content\/uploads\/2021\/12\/logo_pcyti_small.png\",\"contentUrl\":\"https:\/\/pcyti.izt.uam.mx\/wp-content\/uploads\/2021\/12\/logo_pcyti_small.png\",\"width\":71,\"height\":100,\"caption\":\"Posgrado en Ciencias y Tecnolog\u00edas de la Informaci\u00f3n\"},\"image\":{\"@id\":\"https:\/\/pcyti.izt.uam.mx\/#\/schema\/logo\/image\/\"},\"sameAs\":[\"https:\/\/www.facebook.com\/pcyti\/\"]},{\"@type\":\"Person\",\"@id\":\"https:\/\/pcyti.izt.uam.mx\/#\/schema\/person\/9d093e256d84249d175f986d409d857d\",\"name\":\"pcyti\",\"url\":\"https:\/\/pcyti.izt.uam.mx\/?author=2\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"S\u00edntesis de voz basada en Modelos Ocultos de Markov y algoritmos de aprendizaje profundo - Posgrado en Ciencias y Tecnolog\u00edas de la Informaci\u00f3n","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/pcyti.izt.uam.mx\/?p=2035","og_locale":"es_MX","og_type":"article","og_title":"S\u00edntesis de voz basada en Modelos Ocultos de Markov y algoritmos de aprendizaje profundo - Posgrado en Ciencias y Tecnolog\u00edas de la Informaci\u00f3n","og_description":"Alumno:\u00a0Marvin Coto Jim\u00e9nezProfesor:\u00a0Dr.\u00a0John Goddard Close Resumen:&nbsp;La s\u00edntesis de voz es una t\u00e9cnica de producci\u00f3n de habla artificial por medio de computadoras, la cual tiene como finalidad potenciar la interacci\u00f3n humano-computador en todo tipo de dispositivos, desarrollar sistemas de asistencia para personas con necesidades especiales, incorporarse a sistemas de entretenimiento, entre otras muchas aplicaciones. A partir","og_url":"https:\/\/pcyti.izt.uam.mx\/?p=2035","og_site_name":"Posgrado en Ciencias y Tecnolog\u00edas de la Informaci\u00f3n","article_publisher":"https:\/\/www.facebook.com\/pcyti\/","article_published_time":"2022-07-25T22:16:57+00:00","og_image":[{"width":568,"height":107,"url":"https:\/\/pcyti.izt.uam.mx\/wp-content\/uploads\/2022\/07\/deep-learning.png","type":"image\/png"}],"author":"pcyti","twitter_card":"summary_large_image","twitter_misc":{"Escrito por":"pcyti","Tiempo de lectura":"1 minuto"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/pcyti.izt.uam.mx\/?p=2035#article","isPartOf":{"@id":"https:\/\/pcyti.izt.uam.mx\/?p=2035"},"author":{"name":"pcyti","@id":"https:\/\/pcyti.izt.uam.mx\/#\/schema\/person\/9d093e256d84249d175f986d409d857d"},"headline":"S\u00edntesis de voz basada en Modelos Ocultos de Markov y algoritmos de aprendizaje profundo","datePublished":"2022-07-25T22:16:57+00:00","mainEntityOfPage":{"@id":"https:\/\/pcyti.izt.uam.mx\/?p=2035"},"wordCount":315,"publisher":{"@id":"https:\/\/pcyti.izt.uam.mx\/#organization"},"image":{"@id":"https:\/\/pcyti.izt.uam.mx\/?p=2035#primaryimage"},"thumbnailUrl":"https:\/\/pcyti.izt.uam.mx\/wp-content\/uploads\/2022\/07\/deep-learning.png","articleSection":["14-O"],"inLanguage":"es"},{"@type":"WebPage","@id":"https:\/\/pcyti.izt.uam.mx\/?p=2035","url":"https:\/\/pcyti.izt.uam.mx\/?p=2035","name":"S\u00edntesis de voz basada en Modelos Ocultos de Markov y algoritmos de aprendizaje profundo - Posgrado en Ciencias y Tecnolog\u00edas de la Informaci\u00f3n","isPartOf":{"@id":"https:\/\/pcyti.izt.uam.mx\/#website"},"primaryImageOfPage":{"@id":"https:\/\/pcyti.izt.uam.mx\/?p=2035#primaryimage"},"image":{"@id":"https:\/\/pcyti.izt.uam.mx\/?p=2035#primaryimage"},"thumbnailUrl":"https:\/\/pcyti.izt.uam.mx\/wp-content\/uploads\/2022\/07\/deep-learning.png","datePublished":"2022-07-25T22:16:57+00:00","breadcrumb":{"@id":"https:\/\/pcyti.izt.uam.mx\/?p=2035#breadcrumb"},"inLanguage":"es","potentialAction":[{"@type":"ReadAction","target":["https:\/\/pcyti.izt.uam.mx\/?p=2035"]}]},{"@type":"ImageObject","inLanguage":"es","@id":"https:\/\/pcyti.izt.uam.mx\/?p=2035#primaryimage","url":"https:\/\/pcyti.izt.uam.mx\/wp-content\/uploads\/2022\/07\/deep-learning.png","contentUrl":"https:\/\/pcyti.izt.uam.mx\/wp-content\/uploads\/2022\/07\/deep-learning.png","width":568,"height":107},{"@type":"BreadcrumbList","@id":"https:\/\/pcyti.izt.uam.mx\/?p=2035#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Inicio","item":"https:\/\/pcyti.izt.uam.mx\/"},{"@type":"ListItem","position":2,"name":"S\u00edntesis de voz basada en Modelos Ocultos de Markov y algoritmos de aprendizaje profundo"}]},{"@type":"WebSite","@id":"https:\/\/pcyti.izt.uam.mx\/#website","url":"https:\/\/pcyti.izt.uam.mx\/","name":"Posgrado en Ciencias y Tecnolog\u00edas de la Informaci\u00f3n","description":"","publisher":{"@id":"https:\/\/pcyti.izt.uam.mx\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/pcyti.izt.uam.mx\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"es"},{"@type":"Organization","@id":"https:\/\/pcyti.izt.uam.mx\/#organization","name":"Posgrado en Ciencias y Tecnolog\u00edas de la Informaci\u00f3n","url":"https:\/\/pcyti.izt.uam.mx\/","logo":{"@type":"ImageObject","inLanguage":"es","@id":"https:\/\/pcyti.izt.uam.mx\/#\/schema\/logo\/image\/","url":"https:\/\/pcyti.izt.uam.mx\/wp-content\/uploads\/2021\/12\/logo_pcyti_small.png","contentUrl":"https:\/\/pcyti.izt.uam.mx\/wp-content\/uploads\/2021\/12\/logo_pcyti_small.png","width":71,"height":100,"caption":"Posgrado en Ciencias y Tecnolog\u00edas de la Informaci\u00f3n"},"image":{"@id":"https:\/\/pcyti.izt.uam.mx\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/www.facebook.com\/pcyti\/"]},{"@type":"Person","@id":"https:\/\/pcyti.izt.uam.mx\/#\/schema\/person\/9d093e256d84249d175f986d409d857d","name":"pcyti","url":"https:\/\/pcyti.izt.uam.mx\/?author=2"}]}},"modified_by":"pcyti","_links":{"self":[{"href":"https:\/\/pcyti.izt.uam.mx\/index.php?rest_route=\/wp\/v2\/posts\/2035","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/pcyti.izt.uam.mx\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/pcyti.izt.uam.mx\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/pcyti.izt.uam.mx\/index.php?rest_route=\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/pcyti.izt.uam.mx\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=2035"}],"version-history":[{"count":0,"href":"https:\/\/pcyti.izt.uam.mx\/index.php?rest_route=\/wp\/v2\/posts\/2035\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/pcyti.izt.uam.mx\/index.php?rest_route=\/wp\/v2\/media\/2032"}],"wp:attachment":[{"href":"https:\/\/pcyti.izt.uam.mx\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=2035"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/pcyti.izt.uam.mx\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=2035"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/pcyti.izt.uam.mx\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=2035"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}