{"id":1802,"date":"2022-07-24T05:50:46","date_gmt":"2022-07-24T05:50:46","guid":{"rendered":"https:\/\/pcyti.izt.uam.mx\/?p=1802"},"modified":"2022-07-24T05:50:46","modified_gmt":"2022-07-24T05:50:46","slug":"sistema-de-deteccion-de-parafrasis-sobre-un-corpus-de-contexto-cientifico-utilizando-algoritmos-de-mineria-datos-y-semantica-distributiva","status":"publish","type":"post","link":"https:\/\/pcyti.izt.uam.mx\/?p=1802","title":{"rendered":"Sistema de detecci\u00f3n de par\u00e1frasis sobre un corpus de contexto cient\u00edfico, utilizando algoritmos de Miner\u00eda Datos y Sem\u00e1ntica Distributiva"},"content":{"rendered":"\n<p><a href=\"https:\/\/pcyti.izt.uam.mx\/wordpress\/wp-content\/uploads\/Sistema-de-detecci%C3%B3n-de-par%C3%A1frasis-sobre-un-corpus-de-contexto-cient%C3%ADfico_MCyTI2021.pdf\">Descargar versi\u00f3n completa (PDF)<\/a><\/p>\n\n\n\n<p><strong>Profesores:\u00a0<\/strong>Dr. Benjam\u00ed\u00adn Moreno Montiel\u00a0y\u00a0<a href=\"https:\/\/pcyti.izt.uam.mx\/wordpress\/?page_id=198&amp;SingleProduct=196\">Dr.\u00a0Ren\u00e9 MacKinney Romero<\/a><\/p>\n\n\n\n<p><strong>Resumen:&nbsp;<\/strong>Este proyecto tiene por objetivo desarrollar un Sistema de detecci\u00f3n de par\u00e1frasis fusionando algoritmos de Miner\u00eda de Datos y Sem\u00e1ntica Distributiva (MiDSemita). El cual permitir\u00e1 explorar la base de datos que se encuentra en la plataforma TESIUAMI, en busca de par\u00e1frasis de las tesis de ambiente cient\u00edfico ya que en la actualidad este es un problema que debe ser erradicado de las instituciones de educaci\u00f3n superior por medio de pol\u00edticas preventivas y de conciencia para el alumnado.<\/p>\n\n\n\n<p><strong>Objetivo general:<\/strong><\/p>\n\n\n\n<p>Desarrollar un Sistema de detecci\u00f3n de par\u00e1frasis fusionando algoritmos de Miner\u00eda de Datos y Sem\u00e1ntica Distributiva (MiDSemita).<\/p>\n\n\n\n<p><strong>Objetivos espec\u00edficos:<\/strong><\/p>\n\n\n\n<ul class=\"wp-block-list\"><li>Revisi\u00f3n del estado del arte sobre los principales clasificadores para Miner\u00eda de Datos y Sem\u00e1ntica Distributiva aplicados en detecci\u00f3n de par\u00e1frasis<\/li><li>Definir el formato para representaci\u00f3n de los datos documentales, una posibilidad es utilizar Word2vect, sin embargo, existen otros formatos c\u00f3mo globe y fasttext<\/li><li>Generaci\u00f3n de un corpus del repositorio que se tenga en TESIUAMI, enfocado al contexto cient\u00edfico<\/li><li>Manejo de grandes cantidades de datos mediante la generaci\u00f3n del corpus que se obtenga de los repositorios de TESIUAMI de contexto cient\u00edfico<\/li><li>Implementar algoritmos de Sem\u00e1ntica Distributiva y Miner\u00eda de Datos para atacar el problema de detecci\u00f3n de par\u00e1frasis<\/li><li>Se realizar\u00e1n evaluaciones de los algoritmos de desarrollados en el proyectopara desarrollar una m\u00e9trica de similitud sem\u00e1ntica enfocada y especializada para la par\u00e1frasis y el plagio de textos en espa\u00f1ol de acuerdo con las categor\u00edas propuestas por Mota Montoya et al.<\/li><li>Desarrollar el primer prototipo del Sistema de detecci\u00f3n de par\u00e1frasis sobre un corpus de contexto cient\u00edfico, utilizando algoritmos de Miner\u00eda Datos y Sem\u00e1ntica Distributiva<\/li><\/ul>\n","protected":false},"excerpt":{"rendered":"<p>Descargar versi\u00f3n completa (PDF) Profesores:\u00a0Dr. Benjam\u00ed\u00adn Moreno Montiel\u00a0y\u00a0Dr.\u00a0Ren\u00e9 MacKinney Romero Resumen:&nbsp;Este proyecto tiene por objetivo desarrollar un Sistema de detecci\u00f3n de par\u00e1frasis fusionando algoritmos de Miner\u00eda de Datos y Sem\u00e1ntica Distributiva (MiDSemita). El cual permitir\u00e1 explorar la base de datos que se encuentra en la plataforma TESIUAMI, en busca de par\u00e1frasis de las tesis de<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_lmt_disableupdate":"","_lmt_disable":"","footnotes":""},"categories":[75],"tags":[],"class_list":["post-1802","post","type-post","status-publish","format-standard","hentry","category-75"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v27.2 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>Sistema de detecci\u00f3n de par\u00e1frasis sobre un corpus de contexto cient\u00edfico, utilizando algoritmos de Miner\u00eda Datos y Sem\u00e1ntica Distributiva - Posgrado en Ciencias y Tecnolog\u00edas de la Informaci\u00f3n<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/pcyti.izt.uam.mx\/?p=1802\" \/>\n<meta property=\"og:locale\" content=\"es_MX\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Sistema de detecci\u00f3n de par\u00e1frasis sobre un corpus de contexto cient\u00edfico, utilizando algoritmos de Miner\u00eda Datos y Sem\u00e1ntica Distributiva - Posgrado en Ciencias y Tecnolog\u00edas de la Informaci\u00f3n\" \/>\n<meta property=\"og:description\" content=\"Descargar versi\u00f3n completa (PDF) Profesores:\u00a0Dr. Benjam\u00ed\u00adn Moreno Montiel\u00a0y\u00a0Dr.\u00a0Ren\u00e9 MacKinney Romero Resumen:&nbsp;Este proyecto tiene por objetivo desarrollar un Sistema de detecci\u00f3n de par\u00e1frasis fusionando algoritmos de Miner\u00eda de Datos y Sem\u00e1ntica Distributiva (MiDSemita). El cual permitir\u00e1 explorar la base de datos que se encuentra en la plataforma TESIUAMI, en busca de par\u00e1frasis de las tesis de\" \/>\n<meta property=\"og:url\" content=\"https:\/\/pcyti.izt.uam.mx\/?p=1802\" \/>\n<meta property=\"og:site_name\" content=\"Posgrado en Ciencias y Tecnolog\u00edas de la Informaci\u00f3n\" \/>\n<meta property=\"article:publisher\" content=\"https:\/\/www.facebook.com\/pcyti\/\" \/>\n<meta property=\"article:published_time\" content=\"2022-07-24T05:50:46+00:00\" \/>\n<meta name=\"author\" content=\"pcyti\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Escrito por\" \/>\n\t<meta name=\"twitter:data1\" content=\"pcyti\" \/>\n\t<meta name=\"twitter:label2\" content=\"Tiempo de lectura\" \/>\n\t<meta name=\"twitter:data2\" content=\"2 minutos\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\/\/pcyti.izt.uam.mx\/?p=1802#article\",\"isPartOf\":{\"@id\":\"https:\/\/pcyti.izt.uam.mx\/?p=1802\"},\"author\":{\"name\":\"pcyti\",\"@id\":\"https:\/\/pcyti.izt.uam.mx\/#\/schema\/person\/9d093e256d84249d175f986d409d857d\"},\"headline\":\"Sistema de detecci\u00f3n de par\u00e1frasis sobre un corpus de contexto cient\u00edfico, utilizando algoritmos de Miner\u00eda Datos y Sem\u00e1ntica Distributiva\",\"datePublished\":\"2022-07-24T05:50:46+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\/\/pcyti.izt.uam.mx\/?p=1802\"},\"wordCount\":343,\"publisher\":{\"@id\":\"https:\/\/pcyti.izt.uam.mx\/#organization\"},\"articleSection\":[\"2021\"],\"inLanguage\":\"es\"},{\"@type\":\"WebPage\",\"@id\":\"https:\/\/pcyti.izt.uam.mx\/?p=1802\",\"url\":\"https:\/\/pcyti.izt.uam.mx\/?p=1802\",\"name\":\"Sistema de detecci\u00f3n de par\u00e1frasis sobre un corpus de contexto cient\u00edfico, utilizando algoritmos de Miner\u00eda Datos y Sem\u00e1ntica Distributiva - Posgrado en Ciencias y Tecnolog\u00edas de la Informaci\u00f3n\",\"isPartOf\":{\"@id\":\"https:\/\/pcyti.izt.uam.mx\/#website\"},\"datePublished\":\"2022-07-24T05:50:46+00:00\",\"breadcrumb\":{\"@id\":\"https:\/\/pcyti.izt.uam.mx\/?p=1802#breadcrumb\"},\"inLanguage\":\"es\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/pcyti.izt.uam.mx\/?p=1802\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/pcyti.izt.uam.mx\/?p=1802#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Inicio\",\"item\":\"https:\/\/pcyti.izt.uam.mx\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Sistema de detecci\u00f3n de par\u00e1frasis sobre un corpus de contexto cient\u00edfico, utilizando algoritmos de Miner\u00eda Datos y Sem\u00e1ntica Distributiva\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/pcyti.izt.uam.mx\/#website\",\"url\":\"https:\/\/pcyti.izt.uam.mx\/\",\"name\":\"Posgrado en Ciencias y Tecnolog\u00edas de la Informaci\u00f3n\",\"description\":\"\",\"publisher\":{\"@id\":\"https:\/\/pcyti.izt.uam.mx\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/pcyti.izt.uam.mx\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"es\"},{\"@type\":\"Organization\",\"@id\":\"https:\/\/pcyti.izt.uam.mx\/#organization\",\"name\":\"Posgrado en Ciencias y Tecnolog\u00edas de la Informaci\u00f3n\",\"url\":\"https:\/\/pcyti.izt.uam.mx\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"es\",\"@id\":\"https:\/\/pcyti.izt.uam.mx\/#\/schema\/logo\/image\/\",\"url\":\"https:\/\/pcyti.izt.uam.mx\/wp-content\/uploads\/2021\/12\/logo_pcyti_small.png\",\"contentUrl\":\"https:\/\/pcyti.izt.uam.mx\/wp-content\/uploads\/2021\/12\/logo_pcyti_small.png\",\"width\":71,\"height\":100,\"caption\":\"Posgrado en Ciencias y Tecnolog\u00edas de la Informaci\u00f3n\"},\"image\":{\"@id\":\"https:\/\/pcyti.izt.uam.mx\/#\/schema\/logo\/image\/\"},\"sameAs\":[\"https:\/\/www.facebook.com\/pcyti\/\"]},{\"@type\":\"Person\",\"@id\":\"https:\/\/pcyti.izt.uam.mx\/#\/schema\/person\/9d093e256d84249d175f986d409d857d\",\"name\":\"pcyti\",\"url\":\"https:\/\/pcyti.izt.uam.mx\/?author=2\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Sistema de detecci\u00f3n de par\u00e1frasis sobre un corpus de contexto cient\u00edfico, utilizando algoritmos de Miner\u00eda Datos y Sem\u00e1ntica Distributiva - Posgrado en Ciencias y Tecnolog\u00edas de la Informaci\u00f3n","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/pcyti.izt.uam.mx\/?p=1802","og_locale":"es_MX","og_type":"article","og_title":"Sistema de detecci\u00f3n de par\u00e1frasis sobre un corpus de contexto cient\u00edfico, utilizando algoritmos de Miner\u00eda Datos y Sem\u00e1ntica Distributiva - Posgrado en Ciencias y Tecnolog\u00edas de la Informaci\u00f3n","og_description":"Descargar versi\u00f3n completa (PDF) Profesores:\u00a0Dr. Benjam\u00ed\u00adn Moreno Montiel\u00a0y\u00a0Dr.\u00a0Ren\u00e9 MacKinney Romero Resumen:&nbsp;Este proyecto tiene por objetivo desarrollar un Sistema de detecci\u00f3n de par\u00e1frasis fusionando algoritmos de Miner\u00eda de Datos y Sem\u00e1ntica Distributiva (MiDSemita). El cual permitir\u00e1 explorar la base de datos que se encuentra en la plataforma TESIUAMI, en busca de par\u00e1frasis de las tesis de","og_url":"https:\/\/pcyti.izt.uam.mx\/?p=1802","og_site_name":"Posgrado en Ciencias y Tecnolog\u00edas de la Informaci\u00f3n","article_publisher":"https:\/\/www.facebook.com\/pcyti\/","article_published_time":"2022-07-24T05:50:46+00:00","author":"pcyti","twitter_card":"summary_large_image","twitter_misc":{"Escrito por":"pcyti","Tiempo de lectura":"2 minutos"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/pcyti.izt.uam.mx\/?p=1802#article","isPartOf":{"@id":"https:\/\/pcyti.izt.uam.mx\/?p=1802"},"author":{"name":"pcyti","@id":"https:\/\/pcyti.izt.uam.mx\/#\/schema\/person\/9d093e256d84249d175f986d409d857d"},"headline":"Sistema de detecci\u00f3n de par\u00e1frasis sobre un corpus de contexto cient\u00edfico, utilizando algoritmos de Miner\u00eda Datos y Sem\u00e1ntica Distributiva","datePublished":"2022-07-24T05:50:46+00:00","mainEntityOfPage":{"@id":"https:\/\/pcyti.izt.uam.mx\/?p=1802"},"wordCount":343,"publisher":{"@id":"https:\/\/pcyti.izt.uam.mx\/#organization"},"articleSection":["2021"],"inLanguage":"es"},{"@type":"WebPage","@id":"https:\/\/pcyti.izt.uam.mx\/?p=1802","url":"https:\/\/pcyti.izt.uam.mx\/?p=1802","name":"Sistema de detecci\u00f3n de par\u00e1frasis sobre un corpus de contexto cient\u00edfico, utilizando algoritmos de Miner\u00eda Datos y Sem\u00e1ntica Distributiva - Posgrado en Ciencias y Tecnolog\u00edas de la Informaci\u00f3n","isPartOf":{"@id":"https:\/\/pcyti.izt.uam.mx\/#website"},"datePublished":"2022-07-24T05:50:46+00:00","breadcrumb":{"@id":"https:\/\/pcyti.izt.uam.mx\/?p=1802#breadcrumb"},"inLanguage":"es","potentialAction":[{"@type":"ReadAction","target":["https:\/\/pcyti.izt.uam.mx\/?p=1802"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/pcyti.izt.uam.mx\/?p=1802#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Inicio","item":"https:\/\/pcyti.izt.uam.mx\/"},{"@type":"ListItem","position":2,"name":"Sistema de detecci\u00f3n de par\u00e1frasis sobre un corpus de contexto cient\u00edfico, utilizando algoritmos de Miner\u00eda Datos y Sem\u00e1ntica Distributiva"}]},{"@type":"WebSite","@id":"https:\/\/pcyti.izt.uam.mx\/#website","url":"https:\/\/pcyti.izt.uam.mx\/","name":"Posgrado en Ciencias y Tecnolog\u00edas de la Informaci\u00f3n","description":"","publisher":{"@id":"https:\/\/pcyti.izt.uam.mx\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/pcyti.izt.uam.mx\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"es"},{"@type":"Organization","@id":"https:\/\/pcyti.izt.uam.mx\/#organization","name":"Posgrado en Ciencias y Tecnolog\u00edas de la Informaci\u00f3n","url":"https:\/\/pcyti.izt.uam.mx\/","logo":{"@type":"ImageObject","inLanguage":"es","@id":"https:\/\/pcyti.izt.uam.mx\/#\/schema\/logo\/image\/","url":"https:\/\/pcyti.izt.uam.mx\/wp-content\/uploads\/2021\/12\/logo_pcyti_small.png","contentUrl":"https:\/\/pcyti.izt.uam.mx\/wp-content\/uploads\/2021\/12\/logo_pcyti_small.png","width":71,"height":100,"caption":"Posgrado en Ciencias y Tecnolog\u00edas de la Informaci\u00f3n"},"image":{"@id":"https:\/\/pcyti.izt.uam.mx\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/www.facebook.com\/pcyti\/"]},{"@type":"Person","@id":"https:\/\/pcyti.izt.uam.mx\/#\/schema\/person\/9d093e256d84249d175f986d409d857d","name":"pcyti","url":"https:\/\/pcyti.izt.uam.mx\/?author=2"}]}},"modified_by":"pcyti","_links":{"self":[{"href":"https:\/\/pcyti.izt.uam.mx\/index.php?rest_route=\/wp\/v2\/posts\/1802","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/pcyti.izt.uam.mx\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/pcyti.izt.uam.mx\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/pcyti.izt.uam.mx\/index.php?rest_route=\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/pcyti.izt.uam.mx\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=1802"}],"version-history":[{"count":0,"href":"https:\/\/pcyti.izt.uam.mx\/index.php?rest_route=\/wp\/v2\/posts\/1802\/revisions"}],"wp:attachment":[{"href":"https:\/\/pcyti.izt.uam.mx\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=1802"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/pcyti.izt.uam.mx\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=1802"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/pcyti.izt.uam.mx\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=1802"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}