{"id":893,"date":"2016-10-24T13:14:14","date_gmt":"2016-10-24T13:14:14","guid":{"rendered":"http:\/\/localhost\/wordpress\/?page_id=893"},"modified":"2016-11-15T20:32:23","modified_gmt":"2016-11-15T20:32:23","slug":"desarrollo-de-un-modelo-computacional-para-el-procesamiento-de-corpus-textuales-basado-en-la-etiquetacion-automatica","status":"publish","type":"page","link":"https:\/\/www.cla.cu\/es\/desarrollo-de-un-modelo-computacional-para-el-procesamiento-de-corpus-textuales-basado-en-la-etiquetacion-automatica\/","title":{"rendered":"Desarrollo de un modelo computacional para el procesamiento de corpus textuales basado en la etiquetaci\u00f3n autom\u00e1tica"},"content":{"rendered":"<div class=\"art-PostContent\">\r\n<div class=\"art-article\">\r\n<p style=\"text-align: justify;\"><strong>Resumen<\/strong>: Tesis de doctorado que realiza un an\u00e1lisis detallado de la etiquetaci\u00f3n autom\u00e1tica de corpus textuales, las diferentes v\u00edas de desambiguar las palabras con posibilidad de tener m\u00e1s de una categor\u00eda gramatical, seg\u00fan el contexto donde se encuentre, principalmente sobre la base de la teor\u00eda probabil\u00edstica de los modelos ocultos de Markov.La tesis describe la estructura, funcionamiento y descripci\u00f3n del modelo computacional que propone esta investigaci\u00f3n, el cual se denomina ETIPROCT (Etiquetador y Procesador de Corpus Textuales) y describe sus dos secciones: la de la etiquetaci\u00f3n autom\u00e1tica de los textos y la del procesamiento de la informaci\u00f3n ling\u00fc\u00edstica.La aplicaci\u00f3n del ETIPROCT a dos corpus textuales completamente diferentes desde el punto de vista lexical refleja la alta efectividad del sistema. Se procesaron 52051 palabras de 358 textos escritos por alumnos de Secundaria B\u00e1sica de ocho provincias cubanas, donde se obtuvo una efectividad de 98.15%. Por su parte, se analizaron 51252 palabras en 131 textos de la prensa escrita cubana (Granma, Trabajadores y Juventud Rebelde) y la efectividad fue de 97.16%.Otra de las novedades del sistema que describe esta tesis es la codificaci\u00f3n autom\u00e1tica de los lapsogramas cometidos por los estudiantes en las composiciones escritas, codificaci\u00f3n que anteriormente se realizaba de forma manual. El reconocimiento de palabras compuestas, el enriquecimiento constante del lexic\u00f3n, la creaci\u00f3n del aspecto sem\u00e1ntico dentro del mismo y la larga relaci\u00f3n de resultados linguoestad\u00edsticos, entre otros, son los aportes m\u00e1s significativos del primer etiquetador gramatical autom\u00e1tico de corpus textuales creado en Cuba, objetivo principal de esta tesis.<\/p>\r\n<p style=\"text-align: justify;\"><strong>Autor<\/strong>:<\/p>\r\n\r\n<ul>\r\n\t<li class=\"rtejustify\" style=\"text-align: justify;\"><a href=\".\/clanuevo\/leonel-ruiz-miyares\/\" target=\"_blank\">Dr. Leonel Ruiz Miyares<\/a><\/li>\r\n<\/ul>\r\n<\/div>\r\n<\/div>","protected":false},"excerpt":{"rendered":"<p>Resumen: Tesis de doctorado que realiza un an\u00e1lisis detallado de la etiquetaci\u00f3n autom\u00e1tica de corpus textuales, las diferentes v\u00edas de desambiguar las palabras con posibilidad de tener m\u00e1s de una categor\u00eda gramatical, seg\u00fan el contexto donde se encuentre, principalmente sobre <a href=\"https:\/\/www.cla.cu\/es\/desarrollo-de-un-modelo-computacional-para-el-procesamiento-de-corpus-textuales-basado-en-la-etiquetacion-automatica\/\" class=\"read-more\">Seguir leyendo &#8230;<\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":[],"_links":{"self":[{"href":"https:\/\/www.cla.cu\/es\/wp-json\/wp\/v2\/pages\/893"}],"collection":[{"href":"https:\/\/www.cla.cu\/es\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/www.cla.cu\/es\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/www.cla.cu\/es\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.cla.cu\/es\/wp-json\/wp\/v2\/comments?post=893"}],"version-history":[{"count":3,"href":"https:\/\/www.cla.cu\/es\/wp-json\/wp\/v2\/pages\/893\/revisions"}],"predecessor-version":[{"id":1017,"href":"https:\/\/www.cla.cu\/es\/wp-json\/wp\/v2\/pages\/893\/revisions\/1017"}],"wp:attachment":[{"href":"https:\/\/www.cla.cu\/es\/wp-json\/wp\/v2\/media?parent=893"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}