Resumen: Este proyecto concluyó exitosamente en diciembre del 2009 y se obtuvo un sistema que posee herramientas básicas para el procesamiento del lenguaje natural: lematizador, desambiguador, reconocedor de nombres de entidades y analizador sintáctico. El analizador morfológico reconoce un total de 14205 sustantivos, 21704 adjetivos y 10760 verbos, así como palabras del resto de las categorías gramaticales: pronombres, adverbios, etc., todos respondiendo a la variante cubana del español según su frecuencia de uso. El analizador sintáctico extiende el conjunto de reglas de la herramienta FreeLing, para agregar algunas relaciones de dependencia entre las unidades léxicas que en la herramienta original no se manipulan. Los experimentos realizados muestran una mejora de alrededor de 10 puntos porcentuales con respecto a la versión original del FreeLing. Adicionalmente, se presentó un método mediante el cual se obtiene el árbol de constituyentes profundo realizando movimientos en el árbol superficial guiados por el árbol de dependencias. Con las herramientas propuestas se beneficiarán los estudios lingüísticos y las aplicaciones que requieran de Procesamiento del Lenguaje Natural.
Director del proyecto: Dr. Leonel Ruiz Miyares
Codirectora del proyecto: Dra. Aurora Pons Porrata
Integrantes: MsC. Yunior Ramírez Cruz, Lic. René A. Viant Morán, Lic. Carlos A. Fernández Cairó, Lic. Camilo Acosta Arafet, Lic. Jorge A. Ríos García, Lic. Yamila Cobos Castillo, Dra. Eloína Miyares Bermúdez, Dr. Reynaldo J. Gil García, Téc. María Rosa Álvarez Silva, MsC. Mileidis Quintana Polanco, MsC. Lisette García Moya y Lic. Henry Anaya Sánchez