Por favor, use este identificador para citar o enlazar este ítem: http://repositoriodigital.ipn.mx/handle/123456789/7008
Título : Automatic extraction of lexical functions
Autor : Gelbukh, Alexander
Kolesnikova, Olga
Palabras clave : Natural language processing (Computer science)
Fecha de publicación : 2011
Editorial : Instituto Politécnico Nacional. Centro de Investigación en Computación
Resumen : Función léxica es un concepto que formaliza relaciones semánticas y sintácticas entre palabras. Estas relaciones son muy importantes para cualquier sistema de procesamiento de lenguaje natural. Por ejemplo, para seleccionar el significado de una palabra se necesita identificar sus relaciones con otras palabras en el contexto. Una relación colocacional es un tipo de relación léxica entre la base de una colocación y su colocado. Una colocación es una combinación de palabras en la cual las palabras no tienen sus significados típicos. Ejemplos de colocaciones son to give a lecture, impartir una conferencia, to make a decision, tomar una decisión, to lend support, dar apoyo. En esas colocaciones las bases son lecture, conferencia, decision, decisión, support, apoyo, y los colocados son give, impartir, make, tomar, lend, dar. Sin embargo, cuando se utiliza el significado típico, las combinaciones de palabras se conocen como combinaciones libres. Ejemplos de combinaciones libres son: to give a book, dar un libro, to make a dress, hacer un vestido, to lend money, prestar dinero. Existen muchos métodos de extracción automática de colocaciones. El resultado más común de estos métodos son las listas de colocaciones. Las listas de colocaciones contienen solamente las palabras que forman la colocación y la frecuencia de éstas. En este estudio nos enfocamos en agregar información semántica y gramatical a las listas de colocaciones. Esta información es extraída en forma de funciones léxicas. Dicha información hace que las colocaciones sean más útiles para aplicaciones computacionales tales como: analizadores morfológicos, traducción automática de alta calidad, sistemas de paráfrasis y aprendizaje de idiomas extranjeros asistido por computadora. Entonces nuestra meta es extraer funciones léxicas de tipo verbo-sustantivo en español de un corpus. Para lograr eso, proponemos representar el significado léxico de una palabra con el conjunto de sus hiperónimos del diccionario Spanish WordNet y usar métodos de aprendizaje de maquina supervisados para predecir funciones léxicas de colocaciones desconocidas. Evaluamos varios algoritmos de aprendizaje de máquina utilizando el conjunto de entrenamiento y el conjunto independiente de prueba. Los resultados obtenidos (el valor de la medida F-measure de 75%) muestran que es posible detectar funciones léxicas automáticamente. // Lexical function is a concept which formalizes semantic and syntactic relations between lexical units. Relations between words are a vital part of any natural language system. Meaning of an individual word largely depends on various relations connecting it to other words in context. Collocational relation is a type of institutionalized lexical relations which holds between the base and its partner in a collocation (examples of collocations: gives a lecture, make a decision, lend support where the bases are lecture, decision, support and the partners, termed collocates, are give, make, lend). Collocations are opposed to free word combination where both words are used in their typical meaning (for example, give a book, make a dress, lend money). Knowledge of collocation is important for natural language processing because collocation comprises the restrictions on how words can be used together. There are many methods to extract collocations automatically but their result is a plain list of collocations. Such lists are more valuable if collocations are tagged with semantic and grammatical information. The formalism of lexical functions is a means of representing such information. If collocations are annotated with lexical functions in a computer readable dictionary, it will allow effective use of collocations in natural language applications including parsers, high quality machine translation, periphrasis system and computer-aided learning of lexica. In order to create such applications, we need to extract lexical functions from corpora automatically. It is our intent to extract Spanish verb-noun collocations belonging to a given lexical function from corpora. To achieve this task, it has been proposed to represent the lexical meaning of a given word with a set of all its hyperonyms and to use machine learning techniques for predicting lexical functions as values of the class variable for unseen collocations. Hyperonyms are extracted from the Spanish WordNet. We evaluate many machine learning algorithms on the training set and on an independent test set. The obtained results show that machine learning is feasible to achieve the task of automatic detection of lexical functions.
Descripción : Doctorado en Ciencias de la Computación
URI : http://www.repositoriodigital.ipn.mx/handle/123456789/7008
Aparece en las colecciones: Doctorado

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
Tesis 12355.pdf3.37 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.