Por favor, use este identificador para citar o enlazar este ítem: http://repositoriodigital.ipn.mx/handle/123456789/16604
Título : Automatic Readability Classification of Crowd-Sourced Data based on Linguistic and Information-Theoretic Features
Otros títulos : Clasificación automática de la legibilidad de datos de fuentes múltiples basada en características lingüísticas y de la teoría de información
Autor : Islam, Zahurul
Mehler, Alexander
Palabras clave : Keywords. Text readability, Wikipedia, enthropy, information transmission, evaluation of features
Fecha de publicación : 7-jun-2013
Editorial : Revista Computación y Sistemas; Vol. 17 No.2
Citación : Revista Computación y Sistemas; Vol. 17 No.2
Citación : Revista Computación y Sistemas;Vol. 17 No.2
Resumen : This paper presents a classifier of text readability based on information-theoretic features. The classifier was developed based on a linguistic approach to readability that explores lexical, syntactic and semantic features. For this evaluation we extracted a corpus of 645 articles from Wikipedia together with their quality judgments. We show that information-theoretic features perform as well as their linguistic counterparts even if we explore several linguistic levels at once.
URI : http://www.repositoriodigital.ipn.mx/handle/123456789/16604
ISSN : 1405-5546
Aparece en las colecciones: Revistas

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
113_ART 1.pdf472.24 kBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.