Por favor, use este identificador para citar o enlazar este ítem:
http://repositoriodigital.ipn.mx/handle/123456789/16604
Título : | Automatic Readability Classification of Crowd-Sourced Data based on Linguistic and Information-Theoretic Features |
Otros títulos : | Clasificación automática de la legibilidad de datos de fuentes múltiples basada en características lingüísticas y de la teoría de información |
Autor : | Islam, Zahurul Mehler, Alexander |
Palabras clave : | Keywords. Text readability, Wikipedia, enthropy, information transmission, evaluation of features |
Fecha de publicación : | 7-jun-2013 |
Editorial : | Revista Computación y Sistemas; Vol. 17 No.2 |
Citación : | Revista Computación y Sistemas; Vol. 17 No.2 |
Citación : | Revista Computación y Sistemas;Vol. 17 No.2 |
Resumen : | This paper presents a classifier of text readability based on information-theoretic features. The classifier was developed based on a linguistic approach to readability that explores lexical, syntactic and semantic features. For this evaluation we extracted a corpus of 645 articles from Wikipedia together with their quality judgments. We show that information-theoretic features perform as well as their linguistic counterparts even if we explore several linguistic levels at once. |
URI : | http://www.repositoriodigital.ipn.mx/handle/123456789/16604 |
ISSN : | 1405-5546 |
Aparece en las colecciones: | Revistas |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
113_ART 1.pdf | 472.24 kB | Adobe PDF | Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.