SciELO - Scientific Electronic Library Online

 
vol.44 issue77An empirical approach to Aktionsart: A corpus-based studySocio-discursive representation of the actors involved in the attack against a young Ecuadorian girl on a suburban train in Barcelona: A case study author indexsubject indexsearch form
Home Pagealphabetic serial listing  

Revista signos

version ISSN 0718-0934

Abstract

MENDOZA, Marcelo; ORTIZ, Ivette  and  ROJAS, Víctor. Categorización de texto en bases documentales a partir de modelos computacionales livianos. Rev. signos [online]. 2011, vol.44, n.77, pp. 251-274. ISSN 0718-0934.  doi: 10.4067/S0718-09342011000300004.

En este trabajo se presenta un nuevo categorizador de texto para bases de datos documentales. El categorizador propuesto corresponde a una extensión del categorizador Naive Bayes que permite obtener buenos resultados en bases documentales con desbalance en datos de entrenamiento. Resultados experimentales permiten afirmar que el categorizador supera a Naive Bayes y se compara favorablemente con otras técnicas más sofisticadas como máquinas de soporte vectorial y regresión logística sin incurrir en costos computacionales significativos en la fase de entrenamiento.

Keywords : Categorización de texto; modelos Bayesianos; recuperación de información.

        · abstract in English     · text in Spanish     · pdf in Spanish