SciELO - Scientific Electronic Library Online

 
vol.44 número77Aproximación empírica a los modos de acción del verbo: Un estudio basado en corpusRepresentación socio-discursiva de los actores implicados en el ataque a una joven ecuatoriana en un tren de cercanías de Barcelona: Estudio de caso índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

Compartir


Revista signos

versión On-line ISSN 0718-0934

Resumen

MENDOZA, Marcelo; ORTIZ, Ivette  y  ROJAS, Víctor. Categorización de texto en bases documentales a partir de modelos computacionales livianos. Rev. signos [online]. 2011, vol.44, n.77, pp.251-274. ISSN 0718-0934.  http://dx.doi.org/10.4067/S0718-09342011000300004.

En este trabajo se presenta un nuevo categorizador de texto para bases de datos documentales. El categorizador propuesto corresponde a una extensión del categorizador Naive Bayes que permite obtener buenos resultados en bases documentales con desbalance en datos de entrenamiento. Resultados experimentales permiten afirmar que el categorizador supera a Naive Bayes y se compara favorablemente con otras técnicas más sofisticadas como máquinas de soporte vectorial y regresión logística sin incurrir en costos computacionales significativos en la fase de entrenamiento.

Palabras clave : Categorización de texto; modelos Bayesianos; recuperación de información.

        · resumen en Inglés     · texto en Español     · Español ( pdf )

 

Creative Commons License Todo el contenido de esta revista, excepto dónde está identificado, está bajo una Licencia Creative Commons