SciELO - Scientific Electronic Library Online

 
vol.44 número77Aproximación empírica a los modos de acción del verbo: Un estudio basado en corpusRepresentación socio-discursiva de los actores implicados en el ataque a una joven ecuatoriana en un tren de cercanías de Barcelona: Estudio de caso índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

Compartir


Revista signos

versión On-line ISSN 0718-0934

Resumen

MENDOZA, Marcelo; ORTIZ, Ivette  y  ROJAS, Víctor. Text categorization in documentary databases using light computational models. Rev. signos [online]. 2011, vol.44, n.77, pp.251-274. ISSN 0718-0934.  http://dx.doi.org/10.4067/S0718-09342011000300004.

We introduce a new text categorization method for documentary databases. The proposed method is an extension of the Naive Bayes text categorization model which allows obtaining good performance results in documentary databases with unbalanced training data. Experimental results allow us to conclude that the categorization method overcomes Naïve Bayes and compares favorably with more sophisticated categorization methods such as support vector machines and logistic regression without increasing the use of computational resources in the training phase.

Palabras clave : Text categorization; Bayesian models; information retrieval.

        · resumen en Español     · texto en Español     · Español ( pdf )

 

Creative Commons License Todo el contenido de esta revista, excepto dónde está identificado, está bajo una Licencia Creative Commons