SciELO - Scientific Electronic Library Online

 
vol.44 número77Aproximación empírica a los modos de acción del verbo: Un estudio basado en corpusRepresentación socio-discursiva de los actores implicados en el ataque a una joven ecuatoriana en un tren de cercanías de Barcelona: Estudio de caso índice de autoresíndice de assuntospesquisa de artigos
Home Pagelista alfabética de periódicos  

Serviços Personalizados

Journal

Artigo

Indicadores

Links relacionados

Compartilhar


Revista signos

versão On-line ISSN 0718-0934

Resumo

MENDOZA, Marcelo; ORTIZ, Ivette  e  ROJAS, Víctor. Categorización de texto en bases documentales a partir de modelos computacionales livianos. Rev. signos [online]. 2011, vol.44, n.77, pp.251-274. ISSN 0718-0934.  http://dx.doi.org/10.4067/S0718-09342011000300004.

En este trabajo se presenta un nuevo categorizador de texto para bases de datos documentales. El categorizador propuesto corresponde a una extensión del categorizador Naive Bayes que permite obtener buenos resultados en bases documentales con desbalance en datos de entrenamiento. Resultados experimentales permiten afirmar que el categorizador supera a Naive Bayes y se compara favorablemente con otras técnicas más sofisticadas como máquinas de soporte vectorial y regresión logística sin incurrir en costos computacionales significativos en la fase de entrenamiento.

Palavras-chave : Categorización de texto; modelos Bayesianos; recuperación de información.

        · resumo em Inglês     · texto em Espanhol     · Espanhol ( pdf )

 

Creative Commons License Todo o conteúdo deste periódico, exceto onde está identificado, está licenciado sob uma Licença Creative Commons