SciELO - Scientific Electronic Library Online

 
vol.49 número90Communication strategies used by different level L2 English learners in oral interactionExtracción abierta de información a partir de textos de Internet en español utilizando reglas sobre categorías de palabras en secuencias: Problemas del método, sus causas y posibles mejoras índice de autoresíndice de assuntospesquisa de artigos
Home Pagelista alfabética de periódicos  

Serviços Personalizados

Journal

Artigo

Indicadores

Links relacionados

  • Em processo de indexaçãoCitado por Google
  • Não possue artigos similaresSimilares em SciELO
  • Em processo de indexaçãoSimilares em Google

Compartilhar


Revista signos

versão On-line ISSN 0718-0934

Resumo

SAN MATEO, Alicia. Un corpus de bigramas utilizado como corrector ortográfico y gramatical destinado a hablantes nativos de español. Rev. signos [online]. 2016, vol.49, n.90, pp.94-118. ISSN 0718-0934.  http://dx.doi.org/10.4067/S0718-09342016000100005.

Este artículo describe el funcionamiento de un algoritmo de corrección ortográfica y gramatical para textos escritos en español, destinado a hablantes nativos competentes que realizan labores de corrección de textos. Los posibles errores se identifican por medio de análisis estadísticos (en vez de emplear el sistema de ‘etiquetado’ y análisis sintáctico que utiliza la mayor parte de correctores), comparando las combinaciones de palabras utilizadas con un corpus de referencia de cien millones de vocablos. De esa manera, se señalan los pares de palabras (bigramas) poco o muy poco frecuentes, y que, en muchas ocasiones, lo son porque contienen algún error. La limitación fundamental es que no se detectan errores que no puedan ser deducidos del análisis de palabras adyacentes. Pero, como hemos comprobado aquí en el análisis de diferentes textos, el algoritmo es capaz de localizar errores que otros correctores no identifican.

Palavras-chave : Bigramas; corrección de textos; corrector gramatical; detección de errores; pares de palabras.

        · resumo em Inglês     · texto em Espanhol     · Espanhol ( pdf )

 

Creative Commons License Todo o conteúdo deste periódico, exceto onde está identificado, está licenciado sob uma Licença Creative Commons