Servicios Personalizados
Revista
Articulo
Indicadores
Citado por SciELO
Accesos
Links relacionados
Citado por Google
Similares en SciELO
Similares en Google
Compartir
Revista signos
versión On-line ISSN 0718-0934
Resumen
MOLINA SALINAS, Claudio y SIERRA MARTINEZ, Gerardo. Hacia una normalización de la frecuencia de los corpus CREA y CORDE. Rev. signos [online]. 2015, vol.48, n.89, pp.307-331. ISSN 0718-0934. http://dx.doi.org/10.4067/S0718-09342015000300002.
El Corpus Diacrónico del Español (CORDE) y el Corpus de Referencia del Español Actual (CREA) integran uno de los bancos de datos documentales más grande del español y son usados por especialistas en el estudio de la lengua española. Este recurso presenta algunas limitaciones en términos de tamaño, unidad de muestra y representatividad, que condicionan sus resultados y, por tanto, las descripciones de cualquier fenómeno lingüístico estudiado. En el presente trabajo identificamos estas limitaciones y proponemos un método de normalización de frecuencias de documento, por medio del cálculo de medias móviles. Esto permite una interpretación más realista de la lengua española, a través de los datos del corpus, y un aprovechamiento más efectivo del propio recurso.
Palabras clave : Lingüística de corpus; estadística de corpus; normalización de frecuencias de corpus; lingüística cuantitativa; corpus CORDE y CREA.