Scielo RSS <![CDATA[Revista signos]]> http://www.scielo.cl/rss.php?pid=0718-093420160001&lang=en vol. 49 num. 90 lang. en <![CDATA[SciELO Logo]]> http://www.scielo.cl/img/en/fbpelogp.gif http://www.scielo.cl <![CDATA[<b><i>Bueno, pues, es que… en fin</i></b>: <b><i>What discourse markers should we teach?</i></b>]]> http://www.scielo.cl/scielo.php?script=sci_arttext&pid=S0718-09342016000100001&lng=en&nrm=iso&tlng=en El objetivo de este trabajo es identificar los marcadores habituales que organizan tanto la conversación coloquial como los discursos formales, ya sean orales o escritos. Para ello, nos basaremos en un análisis de dos corpus de conversaciones y de un corpus de discursos escritos breves. Estos corpus se reducen a la variedad geográfica del español de España y, por tanto, las conclusiones a las que lleguemos son solo el comienzo de una propuesta de investigación futura más amplia. Tras hacer un análisis de frecuencia de aparición de los marcadores localizados en estos tres corpus, revisamos las listas y clasificaciones de marcadores en las gramáticas y diccionarios considerados de referencia para comprobar el escaso o nulo uso de muchos de ellos como sucede, por ejemplo, con los digresores o los comentadores. También el análisis de frecuencia realizado, cruzado con la variable de tipo de discurso, oral/escrito, y de registro, coloquial/formal, arroja algunas conclusiones predecibles, como la preferencia de los estructuradores de la información por los discursos escritos y de los conversacionales por los discursos orales; pero también muestra conclusiones novedosas, como la frecuencia de aparición de los ordenadores de cierre en las conversaciones coloquiales, o de los conversacionales evidenciales en los discursos escritos. Finalmente, es nuestra intención aplicar estudios como el desarrollado en este artículo a la elaboración de listas de marcadores que corroboren y amplíen las diseñadas en los planes curriculares de aprendizaje de español como segunda lengua o como lengua extranjera.<hr/>This paper focuses on the identification of the usual discourse markers that organise both formal and informal interactions, either in oral or written speech. Drawing on two corpora for oral conversations and one corpus for written speech, the material is only based on the geographical variation of the Spanish language as produced in Spain. Therefore, the conclusions to be reached would be only the beginning of a wider research project to be developed further in the near future. After a data-frequency analysis, findings were compared with the ways in which markers are most commonly listed and classified in reference dictionaries and grammar books to confirm the little or no use of many of those markers, such as the digressive or the ‘here-and-now’ markers. In addition, crossing the data-frequency collected with the variables type of speech -oral or written- and register -formal or colloquial- some predictable conclusions could be drawn, i.e., the preference of written speech for discourse organisers or the conversation markers tendency to oral interactions. The analysis also allowed for new conclusions, such as the use of closing markers in colloquial speech or the conversation-evidential markers in written discourses. Finally, we would like to apply analyses like the one collected in this study to obtain a new list of markers to support and extend those already taught for the acquisition of discourse competence in Spanish as a Foreign Language. <![CDATA[<b><i>Strategic functions of metaphor networks on political discourse</i></b>: <b><i>An Hugo Chavez interactional discourse analysis</i></b>]]> http://www.scielo.cl/scielo.php?script=sci_arttext&pid=S0718-09342016000100002&lng=en&nrm=iso&tlng=en Las redes de metáforas cognitivas son un recurso pragmático del discurso de amplia difusión en el ámbito político, como se colige de los estudios de Chumaceiro (2004), Adrián (2009, 2010) y Duarte (2011, 2013). En Duarte (2013) se explican las redes de metáforas en el discurso político, empero, no se discuten los aspectos relacionados con sus funciones estratégicas. Por ello, el propósito de este artículo es describir las funciones de las redes de metáforas cognitivas en torno a la palabra socialismo en el discurso del ex presidente Hugo Chávez. Se eligió un marco teórico mixto integrado por: la lingüística cognitiva (Lakoff & Johnson, 2007) para el reconocimiento inicial de las metáforas simples; por el aporte lingüístico de Halliday y Hasan (1976), McCarthy (1990) y la Lingüística Sistémica Funcional de Halliday (1994), para reconocer las redes de metáforas y sus funciones; y por el Análisis Interaccional del Discurso de Bolívar (2007), para integrar los enfoques cognitivos y lingüísticos en el análisis. El corpus estuvo conformado por cuatro emisiones del programa Aló Presidente del año 2005. Se procedió, primero, con la identificación de las metáforas simples; luego se reconocieron las redes de metáforas; y finalmente, se detectaron las funciones discursivas de las redes. Los resultados permitieron reconocer tres funciones estratégicas, a saber: función representacional; función interpersonal y función metadiscursiva. Se concluye que las tres funciones están presentes de manera concomitante y articulada entre sí, y que están al servicio de los propósitos comunicativos identificables con el emisor.<hr/>Cognitive metaphor networks are a pragmatic discourse resource widely used in the political realm, as inferred from the studies by Chumaceiro (2004), Adrián (2009, 2010) and Duarte (2011, 2013). Duarte (2013) explains metaphor networks in political discourse, but he does not discuss its functions. Therefore, the aim of this article is to describe cognitive metaphor network functions involving the word ‘socialism’ in president Hugo Chavez’s discourse. For this purpose, a mixed theoretical framework was considered. This framework was shaped by (1) cognitive linguistics (Lakoff & Johnson, 2007) in order to facilitate initial metaphor recognition; (2) Halliday & Hasan (1976), McCarthy (1990) and Systemic Functional Linguistics by Halliday (1994) for metaphor networks and function detection; and (3) Interactional Discourse Analysis (Bolívar, 2007) to integrate cognitive and linguistic approaches in the analysis. The corpus consisted of four broadcasts of the television program Aló Presidente in 2005, and the procedure was as follows: simple metaphors were identified initially; then, metaphor networks recognition was carried out. It was possible to identify three functions of networks: representational, interpersonal, and metadiscoursive functions. It is concluded that the three functions are concurrent and coordinated with each other and serve communicative purposes that are identifiable with the speaker. <![CDATA[<b><i>Analysis of written linguistic and discursive competence of first year students in Primary Education Teacher Degree</i></b>]]> http://www.scielo.cl/scielo.php?script=sci_arttext&pid=S0718-09342016000100003&lng=en&nrm=iso&tlng=en Cuando un alumno llega a la universidad, se le supone adquirido un bagaje lingüístico y lectoescritor que le permitirá la elaboración de trabajos escritos empleando un discurso académico adecuado a su nivel. No obstante, numerosas investigaciones reflejan las carencias lingüístico-discursivas del alumnado universitario. En este artículo, tras exponer estos estudios precedentes, los contenidos y competencias lingüísticas del currículo del futuro maestro y las características del discurso académico universitario, se recoge un análisis de muestras de escritura en la prueba de una materia de Lengua española de tres promociones de alumnos de nuevo ingreso en el Grado de Maestro en Educación Primaria de la Universidad de Granada (España) con el objetivo de detectar y clasificar estas carencias. Los resultados de esta investigación de metodología empírico-analítica descriptiva reflejan el mejor rendimiento de las mujeres en la asignatura que se evalúa, así como del alumnado de origen europeo, pero, principalmente, todos muestran debilidades en su expresión escrita -errores fonológicos, morfológicos, sintácticos, léxico-semánticos, ortográficos y del discurso-, errores propios de etapas educativas anteriores, sobre todo los de tipo gramatical, fruto del bajo dominio de las convenciones textuales y lingüísticas. Se concluye en la necesidad de ofrecer soluciones interdisciplinares desde la propia institución y se plantean algunas propuestas generales de prácticas discursivas escritas integradas en la formación de estos futuros docentes.<hr/>When students start university, they are supposed to have already acquired a linguistic and literacy background that will allow them to write texts using an academic discourse appropriate to their level. However, most research focuses on the lack of linguistic-discourse competence in university students. After exposing these previous studies, the contents and language skills included in the curriculum of future teachers and the characteristics of university academic discourse, this paper covers an analysis of some writing samples in the tests of Spanish of three groups of first year students in the Degree in Primary Education Teacher Program from the University of Granada (Spain) in order to detect and classify these deficiencies. Results of this empirical-analytical descriptive study show that women, as well as students from Europe, perform better in the subject being evaluated, but most of them have problems in their writing (i.e., phonological, morphological, syntactic, lexical-semantic, spelling and discourse errors), which are specific to previous educational stages, especially those of grammatical type, caused by their limited knowledge about textual and linguistic conventions. Conclusions focus on the need of interdisciplinary solutions from the institution itself. Some general proposals of written discursive practices integrated into the training of these future teachers are raised. <![CDATA[<b>Communication strategies used by different level L2 English learners in oral interaction</b>]]> http://www.scielo.cl/scielo.php?script=sci_arttext&pid=S0718-09342016000100004&lng=en&nrm=iso&tlng=en This study aims to examine the different communication strategies (CSs) EFL learners employ when communicating orally, and determine the relationship between the learners’ proficiency level and their CS use. Spoken data from three conversations held by Spanish learners of English of different levels were analysed in order to determine the type of CSs they used when interacting with a native speaker (NS) in an informal environment outside the classroom. The identification of the CSs was carried out following Dörnyei and Körmos’ taxonomy (1998). Overall results show that there is an association between the learners’ proficiency level and their CS usage. Results from a detailed analysis confirmed this relationship and revealed that the learners’ linguistic competence is not only related to the frequency of the CSs used but mostly to the type of CS.<hr/>El objetivo de este estudio fue analizar las diferentes estrategias de comunicación (EsC) que utilizan aprendices de inglés como L2 al comunicarse oralmente, y determinar la relación entre la competencia lingüística de estos estudiantes y el uso de las EsC. Se analizó un corpus oral obtenido de tres conversaciones entre estudiantes de inglés de distintos niveles de competencia con el propósito de descubrir el tipo de EsC que éstos utilizan al interactuar con un hablante nativo en un ambiente informal fuera del aula. La identificación de las EsC utilizadas se realizó mediante la taxonomía propuesta por Dörnyei y Körmos (1998). Desde un punto de vista general los resultados muestran que existe una asociación entre el nivel de competencia lingüística de los estudiantes y las EsC que éstos utilizan. Esto fue corroborado mediante un análisis más detallado de los datos que demostró una relación no sólo entre el nivel de competencia y la frecuencia de uso de las EsC sino principalmente con el tipo de estrategias utilizadas por cada nivel. <![CDATA[<b><i>A bigram corpus used as a grammar checker for Spanish native speakers</i></b>]]> http://www.scielo.cl/scielo.php?script=sci_arttext&pid=S0718-09342016000100005&lng=en&nrm=iso&tlng=en Este artículo describe el funcionamiento de un algoritmo de corrección ortográfica y gramatical para textos escritos en español, destinado a hablantes nativos competentes que realizan labores de corrección de textos. Los posibles errores se identifican por medio de análisis estadísticos (en vez de emplear el sistema de ‘etiquetado’ y análisis sintáctico que utiliza la mayor parte de correctores), comparando las combinaciones de palabras utilizadas con un corpus de referencia de cien millones de vocablos. De esa manera, se señalan los pares de palabras (bigramas) poco o muy poco frecuentes, y que, en muchas ocasiones, lo son porque contienen algún error. La limitación fundamental es que no se detectan errores que no puedan ser deducidos del análisis de palabras adyacentes. Pero, como hemos comprobado aquí en el análisis de diferentes textos, el algoritmo es capaz de localizar errores que otros correctores no identifican.<hr/>This paper describes the performance of an algorithm of spelling and grammar checker for texts written in Spanish by proficient native speakers during proof-reading. Possible mistakes are not detected by tagging and parsing but by statistical analysis, comparing combinations of two words used in the text to a hundred-million-word corpus. Those pairs of words (bigrams) which do not occur or which are suspiciously infrequent in the corpus are highlighted; and such pairs often contain errors. The main limitation is that mistakes that arise from non-adjacent words are not detected. Nevertheless, as we have seen in this study with some different texts, the algorithm detects many errors that other grammar checkers are not able to identify. <![CDATA[<b>Open Information Extraction from real Internet texts in Spanish using constraints over part-of-speech sequences</b>: <b>Problems of the method, their causes, and ways for improvement</b>]]> http://www.scielo.cl/scielo.php?script=sci_arttext&pid=S0718-09342016000100006&lng=en&nrm=iso&tlng=en Usually we do not know the domain of an arbitrary text from the Internet, or the semantics of the relations it conveys. While humans identify such information easily, for a computer this task is far from straightforward. The task of detecting relations of arbitrary semantic type in texts is known as Open Information Extraction (Open IE). The approach to this task based on heuristic constraints over part-of-speech sequences has been shown to achieve high performance with lower computational and implementation cost. Recently, this approach has gained spread and popularity. However, Open IE is prone to certain errors that have not yet been analyzed in the literature. Detailed analysis of the errors and their causes will allow for faster and more focused improvement of the methods for Open IE based on this approach. In this paper, we analyze and classify the main types of errors in relation extraction that are specific to Open IE based on heuristic constraints over part-of-speech sequences. We identify the causes of the errors of each type and suggest ways for preventing such errors with corresponding analysis of their cost and scale of impact. The analysis is performed for extractions from two Spanish-language text datasets: the FactSpaCIC dataset of grammatically correct and verified sentences and the RawWeb dataset of unedited text fragments from the Internet. Extraction is performed by the ExtrHech system.<hr/>Usualmente, el dominio de un texto arbitrario en Internet se desconoce, así como la semántica de las relaciones que transmite. Mientras que los humanos identifican fácilmente esta información, para una máquina esta tarea está lejos de ser sencilla. La tarea de detectar las relaciones semánticamente arbitrarias en el texto, se conoce como extracción abierta de información (Open Information Extraction). El método para esta tarea basado en reglas heurísticas sobre secuencias de etiquetas de categorías gramaticales de palabras ha demostrado un alto rendimiento con un bajo costo computacional. A pesar de la amplia popularidad de tal enfoque, es propenso a ciertos errores son específicos de este enfoque. Tales errores no han sido analizados en la literatura. En este trabajo, analizamos y clasificamos los principales tipos de errores en la extracción de información. Estos son específicos para el enfoque basado en reglas heurísticas sobre secuencias de etiquetas de categorías gramaticales de palabras. También identificamos las causas para cada tipo de error y sugerimos posibles soluciones, con un correspondiente análisis de su costo y la magnitud del impacto. Hemos realizado el análisis de extracciones a partir de dos conjuntos de textos en español: FactSpaCIC, un conjunto de oraciones gramaticalmente correctas y verificadas, y RawWeb, un conjunto de fragmentos de texto procedentes de Internet sin corrección alguna. La extracción se llevó a cabo con el sistema ExtrHech.