You are on page 1of 30

A

rtculos
LA TRANSCRIPCIN DE LA LENGUA HABLADA: EL SISTEMA DEL GRUPO VAL.ES.CO
ANTONIO BRIZ Y GRUPO VAL.ES.CO1
Universitat de Valncia / Universitat dAlacant

1. INTRODUCCIN Elaborar un corpus constituye un trabajo arduo y complejo. Las labores de recopilacin, transcripcin y almacenaje van inevitablemente unidas a lo que se entiende por un corpus lingstico, corpus que, adems, debe reunir una serie de condiciones, como el hecho de ser homogneo (pues todas las muestras han de cumplir un conjunto de requisitos preestablecidos), representativo del estado de habla recogido, de fcil acceso (a travs de mtodos informticos adecuados) y, ante todo, til (Snchez et alii 1995; Alvar Ezquerra et alii 1994; McEnery y Wilson 1996; Azorn y Jimnez Ruiz 1997; Caravedo 1999). Los corpus han evolucionado mucho en los ltimos tiempos y estas exigencias se tienen en cuenta en su construccin. Los primeros referidos al espaol hunden sus races en la dialectologa social y en la lingstica aplicada. Es el caso del PILEI (Programa Interamericano de Lingstica y Enseanza de Idiomas), con su corpus Proyecto de estudio coordinado de la nor1 Los miembros del grupo Val.Es.Co que han participado como autores de este artculo son: Antonio Briz, Marta Albelda, Antonio Hidalgo, Xose Padilla, Salvador Pons, Leonor Ruiz Gurillo y Julia Sanmartn. Este artculo ha sido posible gracias a la ayuda concedida por el Ministerio de Ciencia y Tecnologa (BFF 2000/ 1438), para la elaboracin de un diccionario de partculas, diccionario que exige el apoyo de un corpus textual de referencia y de muestras de habla reales.

ma lingstica culta de las principales ciudades de Iberoamrica y Espaa, iniciado en 1968, que se recoga en cinta magnetofnica y se transcriba de manera ortogrfica. Una vez recogido un nmero considerable de datos, se publicaba un volumen en papel con los resultados. De esa construccin artesanal se ha pasado al empleo actual de programas informticos que procesan, contabilizan datos y conectan el texto transcrito con macros que harn ms fcil la seleccin posterior de las muestras. En este sentido, disponemos de un sistema internacionalmente aceptado, las normas TEI (Text Encoding Initiative), que permite etiquetar muestras muy amplias a partir de unos criterios establecidos y que ha sido utilizado en la transcripcin de numerosos corpus actuales. A pesar de la existencia de este sistema internacional, se constata que los materiales recogidos en los corpus se ajustan a pautas muy diversas de transcripcin que responden, principalmente, a la concepcin del mismo (tanto a los objetivos con los que ha sido diseado como al tipo de material recogido). As por ejemplo, Llisterri (1996), en el marco de los corpus orales, diferencia tres tipos: el primero, los inventarios fonticos y fonolgicos; el segundo, los corpus orales para el desarrollo de las aplicaciones tecnolgicas; y, el tercero, lo que se conoce tradicionalmente como corpus de lengua hablada. Cada una de estas tres perspecti57
Espaol Actual, 77/2002.

Espaol actuaL
vas de estudio condiciona la muestra de habla recogida, su mbito (por ejemplo, el dilogo o el enunciado), la grabacin (entorno natural o controlado) y, por supuesto, el tipo de transcripcin. Es ms, esta disparidad de objetivos, intereses y forma de transcripcin afecta tambin a esa tercera orientacin, a ese corpus de lengua hablada, que, en ningn caso, se puede considerar como una entidad homognea, ya que, como despus expondremos, conviven unas propuestas que aceptan como muestras de habla representativas, entre otras, la entrevista con una encuesta semidirigida, con otras que optan por la grabacin de una conversacin espontnea; unas se centran en la recogida de discursos coloquiales, otras optan por la recogida de muestra de habla patolgica. Justamente, el propsito de este artculo se centra en el anlisis y comentario de uno de los sistemas de transcripcin de este tipo de corpus, el empleado por el grupo de investigacin Val.Es.Co. en la transliteracin de conversaciones coloquiales. Dicho anlisis se inicia con una breve descripcin de otros sistemas de transcripcin de corpus de lengua hablada del espaol, anteriores desde el punto de vista cronolgico, con el objeto de explicar los motivos que nos han llevado a proponer un sistema de transcripcin diferente. Dejaremos sin analizar aquellos otros sistemas que puedan aparecer en los corpus de carcter fontico o los asociados a las tecnologas del habla. 2. LOS SISTEMAS DE TRANSCRIPCIN DE LOS
CORPUS ORALES DEL ESPAOL

pginas nos restringiremos a la exposicin de tres formas de representar un texto oral3. Nos interesa analizar qu se representa o transcribe y cmo se lleva a cabo la codificacin de lo representado.

2.1. Transliteracin o adaptacin ortogrfica Como muestra de una mera transliteracin ortogrfica4 podemos citar el Macro-corpus de la norma lingstica culta de las principales ciudades del mundo hispnico (MC-NLCH), coordinado por Jos Antonio Samper Padilla, Clara Eugenia Hernndez Cabrera y Magnolia Troya Deniz, prolongacin del corpus recogido por el PILEI. Pretenden ofrecer una transliteracin (o transcripcin ortogrfica) de 84 horas de grabacin, donde se hallan representados 168 hablantes del nivel culto de 12 ciudades hispnicas (9 son capitales americanas; las ciudades de Madrid, Sevilla y Las Palmas de Gran Canaria representan el habla culta espaola). El eje vertebrador lo constituyen las entrevistas libres con intervencin del encuestador, presentes en las muestras obtenidas en todas las ciudades. Asimismo, se registran elocuciones formales, dilogos entre dos informantes y grabaciones secretas, si bien no se dispone de esta clase de muestras en todas las ciudades5. He aqu un breve fragmento procedente de la ciudad de Madrid como muestra:
3 Algunos de los datos que se ofrecen a continuacin se hallan reflejados, entre otros trabajos, en los de Alvar Ezquerra y Villena (coords.) (1994), Briz (coord.) (Grupo Val.Es.Co.) (1995), Arrate y Llisterri (1996), Samper Padilla (1996), Lpez Morales (1997), De Kock (ed.) (2001) y Llisterri: http://liceu.uab.es. 4 Otros corpus que emplean un sistema de transliteracin ortogrfica son:

Los corpus orales pretenden recoger en soporte magntico una gran cantidad de datos que, por lo general, se adaptan transliterndolos (mera adaptacin ortogrfica) o transcribindolos (adaptacin fontica, morfolgica, sintctica, discursiva)2. A juicio de Payrat (1995), se observan diversas intersecciones que hacen difcil la clasificacin de la transcripcin en funcin de corrientes y escuelas. En estas
2 Cabe tener presente que la adaptacin de un texto oral siempre pone en entredicho la objetividad de la muestra, dado que constreir la oralidad a los moldes de lo escrito supone cierta interpretacin. Vase, en este sentido, Lpez Morales (1997). Otros autores, como Blanche-Benveniste y Jeanjean (1987), tambin aducen que la mera puntuacin en la transcripcin ortogrfica de un texto oral implica un anlisis gramatical del mismo.

-El constituido por las encuestas del Atlas Lingstico y Etnogrfico de Castilla-La Mancha, dirigido por Pilar Garca Mouton y Francisco Moreno Fernndez. Cuida la variacin diafsica, utilizando en las encuestas el cambio de entrevistador y la circunstancia comunicativa. -El proyecto ACUAH (Anlisis de la conversacin/Universidad de Alcal de Henares), dirigido por Francisco Moreno, ocupa unos 800 minutos de grabacin. La transliteracin es ortogrfica, aunque aparecen ciertas convenciones referentes a la estructura de la conversacin. Recoge en total 18 conversaciones, realizadas de acuerdo con la estructura de la conversacin semidirigida, en un primer momento, que se desarrolla de forma ms espontnea en la segunda parte de la conversacin, gracias a la intervencin de un nuevo participante.
5 Ms datos sobre el corpus MC-NLCH, en Samper Padilla et alii (1998).

58

La transcripcin de la lengua hablada: El sistema del grupo VaL.es.cO


MA-1. Hombre de 25 aos. Estudiante de Ingeniera Enc.- Me puedes hablar un poco de tus estudios? Inf.- Pues s, que estudio tercero actualmente de ingeniero tcnico de Obras Pblicas, como se ha venido llamando, pero que actualmente no sabemos cmo... cmo lo llamamos. Termino este ao, si es que se aclara esta situacin, ya que actualmente estamos en huelga pendientes de unas reuniones de todos los colegios de las... escuelas tcnicas y de arquitectos tcnicos. Enc.- Me puedes hablar de lo que piensas hacer en el futuro con tu carrera? Inf.- Eso actualmente no lo puedo, no lo puedo sealar. Creo que depende de muchsimos factores. Mi intencin es trabajar en Espaa, pero si existen... grandes dificultades para ello pues... procurar buscar otros horizontes; tambin mi intencin es hacer el acceso a la escuela superior como es Caminos en este caso. Para ello, pues necesito encontrar un trabajo apropiado para... para realizar este acceso, al mismo tiempo que me permita una situacin econmica desahogada, no? Entonces pues... mi trabajo pues es relacionado con Obras Pblicas, pero al mismo tiempo puede desarrollarse tambin en una empresa privada, no solamente pblica, ya que existen varias empresas en Espaa hoy da que se dedican a obras pblicas privadamente. (Esgueva y Cantarero 1981: 87)

En cualquier caso, los signos ortogrficos convencionales son de gran utilidad por dos razones: en primer lugar, porque el usuario del sistema de transcripcin ya est familiarizado con estos signos y, por lo tanto, su descodificacin no presenta ningn problema. En este sentido, son casi universales y motivados; en segundo lugar, estos signos se integran en el propio proceso de lectura y representacin de la muestra de habla. En ningn caso suponen un doble proceso de codificacin, una lectura horizontal con dos niveles: lo representado y su marca. No cabe duda de que usar los recursos ortogrficos y tipolgicos (como los tipos de letra o tamao) no perturba tanto la lectura como emplear una marca distinta en el propio texto, que en muchos casos no se sabe si es texto o metalenguaje codificado, como despus sealaremos. 2.2. Etiquetaje y codificacin diferencial de lo representado La lingstica de corpus elaborada en Espaa suele utilizar normas estandarizadas6 en sus transcripciones con el fin de facilitar el tratamiento automatizado, la difusin y el anlisis de los datos. Estos corpus disponen de unas etiquetas que reflejan tanto datos externos a la muestra fecha, texto oral o escrito, transcriptor como internos nfasis, tono, risas, ruido, ftico, vacilacin. En los datos internos se integran aspectos lingsticos y no lingsticos. Valgan como ejemplos de este
6 Como nos informa Snchez Len (2001:374, nota 3) la TEI (Text Encoding Initiative) es un proyecto internacional que pretende definir un conjunto de normas y recomendaciones para la preparacin y el intercambio de textos electrnicos para la investigacin acadmica, y, al propio tiempo, para permitir una amplia variedad de usos por parte de las industrias de la lengua. Por su parte el CES (Corpus Encoding Standard) es una propuesta para la puesta en prctica de las recomendaciones de la TEI que intenta resolver algunas de las limitaciones observadas en estas recomendaciones y que incluye un modelo de datos distribuido que separa el corpus mismo del aparato notacional desarrollado para su anlisis. Adems de los corpus ejemplificados en este texto, los cuatro proyectos siguientes tambin emplean este tipo de codificacin, si bien no siempre coinciden en el empleo de todas las marcas:

Como se puede observar en este corpus se opta por la transliteracin ortogrfica, dados los objetivos del proyecto y el gnero discursivo obtenido, bsicamente la entrevista, que no presenta los problemas de transcripcin de ciertas singularidades de la conversacin (por ejemplo, las escisiones, el habla simultnea, etc.). La transliteracin ortogrfica convencional puede representar fenmenos lingsticos y prosdicos como la pausa (con signos de puntuacin), cierta entonacin y nfasis (signos de exclamacin, interrogacin o puntos suspendidos), alargamientos voclicos, etc. Sin embargo, este tipo de transliteracin no atiende a otros rasgos prosdicos vinculados a la lengua hablada, como pueden ser los tonemas ascendentes o descendentes. Por supuesto, para aquellos que pretendan caracterizar desde el punto de vista fontico la muestra de habla, este sistema se revela insuficiente, al necesitar, como es obvio, una transcripcin fontica. Del mismo modo lo es para aquellos cuyo objetivo sean los fenmenos conversacionales citados anteriormente.
59

- El proyecto PRESEEA (Proyecto de estudio sociolingstico del espaol y del espaol de Amrica) ha sido coordinado por Francisco Moreno Fernndez y Carmen Silva Corvaln. Se preocupa por representar diferentes estilos discursivos y variables sociolingsticas: edad, sexo, nivel sociocultural y modo de vida, y emplea como mtodo las entrevistas (de carcter semidirigido). El sistema de transliteracin es esencialmente ortogrfico, aunque emplea etiquetas textuales basadas en las normas TEI. Se ofrecen

Espaol actuaL
tipo de codificacin dos corpus muy distintos por sus objetivos: -El corpus Alcore (Alicante, Corpus oral del espaol) est dirigido por Dolores Azorn Fernndez y Juan Luis Jimnez Ruiz. Su objetivo consiste en obtener datos reales sobre el comportamiento lingstico alicantino en su dimensin oral, por lo que su principal objetivo es la construccin de un gran archivo oral, donde queden reflejadas las peculiaridades de los distintos grupos de hablantes de la ciudad de Alicante (Azorn y Jimnez Ruiz 1997: 15). Hasta la fecha se ha publicado parte del corpus sociolingstico [Azorn (coord.) 2002] y el Corpus oral de la variedad juvenil universitaria del espaol hablado en Alicante (Azorn y Jimnez Ruiz 1997) En l se ha empleado como mtodo de recoleccin de los datos la entrevista-coloquio con guin conversacional, donde acta un investigador participante. Las grabaciones son de carcter no secreto y el sistema de transcripcin sigue las normas TEI . Integra 13 entrevistas-coloquio en grupo, organizadas por licenciaturas, que recogen en total 800 minutos de grabacin y 63 informantes con edades comprendidas entre los 18 y los 24 aos, elegidas al azar de entre las distintas especialidades universitarias del campus. He aqu una breve muestra del sistema de transcripcin:
<GRUPO G 2: TRABAJO SOCIAL> <cinta 001> <estreo> <duracin 68 minutos> <idioma = espaol> <texto = oral> <corpus = COVJA> <octubre de 1996> <localizacin = Alicante> <E1 = Hombre, 19 aos, estudiante, filologa> <E2 = Mujer, 19 aos, estudiante, filologa> <H1 = Mujer, 19 aos, estudiante, trabajo social> <H2 = Mujer, 19 aos, estudiante, trabajo social> <H3 = Mujer, 18 aos, estudiante, trabajo social> <H4 = Hombre, 23 aos, estudiante, trabajo social> <temas = datos sociobiogrficos: 1-423; existencia de clases sociales: 424-441; funcin del trabajador social: 442-460; clases sociales: 461-497; violencia en la sociedad actual y panorama poltico actual: 498-519> <texto> 1 <H1>: Estudio <nombre propio> Trabajo social </nombre propio>... y bueno... no ha sido siempre la carrera que (-->)... <sic> de mi vida, que siempre he soa<(d)>o, pero ahora estoy en ella y me gusta mucho. Tengo dos hermanos (-->)... y (-->)... 2 <E2>: Y (-->)... bueno, hblanos de tus padres y todo eso, con quin te llevas mejor? 3 <H1>: Con mi madre, mejor que con mi padre. Y de los hermanos con el pequeo. 4 <E2>: Pasis mucho tiempo juntos (-->)..., hacis cosas juntos... o (-->)... o va cada uno por libre y todo eso...?
19% es de procedencia oral, unas 460.000 palabras. Se encuentra en disquette y en soporte ptico (CD-Rom) en formato ASCII y TEI . En l se integra la Base de datos sintcticos del espaol actual (BDS), iniciada en 1987 y concluida en 2001. Ofrece el anlisis manual de cerca de 160.000 clusulas contenidas en la parte contempornea del ARTHUS, a partir de principios constitutivos y funcionalistas. Este subcorpus est constituido por cerca de milln y medio de palabras tomadas de textos hispnicos (espaoles y americanos) de narrativa, ensayo, prensa y teatro, publicados entre 1980 y 1990, as como por transcripciones de lengua oral de la misma poca. La BDS se encuentra disponible en http: //www.bds.usc.es/consultas. -El proyecto VUM (Vernculo Urbano Malagueo), que se empez a gestar en 1988, est dirigido por Andrs Villena Ponsoda. Se integra dentro del proyecto NERC (Network for European Reference Corpora). Atiende a las variaciones diastrticas y diafsicas. Prev disponer de 5.000.000 de palabras. Cuenta con 220 horas de grabacin que recogen 127 entrevistas en las que intervienen 235 sujetos. Se han transliterado y etiquetado 30 horas, correspondientes a 53 entrevistas. Al margen de las entrevistas, se diferencian otros tres tipos de textos orales: conversacional (dilogo-discusin informal), discusiones-dilogos (organizados) y exposicin oral individual (Alvar Ezquerra et alii 1994).

muestras de lengua hablada que pueden consultarse libremente en http://preseea.cervantes1.org. Hay ms datos en Moreno Fernndez (1995) y (1997a, b, c) y Moreno et alii (2000). -El Corpus oral de referencia del espaol contemporneo , dirigido por Francisco Marcos Marn, y concluido en febrero de 1992. Cuenta con una base de datos textual de alrededor de 1.100.000 de palabras. Se refiere nicamente a la variedad central peninsular. No posee estratificacin; no obstante, seala la lengua utilizada en diferentes contextos comunicativos por diversos hablantes, pues se integra en un conjunto no divisible. Recoge textos de diversos tipos, ordenados por temas. La transliteracin es ortogrfica, no hay transcripcin, aunque se acompaa, en la versin de Internet, de TACT, programa de recuperacin de la informacin contenida en archivos textuales. Se encuentra en cinta y en disquetes en formato ASCII (American Standard Code for International Interchange). Tambin es accesible por medio de la red informtica, empleando los comandos FTP:lola.lllf.uam.es. Puede encontrarse ms informacin en Marcos Marn (1991 a,b,c) y (1994); Marcos et alii (1993) y Lavacchi (2001). -El proyecto ARTHUS (Archivo de textos hispnicos de la Universidad de Santiago de Compostela), cuyos directores son Guillermo Rojo y Emilio Montero, posee materiales escritos y orales. El

60

La transcripcin de la lengua hablada: El sistema del grupo VaL.es.cO


5 <H1>: Hombre, hay de todo, o sea, hay cosas que se hacen juntos y cosas separados. 6 <E2>: Y en qu pas <palabra cortada>... o sea, en que pasis el tiempo libre?, qu hacis? 7 <H1>: La familia o yo? 8 <E2>: No, en general <simultneo> todos. 9 <H1>: En general </simultneo> todos? Pues... no s... mi madre y yo somos muy aficionadas a leer y eso, y mi padre es ms de sentarse y ver la tele, y mis hermanos, pues, el deporte. Vamos, a to<(d)>as horas o sea que (-->)... 10 <E1>: En cuanto a los estudios, las asignaturas que ms te gustan o que mejor te han ido o peor... 11 <H1>: Las que ms me han gusta<(d)>o las relacionadas con <nombre propio> Psicologa </nombre propio> porque siempre me han gusta<(d)>o, y eso, o sea... la carrera y bueno como estaba en <nombre propio> Valencia </nombre propio> y no pude hacerla... y luego... del resto pues (-->)... <ftico = duda> no s. 12 <E1>: Has tenido algn logro especial en tu vida, una (-->)... algo que, que, que te haya mar-

24 <H1>: Ah...! Mis padres. 25 <E2>: Un poco de morro, no? <risas> Has trabajado alguna vez o no?
(Azorn y Jimnez Ruiz 1997:. 78-79)

cado, de forma <simultneo> que te haya, que te haya ayudado a seguir? 13 <H1>: S, s <risas> </simultneo>, que ganamos el <extranjero> play-back </extranjero> en <siglas> C.O.U. </siglas> <risas>.

14 <E1>: Muy bien... eso est muy bien </ simultneo>. 15 <E2>: <ininteligible> <simultneo>. 16 <H1>: Y no... </simultneo> o sea... porque... era un ret <palabra cortada>... y es que all, bueno... en mi colegio haba mucha competitividad con eso, digamos, y es una cosa que llevamos haciendo desde siempre, y digamos que fue llegar a <siglas> C.O.U </siglas> y ganar y fue como el... por fin! O sea... irse <sic> el colegio y dejar alguna seal <simultneo> que habas pasa<(d)>o. 17 <E1>: O sea, ms que haber aprobado selectividad </simultneo>. 18 <H1>: Ms, s <risas>. 19 <E1>: Muy bien... <vacilacin> Tienes alguna actividad extraes <palabra cortada>... extraacadmica o algo... <simultneo> que te dediques a hacer? 20 <H1>: No, no </simultneo>, ahora quiero empezar a tocar la guitarra, pero no tengo as... 21 <E2>: Y... cmo te costeas los estudios? 22 <H1>: Cmo me qu? 23 <E2>: Te costeas. 61

-No podemos acabar este apartado sin mencionar un segundo corpus, el Corpus de referencia del espaol actual (CREA), que, junto con el Corpus Diacrnico del Espaol (CORDE), constituyen un intento pionero en nuestra lengua por ofrecer materiales desde los orgenes hasta la actualidad que sean representativos, tanto de la lengua oral como de la escrita. Se iniciaron en 1995 por la Real Academia Espaola y en 2000 se concluy la segunda fase. El CREA abarca el espacio cronolgico que va desde 1975 hasta la actualidad. En ninguno de los dos casos se trata de corpus cerrados, as por ejemplo, el CREA est diseado para albergar los ltimos 25 aos del espaol, de manera que siempre va cambiando sus materiales con el paso del tiempo. Dicho corpus se organiza teniendo en cuenta las variables diatpicas, criterios temticos, de gnero o de medio de aparicin, si bien cabe sealar que la lengua hablada tan solo est presente en un 10% del corpus. La transcripcin empleada de esta lengua hablada es ortogrfica, en un primer nivel, aunque refleja los fenmenos paralingsticos, gestuales o ambientales. Tambin utiliza las normas TEI, en un segundo nivel, y el modelo de separacin de datos primarios y analticos recomendado por el CES. Los textos que actualmente integran la parte oral del CREA y que ya estn disponibles se revisan peridicamente. Como se indica en su pgina web, en la fase 2000-2004, se trabaja simultneamente en la transcripcin ortogrfica de los documentos sonoros y en el alineamiento con la seal sonora digitalizada. Hasta octubre de 2001 se han alineado un total de 100.000 registros de Espaa y Amrica. Los archivos textuales se asocian con su correlato sonoro, lo que facilitar, dentro de un tiempo, el acceso al audio, gracias a marcas de sincronizacin, as como el acceso por medio de la marcacin establecida7. Se accede a ambos corpus por medio de la direccin electrnica de la Real Academia (http://www.rae.es o
7 Ms informacin sobre el CREA y el CORDE, en RAE (1998), Pino Moreno (1999), Pino Moreno y Snchez Snchez (1999) y Snchez Len (2001).

Espaol actuaL
http://www.cronos.rae.es). El metalenguaje empleado para codificar el corpus ha sido el SMGL (Standard Generalized Mark-Up Language), as como el de una de sus instanciaciones, HTML (Hyper-text Mark-up Language). En la fase que va del 2000 al 2004 se est empleando la codificacin XML (Extensive Markup Language). As, como se indica en su pgina web, la transcripcin de los documentos sonoros es de nivel II, de acuerdo con la convencin desarrollada por French (1992) y adoptada por el consorcio NERC (Network of European Reference Corpora), y de nivel S1 (ortographic or transliteration level), en la escala definida por EAGLES (Expert Advisory Group on Language Engineering Standars: EAGLES Spoken Language Working Group, 1995). La transcripcin se enriquece con una serie de informaciones bsicas acerca de los hablantes, los cambios de turno y los elementos no verbales, codificadas en lenguaje SGML, de acuerdo con las recomendaciones de la TEI y de EAGLES. Los criterios de transcripcin y codificacin se describen en el documento interno del Corpus denominado Transcripcin y codificacin de textos orales, versin 4.1 (17 de febrero de 1999). Los investigadores disponen de una ficha de consulta en la que es posible especificar el elemento o elementos de bsqueda, la obra, el autor, el periodo cronolgico en el que se desea buscar, el medio, etc. Cabe precisar que el CREA permite dos niveles de acceso al corpus de lengua hablada: la mera representacin ortogrfica y la representacin con marcas aadidas, tal y como puede apreciarse en la siguiente muestra:
Prrafo n 1.

hasta el cuarto da o as no <UNCLEAR CERT=UNINTELLIGIBLE></UNCLEAR> mara. </F><F>Y luego <DISTINCT TYPE=REPE>la la</DISTINCT> siguiente vez tambin fue complicadsimo. </ F><F>Fue<PAUSE> </F></UT> <U WHO=UAM022.PER002><F>Pero no se vende por la calle y tal? </F></UT> <U WHO=UAM022.PER001><F>Pues <DISTINCT TYPE=REPE>no no no</DISTINCT>. </F><F>O sea es<PAUSE> lo fuma en su casa la gente a escondidas y tal y nada ms. </F><F>

En relacin con este tipo de marcas codificadas, ejemplificadas en las dos muestras de transcripcin apuntadas (fragmentos del CREA y del Alcore), cabe sealar que se indican al principio los datos relativos a la situacin y a la caracterizacin del usuario aspectos totalmente justificados, sobre los que no es preciso realizar ningn comentario y con posterioridad se aaden a la transcripcin ortogrfica otro tipo de marcas que intentan codificar aspectos lingsticos, prosdicos, proxmicos y discursivos. Este tipo de codificacin, sin duda, permite una bsqueda informtica precisa, la localizacin rpida de los fenmenos y una cuantificacin de los datos, as como un intercambio y reusabilidad, dada la compatibilidad ya buscada entre los sistemas informticos y el acuerdo generalizado sobre su uso en la comunidad de investigadores. Ahora bien, dicho sistema presenta diversos inconvenientes, al menos desde la perspectiva de aquellos que nos enfrentamos a la transcripcin de una conversacin coloquial. Conviene comentar y detenernos en esos problemas o escollos que supone utilizar este modelo de transcripcin. En primer lugar, nos preguntamos qu se debe representar: as, por ejemplo, en el terreno lxico se representan y codifican en muchos de estos corpus las palabras extranjeras o las siglas, pero se omite cualquier indicacin o codificacin de metforas, voces argticas o unidades fraseolgicas. Por qu se representan unos fenmenos y no otros? Esta matizacin afecta tambin a los restantes niveles o fenmenos lingsticos. En segundo lugar, las marcas utilizadas impiden o dificultan la lectura del texto. Se produce un doble proceso de lectura, por un lado, el texto ortogrfico, por otro, el metatexto
62

Droga? Es un tema tab, to. S? Eso es complicadsimo. Fuimos, y estuvimos desde que llegamos hasta el cuarto da o as no mara. Y luego la la siguiente vez tambin fue complicadsimo. Fue Pero no se vende por la calle y tal? Pues no no no. O sea es lo fuma en su casa la gente a escondidas y tal y nada ms. Prrafo n 1. <U WHO=UAM022.PER001><F>Droga? </ F><F>Es un tema tab, to. </F></UT> <U WHO=UAM022.PER002><F>S? </F></ UT> <U WHO=UAM022.PER001> <F> Eso es complicadsimo. </F><F><UNCLEAR CERT=UNINTELLIGIBLE></UNCLEAR> fuimos, y estuvimos desde que llegamos

La transcripcin de la lengua hablada: El sistema del grupo VaL.es.cO


codificado aadido. Al investigador que solo le interesa una representacin ms o menos fiel de la realidad de habla debe hacer un esfuerzo de eliminacin del metatexto o marcas codificadas para poder discernir la muestra de habla de la marca codificada. Por supuesto, el propio sistema puede prescindir de dichas marcas y dejar un nivel de lectura meramente ortogrfico, como aparece ejemplificado con el fragmento anterior del CREA, pero dicho sistema se aleja bastante de poder representar, por ejemplo, la realidad conversacional. Una alternativa a estas marcas es el empleo, como posteriormente insistiremos, de recursos ortogrficos y tipogrficos. El tercer inconveniente del sistema de marcas aadidas reside en que dicho modelo supone un anlisis de muchos fenmenos de la muestra de habla, no siempre efectuado por especialistas y sujeto a cierto nivel de interpretacin (por ejemplo, marcar el estilo directo en ocasiones es complejo para alguien ajeno al tema). Por ltimo, el sistema de marcas no presenta con claridad la dinmica conversacional de hecho, la mayor parte del corpus que emplea este sistema de marcas no toma como muestras de habla representativas la conversacin espontnea, sino que prefiere la entrevista semidirigida. Estas deficiencias se observan en las marcas de <simultneo> y </simultneo>, en las que no se percibe el habla simultnea de una forma rpida e inmediata. 2.3. Ortografa y recursos tipogrficos al servicio de la representacin de la realidad conversacional Ante las deficiencias observadas en los sistemas de transcripcin meramente ortogrfico o con marcas, desde el grupo Val.Es.Co. se ha propuesto un mtodo de transcripcin que conjuga lo ortogrfico con otro tipo de signos tipogrficos y fonticos para representar algunos aspectos conversacionales, ya que los mayores problemas en una dimensin prctica de la transcripcin surgen cuando las marcas ortogrficas se revelan insuficientes para plasmar la complejidad de la interaccin oral. En este sentido, Payrat (1995:59) se muestra partidario de un mtodo que se ajuste a una concepcin realista de la transcripcin; ya que
63

es una herramienta aplicada, la evaluacin del sistema y su consiguiente correccin vendr precisamente de su productividad, de su contribucin al logro de los fines perseguidos. Quiz podra considerarse que, en cierto modo, el fin justifica, si no los medios, al menos s el modelo de transcripcin. 3. LA TRANSCRIPCIN DEL CORPUS DE CONVERSACIONES COLOQUIALES DE VAL.ES.CO. 3.1. Descripcin y objetivos del corpus Val.Es.Co. El corpus Val.Es.Co. es el nico corpus del espaol que tiene como objetivo fundamental recoger la conversacin coloquial real. Durante muchos aos la investigacin sobre lo coloquial ha empleado como corpus las obras literarias8 que imitaban este registro. Las reflexiones tericas que se obtenan a partir de tales muestras hablaban de una sintaxis pobre, concatenada, parcelada, que se rellenaba de muletillas y elementos retardatarios del habla. La existencia del corpus Val.Es.Co. ha permitido a nuestro grupo de investigacin profundizar en la realidad de la conversacin. Por un lado, se han investigado sus rasgos lingsticos desde el mtodo inductivo-deductivo que propugnamos, que supone la observacin directa de los datos y la extraccin posterior de conclusiones ms amplias. Por otro, se ha analizado la estructura de una conversacin ms all de las secuencias de apertura y cierre que la enmarcan y se ha llegado a proponer una unidad, el acto, que establece un vnculo entre la sintaxis oracional y la sintaxis del coloquio9. El corpus de conversaciones coloquiales del grupo Val.Es.Co., dirigido por Antonio Briz e iniciado en 1990, consta de 341 horas de grabacin que recogen conversaciones coloquiales, objetivo de su anlisis (lingstico, pragmtico, conversacional, de covariacin sociolingstica, etc.). La muestra atiende a las variables sociolingsticas (sexo, edad, ni8 Entre otras obras destacan las siguientes: El Jarama de R. Snchez Ferlosio; Mesa y Sobremesa de A. Zamora Vicente; Entre visillos de C. Martn Gaite; La colmena de C.J. Cela; Bajarse al moro y La estanquera de Vallecas de J. L. Alonso de Santos; La Taberna Fantstica de A. Sastre; Cinco horas con Mario y La guerra de nuestros antepasados de M. Delibes; las obras de C. Arniches, como El amigo Melquades; El florido pensil de A. Sopea, etc. 9

Vase a este respecto Briz y Grupo Val.Es.Co. (2003).

Espaol actuaL
vel sociocultural, bilinge/monolinge castellano), a la par que al mtodo de extraccin empleado: conversacin libre con observador participante/no participante; grabacin secreta/ordinaria10. Las grabaciones se han llevado a cabo preferentemente en espacios familiares para los participantes. El nmero de interlocutores en cada grabacin oscila entre un mnimo de dos (el mnimo necesario para hablar de conversacin) y un mximo aconsejable de cuatro, ya que un nmero superior de informantes puede aumentar las dificultades de la transcripcin. La presencia de cuatro informantes, adems, basta para que puedan producirse escisiones conversacionales (conversaciones paralelas). El material, transcrito ortogrficamente y con convenciones referentes al Anlisis Conversacional adaptadas a la muestra, se halla almacenado en soporte analgico y digital, aunque, debido a la dificultad que presenta la transcripcin, solo se ha transliterado una muestra del corpus general. El Grupo Val.Es.Co. ha publicado un trabajo reciente (Briz y Grupo Val.Es.Co., 2002) donde se recoge un total de 19 conversaciones. 3.2. Signos y convenciones Nuestro sistema de transcripcin, de acuerdo con los objetivos del corpus, atiende a fenmenos conversacionales y presta atencin a la alternancia de turnos, la sucesin inmediata de emisiones, los solapamientos, reinicios y autointerrupciones, las escisiones conversacionales, las pausas y los silencios, la entonacin (en concreto, las inflexiones finales que influyen en el curso de la conversacin y que introducen cambios respecto a la prosodia normativa), los fenmenos de nfasis, los problemas relacionados con emisiones dudosas o indescifrables, los aspectos de fonosintaxis, los alargamientos fonticos, las preguntas retricas, el estilo directo o las referencias contextuales. El mtodo es lo suficientemente estrecho como
10 Lpez Guzmn (1994) refleja los diversos tipos de manifestaciones orales que se pueden recoger: locutor nico, entrevista, conversacin, etc. Ya Criado de Val (1980) emplea mtodos de observacin participante al diferenciar entre coloquio espontneo y coloquio inducido (con observador participante). Acerca de la llamada paradoja del observador, vase Hidalgo y Pons (1991). Sobre la utilidad de diversos mtodos en la obtencin de muestras espontneas, por lo general se aconseja el empleo de diversos mtodos o triangulacin (Stubbs 1987), hecho que tambin aconseja Payrat (1988).

para conseguir que el lector pueda reproducir con bastante fidelidad la conversacin original, y lo suficientemente ancho como para permitir la lectura fluida de la misma. Sin duda, como precedente ms claro de nuestra propuesta, destaca el mtodo jeffersoniano, que parece ser el ms seguido en el mbito oral11. La etnometodologa desarroll los primeros sistemas de transcripcin del discurso oral, donde se reflejaban diversos aspectos de la interaccin (turnos de habla, solapamientos, emisiones sucesivas de los participantes, etc.). Paralelamente a la etnomedologa, la sociolingstica interaccional y la etnografa de la comunicacin desarrollan mtodos que no solo se preocupan por los aspectos de la interaccin, sino tambin por los rasgos lingsticos, de manera que logran sistemas muy perfeccionados (Ochs 1979; Tannen 1984; Du Bois 1991; Du Bois et alii 1993; Gumperz y Berenz 1993)12. El Grupo Val.Es.Co. opta por un mtodo de transcripcin que, como hemos sealado antes, facilite la labor del lector, de modo que pueda reproducir la conversacin original por medio de los datos que le suministran las claves empleadas. La transcripcin elegida pretende, por un lado, reflejar los rasgos propios de una conversacin, la interaccin coloquial ms prototpica, y, por otro, facilitar una captacin cognitiva inmediata del texto oral para la que no es necesaria ninguna destreza. En este sentido, seguimos los cinco criterios apuntados por Payrat (1995) en relacin con el sistema: supone una interpretacin de algunos datos fnicos, selecciona determinados fenmenos, resulta pertinente en funcin del objeto de investigacin, coherente con nuestra base terica y, sobre todo, ha de ser fiel a la representacin de los datos y flexible, como despus sealaremos. Adems, la simbologa clara, econmica, sencilla y exenta de ambigedad se encuentra motivada y reutiliza tradiciones anteriores
11 Jefferson lo ha desarrollado en el marco del anlisis conversacional americano en sus diversos trabajos, tanto individuales como en colaboracin. Vanse como muestra Jefferson (1987) o Sacks et alii (1974). 12 Edwards (1993) compara diversos mtodos de transcripcin del discurso. Los trabajos de Marcos et alii (1993), Villena Ponsoda (1994), Payrat (1995), vila (1996), Cerdn y Llobera (1997), Llisterri (1999) o Pino (1999) se dedican especficamente a la transliteracin de corpus orales espaoles.

64

La transcripcin de la lengua hablada: El sistema del grupo VaL.es.cO


(como ocurre con ciertos signos fonticos y ortogrficos). Este mtodo de transcripcin, as como las muestras ofrecidas, han sido valorados positivamente por Fajardo (1996) o Cartagena (1998); el segundo de ellos resalta su carcter pionero en la recoleccin amplia y sistemtica de materiales de estudio de la lengua coloquial de la tercera ciudad de Espaa, as como su alto nivel terico, metdico, si bien seala ciertas incoherencias13 en el sistema de transcripcin. Otros autores, en cambio, muestran ciertas reservas respecto al sistema empleado, como Llorente (1996) o vila (1998a). As, la primera critica el sistema de recogida de datos, la coloquialidad y el carcter conversacional de las muestras. Portols (2000), sobre todo a partir de las crticas de Llorente, ofrece una defensa del mtodo de transcripcin y del sistema de recogida de datos del Grupo Val.Es.Co. Algunas de estas crticas han sido tenidas en cuenta en la ltima edicin del corpus, como por ejemplo, el empleo de las maysculas14, ya que en cierto modo atentaba contra el principio bsico de cualquier sistema que exige que un signo sea utilizado nicamente para representar un fenmeno. Los signos fundamentales de sistema de transcripcin Val.Es.Co. son los que a continuacin se detallan; en su mayora proceden de los recursos ortogrficos que nuestra lengua posee (como son los signos de exclamacin e interrogacin, maysculas, parntesis, corchetes, guiones, etc.), si bien tambin utilizamos elementos de carcter fontico (como las barras para indicar pausas, o las flechas para los tonemas) y vinculados a la tipografa (como el empleo de la cursiva para el estilo directo). Tan solo hay un signo que escapa a estos tres mbitos: el que representa un fragmento pronunciado con voz prxima al susurro. Cabe sealar tambin
13 Las incoherencias o errores de transcripcin son responsabilidad de las personas que llevan a cabo esta actividad, pero, en ningn caso, invalidan el sistema.

que cada transcripcin viene precedida de su correspondiente ficha tcnica, donde se recogen los datos relativos a la situacin (marco de interaccin, relacin entre los interlocutores, finalidad o tenor interaccional, temtica, intervencin del investigador, tipo de grabacin, etc.) y a los usuarios (edad, sexo, nivel educativo y profesin, lengua materna, etc.).
: A: ?: Cambio de voz. Intervencin de un interlocutor identificado como A. Interlocutor no reconocido. Sucesin inmediata, sin pausa apreciable, entre dos emisiones de distintos interlocutores. Mantenimiento del turno de un participante en un solapamiento. Lugar donde se inicia un solapamiento o superposicin. Final del habla simultnea. Reinicios y autointerrupciones sin pausa. Pausa corta, inferior al medio segundo. Pausa entre medio segundo y un segundo. Pausa de un segundo o ms. Silencio (lapso o intervalo) de 5 segundos; se indica el n de segundos en las pausas de ms de un segundo, cuando sea especialmente significativo. Entonacin ascendente. Entonacin descendente. Entonacin mantenida o suspendida. Los nombres propios, apodos, siglas y marcas, excepto las convertidas en palabras-marca de uso general, aparecen con la letra inicial en mayscula. Pronunciacin marcada o enftica (dos o ms letras maysculas). Pronunciacin silabeada. Fragmento indescifrable. Interrupciones de la grabacin o de la transcripcin.

= [ ] / // /// (5)

Cou

PESADO pe sa do (( )) ((...))

Curiosamente, en el sistema de marcas TEI algunos autores, como Villena Ponsoda (1994: 84) justifican el uso de las maysculas para el nombre propio por razones de tipo esttico y convencional, cuando en ese sistema ya se indica el nombre propio con una marca especfica, con lo cual resulta redundante, y, adems, se emplea tambin la misma marca, la mayscula, al inicio de cada intervencin o para sealar la recuperacin del turno, con todo ello el signo adquiere una clara ambigedad. Esto sucede tambin con otras marcas como la barra, empleada con dos significados.
14

((siempre))Transcripcin dudosa.

(en)tonces Reconstruccin de una unidad lxica que se ha pronunciado incompleta, cuando pueda perturbar la comprensin. pal Fenmenos de fontica sintctica entre

65

Espaol actuaL
palabras, especialmente marcados. ( h ) Fragmento pronunciado con una intensidad baja o prxima al susurro. Aspiracin de s implosiva.

(RISAS, TOSES GRITOS) Aparecen al margen de los enunciados. En el caso de las risas, si son simultneas a lo dicho, se transcribe el enunciado y en nota al pie se indica entre risas. aa nn ? ! !? Alargamientos voclicos. Alargamientos consonnticos. Interrogaciones exclamativas. Interrogaciones. Tambin para los apndices del tipo no?, eh?, sabes? Exclamaciones.

ver con la identificacin de los interlocutores, as como con el reparto de los papeles comunicativos, la sucesin de habla; un segundo grupo de signos marca fenmenos relacionados con la formulacin del discurso, caractersticas de la emisin, pronunciacin, demarcacin de unidades, construccin sintctica, etc.; otro marca algunas caractersticas de las secuencias conversacionales, el relato dramatizado y el discurso en valenciano; finalmente, otros aaden informacin sobre el contexto y las circunstancias de la interaccin, sobre lo extraverbal y lo extralingstico, con el fin de facilitar la comprensin de lo transcrito. 3.3.1. Emisores y hablantes : Los dos puntos indican que un emisor, identificado con una letra mayscula, interviene en la conversacin, hay un cambio de voz, aunque no necesariamente seala un cambio de turno15. A partir de los trabajos sobre unidades, hemos marcado la diferencia entre intervencin y turno, no as en la transcripcin. Un estudio que tuviera como fin dicha alternancia de habla, debera incorporar, por tanto, un nuevo signo que estableciera la diferencia entre intervenciones que ocupan o no un turno. Del mismo modo, otro signo debera introducirse para marcar las distintas intervenciones de los interlocutores. Los nmeros pueden servirnos para tal fin: un nmero a la derecha de la letra identificadora del participante (G1, G2, G3) sealara cada una de las intervenciones de los participantes, as como las veces que ste participa; la ausencia de este nmero indicara que no existe nueva intervencin, sino mera continuacin de otra (intervencin discontinua); el nmero a la izquierda (1G, 2G, 3G) marcara
15 Proponemos definir la unidad turno como hueco o lugar de habla rellenado con emisiones informativas que son reconocidas y aceptadas por los interlocutores mediante su atencin manifiesta y simultnea. Aceptacin es ahora la palabra clave en la definicin del turno y alternancia de turno, lo cual pone en duda todas las definiciones anteriores apoyadas en el cambio de voz. Si un emisor y la reaccin de otro son el lmite por arriba y por abajo de una intervencin, en el caso de los turnos, el emisor ha de ser hablante y la reaccin ha de ser aceptada. Dicho esto, se entender que todo turno es una intervencin, pero no toda intervencin es necesariamente turno (Briz 2000a y Briz y Grupo Val.Es.Co. 2003).

s que se pareix a mosatros: Fragmento de conversacin en valenciano. Se acompaa de una nota donde se traduce su contenido al castellano. Letra cursiva: Reproduccin e imitacin de emisiones. Estilo directo, caracterstico de los denominados relatos conversacionales. Notas a pie de pgina: Anotaciones pragmticas que ofrecen informacin sobre las circunstancias de la enunciacin. Rasgos complementarios del canal verbal. Aaden informaciones necesarias para la correcta interpretacin de determinadas palabras (la correspondencia extranjera de la palabra transcrita en el texto de acuerdo con la pronunciacin real, siglas, marcas, etc.), enunciados o secuencias del texto (p. e., los irnicos), de algunas onomatopeyas; del comienzo y final de las escisiones conversacionales, etc. * Las incorrecciones gramaticales (fnicas, morfosintcticas y lxicas) no aparecen marcadas por lo general. As pues, segn el usuario del corpus (p. e., si este es utilizado por un estudiante de espaol como segunda lengua), puede ser recomendable el soporte explicativo del profesor. * Los antropnimos y topnimos no se corresponden por lo general con los reales.

3.3. Notas y observaciones sobre los signos de transcripcin. Aplicaciones al anlisis de la conversacin Estos signos y convenciones remiten a hechos diferenciados. Un primer grupo tiene que
66

La transcripcin de la lengua hablada: El sistema del grupo VaL.es.cO


el cambio de turno; la ausencia de numeracin sealara que la intervencin no constituye turno. Por ejemplo:
1J1: te vas ya/ Gerardo? 2G1: s/ porque a las ocho he quedao con Pablo el de (( )) para irnos a correr y mientras llego a casa/ [me cambio=] J2: ((...)) [AP.80.A1: pg. 144; lneas 1-5] 6G2: el da ventiunoo me imagino que vendris aa(a)nimar y a hacer fotografas/ [no?] 7J4: 8G3: t a correr? 9J5: [yo a correr]/ eh? [ay qu bien! ] G: = y calientoo

pacin de un interlocutor en la conversacin, y as mismo, segn el nmero a la izquierda, el grado de aceptacin por parte del resto de interlocutores, es decir, si es hablante o mero emisor (tngase en cuenta, por ejemplo, que la mera contabilizacin del total de las intervenciones-turnos de los diferentes interlocutores nos informara de quin o quines se erigen en protagonistas o centros del negocio conversacional y de aqullos que tienen un papel secundario o menos activo en ste, lo que desde el punto de vista de la conducta interaccional y social puede ser un dato relevante). [] = Estos cuatro signos aluden al modo como progresa la conversacin, a la sucesin de habla, a la alternancia de turno, reparto, permuta y cambio de papeles, a los conflictos, robos y apropiaciones indebidas, lo cual est en relacin con los principios de cooperacin y de cortesa y al modo en que stos se manifiestan y entienden en la conversacin coloquial. El primero de stos seala que hay sucesin inmediata de emisiones de dos interlocutores diferentes sin pausa apreciable, los otros aparecen en casos de solapamientos17. El habla simultnea es un fenmeno muy frecuente en la conversacin coloquial espaola, luego la marcacin del mismo (los corchetes nos indican el principio y final de tales superposiciones de habla) es fundamental para el anlisis de la conversacin y, sobre todo, para aquellos estudios dedicados a observar el proceso de alternancia de habla. Basta una simple bsqueda de tales signos para darse cuenta de las funciones o estrategias que hay en ocasiones tras estos solapamientos: estrategia para obtener el turno, para retenerlo, para recuperarlo, para interrumpir, estrategia de cooperacin. O, simplemente, el fenmeno se debe a una falta de sincronizacin en la toma de turno o a la hora de intervenir (es el caso de los arranques simultneos, cuando no ha habido seleccin previa del hablante que tena el turno y existe autoseleccin). La necesidad
17 Curiosamente, algunos de estos signos ms especficos para representar la dinmica conversacional, como es la sucesin inmediata sin pausa apreciable, no se recogen en el sistema TEI, al menos en los corpus revisados. Sin embargo, el TEI codifica otros fenmenos que no aparecen en nuestro sistema (las siglas, la correccin gramatical, etc.).

y mi hermano tambin/ Lorenzo

S1: [qu pasa el da ventiuno?] 10G4: [((dame tu nombre))] completoo el dnei 16 fecha de nacimiento yy/ ya nada [AP.80.A1: pg. 144; lneas 9-14]

- 1J1 indica que se trata de la primera intervencin de J y que esta ocupa el primer turno de la conversacin (de hecho, la pregunta es contestada aceptada por G). - 2G1 seala la primer intervencin de G, un segundo turno (la pregunta anterior marca la cesin de turno aceptacin a ste), y, por tanto, que existe alternancia. - J2 es la segunda intervencin del interlocutor identificado como J, pero no ocupa turno (su intervencin no es atendida, ni aceptada por el resto de participantes). - G: sin nmero a la derecha se indica que la intervencin G1 contina. Sobre el segundo fragmento, ntese de nuevo que S1 es la primera intervencin de dicho emisor, pero la ausencia de nmero a la izquierda de la letra identificadora seala que no es un turno (su pregunta no es atendida por el resto). Esta propuesta de marcaje numrico tiene varias ventajas; por un lado, al marcar cada una de las intervenciones con un nmero, podemos saber, mediante la numeracin a la derecha (G1, G2, G3), el grado de partici16

Documento Nacional de Identidad (D.N.I.).

67

Espaol actuaL
ahora de marcar en este proceso simultneo de habla, conflictivo o no, cul de los participantes contina con el turno hace necesario el signo =, ms todava en aquellos casos en que son varias las intervenciones que ocupan el mismo turno, pues permite su identificacin inmediata. Adems, al igual que en el caso de los corchetes, supone la utilizacin de un signo ortogrfico, conocido, y, en el caso del signo =, resulta en cierto modo motivado, lo que supone en ambos casos que su descodificacin sea sencilla y poco costosa.
2G1: s/ porque a las ocho he quedao con Pablo el de (( )) para irnos a correr_ y mientras llego a casa/[me cambio=] J2 [ay qu bien! ] G: = y calientoo

3.3.2. La formulacin del discurso y las caractersticas de la emisin y de la construccin. El papel de la prosodia en la interaccin conversacional Aunque sin pausa, la conversacin avanza sin prisa. Los reinicios, los cambios de plan sintctico, los truncamientos de las construcciones favorecen el lento discurrir del discurso. Dejaramos de dar cuenta de todo estos hechos si no se incorporara este signo de reinicio y autointerrupcin (-)18. Un estudio ms preciso de todas las construcciones as marcadas notara que, junto a las simples vacilaciones debidas a causas externas (falta de destreza, olvido de una palabra, etc.), en ocasiones los reinicios obedecen a un plan, sea de orden informativo (el interlocutor desea precisar o explicar mejor lo que no ha acabado todava de decir) o de actitud. En el intercambio siguiente, L emite un juicio y opinin directos sobre E con varios reinicios, el primero de los cuales no es sino un mecanismo reformulador-atenuador de su afirmacin. El segundo, antes que falta de destreza lingstica, muestra la precaucin en el uso de una palabra que describa la actuacin de E (liberal). En la intervencin de E, que muestra desacuerdo con lo dicho por el otro, el reinicio atenuador es evidente: la autocorreccin sirve a la despersonalizacin u ocultamiento del yo y, as pues, minimiza el desacuerdo:
L: yo creo que- no s que tienes actos muy- muy liberales [en relacin a] E: [no soy nada-] no son liberales [L.15.A.2]

Se deja de marcar cuando el interlocutor que se solapa es finalmente el que obtiene el turno:
S1: [qu pasa el da ventiuno?] G4: [((dame tu nombre))] completoo el dnei fecha de nacimiento yy/ ya nada

En los dos fragmentos conversacionales del inicio del subapartado puede observarse la superposicin cooperativa (no hay intencin de robar el turno) de la intervencin de J2 sobre la de 2G1. La pausa en 6G2 la entiende 7J4 como seal terminativa, el cual adelanta su respuesta y provoca la superposicin. El interlocutor S1 pretende intervenir en el dilogo que estn manteniendo solo G y J, sin que ninguno de ellos lo haya aceptado como hablante, lo que produce un nuevo solapamiento. Los hechos a que hacen referencia estos cuatro signos son de gran importancia para la caracterizacin de la interaccin entre espaoles, para llegar a precisar qu se entiende por el principio pragmtico de cooperacin en espaol o para llegar a entender la conducta interaccional de los espaoles en la negociacin conversacional: la sucesin inmediata de emisiones de dos interlocutores diferentes sin pausa apreciable, algunos casos de habla simultnea, etc., no son entendidas en la conversacin espaola peninsular como conductas transgresoras, sino como muestras de colaboracin y apoyo hacia el otro y hacia lo que dice, a veces, incluso, solicitadas explcitamente sea mediante mecanismos verbales ( no? entiendes? sabes?) o extraverbales (gestos).
68

/ // /// (5) Las barras oblicuas indican duracin de las pausas, las cuales han sido medidas por lo general mediante un programa de sonido incorporado a un ordenador o a travs de un
18 As como en el sistema TEI se indica si se produce vacilacin, suspensin voluntaria o interrupcin, en nuestro caso optamos por representar el fenmeno sin caracterizar su tipologa. 19 Los mtodos que se acogen al Anlisis Conversacional proponen diversas indicaciones de los rasgos prosdicos. Las pausas se indican por lo general con barras: /, //, //, o con la expresin en segundos. En cambio, los tonemas se ajustan a los programas informticos concretos. Payrat (1995) prefiere para la entonacin los signos / \ -, fcilmente transportables a los sistemas informticos. Val.ES.Co. emplea otros ms interpretables o legibles: . En general, estos y otros signos se adaptan a las exigencias de cada corpus.

La transcripcin de la lengua hablada: El sistema del grupo VaL.es.cO


cronmetro. Los signos no son nuevos, pues aparecen en los alfabetos fonticos19. A pesar de que la base del sistema propuesto es de carcter ortogrfico, dejamos de utilizar los signos de puntuacin para marcar estas pausas. La razn parece evidente: en lo oral las pausas no siempre coinciden con las del texto escrito. Estos momentos de no-habla, como sealaba Levinson (1983, 1989: 314), son mecanismos simblicos en potencia. No solo sirven como formas de planificacin, descansos para procesar, sino que en muchas ocasiones muestran o quieren hacer ver algo ms al receptor (por ejemplo, una pausa larga antes de una respuesta se interpreta a veces como una indicacin de respuesta negativa o puede dar a entender que la respuesta es desconocida, etc.). Las pausas no solo afectan al contenido del mensaje, sino que inciden tambin en el sistema de toma y cesin de turno (una pausa en un lugar de transicin pertinente puede llegar a indicar cesin de turno; una pausa no esperable en otro momento puede favorecer el habla simultnea. No entraremos en las distinciones que comnmente se hacen entre intervalos, lapsos y silencios, aunque baste citar esta tipologa para llamar la atencin e insistir en la importancia que las pausas tienen en el desarrollo de la conversacin. La barra simple (/) indica una pausa corta, menos de 05 segundos (medio segundo). Con frecuencia indica discontinuidad sintctica (incompletitud). En ocasiones la pausa corta es imperceptible, pero aparece sealada de algn modo por un tonema de descenso precedente. Sealamos, pues, la variacin tonal correspondiente (A: no bastante ) o la pausa, si esta llega a percibirse (no/ bastante). La barra doble (//) equivale a una pausa de ms de medio segundo, hasta un segundo. A veces marca, por ejemplo, un contorno entonativo completo:
C: oye pues est bien eh?// qu tranquila! eh? [RB. 37. B.1]

La pausa de dos o ms segundos se marca con indicacin exacta de su duracin cuando entendemos que puede ser especialmente significativo. De ese modo, intentamos facilitar el anlisis sobre la cuestin:
E: luego te pregunta si tienes alguna preferencia// y dijee pues/ lo que tol mundo administrativo// y mi carrera y administrativo que (es lo que ms me convence a m)///(5) (yo qu s) [L.15.A.2.]

? ! !? Los signos mnimos empleados para representar la inflexin meldica, esto es, los tonemas20, han de entenderse ms como marcas indicativas de una curva meldica peculiar que como codificaciones definitivas de la misma. En este sentido, tales tonemas representan la inflexin (ascendente, descendente, suspendida) del fundamental al final de cada uno de los grupos de entonacin afectados. Se ha optado por transcribir las inflexiones tonales que influan notablemente en el curso de la conversacin o introducan alguna modificacin en relacin con la prosodia normativa21, sea en relacin con su funcin distintiva, demarcativa o expresiva. Una lectura de la transcripcin por parte de alguien ajeno al grupo de transcriptores nos sirvi, finalmente, para observar la adecuacin de los mismos. En funcin de ello, se aadieron ciertos tonemas (especialmente, en interior de grupo, para lograr los efectos rtmicos, marcar la continuidad de los enunciados, etc.) y se eliminaron otros que se mostraban como redundantes (por ejemplo, el tonema descendente en una aseveracin seguida de pausa, al final de intervencin, etc.):
G: dame tu nombre completoo / el dnei fecha de nacimiento // yy/ ya nada [AP.80.A-1]

C: ella no/ ella es ms mirada/ es ms a su madre [G.68.A.1 + G.69.B.1]

En cuanto a los tonemas que representan curvas con valor modal especfico (funcin distintiva), la interrogacin-pregunta ( ?), la
20 Unidades prosdicas que hemos tomado de acuerdo con la tradicin fontica hispnica. Vanse al respecto Quilis (1975) o Navarro Toms (1982). 21 Para el anlisis acstico de los rasgos prosdicos presentes en cada conversacin, nos hemos servido de los programas Visipitch 6097 y CSL 4300B, incorporados a un ordenador con procesador Pentium III.

Las tres barras (///) suponen una pausa de ms de un segundo (hasta dos segundos). Puede sealar, por ejemplo, un cambio de tpico o reformulacin del anterior:
A: eso parece/// EEs que a mi marido lo han hecho fijo [RB. 37. B.1]

69

Espaol actuaL
exclamacin ( !), la aseveracin, solo aparecen marcados los que no se corresponden con el patrn entonativo estndar. Indicamos, asimismo, en su caso, los tonemas interiores de grupo:
J: te vas ya/ Gerardo? [AP.80.A1] C: de qu marca te lo has comprao? [H. 38. A.1] B: cmo quies decir de vacaciones? [RB. 37. B.1] A: aqu- al volver la esquina no hay un poyete en una ventana/ de mrmol? [RB. 37. B.1]

Existe una serie de frmulas de control del contacto formalmente interrogativas, aunque su valor no siempre es apelativo, del tipo no?, sabes?, verdad?, eh?, etc. (Briz 1998: 224-229). Se representan mediante los signos convencionales de interrogacin (?), puesto que poseen en su mayor parte una curva tonal ascendente, propia de una interrogativa absoluta. En consecuencia, no se explicita su tonema final ascendente caracterstico, aunque conviene matizar que el ascenso producido en posicin interior de intervencin suele resultar menos pronunciado (valor expresivo-ftico) que cuando se sita en posicin final, con carcter de pregunta y de apelacin al oyente. En el caso de las aseveraciones, solo aparecen marcados los tonemas interiores de grupo cuando estos segmentan partes potencialmente informativas dentro del texto o es necesario en virtud de la demarcacin de unidades:
A: a setiembre se le acababa el contrato la primera semana [RB. 37. B.1] A: bueno entonces Antonio qu?// cmo te va? [H. 38. A.1] B: hombre en eso ya empezamos aa [H. 38. A.1] A: aqu hay un montn de bichos t [H. 38. A.1] A: no en serio/ la semana pasada [H. 38. A.1] D: a m no crudos no [H. 38. A.1]

En relacin con la funcin demarcativa-integradora de la entonacin, se han sealado ciertas inflexiones que pueden ayudar, por ejemplo, al reconocimiento y anlisis de ciertos rdenes de palabras, sea el caso de los fenmenos de topicalizacin y dislocacin, el de la introduccin del discurso directo o la inclusin de ste en el dilogo que se est llevando a cabo. Sin olvidar que la entonacin en muchos casos es capaz por s sola de individualizar segmentos de frase, por ejemplo, por nfasis, realce, focalizacin, etc. La direccin de los tonemas demarcativos de tales segmentos puede variar, ascendente o descendente :
S: yo los tengo bien los dientes [AP.80.A.1.]

Ntese en los ejemplos siguientes que la combinacin y mezcla del dilogo actual y libre con la narracin de hechos pasados en estilo directo, a la que hacamos referencia antes, solo es posible a partir de la presencia de inflexiones tonales, pausas, etc.:
C: me dice mire un mueco que sale en la tele no se me olvidar en la- en la VIDA/ que es rosa y tiene muchos pinchos usted sabra decirnos el nombre? [H.25.A.1] C: =y viene el hijo y dicen ve- vetee aa la radio porpor casi lo meten en la crcel que nos ha salido una televisin y el muchacho all exigiendo la televisin [H.25.A.1] C: mi marido peg un bote de la cama no veas! se le cay hasta el telfono// est Jess? dice mi marido mire se ha equivocao [H.25.A.1] C: y yo Vicente por Dios! [H.25.A.1]

El signo doble de interrogacin y admiracin ( !?) indica la presencia de lo que se ha denominado interrogacin exclamativa, una forma interrogativa que no posee el valor modal de una pregunta (no solicita informacin, ni se requiere, en principio, respuesta del receptor):
E: y no me gusta pues qu te voy a decir yo!? pues no s los pasteles [L.15.A.2] A: buf!// mira Blanca/ es que/ es que/ no lo s/ es que/ YO QU QUIERES QUE HAGA!? [ML. 84. A.1]

Como ha podido notarse en algunos de los ejemplos mencionados, cuando la segmentacin (demarcacin) del enunciado se manifiesta mediante el ascenso tonal, marca adems de continuacin o mantenimiento del hilo discursivo, hemos empleado el mismo signo para la inflexin ascendente ordinaria ():
C: te veo todo el rato igual ests superbin conmigo ah superbin no? y con todo el mundo y de repente te encierras to yo no s qu te pasa si es que tienes algn problema en casa o algo to[ML. 84. A.1]

En ocasiones puede observarse en el ejemplo anterior y en el de ms abajo se indica este tonema continuativo, aunque la lectura no lo precise, para marcar el nfasis o expresividad del que habla:
70

La transcripcin de la lengua hablada: El sistema del grupo VaL.es.cO


C: se fue a una reunin destas/ no compr ningn libro y mira qu carterita [G.68.A.1 + G. 69. B. 1]

con lo anterior, como atenuacin de lo que se dice, como marca de escisin conversacional, etc. (en)tonces pal Hay segmentos en la palabra o en la frase que el emisor deja de pronunciar. La supresin de tales elementos, en posicin inicial, medial o final, se recupera en los casos en que consideramos puede afectar a la comprensin: (en)tonces, (d)ice, os(e)a. Lo reconstruido aparece entre parntesis. En otros casos, por el contrario, se escribe la pronunciacin exacta, por ejemplo, en los participios, amao, corro, sin la consonante. Solo ciertos fenmenos de fontica sintctica no extrema entre palabras se marcan con el signo ms comn, el apstrofo, ya que en tales casos, el lector puede recuperar con facilidad lo suprimido. (( )) ((siempre)) Las ausencias o supresiones no siempre se deben al interlocutor. A veces el transcriptor tiene dificultades para entender lo grabado. As se explica otro signo, el doble parntesis (( )), que indica que existe un trozo de texto que ha sido imposible descifrar, o que lo transcrito en el mismo es solo una interpretacin de lo dicho (transcripcin dudosa). aa nn Un fenmeno frecuente es el alargamiento, sea voclico o consonntico. A veces resulta de la falta de destreza lingstica; otras se debe a problemas de memoria, se utiliza como pausa oralizada, retardataria, para pensar lo que se va a decir a continuacin. Sin embargo, a menudo tiene un valor comunicativo preciso. De ah la necesidad de establecer una marca de dicho fenmeno, aunque tal convencin no d cuenta de la duracin de dicho alargamiento. h Aunque entre los objetivos del sistema de transcripcin propuesto no figura el anlisis fontico, hay un signo que hace referencia a la pronunciacin aspirada de la consonante s implosiva. El motivo principal no es otro que nuestro inters particular sobre el desarrollo creciente de este fenmeno en el castellano de Valencia.
71

Obsrvese en la intervencin siguiente cmo las inflexiones indican y refuerzan a la vez el ajetreo de tanta actividad:
S: o sea quee/ voy a ir pillao// gimnasioo curso/ gimnasio curso [AP.80.A.1]

En los alargamientos voclicos motivados por vacilaciones expresivas del hablante (pausas oralizadas) resulta difcil a veces determinar hasta qu punto aparece o no un tonema suspensivo () continuativo aadido. En la mayora de casos hemos optado por transcribir solo el alargamiento:
C: pero l- pero l entenda dee- de reLOJES oo? [RB. 37. B.1]

Como observacin general a la explicacin anterior, debemos advertir que ascensos, descensos o suspensiones tonales tienen siempre un valor relativo y no todos desarrollan necesariamente una misma funcin (demarcativa, interactiva, expresiva); sin embargo, la especificacin de los parmetros acsticos y el anlisis de su comportamiento especfico corresponden a trabajos posteriores que deben realizarse sobre los textos y el material grabado. En todo caso, la mayor o menor especificidad en la marcacin de estos factores depender siempre del objeto de estudio perseguido. PESADO pe sa do ( ) Estos nuevos signos completan la informacin sobre la emisin y pronunciacin de los enunciados. Las letras maysculas (dos o ms) indican pronunciacin marcada, elevacin de la intensidad de una palabra o de algunos de sus formantes, de la frase o de un constituyente mayor. El silabeo demorado se expresa con espacios entre las slabas de una palabra o frase. Tales hechos remiten no tanto a las cualidades de la voz de un individuo como a una funcin comunicativa concreta; de ah el valor que puede tener dicha marca, por ejemplo, para los investigadores que estudian la categora pragmtica intensificacin. La pronunciacin de intensidad baja, prxima al susurro, se marca con el signo ( ). Tal hecho es con frecuencia relevante en la interaccin, por ejemplo, en contraste

Espaol actuaL
3.3.4. Caractersticas de algunas secuencias conversacionales: el relato dramatizado, el discurso en valenciano Letra cursiva Una constante de la conversacin coloquial es la presencia del denominado relato dramatizado, en estilo directo. Para destacarlo del resto de la interaccin se marca en letra cursiva; esto supone el aprovechamiento de los recursos tipogrficos:
A: porque ya comentndolo pall// le dije- digo mira digo qu reloj mhe encontrao/ di(go) madre ma!// dalgn trasto 22 ser B: s yoo hoombre yo pienso en principio si sera de oro A: DE ORO qu va! bueno la correa s que era bueno de oro23 B: pero yo qu s digo A: PERO yo digo no va ni na(da) digo mira digo tiene una saeta rota// y dicee/ ESTO que lo habrn tirao a la basura y algn cro lo habr puesto ah// (y yoo) digo por lo menos la correa/ mil pesetas por lo menos la correa valdr// yy/ y luego vimos a mi cuao y a mi cu y dicee/ digo mira/ digo qu reloj mhe encontrao y mi cu diu/24 AH! pues este rel es BUENO/ y empez mi cuao de cachondeo / VAMOS a una relojera y vers qu pronto lo sabemos/ VAMOS yo digo pero djaloo que ahora no quieroo arreglarlo/ VAMOS que si es BUENO ya te lo diry si es malo// en total que all nos fuimos los cuatro

La nota al pie se utiliza con distintos fines, ya sea como ayuda para la comprensin e interpretacin del texto o de alguna de sus partes, ya como modo de aadir informacin no dada, dada extraverbalmente o solo compartida por los participantes en la conversacin. As, por ejemplo: -Introduce datos sobre las circunstancias de la enunciacin y ofrece informacin necesaria para comprender determinados pasajes de la conversacin, especialmente aquellos que quedan sometidos fuertemente al contexto, por ejemplo, referencias decticas, elisiones contextuales debidas al saber y experiencia comn de los interlocutores, etc. -Aade informacin sobre rasgos complementarios del canal verbal. -Aporta datos sobre determinadas palabras (la correspondencia extranjera de la palabra transcrita en el texto de acuerdo con la pronunciacin real, siglas, marcas, etc.) y enunciados del texto (por ejemplo, marca el valor irnico de algunos de stos), informa sobre el sentido de algunas onomatopeyas, etc. -Informa sobre el comienzo y final de las escisiones conversacionales, conversaciones simultneas de dos a dos, de uno en dos, etc. (TOSES), (CARRASPEO), (RISAS) Por ltimo, indicamos entre parntesis elementos paralingsticos, dada la falta de convenciones ortogrficas para representar estos sonidos, a diferencia de las onomatopeyas que suelen aparecer codificadas en algunos textos. 3.3.6 Sobre las dos observaciones que cierran la nmina de signos Puesto que la transcripcin intenta reproducir las emisiones tal como han sido pronunciadas, puede llamar la atencin la ortografa de ciertas palabras, la presencia de incorrecciones gramaticales, etc. En algunos casos, como el de los extranjerismos, nos vemos obligados a facilitar la palabra original (en nota, como ya se ha indicado), pues podra no entenderse (por ejemplo, gindou, window). Ahora bien, por lo general, las incorrecciones gramaticales (fnicas, morfosintcticas y lxicas) no aparecen
72

s que se pareix a mosatros Dado que el material recogido procede de una zona de contacto de lenguas entre espaol y valenciano, es necesario utilizar alguna convencin para marcar los cambios de cdigo. En la transcripcin se reproduce el fragmento en valenciano y se acompaa de una nota donde se traduce su contenido al castellano. Vase en el ejemplo anterior la forma verbal diu, as como la nota al pie nmero veinticuatro, donde se marca la procedencia valenciana de la misma y su traduccin al castellano. 3.3.5. Otro tipo de informaciones Notas a pie de pgina
22 23 24

Atraco? Entre risas. Valenciano, dice.

La transcripcin de la lengua hablada: El sistema del grupo VaL.es.cO


marcadas, porque son reconocibles para cualquier investigador que lea la transcripcin. Algunos antropnimos y topnimos que aparecen en la transcripcin no siempre se corresponden con los realmente aludidos en la conversacin. Era este un modo de asegurar el anonimato de los interlocutores. 3.4. La flexibilidad del sistema propuesto: la capacidad de estrecharse o ampliarse Aunque actualmente disponemos de mtodos que han comprobado su utilidad en la prctica los ajustados a normas internacionales, los que se acogen a objetivos concretos del corpus, como la especifidad de la conversacin coloquial los problemas tericos y prcticos siguen existiendo: Cmo ajustar las claves a los programas informticos? La transcripcin debe reflejar todos o parte de los rasgos fonticos geolectales o idiolectales de los participantes? Es suficiente la marcacin prosdica empleada? Cmo indicar la irona? En la respuesta de estas y otras preguntas debe tenerse siempre presente la finalidad del corpus, para qu fue creado. La transcripcin ofrecida, ancha o estrecha, ser pertinente de acuerdo con los objetivos perseguidos. Las conversaciones transcritas por Val.Es.Co. constituyen una muestra de transcripcin semiestrecha. Pero es importante sealar que el sistema de transcripcin no es esttico. En funcin de los objetivos de una investigacin, la transcripcin puede estrecharse (e integrar, por ejemplo, aspectos prosdicos ausentes antes) o ensancharse25 (y prescindir, por ejemplo de reinicios y solapamientos si no resultan pertinentes para el estudio). As por ejemplo, en Hidalgo (1997), dedicado al estudio de la entonacin en el coloquio, se desarrolla una versin ms estrecha del sistema de transcripcin Val.Es.Co. que incluye, adems de las convenciones aqu
25 En este sentido, el corpus de entrevistas semidirigidas realizadas en diversas prisiones valencianas (Sanmartn 1998) constituye un ejemplo de un sistema de transcripcin ancho, al igual que el empleado por Gmez Molina (coord.) (2001) en el marco del proyecto PRESEEA para representar el espaol hablado de Valencia. En el primer caso, el sistema se ajusta al tipo de discurso (entrevista) y al sociolecto recogido (inters por los fenmenos lxicos). En el segundo caso, sucede algo similar, ya que se vale de entrevistas semidirigidas y prescinde sobre todo de los elementos entonativos.

presentadas, otras relativas a la frecuencia fundamental (F0) de cada uno de los grupos entonativos. Dicha transcripcin resulta apta para reconocer y localizar los grupos de entonacin y los lugares de presencia de silencios (pausas obstruyentes), si bien no existen en este mtodo pretensiones de generalizacin fonolgica. Constituye, en todo caso, un mtodo suficiente para acceder a la interpretacin de rasgos entonativos esenciales para la adecuada comprensin del discurso, que posee un cariz esencialmente descriptivo. Por este motivo se aportan exclusivamente los datos frecuenciales (de F0) no sometidos an al denominado proceso de estilizacin. En primer lugar, y dadas las necesidades particulares de esta investigacin, se ha ampliado el sistema de transcripcin de Val.Es.Co.; as, se ha indicado en su caso el punto final de cada grupo de entonacin identificado y el tipo de inflexin que manifiesta. Asimismo, se ha aadido un nuevo smbolo (^) aplicado a los casos de entonacin ascendente-circunfleja (expresiva). Por supuesto todos los ascensos, descensos o suspensiones tonales de los grupos de entonacin identificados tienen un valor relativo y no todos desarrollan una misma funcin (demarcativa, interactiva, expresiva). Se hace necesaria, pues, la cuantificacin de la F0 a lo largo de los distintos grupos de entonacin, sobre todo en los lugares clave, esto es, en el punto de ataque y en el punto final de cada grupo entonativo. Los valores de F0 poseen, adems, un valor relativo al rango tonal de cada hablante, en funcin de sus caractersticas individuales (sexo, edad, nivel sociocultural, etc.), lo que nos obliga a establecer previamente el rango tonal de cada hablante, esto es, su promedio de F0 a lo largo de la conversacin. En realidad, es imprescindible extraer este promedio para poder interpretar posteriormente el comportamiento funcional de la F0 en cada caso concreto, ya que nicamente en relacin a l es posible determinar la existencia de regularidades funcionales. Concluido el proceso de medicin y visualizacin de contornos entonativos, se indican en la transcripcin los valores numricos (en herzios) correspondientes al punto inicial y final de cada grupo de entonacin, para analizar
73

Espaol actuaL
posteriormente las relaciones prosdicas entre grupos de entonacin contiguos. Por otro lado, se ha precisado tambin el sistema de pausas, cuantificando la duracin especfica de todas ellas. Todo ello proporciona una transcripcin ms estrecha si la comparamos con la versin general tal y como ejemplificamos a continuacin:
FRAGMENTO EN LA VERSIN GENERAL B: ah y eso era a- la- las tres de la ma- o la una de la maana o por ah o las doce no s y llama a ese nmero y se pone una mujer toda cabreada dice usted es una perra no s qu no s cuntos A: insultndola? B: claro porque la mujer le haban estao llamando a su telfono todo el da A: (ya) B: con lo mismo con la historia de espinete A: pobre mujer B: y ya estaba A: (pobres mujeres) B: hasta el gorro y entonces la que le gastaron la broma pues sali A: (RISAS) B: bueno y eso de la prueba de la paciencia? A: eso son los de radioo los de la ser aqu en Valencia que se dedican a llamar a- a alguien con una historia completamente disparatada un da llam uno a una farmacia diciendo quee haba comprado all preservativos y que se le haban roto y que su novia se haba quedao embarazada y que ahora a ver qu haca l con el nio B: (RISAS) A: que le tenan que dar una subvencin o que le tenan que dar alguna ayuda para comprar dice bueno B: pues seguro [(())] A: [dice por lo menos] por lo menos deme usted las papillas gratis B: (RISAS) A: porque ha sido culpa suya (()) [(())] B: ese programa [ s que he odo yo] B: se pasan mucho se pasaban [mucho ] A: [lo que-] yoo lo que no entiendo es cmo la gente tiene tantsima paciencia de verdad B: es que el hombre que lo hace un- unaa A: una labia B: s s s porque lo lgico es que te cuelguen A: (s) B: si en cuanto te- te ven que ests haciendo el tonto pero no el to se las ingeniaba paraa A: AAYY no pero seguro que llam a muchas personas y le colgaron B: seguro eso est claro hombre pero una llamadaa de veinte llamadas a lo mejor una A: a ver si llaman a mi madre que si llaman a mi madre no hay ningn problema venga B: (RISAS) A: lo que ustedes quieran con tal de hablar B: s no bueno yo nunca haba hablado y el otro da [((se puso)) ] A: [ves?] a que s? a que se enrolla de maravilla? B: habla habla habla A: s? 26 B: o sea no es FRAGMENTO EN LA VERSIN ESTRECHA B: ah 143,6 y eso era a- la- las tres de la ma- o la una de la maana o por ah 120,4 112,8 o las doce 120,4 no s 101 (0,48) 104,8 y llama a ese nmero 115,1 (0,38) 129,3 y se pone una mujer toda cabreada 135,2 (0,6) dice 133,4 usted es una perra 147 142,1 no s qu no s cuntos154,9 A: 245,4 insultndola? 214,4 B: claro 138 139,2 porque la mujer le haban estao llamando a su telfono todo el da 105,4 (0,62) A: (ya) B: 135,2 con lo mismo 107 (0,5) 126 con la historia de espinete 106,7 (0,5) A: 195,1 pobre mujer 98,8 B: 123,4 y ya estaba 117,7 (0,7) A: (pobres mujeres) B: 107 hasta el gorro 108,6 119,4 y entonces la que le gastaron la broma pues sali 107,5 (2)
26

A: lo has visto? bueno mejor dicho lo has odo? B: alguna vez s A: ay es genial lo van a volver a hacer no s cundo

Entre risas.

74

La transcripcin de la lengua hablada: El sistema del grupo VaL.es.cO


A: (RISAS) B: bueno 135,6 127,8 y eso de la prueba de la paciencia? 167,1 (0,68) A: 154,4 a ver si llaman a mi madre 182 194,7 que si llaman a mi madre 278,2 no hay ningn problema 291,1venga 277,4 (0,64) B: (RISAS) A: 268,5 lo que ustedes quieran 193,6 232,3 con tal de hablar 359,1 (1,14) B: s no 106,1 bueno 112,2 (0,5) 155,4 yo nunca haba hablado 119,4 127,8 y el otro da [((se puso)) 154,7] A: [ves?] a que s? 254,8 227,5 a que se enrolla de maravilla? 224 B: 119,5 habla habla habla 108,6 A: s? 175,3 27 (0,6) B: o sea 122,2 129,8 no es135

A: 327,3 eso son los de radioo 174 los de la ser 190,7 228,1 aqu en Valencia 178,1 213,4 que se dedican a llamar a- a alguien con una historia 102,9 182,3 completamente disparatada 102,9 (0,8) 237,8 un da llam uno a una farmacia 136,7 (0,8) 235 diciendo quee haba comprado all preservativos 254,8 (0,55) 241,3 y que se le haban roto 279,7 y que su novia se haba quedao embarazada 179,4 247,2 y que ahora a ver qu haca l con el nio 169,9 B: (RISAS) A: 177,5 que le tenan que dar una subvencin 305,3 235,6 o que le tenan que dar alguna ayuda para comprar 318 249,7 dice bueno 134,3 B: 130 pues seguro 141,1 [(())] A: [dice por lo menos 267] por lo menos deme usted las papillas gratis 232,8 (0,49) B: (RISAS) A: 168,2 porque ha sido culpa suya 312 (()) [(())] B: s que he odo yo] ese programa 123,5 [140,5

Un paso ms avanzado en el proceso de estrechamiento de la transcripcin implicara necesariamente proceder a la estilizacin de los datos prosdicos. Conviene reconocer, en este sentido, que, al margen de las precisiones metodolgicas anteriores relativas a la transcripcin de los rasgos prosdicos, persisten ciertos problemas pendientes de resolucin (vase al respecto, Estruch et alii, e.p.): - No se dispone de un modelo generalizado y comnmente aceptado para la representacin de los aspectos prosdicos, a diferencia de lo que ocurre en el plano segmental (AFI). -El estudio de la entonacin se ha considerado habitualmente desde un punto de vista fontico o fonolgico, por lo que se han planteado diferentes mtodos de representacin en funcin del predominio de uno u otro enfoque. -La obtencin de representaciones vlidas y generales de las curvas meldicas exige al menos tres etapas: clculo de la curva meldica (valoracin cuantitativa de la F0), obtencin de la curva estilizada correspondiente, anotacin o transcripcin correspondiente. Obviamente el proceso de estilizacin resulta bastante complejo si se quiere mantener escrupulosamente hasta sus ltimas consecuencias. As, desde el principio del proceso
27

A: 137,5 lo has visto? 350,3 bueno 114,9 mejor dicho lo has odo? 278,9
B: 122,9 alguna vez 119,4 s 102,3(0,6) A: ay 222 es genial 192,5 177,8 lo van a volver a hacer 206 230,7 no s cundo 268,5 B: 148,9 se pasan mucho 122,6 se pasaban [mucho 93,6] A: [lo que-] yoo 312 lo que no entiendo es cmo la gente tiene tantsima paciencia 221 de verdad 210,3 B: 149,6 es que el hombre que lo hace un- unaa 128 A: 111,8 una labia 116,8 (0,6) B: s s s 117,3 135,8 porque lo lgico es que te cuelguen 166,3 (0,46) A: (s) B: 123,2 si en cuanto te- te ven que ests haciendo el tonto 166,3 (1,1) pero no 110,2 el to se las ingeniaba paraa 123,1 A: AAYY 447,4 (0,43) no 220,5 pero seguro que llam a muchas personas 298,1 y le colgaron 136,3 (0,5) B: seguro 102,3 117,9 eso est claro 107 hombre 108,2 (0,56) 133,6 pero una llamadaa de veinte llamadas a lo mejor una 128,1

Entre risas.

75

Espaol actuaL
emprico (la grabacin misma) debemos seguir un procedimiento metdico, a fin de tergiversar lo menos posible los datos reales. En primer lugar, se hace necesario minimizar los errores de deteccin de la seal entonativa, para lo cual podemos recurrir a diversas tcnicas, fundamentalmente la de limitacin del rango de bsqueda y la de alisado. La limitacin del rango de bsqueda consiste en determinar un rango frecuencial de bsqueda a partir del rango frecuencial del hablante. En los varones el rango frecuencial se suele situar entre los 80 y los 300 hz, mientras que en las mujeres el rango oscila entre 130 y 525 hz. Los valores de F0 situados fuera de esos rangos debern ser considerados como errores de deteccin y se desestimarn. A ello se aade la aplicacin de las tcnicas de alisado; en primer lugar, se compara cada valor de F0 con los valores anteriores y/o posteriores y se establece as un porcentaje mximo de variacin con respecto a los valores adyacentes. Se entender que los valores de F0 que superan el porcentaje de variacin constituyen errores de estimacin; tales errores de deteccin debern ser eliminados igualmente de la curva meldica definitiva. Eliminados los errores de deteccin todava persisten ciertos problemas empricos derivados de la propia naturaleza de los elementos segmentales. Tales problemas se conocen como variaciones micromeldicas. Efectivamente, las curvas meldicas contienen variaciones o rupturas que, si bien no aportan informacin lingstica relevante, pueden en cambio ofrecer indicios para reconocer el segmento afectado: a) interrupciones debidas a la aparicin de segmentos sordos a lo largo del enunciado. b) variaciones de F0 debidas a la naturaleza de los elementos segmentales: - fundamental intrnseco de las vocales, segn su grado de abertura, de forma que cuanto ms cerrada sea la vocal ms alto es el valor de su F0 - pequeos descensos en la F0 debidos a las caractersticas intrnsecas de ciertas consonantes (aproximantes, vibrantes, etc.)
76

- ascensos y descensos antes y despus de un segmento sordo debidos a los efectos de coarticulacin.

Los resultados y eliminacin final de estas variaciones micromeldicas se conocen como estilizacin entonativa. En la estilizacin, pues, las curvas meldicas quedan reducidas a una serie discreta de puntos, considerados como valores de F0 verdaderamente relevantes para el anlisis, y derivados de la simplificacin de la curva meldica original. Segn el nmero de puntos que se mantenga para la representacin, la estilizacin ser ancha (menor nmero de puntos) o estrecha (mayor nmero de puntos). En general, si la estilizacin se basa en criterios lingsticos (un valor de F 0 para cada slaba), ser ms estrecha que si se basa en criterios acsticos (un valor de F0 para cada cambio destacable en la direccin y la pendiente de la curva), la cuestin es localizar adecuadamente los puntos que permiten proceder a la estilizacin entonativa. El proceso de estilizacin, no obstante, permite eliminar solo una parte de las variaciones irrelevantes de la curva meldica, ya que se mantienen otras como las derivadas de la F 0 propia del hablante o de la duracin ms o menos prolongada del enunciado. Al efecto de hallar solucin para estos problemas destacan las aportaciones de J. M. Garrido o F. J. Cantero. As, Garrido (1991a) y (1991b) propone un sistema que representa los valores frecuenciales de la curva estilizada independientemente del locutor: los valores de los diferentes puntos de inflexin de la curva estilizada se pueden normalizar si se resta el valor de F0 del primer punto de la curva; as el valor inicial se convierte en punto de referencia y los valores de los dems puntos se expresan en trminos de diferencias frecuenciales con respecto a ese punto. Por su parte, Cantero (2002) cuantifica la altura (ascenso o descenso) por medio de porcentajes con respecto al total del rango tonal del hablante. Las diferencias en la F0 inherentes a cada hablante pueden neutralizarse tambin mediante el uso de una escala logartmica para la representacin de los valores frecuenciales.

La transcripcin de la lengua hablada: El sistema del grupo VaL.es.cO


Por ejemplo, la representacin en octavas de Navarro Toms (1944) o en semitonos de THart et alii (1990). Proceso ulterior a la estilizacin es el de la anotacin o representacin simblica de las curvas meldicas, lo que permite la representacin de los movimientos de las mismas mediante smbolos convencionales. Constituye una alternativa a la estilizacin, ya que puede realizarse directamente sobre las curvas meldicas originales, incluso sin necesidad de llevar a cabo un anlisis acstico. Pero tambin puede entenderse como un paso ms, posterior a la estilizacin, en el que se eliminen los ltimos restos de informacin lingstica irrelevante. Hay dos mtodos generales: los que representan la forma fontica de la curva meldica (sistemas de anotacin fontica) y los que representan la forma fonolgica subyacente a la curva meldica (sistemas de anotacin fonolgica) (vanse al respecto Llisterri 1994, 1996 y 1997; o Klein et alii 1998). El sistema de transcripcin ha vuelto a estrecharse en aquellos artculos dedicados al anlisis de las unidades conversacionales que incluyen, adems de las convenciones habituales, el signo # como marca del comienzo y fin del acto, unidad estructural monologal, jerrquicamente inferior a la intervencin, su constituyente inmediato.
12 E6: #yo tengo unos principios# y #para m hay valores fundamentales# 13G3: #eso#/ #y t los sigues no?# [L.15.A.1]

de solicitudes28 y peticiones del corpus en formato electrnico que recibimos por parte de otros investigadores y estudiosos (o incluso de las propias grabaciones), nos hace pensar que posee bastante reusabilidad, adems de inters. Tambin cabe destacar que el criterio seguido por nuestro grupo de primar la fidelidad a los datos de la muestra de habla, teniendo presente el tipo de discurso (conversacional) y la facilidad de lectura (frente a un exceso de representacin de fenmenos diversos y un tipo de codificacin que entorpece o impide apreciar con nitidez la realidad del proceso de habla), no ha sido una decisin en solitario si tenemos presente otros corpus similares que han optado por un sistema de transcripcin parecido29. Citaremos como botn de muestra tres corpus bastante dispares entre s tanto por la finalidad como por el objeto de estudio, aunque unificados por el discurso analizado: la conversacin. El primero de ellos es el Corpus del espaol conversacional de Barcelona y su rea metropolitana, el cual nos ofrece una publicacin reciente (Vila y Grupo GRIESBA 2001). El objetivo principal de este proyecto consiste en disponer de material real, tanto oral como escrito, necesario para poder caracterizar el espaol de una comunidad bilinge como la de Barcelona. Por ello, las muestras recogidas se cien a esta ciudad y a su rea metropolitana. En el volumen editado se recogen 10 situaciones conversacionales de carcter informal. Se emplea un mtodo de transcripcin basado en el del Grupo Val.Es.Co. Reproducimos como ejemplo un breve fragmento conversacional:
Informante 59 I59: est-estas mozas me tienen a m loco de de / me tienen me... y bueno/ este ao to(d)ava A: mhm I59: peroo...
28 El grupo Val.Es.Co. suele enviar de forma gratuita una muestra reducida en formato electrnico a aquellos investigadores que as lo solicitan. 29 Quiz por esta razn nuestro sistema se asemeja bastante al empleado previamente, por ejemplo, por V. Traverso (1996) en su transcripcin de la conversacin familiar. Otro autor que emplea nuestro sistema de transcripcin es Nowikow (2001).

De todo lo visto se extrae una conclusin obvia: no hay un sistema de transcripcin esttico, del mismo modo que no hay un objetivo exclusivo de investigacin, aunque s principios nicos que han de guiar la transcripcin. 3.5. La proyeccin del sistema de transcripcin Una de las crticas ms insistentes que se ha apuntado a nuestro sistema de transcripcin es su dificultad de reusabilidad e incompatibilidad con los programas informticos. Sin embargo, a juzgar no solo por el empleo de nuestro corpus en versin impresa, sino por el nmero
77

Espaol actuaL
A: no no / es bueno ahora c- cmo...? I59: no no / este ao / este ao [sestn comp....]1 A: [(( ))] 1 para ser [((nuevas))]2 I59: [si/ es] 2 te ao para ser nuevas hombre / yo incluso el ao pasado cuando vino tanta gente quel ao pasado vinieron... A: tambin hubo mucha [gente al principio] I59: [si] trees me parece que fueron tres o cuatro nuevas / y este ao hombre este ao pues de momento noo... muy bien no? porque / en un principio (cl)aro / el problema que tengo es el de la portera que jo! dices ff! Sin portera y tal y hoy mimmo con el folln (en) el vestuario de la gente que me ha venido a entrenar / [que...] A: [(a()j!] que ya estaban abroncando

principal es Gallardo Pals, que tiene como objetivo elaborar y analizar el lenguaje afsico. En estos momentos el corpus se encuentra en fase de recogida de datos, aunque ya se est transcribiendo una parte. Para esta transcripcin se ha tenido presente el sistema del Grupo Val.Es.Co, porque, como en nuestro caso, prima el criterio de la legibilidad y el de la fidelidad a los datos; aqu, la fidelidad exige la representacin de una serie de fenmenos importantes desde la perspectiva de este tipo de lenguaje (as, las miradas, los gestos repetitivos, la pronunciacin extraa, etc.). Tambin reproducimos un breve discurso (Gallardo Pals, en prensa.):
108 H. 109 P. algo?)) no tacuerdas? ((yo qu s a- enfer- que tena

Desde otro marco de estudio, HernndezFlores (2002) tambin emplea en gran medida nuestro sistema de transcripcin tal y como la autora indica expresamente, dado que su objeto de anlisis es la descripcin de la cortesa en la conversacin espaola de familiares y amigos. Vase como ejemplo esta muestra de habla:
Secuencia 14: Ofrecimiento de un brazo de gitano Pili: (A Elsa 2) te lo vas a comer mejor as Elsa, porque es que si no est un poco seca, eh?, con la cuchara, vamos a ver, cuntos somos? uno, dos, [tres, cuatro y cinco] = Juan: ciocho y la madre] Pili: (Partiendo la tarta) uno... dos... [die-

110 H. s// y te fui a dar una aspirinaaauna aspirina nooo-uuun eeeh- un antibitico// y entonces/ estabas yaaa que te haba da(d)o el infarto// y luego llamamos al samu/ que vino el samu/ no tacuerdas? (Del corpus PerLa, JFG: 108-110)

4. CONCLUSIONES FINALES Ningn sistema de transcripcin actual puede reproducir exactamente lo oral. Sin pretender lo imposible, nuestro sistema intenta aproximarse, intenta que el lector de dicha transcripcin pueda reproducir lo ms fielmente posible la emisin original, obtener una rpida captacin cognitiva, mostrar ciertas caractersticas de lo oral y, sobre todo, el producto para facilitar el anlisis de la conversacin. Sin duda, el mejor soporte de la investigacin sobre lo oral es el material grabado, pero nadie puede negar el aporte del material escrito y las posibilidades que una buena transcripcin ofrece al analista de la conversacin. Hemos recibido alabanzas, tambin alguna crtica constructiva, que nos ha servido para mejorar el sistema de transcripcin, y, como se ha expuesto, se est utilizando tanto en Espaa como en el extranjero. Sin duda, deseamos mejorar su adecuacin a los sistemas informticos para facilitar su reusabilidad y su posibilidad de intercambio. No negamos, por supuesto, una posible codificacin ms estrecha de ciertos fenmenos, como la efec78

Elsa: (Viendo cmo Pili le parte un trozo) a m, mira, yo te digo Pili: venga! si t tambin eres golosa! Elsa: Pili: (Risas) Elsa: Juan: has odo? = pero no me partas mucho! (A Pili) a ver si... tienes luego la luz... (Pausa de 5 segundos) oye!, s oye =

Por ltimo cabe citar el corpus PerLa (Percepcin y Lenguaje Afsico), cuya investigadora

La transcripcin de la lengua hablada: El sistema del grupo VaL.es.cO


tuada por Hidalgo (1997), aunque por supuesto dicha codificacin debe llevarse a cabo por especialistas y en funcin de unos objetivos especficos. El propsito de nuestro corpus intenta nicamente llenar un hueco en el panorama de los corpus actuales, as como atender a ese fenmeno tan comn y cotidiano como es la conversacin coloquial y, por ello, hemos utilizado el sistema de transcripcin que mejor permite reflejar esa dinmica discursiva. Adems, cabe tener presente que nuestro proyecto de futuro ms inmediato es codificar en nuestro corpus algunos de los fenmenos lingsticos singulares del registro coloquial (orden de palabras, argot, metforas cotidianas, unidades fraseolgicas, neologismos, atenuantes e intensificadores, etc.). Y contamos para ello con una ventaja: todos los hechos lingsticos van a ser marcados por especialistas en la materia y en funcin de unos objetivos concretos, que en parte son coincidentes con los de otros estudiosos de la lengua hablada. Simposio de Historiografa Lingstica. Granada, Mtodo Ediciones, pgs. 103-112. VILA, A. M. (1998): Resea al grupo Val.Es.Co. (coord. Antonio Briz): La conversacin coloquial. Materiales para su estudio. Universitat de Valncia, 1995, Oralia, 1, pgs. 237-251. VILA MUOZ, A. M. (1998b): Corpus orales. Algunos planteamientos tericos previos a la eleccin de textos, en Delgado, F., Calero, M.A. y Osuna, F. (eds.), pgs. 101-114. VILA MUOZ, A.M. (1999): Lxico de frecuencia del espaol hablado en la ciudad de Mlaga. Mlaga. Universidad de Mlaga. AZORN, D. (COORD.) (2002): Alicante corpus oral del espaol. Alicante, Universidad de Alicante (edicin en CD-Rom). AZORN, D. Y JIMNEZ RUIZ, J. L. (1997): Corpus oral de la variedad juvenil universitaria del espaol hablado en Alicante. Alicante, Instituto de Cultura Juan Gil Albert. AZORN, D., JIMNEZ RUIZ, J. L. Y MARTNEZ LINARES, M.A.: (eds.) (1999): Estudios para un corpus del espaol hablado en Alicante. Alicante, Universidad de Alicante. BARRENECHEA, A. M. (ED.) (1987): El habla culta de la ciudad de Buenos Aires. Materiales para su estudio. Buenos Aires, Universidad de Buenos Aires. BIBER, D. Y FINEGAN, E. (EDS.) (1994): Sociolinguistic Perspectives on Register. Nueva York, Oxford University Press. BLANCHE-BENVENISTE, C. y JEANJEAN, C. (1987): Le franais parl. Transcription et dition. Paris, Didier rudition. BRIZ, A. (1996): El corpus de conversacin coloquial del grupo Val.Es.Co, en Payrat, Ll., Boix, E., Lloret, M. y Lorente, M. (eds.) Corpus, Corpora. Actes del 1er i 2on Col.loquis Lingstics de la Universitat de Barcelona (CLUB-1, CLUB-2). Barcelona, Promociones y Publicaciones Universitarias S.A., pgs. 255-296. BRIZ, A. (1998): El espaol coloquial en la conversacin. Esbozo de pragmagramtica. Barcelona, Ariel. BRIZ, A. (2000a): Turno y alternancia de turno en la conversacin, Revista Argentina de Lingstica, 16, 3-27.
79

REFERENCIAS BIBLIOGRFICAS ALVAR EZQUERRA, M. y CORPAS PASTOR, G. (1994): Criterios de diseo para la creacin de corpora, en Alvar Ezquerra, M. y Villena Ponsada, J.A. (coords.), pgs. 31-40. ALVAR EZQUERRA, M. y VILLENA, J. A. (coords.) (1994): Estudios para un corpus del espaol. Mlaga, Universidad de Mlaga (Analecta Malacitana, Anejo 7). ALVAR EZQUERRA, M., BLANCO, M J., PLAGOS, F. (1994): Diseo de un corpus espaol en el marco de un corpus europeo, en Alvar Ezquerra, M. y Villena Ponsada, J.A. (coords.), pgs. 8-29.
REZ

ARRATE, G. Y LLISTERRI, J. (1996): Informe sobre recursos lingsticos para el espaol. Corpus escritos y orales disponibles y en desarrollo en Espaa. Alcal de Henares, Instituto Cervantes. VILA MUOZ, A.M. (1996): Problemas prcticos en la realizacin de corpus orales. La transliteracin del corpus oral del proyecto de investigacin de las variedades vernculas malagueas (VUM), en Luque Durn, J. y Pamies Bertrn, A. (eds.) (1996) Actas del Primer

Espaol actuaL
BRIZ, A. (2000b): El anlisis de un texto oral coloquial, en A. Briz y Grupo Val.Es.Co. (2000), pgs. 29-48. BRIZ, A. ET ALII (1995a): La elaboracin de un corpus de espaol coloquial. Problemas metodolgicos previos, en Actas del I Congreso de Lingstica General. Valncia, Universitat de Valncia. BRIZ, A. (COORD.) (GRUPO VAL.ES.CO.) (1995b): La conversacin coloquial. Materiales para su estudio. Anejo XVI de la revista Cuadernos de Filologa. Valencia, Universitat de Valncia. BRIZ, A. y GRUPO VAL.ES.CO. (2000): Cmo se comenta un texto coloquial? Barcelona, ArielPracticum. BRIZ, A. y GRUPO VAL.ES.CO. (2002): Corpus de conversaciones coloquiales. Anejo de la revista Oralia. Madrid, Arco Libros. BRIZ, A. y GRUPO VAL.ES.CO. (2003): Un sistema de unidaes para el estudio del lengujuaje coloquial, Oralia 6, pgs. 7-61. BRIZ, A. y GMEZ MOLINA, J. R. (1992): Scheme of Study of Colloquial Spanish: Some Methodological Considerations, LynX, 3 (A Monographic Series en Linguistics and World Perception), pgs. 111-124 BROWN, G. y YULE, G. (1983): Anlisis del discurso. Madrid, Visor. CANTERO, F. J. (2002): Teora y anlisis de la entonacin. Barcelona, Edicions Universitat de Barcelona. CARAVEDO, R. (1999): Gramtica espaola: Enseanza e Investigacin. I. Apuntes metodolgicos. 6. Lingstica del Corpus. Cuestiones tericometodolgicas aplicadas al espaol. Salamanca, Ediciones Universidad de Salamanca. CARR, R. (1991): Los bancos de sonidos, en Vidal Beneyto, J. (dir.), Las industrias de la lengua. Salamanca/Madrid, Fundacin Snchez Ruiprez / Pirmide (Biblioteca del Libro, 5) pgs. 108-118. CARR, R. (1992): Speech Databases en Ainsworth, W.A. (ed.) Advances en Speech, Hearing and Language Processing. A Research Annual, 2. London, Jai Press, pgs. 199-216. CARTAGENA, N. (1998): Resea a Briz, A. (coord.) (Grupo Val.Es.Co.) (1995), La conver80

sacin coloquial. Materiales para su estudio, Romanistisches Jahrbuch, 49, pgs. 392-394. CERDN, L. y LLOBERA, M. (1997): Actuacin de los profesores en el aula. Desarrollo de un modelo semitico de transcripcin, RESLA,12, pgs. 115-140. CORTS RODRGUEZ, L. (1994): Tendencias actuales en el estudio del espaol hablado. Almera, Universidad de Almera. CRIADO DE VAL, M. (1980): Estructura general del coloquio. Madrid, SGEL. DE KOCK (ED.) (2001): Gramtica espaola: enseanza e investigacin. I. Apuntes metodolgicos. 7. Lingstica con corpus. Catorce aplicaciones sobre el espaol. Salamanca, Ediciones Universidad de Salamanca. DE MELLO, G. (2001): Objeto directo vs. objeto indirecto con verbo de influencia: A Mara no la/le dejan salir de noche, en De Kock (ed.), pgs. 139-154. DU BOIS, J. W. (1991): Transcription design principles for spoken discourse research, Pragmatics, 1, pgs. 71-106 DU BOIS, J. W., Schuetze-Coburn, S., Cumming, S. y Paolino, D. (1993): Outline of discourse transcription, en Edwards, J.A., Lampert, M.D. (eds.) Talking Data: Transcription and Coding en Discourse Research. Hillsdale, N.J., Lawrence Erlbaum Associates, pgs. 4590. PROYECTO EAGLES, Handbook on Spoken Languaje Systems. Draft-Work in Progress. EAGLES Document SLWG, Phase 2, 1- may - 1995, URL: http://coral.lili.uni-bielofold.de/~gibbon/EAGLEs/ slwghand-t/slwghand-t.html. EDWARDS, J. A. (1993): Principles and contrasting systems of discourse transcription, en Edwards, J.A., Lampert, M.D. (eds.) Talking Data: Transcription and Coding en Discourse Research. Hillsdale, N.J., Lawrence Erlbaum Associates, pgs. 3-32 EDWARDS, J. A., y LAMPERT, M.D. (EDS.) (1993): Talking Data: Transcription and Coding en Discourse Research. Hillsdale, N.J., Lawrence Erlbaum Associates. ESGUEVA, M. Y CANTARERO, M. (EDS.) (1981): El habla de la ciudad de Madrid. Materiales para su estudio. Madrid, CSIC.

La transcripcin de la lengua hablada: El sistema del grupo VaL.es.cO


ESTRUCH, M., GARRIDO, J.M., LLISTERRI, J. Y RIERA, M. (en prensa): Tcnicas y procedimientos para la representacin de las curvas meldicas, en Philologica Hispalensis. FANT, L. (1984): Estructura informativa en espaol. Estudio sintctico y entonativo. Uppsala, Almqvist & Winksell International. FAJARDO, A. (1996): Resea de La conversacin coloquial. Materiales para su estudio, Revista de Filologa de la Universidad de La Laguna, 15, pgs. 239-240. FERNNDEZ, A. Y LLISTERRI, J. (1996): Informe sobre los recursos lingsticos para el espaol (II): Corpus escritos y orales disponibles y en desarrollo en Espaa. Madrid, Alacal de Henares. FRENCH, J. P. (1992): Transcription proposals: multilevel System. Working paper, University of Birmingham. GALLARDO PALS, B. (1998a): Comentario de textos conversacionales II. Los textos. Madrid, Arco-Libros. GALLARDO PALS, B. (1998b): Comentario de textos conversacionales I. De la teora al comentario. Madrid, Arco-Libros. GALLARDO PALS, B. (en prensa): La transcripcin del habla patolgica, Estudios de Lingstica Clnica, 2, Valencia, Nau Llibres. GARRIDO, J. M. (1991a): Modelizacin de patrones meldicos del espaol para la sntesis y el reconocimiento de habla. Bellaterra, Universitat Autnoma de Barcelona. GARRIDO, J. M. (1991b): Modelizacin de patrones meldicos del espaol para sistemas de conversin texto-habla, en Procesamiento del Lenguaje Natural, 11, pgs.209-219. GARRIDO, J. M. (1996): Modelling Spanish Intonation for Text-to-speech Applications. Barcelona, Universitat Autnoma de Barcelona. GMEZ MOLINA, J. R. (Coord.) (2001): El espaol hablado en Valencia. Materiales, el estudio sociolingstico. (PRESEEH). Vol. I. Nivel sociocultural Alto. Valencia. Universitat de Valencia. Anejo XXI de Cuadernos de Filosofa. GUMPERZ, J. J. Y BERENZ, N. (1993): Transcribing Conversational Exchanges, en Edwards, J.A., Lampert, M.D. (eds.) Talking Data: Transcription and Coding en Discourse Research .
81

Hillsdale, N.J., Lawrence Erlbaum Associates. pgs. 91-122. HALLIDAY, M. A. K. (1985): Lingua parlata e lingua scritta. Firenze, La Nuova Italia. HERNNDEZ, N. (2002): La cortesa en la conversacin espaola de familiares y amigos, Tesis doctoral. Adlborg Universitet, vol 37. HIDALGO, A.(1993): El habla juvenil: Una propuesta metodolgica para la extraccin de un corpus oral representativo en Fernndez Barrientos, J. (ed.) Jornadas Internacionales de Lingstica Aplicada/International Conference of Applied Linguistics. Robert J. Di Pietro en Memorian. Actas/Proceedings. Granada, Instituto de Ciencias de la Educacin de la Universidad de Granada, 1, pgs. 66-75. HIDALGO, A. (1997): Entonacin coloquial. Funcin Demarcativa y Unidades de Habla. Anejo XXI de la Revista Cuadernos de Filologa. Valencia, Universidad de Valencia. HIDALGO, A. y PONS, S. (1991): Algunas consideraciones sobre la paradoja del observador, en Calvo, J.(1991): Lingstica Aplicada y Tecnologa, I (Actas del I Simposio. Valencia, 12-16 de febrero de 1990). Valncia, Universitat, pgs. 71-84. INSTITUTO CERVANTES (1996): Informe sobre recursos lingsticos para el espaol (II). Corpus ESPAA. OBSERVAESPAOL DE INDUSTRIAS DE LA LENGUA. Alcal de Henares.
DISPONIBLES Y EN DESARROLLO EN TORIO

INSTITUTO CERVANTES.

ESCRITOS Y ORALES

JEFFERSON, G. (1987): An exercise in the transcription and analysis of laughter, en van Dijk (ed.) Handbook onf Discourse Analysis , 3. Londres, Academic Press, pgs. 25-34. JOHANSSON, S. (1991): Computer corpora in English language research, en Johansson y Stenstrm (eds). JOHANSSON, S. y STENSTRM, A-B. (EDS) (1991): English Computer Corpora. Selected Papers and Research Guide, Berlin, Mouton. KLEIN, M. ET ALII (1998): Supported Coding Schemes, Multilevel Annotation Tools Engineering, LE Telematics Project LE4-8370, Deliverable D1.1. KNOWLES, G. (1996): The value of prosodic transcriptions, en Knowles et alii (eds.) Work-

Espaol actuaL
ing with Speech: Perspectives on research into the Lancaster/IBM Spoken English Corpus. Londres y New York, Longman, pgs. 87-106. LAMQUIZ, V. (1994): El enunciado textual. Anlisis lingstico del discurso. Barcelona, Ariel. LAMQUIZ, V. (dir.) (1983): Sociolingstica andaluza, 2. Material de encuestas para el estudio del habla urbana culta de Sevilla. Sevilla, Universidad de Sevilla. LAMQUIZ, V. (dir.), (1987): Encuestas del habla urbana de Sevilla, Sociolingstica andaluza. Sevilla, Servicio de Publicaciones. LAMQUIZ, V. (dir.) (1992): Sociolingstica andaluza, 6. Encuestas del habla urbana de Sevilla (nivel medio). Sevilla, Universidad (editores M. Ollero, M. . Pineda). LASSALETA, M. C. (1974): Aportaciones al estudio del lenguaje coloquial galdosiano. Madrid, nsula. LAVACCHI, L. (2001): Las oraciones pseudoescindidas, en De Kock (ed.), pgs. 197-228. LEECH, G. ET ALII (eds.) (1995): Spoken English on Computer: Transcription, Markup and Applications. Harlow, Longman. LEVINSON, S. (1983, 1989): Pragmtica. Barcelona, Teide. LLISTERRI , J. (1994): Prosody Encoding Survey. WP 1 Specifications and Standards. T1.5 Markup Specifications. Deliverable 1.5.3. Final version, 15 September 1994. LRE project 62-050 MULTEXT. LLISTERRI, J. (1996): Els corpus lingstics orals, en Payrat, Ll., Boix, E.,. Lloret, M.R., Lorente, M. (eds.) (1996), pgs. 27-70. LLISTERRI, J. (Ed.) (1996): Prosody Tools Efficiency and Failures. WP 4 Corpus. T4. 6 Speech Markup and Validation. Deliverable 4.5.2. Final version 15 October 1996. LRE Project 62-050 MULTEXT. LLISTERRI, J. (1997): Transcripcin, etiquetado y codificacin de corpus orales, en Seminario de Industrias de la Lengua, Curso Etiquetado y extraccin de informacin de grandes corpus textuales. Soria, Fundacin Duques de Soria. http://liceu.mdb.es. LLISTERRI, J. (1999): Transcripcin, etiquetado y codificacin de corpus orales, en G82

mez Guinovar, J., Lorenzo, A., Prez Guerra, J. y lvarez, A. (eds.), Panorama de la investigacin en lingstica informtica. RESLA, (volumen monogrfico), pgs. 53-82. LLORENTE ARCOCHA, M. T. (1996): Organizadores de la conversacin. Operadores discursivos en espaol. Salamanca, Universidad Pontificia de Salamanca. LOPE BLANCH, J. M. (ed.) (1971): El habla de la ciudad de Mxico. Materiales para su estudio. Mxico, Publicaciones del Centro de Lingstica Hispnica de la UNAM. LOPE BLANCH, J. M. (1986): El estudio del espaol hablado culto. Historia de un proyecto. Mxico, Universidad Nacional Autnoma de Mxico. LPEZ GUZMN, J. M. (1994): Niveles de representacin de textos escritos, en Alvar Ezquerra, M. y Villena Ponsada, J.A. (eds.) pgs. 63-71. LPEZ MORALES, H. (1994): El corpus, en Mtodos de investigacin lingstica, Salamanca, Ediciones Colegio de Espaa, pgs. 95-103. LPEZ MORALES, H. (1996): Los estudios de disponibilidad lxica: pasado y presente, en Actas del IV Congreso de la Asociacin Espaola de Filologa de Costa Rica. LPEZ MORALES, H. (1997): Corpora orales hispnicos, en Briz, A. et alii (eds.) (1997b), pgs. 137-145. MARCOS MARN, F. Y ZUMRRAGA, V. (1991): El corpus de referencia de la lengua espaola, Razn y Fe, 223/1, 109, pgs. 285-293. MARCOS MARN, F. (1991a): Corpus oral de referencia de la lengua espaola contempornea, en Marcos Marn, F., Archivos Digitales. Sociedad Estatal del V Centenario, rea de Industrias de la Lengua, pgs. 1-25. MARCOS MARN, F. (1991b): Archivos digitales, en Simposio de la Lengua Espaola. Ciencia y Tecnologa. Barcelona. MARCOS MARN, F. (1991c): Corpus lingstico de referencia de la lengua espaola, Boletn de la Academia Argentina de Letras, 56, pgs. 129-155. MARCOS MARN, F. (1994): Informtica y humanidades. Madrid, Gredos.

La transcripcin de la lengua hablada: El sistema del grupo VaL.es.cO


MARCOS MARN, F. (1996): El comentario filolgico con apoyo informtico. Madrid, Sntesis. MARCOS MARN, F., BALLESTER, y SANTAMAC. (1993): Transcription Conventions used for the Corpus of Spoken Contemporary Spanish, Literary and Linguistic Computing 8, 4, pgs. 283-292.
RA ,

MORENO FERNNDEZ, F., CESTERO MANTERA, A.M., MOLINA MARTOS, I. Y PAREDES GARCA, F. (2000): La sociolingstica de Alcal de Henares en el Proyecto sociolingstico del espaol de Espaa y de Amrica (PRESEA), Oralia, 3, pgs. 113-148. NARBONA, A. (1993): Notas sobre sintaxis coloquial y realismo en la literatura narrativa espaola, en Bartol Hernndez, J.A. et alii (eds.): Estudios Filolgicos en Homenaje a Eugenio de Bustos Tovar, I. Salamanca, Universidad de Salamanca, pgs. 163-169. NAVARRO TOMS, T. (1944): Manual de entonacin espaola. Nueva York, Hispanic Institute. NAVARRO TOMS, T. (1982): Manual de pronunciacin espaola. Madrid, CSIC. (1 ed. 1919). Reference Corpora. Final Report. Pisa. (Spoken Language, Phonetic/Phonemic and Prosodic Annotation).
NERC (1994): NERC-1. Network of European

MARRONE, N. G. (ed.) (1992): El habla de la ciudad de La Paz. Materiales para su estudio. La Paz, Signo. MCCARTHY, M. J. (1999): Spoken language and Applied Linguistics. Cambridge, Cambridge University Press. MCENERY, T. y WILSON. A. (1996): Corpus Linguistics, Edinburgh University Press. MONTES GIRALDO, J. J. ET ALII (1997): El espaol hablado en Bogot. Relatos semilibres de informantes pertenecientes a tres estratos sociales. Santaf de Bogot, Instituto Caro y Cuervo. MORALES, A. y M. VAQUERO (EDS.) (1990): El habla culta de San Juan. Materiales para su estudio. Ro Piedras. MORENO FERNNDEZ, F. (1995): Proyecto de estudio sociolingstico del espaol y del espaol de Amrica (PRESEEA). Presentacin en Lingstica, 7. pgs. 364-380. MORENO FERNNDEZ, F. (1997a): Niveles sociolingsticos, estilos y lengua hablada, la formacin de corpus lingsticos, en Briz, A., Gmez Molina, J.R., Martnez Alcalde, M.J. y grupo Val.Es.Co. (eds.): Pragmgtica y gramtica del espaol hablado. Zaragoza. Prtico. pgs. 147-155. MORENO FERNNDEZ, F. (1997b): Metodologa del Proyecto para el Estudio Sociolingstico del Espaol de Espaa y de Amrica, en Moreno Fernndez, F. (ed.), Trabajos de sociolingstica hispnica. Alcal de Henares, Universidad de Alcal, pgs. 137-167. MORENO FERNNDEZ, F. (1997c): La formacin de corpus de lengua hablada, en Moreno Fernndez, F. (ed.): Trabajos de sociolingstica hispnica. Alcal de Henares, Universidad de Alcal, pgs. 93-114. MORENO FERNNDEZ, F. (ED.) (1992): Sociolinguistics and Stylistic Variation, Valencia, LynX, 3. University of Minnesota/Universitat de Valncia.
83

NOWIKOW, W. (2001): Sobre la elaboracin del modelo para el estudio del espaol hablado de Puebla (Mxico): esbozo de una experiencia, Moenia. OCHS, E. (1979): Transcription as theory, en Ochs, E. y Schiffelin, B. (eds.), Developmental Pragmatics. Nueva York, Academic Press, pgs. 43-72. OESTERREICHER, W. (1996): Lo hablado en lo escrito. Reflexiones metodolgicas y aproximacin a una tipologa, en Kotschi, T. , Oesterreicher, W. y Zimmermann, K. (eds.) (1996), pgs. 317-340. OTLORA DE FERNNDEZ, H. Y A.GONZLEZ (DIRS) (1986): El habla de la ciudad de Bogot, materiales para su estudio. Bogot, Instituto Caro y Cuervo. PADILLA GARCA, X.A. (2003): Los papeles comunicativos y las unidades conversacionales, en Actas del Congreso Alonso Zamora Vicente (Los clsicos, los contemporneos), Alicante, Universidad de Alicante. PADILLA GARCA, X.A. (en prensa): Del oyente receptor al oyente combatiente, ELUA, 17. PAYRAT, LL. (1988): Catal col.loquial. Aspectes de ls corrent de la llengua catalana. Valencia, Universidad de Valencia.

Espaol actuaL
PAYRAT, LL. (1995): Transcripcin del discurso coloquial, en Corts, L. (ed.): El espaol coloquial. Actas del I Simposio sobre Anlisis del Discurso Oral. Almera, Universidad de Almera, pgs. 43-70. PAYRAT, LL., BOIX, E., LLORET, LORENTE, M. (eds.) (1996): Corpus, corpora (Actes del 1r i 2n Col.loquis Lingstics de la Universitat de Barcelona (CLUB-1, CLUB-2). Barcelona, PPU. MORENO, M. (1999): TranPINO scripcin, codificacin y almacenamiento de los textos orales del corpus CREA. Versin 4.1. Madrid, Real Academia Espaola. [Disponible a travs de http://www.rae.es en su acceso especial para investigadores o a travs de la direccin de correo electrnico oral@rae.es.] PINO MORENO, M. Y M. SNCHEZ SNCHEZ (1999): El subcorpus oral del banco de datos CREA-CORDE (Real Academia Espaola): Procedimientos de transcripcin y codificacin, Oralia, 2, pgs. 83-138. PORTOLS, J. (2000): Dos perspectivas en el estudio de los marcadores discursivos, en De Miguel, E.; Fernndez Lagunilla, M. (eds.): Sobre el lenguaje: unidades plurales y singulares . Madrid, Arrecife, pgs. 101-119. POYATOS, F. (1994): La comunicacin no verbal. Madrid, Istmo. QUILIS, A. (1975): Las unidades de la entonacin, RSEL, 5, pgs. 261-280. QUILIS, A. (1981): Fontica Acstica de la lengua espaola. Madrid, Gredos. QUILIS, A. ET ALII (1993): El grupo fnico y el grupo de entonacin en espaol hablado, Revista de Filologa Espaola, 73, pgs. 55-64. RABANALES, A. y CONTRERAS, L. (eds.) (1979): El habla culta de Santiago de Chile. Materiales para su estudio. Santiago de Chile. Anejo 2 del Boletn de Filologa de la Universidad de Chile. RABANALES, A. y CONTRERAS, L. (eds.) (1990): El habla culta de Santiago de Chile. Materiales para su estudio. Bogot, Instituto Caro y Cuervo. RAE (1998): CREA-CORDE. Transcripcin y codificacin de textos orales. Madrid. http:// www.rae.es ROSENBLAT, . y BENTIVOGLIO, P. (eds.) (1979): El habla culta de Caracas. Materiales para su estudio. Caracas.
84

SACKS, H., SCHEGLOFF, E. Y JEFFERSON, G. (1974): A Symplest Systematics for the Organization of Turn-Taking for conversation, Language, 50,4, pgs. 696-735. SAMPER PADILLA, A.; HERNNDEZ, C. Y TROYA, M. (1998): Macrocorpus de la norma lingstica culta de las principales ciudades del mundo hispnico (MC-NLCH). Las Palmas de Gran Canaria. Las Palmas, Servicio de Publicaciones de la Universidad de Las Palmas de Gran Canaria (edicin en CD-Rom). SAMPER PADILLA, J. A. (1990): Estudio sociolingstico del espaol de Las Palmas de Gran Canaria. Las Palmas de Gran Canaria, La Caja de Canarias. SAMPER PADILLA, J. A. (1995): Presentacin del Macro-corpus de la norma lingstica culta de las principales ciudades del Mundo Hispnico, Lingstica, 7, pgs. 381-398 SAMPER PADILLA, J. A. (1996): El estudio de la norma lingstica culta del espaol de Las Palmas de Gran Canaria, en Medina, J., Corbella, D. (eds.): El espaol de Canarias hoy, anlisis y perspectivas. Frankfurt, Vervuert Iberoamericana, pgs. 255-283. SNCHEZ LEN, F. (2001): Corpus y paradigma verbal, en De Kock (ed.), pgs. 371-393. SNCHEZ, A. (1983): Una metodologa de la lengua oral. Madrid, Escuela Espaola. SNCHEZ, A. (1995): Implicaciones del Corpus en la enseanza de la lengua, en Snchez, A., Sarmiento, R., Cantos, P. y Simn, J., pgs. 115-127. SNCHEZ, A., SARMIENTO, R., CANTOS, P. Y SIJ. (1995): CUMBRE, Corpus lingstico del espaol contemporneo, Madrid, SGEL.
MN,

SANMARTN, J. (1998): Palabras desde el talego. Valencia, Instituci Alfons el Magnnim. SARMIENTO, R. (1995): La investigacin gramatical mediante corpus: el Corpus Cumbre, en Snchez, A., Sarmiento, R. Cantos, P. y Simn, J., pgs. 83-113. SINCLAIR, J. (1991): Corpus, Concordance, Collocation. Oxford, University Press. SPERBERG-MCQUEEN, C.M. Y BURNARD, (EDS.) (1994): Guidelines for Electronic Text Encoding and Interchange. TEI P3. Chapter 11: Transcriptions of Speech. Association for Computational Linguistics / Association for Computers and the

La transcripcin de la lengua hablada: El sistema del grupo VaL.es.cO


Humanities / Association for Literary and Linguistic Computing. Chicago and Oxford, URL: http: //etext.virginia.edu/tei.html. STUBBS, M. (1987): Anlisis del discurso, Madrid, Alianza (1 ed., 1983). TANNEN, D. (ED.) (1981): Analysing Discourse. Text and Talk. Washington, Georgetown University Press. TANNEN, D. (ED.) (1982): Coherence in Spoken and Written Discourse. Norwood, Ablex. TANNEN, D. (1984): Conversational Style: Analysing Talk among Friends, Norwood, N.J., Ablex. THART, J. ET ALII (1990): A Perceptual Study of Intonation. An Experimental-Phonetic Approach to Intonation. Cambridge, CUP.Traverso, V. TRAVERSO, V. (1996): La conversation familire. Analyse pragmatique des interactions. Lyon, Presses universitaires de Lyon. VZQUEZ VEIGA, N. (1995): Corpus de lengua hablada en la ciudad de A Corua: el rol del entrevistador en la conversacin semidirigida, Moenia, pgs. 181-202. VERA, A. (1998): Los medios de comunicacin como recurso lingstico (proyecto de acopio y distribucin de materiales lingsticos. Instituto Cervantes, Espaa), en La lengua espaola y los medios de comunicacin. Mxico, Siglo XXI Editores, pgs. 1331-1338. VILA, R. Y GRUPO GRIESBA (2001): Corpus del espaol conversacional de Barcelona y su rea metropolitana. Barcelona, Edicions Universitat de Barcelona. VILLENA PONSODA, J. A. (1994): Pautas y procedimientos de representacin del corpus oral de la Universidad de Mlaga. Informe preliminar, en Alvar Ezquerra, M., Villena Ponsoda, J.A. (coords.): Estudios para un corpus del espaol. Mlaga, Universidad de Mlaga. pgs. 73-102.

85

You might also like