Corpus Esteve-Prieto

1. Corpus amb transcripció ortogràfica i pragmàtica (en format PhonProject)

Descripció general. Corpus amb sessions audiovisuals de quatre nens catalanoparlants (An, On, Bi i Ma) des que tenien 6 mesos fins que en van fer 32. Les sessions de 6 a 11 mesos estan segmentades, anotades i transcrites ortogràficament i pragmàticament amb l'aplicació Phon. Els nens van ser enregistrats a setmanalment dels 6 mesos a 1 any d'edat, quinzenalment des de l'any fins als 18 mesos d'edat, i cada tres setmanes dels 19 als 32 mesos. Els enregistraments es van fer a casa de les famílies i mentre interactuaven espontàniament amb algun adult, normalment la mare. Les sessions tenen entre 30 i 40 minuts cadascuna. L'entorn lingüístic dels nens és gairebé exclusivament en català, ja que pares i mares parlen només en català amb els nens i entre ells. A més, tots quatre nens van néixer i viuen en petites localitats de la comarca de l'Alt Penedès (Catalunya), a 50 km al sud de Barcelona. Segons el web de l'estadística oficial de Catalunya (www.idescat.cat), aproximadament el 90% de la població que viu en aquestes localitats parla regulament català.

 

Materials. Gravacions audiovisuals des dels 6 als 32 mesos. Les sessions dels 7 als 11 mesos contenen la transcripció ortogràfica i anotació de les funcions pragmàtiques de les produccions dels nens. El corpus s'ha anotat pragmàticament tenint en compte elements no verbals com ara els moviments de les mans, la direcció de la mirada, l'expressió de la cara o la posició del cos. A partir de l'observació d'aquests elements, les vocalitzacions s'han classificat en algun d'aquests grups: non-communicative (si la vocalització no té cap intencionalitat comunicativa), protest (si l'infant expressa desaprovació o desacord), request (si l'infant vol arribar a un objecte), response (si l'infant replica a una pregunta de la mare), satisfaction (si l'infant està conent i ho expressa verbalment), statement (si l'infant inicia la comunicació amb l'adult mentre el mira), surprise (si l'infant vocalitza després d'un esdeveniment inesperat), vocative (si l'infant crida algú que ha sortit de l'habitació) o fuzzy intention (si la vocalització és clarament comunicativa però sense cap intenció específica).

 

Nom Rang d'edat Sexe Núm. de sessions Corpus
An dels 7 als 31 mesos nena 45 vés-hi
On dels 5 als 31 mesos nena 39 vés-hi
Bi dels 6 als 32 mesos nen 42 vés-hi
Ma dels 6 als 31 mesos nen 40 vés-hi

 

Equip de treball. Els membres del GrEP (Grup d'Estudis de Prosòdia) que han treballat en la segmentació i anotació del corpus són Núria Esteve, que ha dut a terme els enregistraments i les transcripcions ortogràfica i pragmàtica, i Pilar Prieto, que ha supervisat tot el procés d'enregistrament i transcripció.

 

Patrocini. L'elaboració del corpus ha estat finançada pels projectes del Ministeri d'Educació i Ciència HUM2006-01758/FILO, 2006-2009 ("Estructura prosòdica i adquisició de la prosòdia en català i espanyol") i FFI2009-07648/FILO, 2009-2011, a més del projecte Batista i Roca, finançat per la Generalitat de Catalunya (2009 PBR 00018). Tots tres projectes són dirigits per Pilar Prieto (ICREA-Universitat Pompeu Fabra).