Corpora

En aquesta pàgina hi trobareu quatre corpus de parla infantil per a estudiar l'adquisició del català, l'adquisició del castellà i l'adquisició de totes dues llengües per part de nens bilingües.

 

  Corpus Serra-Solé Corpus amb les dades de cinc nens monolingües de català, un monolingüe castellà i quatre bilingües de català i castellà. Les transcripcions fonètiques del corpus amb l'aplicació Phon inclouen gravacions des d'1;0 fins a 2;9. El corpus complet, amb gravacions des d'1;0 fins a 4;0, està disponible a CHILDES.

 

  Corpus Llinàs-Ojea Corpus amb les dades de dues nenes monolingües de castellà i una nena monolingüe de català. Les transcripcions fonètiques del corpus amb l'aplicació Phon inclouen gravacions des de 0;11 fins a 2;04. El corpus complet, amb gravacions des de 0;11 fins a 3;02, està disponible a CHILDES.
 

 

Corpus López-Ornat

 

Corpus amb les dades d'una nena monolingüe de castellà. Les transcripcions fonètiques del corpus amb l'aplicació Phon inclouen gravacions des de 1;07 fins a 2;04. El corpus complet, amb gravacions des de 1;07 fins a 3;10, està disponible a CHILDES.

 

 

Corpus Esteve-Prieto

 

Corpus amb enregistraments audiovisuals de quatre nens monolingües catalanoparlants, des dels 6 fins als 32 mesos. Gravacions setmanals o quinzenals. Les sessions des dels 7 fins als 11 mesos contenen transcripcions ortogràfiques i sobre intencions pragmàtiques amb Phon.

 

 

Instruccions per a consultar el corpus. Podeu consultar el corpus de dues maneres diferents:

  • En format PhonProject, que inclou sessions audiovisuals de gravació segmentades, anotades i transcrites fonèticament en format .phon (el propi del programa Phon).
  • En format CLAN, que inclou fitxers amb la transcripció ortogràfica que es poden descarregar en format .pdf i en format .cha (el propi del programa CLAN).

 

Els membres de l'equip dels projectes Phon-Cat i Phon-Esp agrairan ser notificats amb una còpia o un resum de qualsevol treball que hagi estat possible mitjançant l'ús de les dades disponibles en els corpus.