Corpora

En esta página podéis encontrar tres corpus de habla infantil para estudiar la adquisición del catalán, la adquisición del castellano y la adquisición de las dos lenguas por parte de niños bilingües.

 

  Corpus Serra-Solé Corpus con los datos de cinco niños monolingües de catalán, un monolingüe castellano y cuatro bilingües de catalán y castellano. Las transcripciones fonéticas del corpus con la aplicación Phon incluyen grabaciones desde 1;0 hasta 2;9. El corpus completo, con grabaciones desde 1;0 hasta 4;0, está disponible en CHILDES.

 

  Corpus Llinàs-Ojea Corpus con los datos de dos niñas monolingües de castellano y una niña monolingüe de catalán. Las transcripciones fonéticas del corpus con la aplicación Phon incluyen grabaciones desde 0;11 hasta 2;04. El corpus completo, con grabaciones desde 0;11 hasta 3;02, está disponible en CHILDES.
 

 

Corpus López-Ornat

 

Corpus con los datos de una niña monolingüe de castellano. Las transcripciones fonéticas del corpus con la aplicación Phon incluyen grabaciones desde 1;07 hasta 2;04. El corpus completo, con grabaciones desde 1;07 hasta 3;10, está disponible en CHILDES.

 

Corpus Esteve-Prieto

Corpus con grabaciones audiovisuales de cuatro niños monolingües catalanohablantes, desde los 6 hasta los 32 meses. Grabaciones semanales o quincenales. Las sesiones desde los 7 hasta los 11 meses contienen transcripciones ortográficas y sobre intenciones pragmáticas con la aplicación Phon.

 

Instrucciones para consultar el corpus. Se puede consultar el corpus de dos formas distintas:
  • En formato PhonProject, que incluye sesiones audiovisuales de grabación segmentadas, anotadas y transcritas fonéticamente en formato .phon (el propio del programa Phon).
  • En formato CLAN, que incluye archivos con la transcripción ortográfica que se pueden descargar en formato .pdf y en formato .cha (el propio del programa CLAN).

 

Los miembros del equipo de los proyectos Phon-Cat y Phon-Esp agradeceran ser notificados con una copia o un resumen de cualquier trabajo que haya sido posible gracias el uso de los datos disponibles en el corpus.