Corpus

Les dades dels corpus es presenten en suport auditiu i, si està disponible, en suport audiovisual. La classificació és segons l’investigador o grup de recerca que ha recollit el corpus (AMPER-Cat, Arxiu de Tradicions de l’Alguer, Atles interactiu de l’entonació del català, Francesc Ballone, Andreu Bosch o Jaume Corbera).

Dins de cada corpus hom pot visualitzar/escoltar el material i anar-lo seguint mitjançant la transcripció ortogràfica. La transcripció ortogràfica s'ha fet seguint uns criteris lingüístics (lèxic, fonètica, morfologia i sintaxi) i no lingüístics adoptats també per a la transcripció ortogràfica de les dades de conversa espontània o semiespontània presentades a l’Atles interactiu de l’entonació del català. Per a l'elaboració d'aquests criteris s'han consultat obres de referència per a cada un dels subestàndards del català com la proposta d'Scala (2003) per a l'alguerès i també la versió electrònica de la Gramàtica normativa de la llengua catalana de l’Institut d’Estudis Catalans que té en compte les variacions dialectals que es donen en tot el domini lingüístic català així com els diferents graus de formalitat amb què la llengua és usada oralment i per escrit. Pel que fa a les obres lexicogràfiques, no només s’han consultat els diccionaris normatius, sinó també obres descriptives com el Diccionari català-valencià-balear (1993) d’Alcover i Moll o el Diccionari català de l'Alguer (1988) de Josep Sanna.