1.Darbība
Ir pabeigta KAT I (CDI I) un KAT II (CDI II) datu elektroniskā vākšana, izmantojot tiešsaistes metodi. KAT formas aizpildījuši 718 respondenti, kas ir mazāk par iepriekš plānoto, bet tomēr pietiekami, lai varētu izstrādāt ticamus normatīvos rādītājus. Visiem ieinteresētajiem vecākiem neatkarīgi no tā, vai viņi ir saņēmuši uzaicinājumu no PMLP, tika piedāvāta iespēja reģistrēties tiešsaistē un iegūt pieeju KAT formām. Tas mums ļaus palielināt izlasi nākotnē. Šobrīd tiek izstrādātas KAT datos pamatotas normas un KAT lietotāju rokasgrāmata. Tā kā dati vairāk ir nobīdīti augstākas vecāku izglītotības virzienā (kas ir parasta parādība šāda veida datu kopām), ir jāievieš korekcijas koeficients. Ir uzsākta sadarbība ar KAT (CDI) Konsultatīvo padomi un Dienviddānijas Universitātes kolēģiem par normu izstrādi saistībā ar iepriekšminētajiem izaicinājumiem.
2.Darbība
Latviešu un krievu valodas fonēmu testu pārbaude bērnudārzos ir pabeigta, 1100 bērnu runas ieraksti ir izvērtēti un rezultāti ievietoti datu bāzē, par analīzes rezultātiem publicēti zinātniskie raksti un izveidota rokasgrāmata (ieteikumi lietotājiem un normatīvie rādītāji).
3.Darbība
Longitudināls četru bērnu runas korpuss ir ierakstīts un transkribēts.
Trešajā fāzē monolingvālu (latviski runājošu) un bilingvālu (krieviski un latviski runājošu) bērnu runas longitudināls korpuss tika pabeigts:
- veikti četru 17 līdz 44 mēnešus vecu bērnu runas longitudināli ieraksti ( dati ievākti 18 mēnešu periodā no 2015. gada aprīļa līdz 2016. gada septembra beigām);
- bērnu vecums datu ievākšanas sākumā: jaunākajam dalībniekam bija 17 mēneši, bet vecākajam – 27 mēneši;
- dati tika ievākti, izmantojot diktofonu, tas notika bērna un pieaugušā sadarbības laikā dabiskos apstākļos: bērna runa tika ierakstīta viņu mājās vai citā pazīstamā vidē, sadarbojoties ar savu ģimeni (visbiežāk ar bērna māti);
- tika ievākti un daļēji transkribēti apmēram 134 stundu (aptuveni 34 stundas vairāk, salīdzinot ar iepriekšējo periodu) ieraksti. Transkripcijai izmantota ortogrāfiskā anotēšana;
- audio ieraksti un transkripcijas ir saistītas un sinhronizētas.
4.Darbība
Ir izveidots noteikumu kopums, lai konvertētu ortogrāfiski transkribētus datus CHAT (Codes for the Human Analysis of Transcripts) marķējumā, kura ir standarta transkripcijas sistēma, ko izmanto CHILDES (Child Language Data Exchange System) sistēmā (CHILDES; MacWhinney 2000).
Pabeigta bērna runas analizēšanai izmantojamā latviešu morfoloģiskās analīzes instrumenta adaptācija. Tika nolemts izmantot gandrīz visus morfoloģiskos marķierus, izņemot tikai tos, kurus ir grūti atpazīt, kā, piemēram, dažas darbības vārdu pazīmes. Ortogrāfiski transkribēti dati ir morfoloģiski anotēti.
Lai meklētu morfoloģiski un ortogrāfiski anotētus datus, tika izstrādāta meklēšanas saskarne. Šobrīd tā tiek pārbaudīta un uzlabota. Uzsākta korpusa datu izpēte.