Ir izveidots “Morfoloģiski marķēts longitudināls bērnu runas korpuss”, kurā ir ietverti 4 apakškorpusi: 3 monolingvāli latviski runājošu bērnu runas apakškorpusi un 1 bilingvāli – latviski un krieviski – runājoša bērna runas apakškorpuss. Korpusā iekļauta gan bērna runa, gan viņa sarunu biedra, parasti kāda pieaugušā, runa. Iegūtie dati ir ortogrāfiski transkribēti un automātiski morfoloģiski marķēti.
Dati ir sagatavoti ievietošanai CHILDES datubāzē.
Par projekta rezultātiem ir ziņots Latvijas Universitātes 75. zinātniskās konferences Datorlingvistikas sekcijā 2017. gada 16. februārī (stenda referāts „Fonēmu producēšanas testu rezultāti bērnu runā”) un valodnieces Veltas Rūķes-Draviņas simtgadei veltītajā konferencē 2017. gada 25. un 26. janvārī (referāts „Meklēšana ortogrāfiski un morfoloģiski marķētā bērnu runas korpusā”).