Spring til hovednavigation Spring til søgning Spring til hovedindhold

Numbers on words: Analyses of the Danish Longitudinal CDI study

    Publikation: AfhandlingPh.d.-afhandling

    14 Downloads (Pure)

    Abstract

    Indledning

    Børns sprogtilegnelse, som er ”afkommet” af hovedsagelig lingvistik og udviklingspsykologi, er et ret nyt forskningsområde. Dets ”fødsel” kan føres tilbage til 1974, da The Journal of Child Language (JCL) blev grundlagt. Seks år senere blev First Language (FL) grundlagt. Begge tidsskrifter betragtes som toneangivende indenfor deres område og bringer ”articles on all aspects of the scientific study of language behaviour in children, the principles which underlie it, and the theories which may account for it2” (JCL homepage ) og ”original research, theoretical articles, review articles and book reviews in all areas of first language acquisition” (FL homepage ). En hurtig søgning på ”Danish” gav 11 resultater i JCL og 9 resultater i FL, hvor næsten alle har forbindelse til forskningen udført af Plunkett og kolleger (f.eks. Plunkett 1984; Plunkett 1986; Plunkett & Str¨omqvist 1992; se også det danske korpus i CHILDES udført af Plunkett6 ): den internationalt offentliggjorte forskning om dansk børnesprogtilegnelse i det mindste indenfor de seneste 30 år er begrænset (se Bleses m.fl. submitted).

    Odense Projektet i Sprogtilegnelse (1998-2001) blev grundlagt af en tværfaglig forskningsgruppe for at fremme forskning i første sprogtilegnelse på dansk (Basbøll m.fl. 2002). En del af dette projekt var, at adaptere det amerikanske instrument MacArthur-Bates Communicative Development Inventories (CDI) (Fenson m.fl. 1993; Fenson m.fl. 1994; Fenson m.fl. 2007), som er en meget brugt forældrerapport i form af en checkliste, til dansk. Dette instrument er opdelt i et skema ”Words and gestures” (også betegnet som Infant del) ret aldersgruppen 8-16 måneder og et skema ”Words and gestures” (Toddler del) i aldersgruppen 16-30 måneder. CDI’er var udformet til at bedømme børns tidlige kommunikative færdigheder på forskellige områder ved f.eks. at spørge forældre om deres barn bruger visse gestikulationer (Infant del), forstår og/eller siger visse almindelige ord (begge dele), eller er begyndt at bruge mere komplekse sætningskonstruktioner (Toddler del). Med dette værktøj som udgangspunkt søgte forskerne at beskrive det (gennemsnitlige) forløb af den tidlige danske sprogtilegnelse og at sammenligne danske børns sproglige udvikling på tværs af regioner, kulturer og forskellige sprog (se Andersen m.fl. 2006).

    Dataindsamlingen, baseret på det danske CDI instrument, havde to formål: en storstilet tværsnitsundersøgelse, som omfattede 6112 danske børn, blev udført for at belyse udviklingen af ordforråd, og give stof til analyser af, hvilken indflydelse faktorer som køn og/eller forældrenes uddannelse har på den tidlige sprogtilegnelse (Bleses m.fl. under udgivelse; Bleses m.fl. submitted 1; Bleses m.fl. submitted 2). Dette blev ledsaget af en længde-undersøgelse for at blive i stand til at studere børns individuelle udvikling over tid. Med omkring 180 deltagere er det danske longitudinale CDI studie en storstilet undersøgelse og repræsenterer, så vidt jeg ved, den største datakilde blandt de CDI-baserede longitudinale studier indtil videre: det er et unikt datasæt, som tilbyder næsten utallige muligheder for analyse.

    Et tværfagligt Ph.D. projekt, som resulterede i nærværende Ph.D. afhandling, blev iværksat i 2003 for at hjælpe til med at analysere de indsamlede data, og dets bredt formulerede formål var ”at udvikle og anvende statistiske metoder som er passende til at afprøve hypoteser om sprogtilegnelse blandt danske børn”.

    Data

    Hovedformålet med de tværsnitlige data var at etablere normer og sammenligne danske børns gennemsnitlige tidlige sprogudvikling tværkulturelt og tværlingvistisk baseret på målinger, som var prædefineret af andre offentligjorte resultater, d.v.s. hovedsagligt ”sum scores”. Fokus her ligger at andet sted: kilden til al forskning, som præsenteres i det følgende er data fra den danske CDI longitudinale undersøgelse. Med udgangspunkt i det danske CDI værktøj blev 183 danske børn fulgt månedligt fra 8 måneders alderen til 30 måneders alderen, idet den danske Infant del af CDI (”Ord og gestikulation”) blev benyttet fra 8 til 15 måneders alderen og den danske Toddler del (”Ord og sætninger”) fra 16. måned til undersøgelsens afslutning. Analyserne fokuserer hovedsagligt på de dele af CDI checklisten, som har med ordforråd at gøre, nærmere betegnet de 410 ord (begreber), som findes i både Infant og Toddler delen. Dataenes longitudinale struktur giver os mulighed for at følge optræden af ”første ord” hos et barn, og derfor bliver det muligt at analysere tilegnelsestidspunktet (hvis man stiller tilegnelsen på samme trin som rapportering for første gang). Den egentlige definition af tilegnelsestidspunktet for et specifikt begreb, d.v.s. tidspunktet hvor det første ord bliver nævnt (krydset af som ”sagt og forstået” af forælderen), kan udføres på mindst to forskellige tidsskalaer: den kronologiske aldersskala som den måned, hvor ordet først optræder (f.eks. i måned 12) eller skalaen for den individuelle ordforrådsstørrelse, hvor den rangerer i et barns tilegnelsessekvens (f.eks. som ord nr. 56).

    Formål

    Da dette er et tværdisciplinært projekt, som både kombinerer børnesprogstilegnelse og statistik, havde denne afhandling to formål. Det første formål, som repræsenterer sprogtilegnelse, var at få indsigt i og dokumentere resultaterne af danske børns første brug af sprog. Ved at opdele dette generelle formål i flere ”mindre” formål, begyndte vi med at beskrive danske børns første ord og sammenligne dem tværlingvistiskt, derefter studerede vi både gruppe og individuelle variationer: afhænger disse ord af faktorer som f.eks. køn, og er der børn som udviser (individuelle) præferencer for visse ordklasser? Det sidste sprog-relaterede forskningsspørgsm˚al omhandlede forholdet mellem ordpar: kan vi identificere par, der er tilegnet tættere sammen end forventet og deler disse nogle genkendelige lingvistiske egenskaber, som f.eks. at de rimer? Det andet formål var af en mere metodologisk, statistisk art. Vi ønskede at udforske CDIs potentiale udover beregningen af ”sum scores”: vil analyse af enkelte begreber på ordforrådschecklisten, især med time-to-event metoder på ordforrådsstørrelseskalaen vise sig at bære frugt? En yderligere statistisk øvelse var udviklingen af en målemetode til formelt at kvantificere ”closeness” for et ordpar.

    Resultater og diskussion 

    For det første var vi i stand til at reproducere ”typiske” resultater af første ord baseret på f.eks. deres semantiske-pragmatiske indhold og deres lydstruktur. Set i lyset af undersøgelsesresultater, der indikerer at danske børn typisk er 2-3 måneder bagefter deres amerikanske jævnalderende m.h.t. tidlig forståelse og produktion af ord (Bleses m.fl. submitted ), var dette beroligende, eftersom vi intet fandt, der støtter hypotesen om at danske børn følger en sprogtilegnelsesrækkefølge eller et -mønster, som er forskelligt fra deres amerikanske eller italienske jævnaldrende. Vi har derimod identificeret nogle slående tværlingvistiske forskelle på enkeltordsniveauet, hvilket giver grund til at revurdere hypoteser om arten og optræden af første ord i almindelighed. Vi var også i stand til at finde, ligeledes på enkeltordsniveauet, forskelle i den gennemsnitlige tilegnelsestid (målt på ordforrådsstørrelsesskalaen), der henfører til grupper, som er defineret af køn og søskende status, og vi formulerede nogle ad-hoc kategorier, som redegør for disse forskelle. Med hensyn til individualiteten af børns sammensætning af leksikon, opdagede vi, at visse børn udviste præferencer, som bestod over tid for nogle ordklasser på dette tidlige stadie. Disse individuelle forskelle blandt børn kan måske sættes i forbindelse med distinktioner som referentiel mod ekspressiv (se Shore 1995). I en undersøgelse af det gensidige forhold mellem tilegnelsestid og specifikke CDI ordpar, opnåede vi resultater, der tyder på, at ord, der deler semantiske og pragmatiske træk, som f.eks. kropsdele, (zoo) dyr eller betegnelser for slægtninge, havde en tendens til at blive rapporteret tidsmæssigt tæt sammen. Ved at anvende en mere eksakt, relativ måling fandt vi også nogle spændende mønstre (mellem de pågældende ordpar). Disse (mønstre) er imidlertid ikke så knyttede til ordenes indhold, som resultaterne fra den mere simple metoder tyder på. Blandt andet virker hypotesen om at ”ordets længde” har en indflydelse som forbindende faktor plausibel og bør undersøges nærmere.

    Med hensyn til det andet formål understøttede alle analyseresultaterne CDIs nytte på trods af den megen diskussion af metodens begrænsninger (f.eks. Pine 1992). I særdeleshed kunne CDI målingen fastholde forskelle på enkeltordsniveau, ligesom den kunne fange individuel variation over tid. Med longitudionale data som vore var anvendelsen af time-to-event metoder mulig og lovende. For at give en første illustration, virkede Cox proportional hazards modellen (på ordforrådsstørrelseskalaen) fint til at identificere enkelte begreber, som varierede i tilegnelsestid blandt grupper; vi forslog yderligere en måling som ”closeness” for et enkelt ordpar baseret på den absolutte difference på de tilsvarende tilegnelsestider, i forhold til den forventede difference under (konditionel) uafhængighed. Denne måling kan også vise sig at være nyttig i andre forbindelser, hvor det er af interesse at måle ”closeness” af to ”event” tider.

    Konklusion

    Analysen af data fra den danske longitudinale CDI undersøgelse, som forgik fra to vinkler – sprogtilegnelse og statistik – viste sig at være inspirerende for begge parter. Indenfor sprogtilegnelse bliver der sædvanligvis brugt mange anstrengelser, tid og penge på data indsamling. At udvikle og anvende (statistiske) metoder, som kan hjælpe med til at udtrække så mange informationer som muligt, synes at være anstrengelserne værd, og det har vist sig at bære frugt: vore analyser gav interessante og meningsfyldte resultater. Med hensyn til statistik er statistisk videnskab forholdsvis meningsløs uden data. Den danske longitudinale CDI undersøgelse er på mange måder et unikt datasæt, og det har ikke kun været spændende i sig selv at finde passende måder at løse forskningsspørgsmål på, men kan også resultere i statistiske metoder, som kan anvendes indenfor andre områder. Men når jeg ser på Ph.D. projektets bredt formulerede emne ovenfor, må jeg konkludere, at selv om det var morsomt, er jeg langt fra at være færdig.
    OriginalsprogEngelsk
    Bevilgende institution
    • Syddansk Universitet
    Udgiver
    StatusUdgivet - 2008

    Fingeraftryk

    Dyk ned i forskningsemnerne om 'Numbers on words: Analyses of the Danish Longitudinal CDI study'. Sammen danner de et unikt fingeraftryk.

    Citationsformater