ST813: Statistisk Modellering

Det Naturvidenskabelige Studienævn

Undervisningssprog: På dansk eller engelsk afhængigt af underviser, men engelsk ved internationale studerende
EKA: N370004102
Censur: Ekstern prøve
Bedømmelse: 7-trinsskala
Udbudssteder: Odense
Udbudsterminer: Forår
Niveau: Kandidatkursus forhåndsgodkendt som Ph.d.-kursus

STADS ID (UVA): N370004101
ECTS-point: 10

Godkendelsesdato: 26-10-2018


Varighed: 1 semester

Version: Godkendt - aktiv

Kommentar

25002701(tidligere UVA) er identisk med denne kursusbeskrivelse. 

Kurset kan ikke følges af studerende, der har bestået kurset ST523.
Kurset samlæses med ST523.

Indgangskrav

Igen

Faglige forudsætninger

Studerende, der følger kurset, forventes at:
  • Have kendskab til algebra og lineær algebra, calculus, grundlæggende statistik
  • Kunne anvende den statistiske software R

Formål

Kurset har til formål at sætte den studerende i stand til at Deltagerne
vil opnå indsigt i lineære og generaliserede lineære modellers
matematiske struktur, herunder erfaring med at genkende sådanne modeller
ud fra et givet statistisk problem.

Kurset bygger oven på den viden,
der er erhvervet i kurserne ST521: Matematisk statistik og kendskab til
lineær algebra svarende til kurset MM538: Algebra og lineær algebra, og
giver et fagligt grundlag for at studere avanceret statistik og speciale
projekter.

I forhold til uddannelsens kompetenceprofil har kurset eksplicit fokus på at:

  • have
    overblik over de forskellige typer lineære og generaliserede lineære
    modeller og hovedeksempler på disse, samt kunne identificere hvilke
    problemstillinger der kan løses ved hjælp af sådanne modeller;
  • have
    rutine i at manipulere de matematiske og statistiske elementer for
    lineære og generaliserede lineære modeller og at skelne klart mellem
    eksakte og asymptotiske resultater;
  • have sikkerhed i at anvende
    teoretiske resultater for lineære og generaliserede lineære modeller på
    konkrete eksempler, samt gøre rede for resultaternes praktiske
    fortolkning;
  • have fortrolighed med den statistiske programpakke R, og rutine i dens anvendelse til statistisk modellering. 

Målbeskrivelse

For at opnå kursets formål er det læringsmålet for kurset, at den studerende demonstrerer evnen til at:

  • kunne
    genkende de forskellige typer modeller og beskrive deres ligheder og
    forskelle, og gøre rede for den rolle som svarvariabel, forklarende
    variable, variansfunktion og linkfunktion spiller for statistisk
    modellering;
  • kunne manipulere de matematiske og statistiske
    elementer for lineære og generaliserede lineære modeller, så som
    parametre og principper for estimation, udledning af statistiske test
    baseret på standardfejl, devians og residual kvadratsum;
  • opnå
    overblik over de vigtigste eksempler på lineære og generaliserede
    lineære modeller, samt kunne udlede teoretiske egenskaber for nye
    modeller baseret på den generelle teori;
  • erkende betydningen af
    og forskellen mellem regressionsparametre og dispersionsparameteren, og
    bruge denne viden i praktiske og teoretiske sammenhænge:
  • kunne
    udføre praktisk dataanalyse ved hjælp af statistisk modellering,
    herunder undersøge en models korrekthed ved hjælp af residualanalyse;
  • udføre
    den statistiske analyse med brug af den statistiske software R,
    herunder kunne identificere og fortolke relevante oplysninger i
    programmets output;
  • dokumentere resultaterne af en statistisk analyse i form af en skriftlig rapport.

Indhold

Kurset indeholder følgende faglige hovedområder:
  • Lineære modeller, simple og multiple regressionsmodeller. 
  • Parameterestimation, hypotesetest og konfidensområder. 
  • Residualanalyse. 
  • Transformation af variable, polynomiel regression. 
  • Envejs ANOVA. 
  • Modelopbygning og variabelselektion. 
  • Prediktion. 
  • Naturlige eksponentielle familier; momentfrembringende funktioner; variansfunktioner; 
  • Dispersionsmodeller; 
  • Likelihood teori; 
  • Chi-i-anden, F-og t-test; deviansanalyse; 
  • Iterativ mindste kvadraters algoritme; 
  • Lineære normale modeller, 
  • Logistisk regression, 
  • Analyse af tælledata, positive data. 

    Litteratur

    Se BlackBoard for pensumlister og yderligere litteraturhenvisninger.

    Eksamensbestemmelser

    Eksamenslement a)

    Tidsmæssig placering

    Forår

    Udprøvninger

    To take-home-opgaver, der bedømmes samlet

    EKA

    N370004102

    Censur

    Ekstern prøve

    Bedømmelse

    7-trinsskala

    Identifikation

    Fulde navn og SDU brugernavn

    Sprog

    Følger, som udgangspunkt, undervisningssprog

    Hjælpemidler

    Oplyses på kurset

    ECTS-point

    10

    Uddybende information

    Eksamensformen ved reeksamen kan være en anden end eksamensformen ved den ordinære eksamen.

    Vejledende antal undervisningstimer

    80 timer per semester

    Undervisningsform

    Undervisningsaktiviteter udmønter sig i en anslået vejledende fordeling af arbejdsindsatsen hos en gennemsnitsstuderende på følgende måde:

    • Introfase (forelæsning, holdtimer) - 48 timer
    • Træningsfase: 32 timer

    I introfasen benyttes en modificeret udgave af klassisk forelæsning, hvor fagets grundbegreber og metoder præsenteres, med såvel teori som eksempler baseret på konkrete data. I disse timer er der mulighed for spørgsmål og diskussion. I træningsfasen arbejdes der med regneopgaver og diskussionsemner, som relaterer sig til indholdet i de forudgående introfasetimer. I disse timer er der mulighed for at arbejde specifikt med særligt vanskelige emner. I studiefasen arbejder de studerende selvstændigt med opgaver og forståelsen af fagets termer og begreber diskuteres. Der er efterfølgende mulighed for at bringe spørgsmål op i enten introfasetimerne eller træningsfasetimerne. 

    Aktiviteter i studiefasen:

    De studerende forventes at:

    • Arbejde med de nye begreber.
    • Øge deres forståelse af de emner der dækkes ved forelæsningerne.
    • Løse relevante opgaver.
    • Læs teksten bogkapitler og videnskabelige tidsskriftsartikler leveres som støtte til forelæsningerne

    Ansvarlig underviser

    Navn E-mail Institut
    Fernando Colchero colchero@imada.sdu.dk

    Skemaoplysninger

    Administrationsenhed

    Institut for Matematik og Datalogi (matematik)

    Team hos Registrering & Legalitet

    NAT

    Anbefalede studieforløb

    Profil Program Semester Periode