ST813: Statistisk Modellering

Det Naturvidenskabelige Studienævn

Undervisningssprog: På dansk eller engelsk afhængigt af underviser, men engelsk ved internationale studerende
EKA: N370004102
Censur: Ekstern prøve
Bedømmelse: 7-trinsskala
Udbudssteder: Odense
Udbudsterminer: Efterår
Niveau: Kandidatkursus forhåndsgodkendt som Ph.d.-kursus

STADS ID (UVA): N370004101
ECTS-point: 10

Godkendelsesdato: 24-04-2024


Varighed: 1 semester

Version: Godkendt - aktiv

Kommentar

Kurset samlæses med ST523.

Indgangskrav

Kurset kan ikke vælges hvis du har bestået, er tilmeldt eller har fulgt ST523, eller hvis ST523 indgår som obligatorisk i din studieordning.

Faglige forudsætninger

Studerende, der følger kurset, forventes at:
  • Have kendskab til lineær algebra, calculus, grundlæggende statistik
  • Kunne anvende den statistiske software R

Formål

Kurset har til formål at sætte den studerende i stand til at arbejde med lineære og generaliserede lineære modeller ud fra såvel et teoretisk og et anvendelsesperspektiv. Deltagerne vil opnå indsigt i lineære og generaliserede lineære modellers matematiske struktur, herunder erfaring med at genkende sådanne modeller ud fra et givet statistisk problem.
Kurset bygger oven på den viden, der er erhvervet i kurserne ST521: Matematisk statistik og kendskab til lineær algebra svarende til kurset MM538: Algebra og lineær algebra, og giver et fagligt grundlag for at studere avanceret statistik og speciale projekter.

I forhold til uddannelsens kompetenceprofil har kurset eksplicit fokus på at:
  • Give kompetence til at håndtere modelopstillinger og/eller modelberegninger.
  • Give færdigheder i at foretage statistisk analyse af data.
  • Give teoretisk viden om og praktisk erfaring med at anvende metoder og modeller fra statistik.

Målbeskrivelse

For at opnå kursets formål er det læringsmålet for kurset, at den studerende demonstrerer evnen til at:
  • genkende de forskellige typer modeller og beskrive deres ligheder og forskelle, og gøre rede for den rolle som svarvariabel, forklarende variable, variansfunktion og linkfunktion spiller for statistisk modellering;
  • manipulere de matematiske og statistiske elementer for lineære og generaliserede lineære modeller, så som parametre og principper for estimation, udledning af statistiske test baseret på standardfejl, devians og residual kvadratsum;
  • udlede teoretiske egenskaber for nye modeller baseret på den generelle teori, samt skelne klart mellem eksakte og asymptotiske resultater;
  • give overblik over de vigtigste eksempler på lineære og generaliserede lineære modeller, samt kunne identificere hvilke problemstillinger der kan løses ved hjælp af sådanne modeller; 
  • anvende teoretiske resultater for lineære og generaliserede lineære modeller på konkrete eksempler, samt gøre rede for resultaternes praktiske fortolkning;
  • erkende betydningen af og forskellen mellem regressionsparametre og dispersionsparameteren, og bruge denne viden i praktiske og teoretiske sammenhænge;
  • udføre praktisk dataanalyse ved hjælp af statistisk modellering, herunder undersøge en models korrekthed ved hjælp af residualanalyse;
  • udføre den statistiske analyse med brug af den statistiske software R, herunder kunne identificere og fortolke relevante oplysninger i programmets output;
  • dokumentere resultaterne af en statistisk analyse i form af en skriftlig rapport.

Indhold

Kurset indeholder følgende faglige hovedområder:
  • Lineære modeller, simple og multiple regressionsmodeller. 
  • Parameterestimation, hypotesetest og konfidensområder. 
  • Residualanalyse. 
  • Transformation af variable, polynomiel regression. 
  • Envejs ANOVA. 
  • Modelopbygning og variabelselektion. 
  • Prediktion. 
  • Naturlige eksponentielle familier; momentfrembringende funktioner; variansfunktioner; 
  • Dispersionsmodeller; 
  • Likelihood teori; 
  • Chi-i-anden, F-og t-test; deviansanalyse; 
  • Iterativ mindste kvadraters algoritme; 
  • Lineære normale modeller, 
  • Logistisk regression, 
  • Analyse af tælledata, positive data. 
  • Anvendelse af statistisk modellering på forskellige datatyper, blandet andet med eksempler fra sundhedsvidenskab, biologi, økonomi, osv. 

    Litteratur

    Se itslearning for pensumlister og yderligere litteraturhenvisninger.

    Eksamensbestemmelser

    Eksamenselement a)

    Tidsmæssig placering

    Efterår

    Udprøvninger

    Hjemmeopgaver

    EKA

    N370004102

    Censur

    Ekstern prøve

    Bedømmelse

    7-trinsskala

    Identifikation

    Fulde navn og SDU brugernavn

    Sprog

    Følger, som udgangspunkt, undervisningssprog

    Hjælpemidler

    Oplyses på kurset

    ECTS-point

    10

    Uddybende information

    To take-home-opgaver, der bedømmes samlet

    Vejledende antal undervisningstimer

    80 timer per semester

    Undervisningsform

    Undervisningsaktiviteter udmønter sig i en anslået vejledende fordeling af arbejdsindsatsen hos en gennemsnitsstuderende på følgende måde:
    • Introfase (forelæsning) - 48 timer
    • Træningsfase: 32 timer

    I introfasen benyttes en modificeret udgave af klassisk forelæsning, hvor fagets grundbegreber og metoder præsenteres, med såvel teori som eksempler baseret på konkrete data. I disse timer er der mulighed for spørgsmål og diskussion. I træningsfasen arbejdes der med regneopgaver og diskussionsemner, som relaterer sig til indholdet i de forudgående introfasetimer. I disse timer er der mulighed for at arbejde specifikt med særligt vanskelige emner. I studiefasen arbejder de studerende selvstændigt med opgaver og forståelsen af fagets termer og begreber diskuteres. Der er efterfølgende mulighed for at bringe spørgsmål op i enten introfasetimerne eller træningsfasetimerne. 

    Aktiviteter i studiefasen hvor de studerende forventes at:

    • Arbejde med de nye begreber.
    • Øge deres forståelse af de emner der dækkes ved forelæsningerne.
    • Løse relevante opgaver.
    • Læs teksten bogkapitler og videnskabelige tidsskriftsartikler leveres som støtte til forelæsningerne

    Ansvarlig underviser

    Navn E-mail Institut
    Birgit Debrabant bdebrabant@imada.sdu.dk Data Science

    Skemaoplysninger

    Administrationsenhed

    Institut for Matematik og Datalogi (matematik)

    Team hos Uddannelsesjura & Registratur

    NAT

    Udbudssteder

    Odense

    Anbefalede studieforløb

    Profil Uddannelse Semester Udbuds periode

    Overgangsordninger

    Overgangsordninger beskriver, hvordan et kursus erstatter et andet kursus, når der ændres i et studieforløb.
    Hvis der er lavet en overgangsordning for et kursus vil den fremgå af oversigten.
    Se overgangsordninger for alle kurser på Det Naturvidenskabelige Fakultet.