ST811: Multivariat Statistisk Analyse

Det Naturvidenskabelige Studienævn

Undervisningssprog: På dansk eller engelsk afhængigt af underviser, men engelsk ved internationale studerende
EKA: N370003102
Censur: Intern prøve, to eller flere bedømmere
Bedømmelse: 7-trinsskala
Udbudssteder: Odense
Udbudsterminer: Forår
Niveau: Kandidatkursus forhåndsgodkendt som Ph.d.-kursus

STADS ID (UVA): N370003101
ECTS-point: 5

Godkendelsesdato: 26-10-2018


Varighed: 1 semester

Version: Arkiv

Kommentar

25002401(tidligere UVA) er identisk med denne kursusbeskrivelse.
Kurset samlæses med ST514 Multivariat statistisk analyse

Indgangskrav

Bestået bachelorgrad i Naturvidenskab eller tilsvarende studieprogram.

Kurset kan ikke følges af studerende, der har bestået ST514.

Faglige forudsætninger

Studerende, der følger kurset, forventes at:

  • have kendskab til
    statistik svarende til ST520 Anvendt statistik eller ST521 Matematisk
    statistik, og calculus svarende til et af calculuskurserne på førsteåret
    på studier ved det Naturvidenskabelige fakultet, SDU
  • kunne anvende statistikprogrammet R

Formål

Kurset har til formål at sætte den studerende i stand til at arbejde
systematisk med datasæt med flere variable, hvilket er vigtigt i forhold
til at kunne gennemføre statistiske analyser indenfor en lang række
forskningsområder, f.eks. biologi og epidemiologi.

Kurset bygger oven
på den viden, der er erhvervet i kurserne i basal statistisk, f.eks.
ST520 Anvendt statistik eller ST521 Matematisk, og det til de respektive
studieretninger hørende calculuskursus, og giver et fagligt grundlag
for at studere emner såsom biometri, der er placeret som valgfrit kursus
senere i uddannelsen, såvel som specialemener med anvendelse af
multivariate metoder.

I forhold til uddannelsens kompetenceprofil har kurset eksplicit fokus på at:

  • Give kompetence til at vurdere og vælge mellem forskellige metoder til analyse af multivariate datasæt
  • Give færdigheder i at gennemføre analyser at multivariate datasæt ved hjælp af statistikprogrammet R
  • Give viden om de grundlæggende problemstillinger og metoder til at analysere målinger på flere variable

Målbeskrivelse

For at opnå kursets formål er det læringsmålet for kurset, at den studerende demonstrerer evnen til at kunne:

  • reproducere
    de vigtigste teoretiske resultater vedrørende basale operationer på
    stokastiske variable og vektorer og anvende dem i enkle teoretiske
    opgaver
  • arbejde med kursets koncepter og modeller, både i skalar- og matrix-/vektor-repræsentation
  • forstå og identificere hvilke problemstillinger, der kan løses ved hjælp af multivariate teknikker
  • udføre praktisk dataanalyse ved hjælp af kursets modeller
  • programmere kursets modeller og teknikker i den statistiske software brugt ved kurset
  • identificere og forstå relevante oplysninger i softwarens output
  • resumere resultaterne af en analyse i en statistisk rapport

Indhold

Kurset indeholder følgende faglige hovedområder:
  • stokastiske vektorer
  • den multivariate normalfordeling
  • inferens for en middelværdivektor
  • sammenligning af flere middelværdivektorer
  • principalkomponentanalyse
  • diskriminantanalyse og klassifikation

    Litteratur

    Se itslearning for pensumlister og yderligere litteraturhenvisninger.

    Eksamensbestemmelser

    Eksamenselement a)

    Tidsmæssig placering

    Juni

    Udprøvninger

    Projekt og skriftlig eksamen

    EKA

    N370003102

    Censur

    Intern prøve, to eller flere bedømmere

    Bedømmelse

    7-trinsskala

    Identifikation

    Studiekort

    Sprog

    Følger, som udgangspunkt, undervisningssprog

    Varighed

    Skriftlig eksamen - 2½ time

    Hjælpemidler

    Oplyses på kurset.

    ECTS-point

    5

    Uddybende information

    Eksamen består af et projekt, der afleveres i løbet af kurset samt en skriftlig eksamen. 

    Eksamensformen ved reeksamen kan være en anden end eksamensformen ved den ordinære eksamen.

    Vejledende antal undervisningstimer

    48 timer per semester

    Undervisningsform

    Undervisningsaktiviteter udmønter sig i en anslået vejledende fordeling af arbejdsindsatsen hos en gennemsnitsstuderende på følgende måde:
    • Introfase (forelæsning, holdtimer) - 24 timer
    • Træningsfase: 24 timer

    I introfasen benyttes en modificeret udgave af klassisk forelæsning, hvor fagets grundbegreber og metoder præsenteres, med såvel teori som eksempler baseret på konkrete data. I disse timer er der mulighed for spørgsmål og diskussion. I træningsfasen arbejdes der med regneopgaver og diskussionsemner, som relaterer sig til indholdet i de forudgående introfasetimer. I disse timer er der mulighed for at arbejde specifikt med særligt vanskelige emner. I studiefasen arbejder de studerende selvstændigt med opgaver og forståelsen af fagets termer og begreber diskuteres. Der er efterfølgende mulighed for at bringe spørgsmål op i enten introfasetimerne eller træningsfasetimerne. 

    Aktiviteter i studiefasen:

    • Gennemgang af opgaver ud over de opgaver, der indgår i træningsfase.
    • Diskussion af fagets begreber og termer

    Ansvarlig underviser

    Navn E-mail Institut
    Jing Qin qin@imada.sdu.dk Data Science

    Skemaoplysninger

    Administrationsenhed

    Institut for Matematik og Datalogi (matematik)

    Team hos Uddannelsesjura & Registratur

    NAT

    Udbudssteder

    Odense

    Anbefalede studieforløb

    Profil Uddannelse Semester Udbuds periode