DS805: Multivariat statistisk analyse
Kommentar
Indgangskrav
Dette kursus kan ikke følges af kandidatstuderende på Datalogi.
Faglige forudsætninger
Studerende, der følger kurset, forventes at:
- Have kendskab til
statistik og matematik svarende til DS803 Statistik for Data Science. - Kunne anvende statistikprogrammet R.
Formål
Kurset har til formål at sætte den studerende i stand til at arbejde
systematisk med datasæt med flere variable, hvilket er vigtigt i forhold
til at kunne gennemføre statistiske analyser indenfor en lang række
forskningsområder, f.eks. biologi og epidemiologi.
Kurset bygger oven
på den viden, der er erhvervet i kurser i basal statistisk, f.eks. DS803 Statistik for Data Science, og giver et fagligt grundlag
for at studere emner indenfor videregående statistik, såvel som gennemføre specialeprojekter med anvendelse af multivariate metoder.
I forhold til uddannelsens kompetenceprofil har kurset eksplicit fokus på at:
- Give kompetence til at vurdere og vælge mellem forskellige metoder til analyse af multivariate datasæt.
- Give færdigheder i at gennemføre analyser at multivariate datasæt ved hjælp af statistikprogrammet R.
- Give viden om de grundlæggende problemstillinger og metoder til at analysere målinger på flere variable.
Målbeskrivelse
For at opnå kursets formål er det læringsmålet for kurset, at den studerende demonstrerer evnen til at kunne:
- Reproducere de vigtigste teoretiske resultater vedrørende basale operationer på stokastiske variable.
- Arbejde med kursets koncepter og modeller, både i skalar- og matrix-/vektor-repræsentation.
- Forstå og identificere hvilke problemstillinger, der kan løses ved hjælp af multivariate teknikker.
- Udføre praktisk dataanalyse ved hjælp af kursets modeller.
- Programmere kursets modeller og teknikker i den statistiske software brugt ved kurset.
- Identificere og forstå relevante oplysninger i softwarens output.
- Resumere resultaterne af en analyse i en statistisk rapport.
Indhold
- stokastiske vektorer
- den multivariate normalfordeling
- inferens for en middelværdivektor
- sammenligning af flere middelværdivektorer
- principalkomponentanalyse
- diskriminantanalyse og klassifikation
Litteratur
Eksamensbestemmelser
Eksamenselement a)
Tidsmæssig placering
Udprøvninger
Skriftlig eksamen
EKA
Censur
Bedømmelse
Identifikation
Sprog
Varighed
Hjælpemidler
ECTS-point
Vejledende antal undervisningstimer
Undervisningsform
- Introfase (forelæsning) - 24 timer
- Træningsfase: 24 timer
I introfasen benyttes en modificeret udgave af klassisk forelæsning, hvor fagets grundbegreber og metoder præsenteres, med såvel teori som eksempler baseret på konkrete data. I disse timer er der mulighed for spørgsmål og diskussion. I træningsfasen arbejdes der med regneopgaver og diskussionsemner, som relaterer sig til indholdet i de forudgående introfasetimer. I disse timer er der mulighed for at arbejde specifikt med særligt vanskelige emner. I studiefasen arbejder de studerende selvstændigt med opgaver og forståelsen af fagets termer og begreber diskuteres. Der er efterfølgende mulighed for at bringe spørgsmål op i enten introfasetimerne eller træningsfasetimerne.
Aktiviteter i studiefasen:
- Gennemgang af opgaver ud over de opgaver, der indgår i træningsfasen.
- Diskussion af fagets begreber og termer.
Ansvarlig underviser
Skemaoplysninger
Administrationsenhed
Team hos Uddannelsesjura & Registratur
Udbudssteder
Anbefalede studieforløb
Overgangsordninger
Se overgangsordninger for alle kurser på Det Naturvidenskabelige Fakultet.