DSK805: Multivariat statistisk analyse

Det Naturvidenskabelige Studienævn

Undervisningssprog: Engelsk
EKA: N340144202
Censur: Intern prøve, to eller flere bedømmere
Bedømmelse: 7-trinsskala
Udbudssteder: Kolding
Udbudsterminer: Forår
Niveau: Kandidat

STADS ID (UVA): N340144201
ECTS-point: 5

Godkendelsesdato: 04-11-2024


Varighed: 1 semester

Version: Godkendt - aktiv

Indgangskrav

Kurset kan ikke følges hvis ST514, ST811 eller DS805 er bestået, eller hvis ST514, ST811 eller DS805 indgår obligatorisk i din studieordning.

Dette kursus kan ikke følges af kandidatstuderende på Datalogi.

Faglige forudsætninger

Studerende, der følger kurset, forventes at:

  • Have kendskab til
    statistik og matematik svarende til DSK803 Statistik for Data Science.
  • Kunne anvende statistikprogrammet R.

Formål

Kurset har til formål at sætte den studerende i stand til at arbejde
systematisk med datasæt med flere variable, hvilket er vigtigt i forhold
til at kunne gennemføre statistiske analyser indenfor en lang række
forskningsområder, f.eks. biologi og epidemiologi.

Kurset bygger oven
på den viden, der er erhvervet i kurser i basal statistisk, f.eks. DS803 Statistik for Data Science, og giver et fagligt grundlag
for at studere emner indenfor videregående statistik, såvel som gennemføre specialeprojekter med anvendelse af multivariate metoder.

I forhold til uddannelsens kompetenceprofil har kurset eksplicit fokus på at:

  • Give kompetence til at vurdere og vælge mellem forskellige metoder til analyse af multivariate datasæt.
  • Give færdigheder i at gennemføre analyser at multivariate datasæt ved hjælp af statistikprogrammet R.
  • Give viden om de grundlæggende problemstillinger og metoder til at analysere målinger på flere variable.

Målbeskrivelse

For at opnå kursets formål er det læringsmålet for kurset, at den studerende demonstrerer evnen til at kunne:

  • Reproducere de vigtigste teoretiske resultater vedrørende basale operationer på stokastiske variable.
  • Arbejde med kursets koncepter og modeller, både i skalar- og matrix-/vektor-repræsentation.
  • Forstå og identificere hvilke problemstillinger, der kan løses ved hjælp af multivariate teknikker.
  • Udføre praktisk dataanalyse ved hjælp af kursets modeller.
  • Programmere kursets modeller og teknikker i den statistiske software brugt ved kurset.
  • Identificere og forstå relevante oplysninger i softwarens output.
  • Resumere resultaterne af en analyse i en statistisk rapport.

Indhold

Kurset indeholder følgende faglige hovedområder:
  • stokastiske vektorer
  • den multivariate normalfordeling
  • inferens for en middelværdivektor
  • sammenligning af flere middelværdivektorer
  • principalkomponentanalyse
  • diskriminantanalyse og klassifikation

    Litteratur

    Se itslearning for pensumlister og yderligere litteraturhenvisninger.

    Eksamensbestemmelser

    Eksamenselement a)

    Tidsmæssig placering

    Forår og juni

    Udprøvninger

    Portfolio eksamen

    EKA

    N340144202

    Censur

    Intern prøve, to eller flere bedømmere

    Bedømmelse

    7-trinsskala

    Identifikation

    Fulde navn og SDU brugernavn

    Sprog

    Følger, som udgangspunkt, undervisningssprog

    Varighed

    Skriftlig MCQ eksamen - 2½ time

    Hjælpemidler

    Alle almindelige hjælpemidler er tilladte fx lærebøger, egne noter, computerprogrammer som ikke benytter internettet m.v. 

    Internet er ikke tilladt. Du må dog gå ind på system DE-Digital Eksamen i forbindelse med udfyldelse af multiple choice testen. Noter fra kurset i itslearning, som du ønsker at anvende som hjælpemidler, skal downloades til din computer senest dagen før eksamenen. Under eksamenen må itslearning ikke anvendes.

    ECTS-point

    5

    Uddybende information

    Portfolioeksamen består af to elementer:
    1) Et projekt 
    2) Individuel skriftlig MCQ eksamen
    Studerende kan kun opnå en samlet bestået krakrater hvis begge elementer er til stede. Projektet tæller 10% af den samlede karakter, mens den skriftlige eksamen tæller 90%.

    Reeksamen er en skriftlig eksamen

    Vejledende antal undervisningstimer

    40 timer per semester

    Undervisningsform

    På naturvidenskab er undervisningen tilrettelagt efter trefasemodellen dvs. intro, trænings- og studiefasen. Disse undervisningsaktiviteter udmønter sig i en anslået vejledende fordeling af arbejdsindsatsen hos en gennemsnitsstuderende på følgende måde:
    • Introfase (forelæsning) - 24 timer
    • Træningsfase: 16 timer
    • Studiefase: 75 timer

    I introfasen benyttes en modificeret udgave af klassisk forelæsning, hvor fagets grundbegreber og metoder præsenteres, med såvel teori som eksempler baseret på konkrete data. I disse timer er der mulighed for spørgsmål og diskussion. I træningsfasen arbejdes der med regneopgaver og diskussionsemner, som relaterer sig til indholdet i de forudgående introfasetimer. I disse timer er der mulighed for at arbejde specifikt med særligt vanskelige emner. I studiefasen arbejder de studerende selvstændigt med opgaver og forståelsen af fagets termer og begreber diskuteres. Der er efterfølgende mulighed for at bringe spørgsmål op i enten introfasetimerne eller træningsfasetimerne.

    Aktiviteter i studiefasen:

    • Gennemgang af opgaver ud over de opgaver, der indgår i træningsfasen.
    • Diskussion af fagets begreber og termer.

    Ansvarlig underviser

    Navn E-mail Institut
    Jing Qin qin@imada.sdu.dk Data Science

    Skemaoplysninger

    Kolding
    Vis fuldt skema

    Administrationsenhed

    Institut for Matematik og Datalogi (datalogi)

    Team hos Registratur

    NAT

    Udbudssteder

    Kolding

    Anbefalede studieforløb

    Overgangsordninger

    Overgangsordninger beskriver, hvordan et kursus erstatter et andet kursus, når der ændres i et studieforløb.
    Hvis der er lavet en overgangsordning for et kursus vil den fremgå af oversigten.
    Se overgangsordninger for alle kurser på Det Naturvidenskabelige Fakultet.