DM864: Advanced Data Mining
Indgangskrav
Faglige forudsætninger
- Have en basal forståelse for sandsynlighed og matematik;
- Have kendskab til programmering;
- Have kendskab af grundelementer af unsupervised data mining, fx, fra kurset DM555 eller fra kurset DM843 (kan kombineres med kurset).
Formål
- Give kompetence til at beskrive, analysere og løse avancerede problemstillinger i unsupervised data mining ved anvendelse af de lærte modeller og metoder.
- Give kompetence til at analyse fordelene og ulemper ved forskelige metoder på avanceret unsupervised data mining.
- Give færdigheder i tilstrækkelig brug af de lærte modeller og metoder.
- Give viden og forstand om udvælgelse af specialiseret modeller og metoder på unsupervised data mining med ensemble tekniker eller adaptioner til høj dimensional data, herunder metoder fra fagets forskningsfront.
Målbeskrivelse
- beskrive de data mining opgaver som præsenteres i kurset;
- beskrive de algoritmer og metoder som bliver præsenteret i kurset;
- beskrive de emner der bliver præsenteret i kurset i et præcist matematisk sprog;
- forklare de enkelte trin i de matematiske udledninger der præsenteres i kurset;
- anvende metoderne på andre problemstillinger end dem der bliver præsenteret i kurset;
- vurdere og reflektere over valg af design af data mining metoder for høj dimensional data og ensemble metoder.
Indhold
- generelle principper og metoder for ensemble læring;
- specielle udfordringer og tilgange for ensemble clustering og ensemble outlier detection;
- udvalgte metoder for ensemble clustering og ensemble outlier detection;
- specielle udfordringer for data mining høj dimensional data;
- generelle tilgange for unsupervised læring i høj dimensional data;
- udvalgte metoder for subspace clustering;
- udvalgte metoder for høj dimensional outlier detection.
Litteratur
Eksamensbestemmelser
Forudsætningsprøve a)
Tidsmæssig placering
Udprøvninger
Mundtlig præsentation
EKA
Censur
Bedømmelse
Identifikation
Sprog
Hjælpemidler
Oplyses på kurset.
ECTS-point
Uddybende information
Præsentation af en eller flere videnskabelige artikler i klassen
Forudsætningsprøven er en forudsætning for deltagelse i eksamenselement a)
Eksamenselement a)
Tidsmæssig placering
Forudsætninger
Type | Forudsætningsnavn | Forudsætningsfag |
---|---|---|
Delprøve | Forudsætningsprøve a) | N340084101, DM864: Advanced Data Mining |
Udprøvninger
Mundtlig eksamen
EKA
Censur
Bedømmelse
Identifikation
Sprog
Hjælpemidler
Nærmere beskrivelse af eksamensreglerne vil blive offentliggjort i itslearning.
ECTS-point
Vejledende antal undervisningstimer
Undervisningsform
På naturvidenskab er undervisningen tilrettelagt efter trefasemodellen dvs. intro, trænings- og studiefasen.
- Introfase 24 timer
- Træningsfase 12 timer, heraf eksaminatorier 12 timer.
Aktiviteter i studiefasen:
- Læse lærebogen og artikler
- Løse hjemmeopgaver
- Anvende opnået viden i praktiske projekter
I introfasen introduceres koncepter, teorier og modeller og sættes i perspektiv. I træningsfasen træner eleverne deres færdigheder gennem øvelser og graver dybere ned i faget. I studiefasen får de studerende akademiske, personlige og sociale erfaringer, der konsoliderer og videreudvikler deres videnskabelige færdigheder. Fokus er på fordybelse, forståelse og udvikling af samarbejdsevner.