DM583: Datamining

Det Naturvidenskabelige Studienævn

Undervisningssprog: På dansk eller engelsk afhængigt af underviser, men engelsk ved internationale studerende
EKA: N330071102
Censur: Ekstern prøve
Bedømmelse: 7-trinsskala
Udbudssteder: Odense
Udbudsterminer: Forår
Niveau: Bachelor

STADS ID (UVA): N330071101
ECTS-point: 5

Godkendelsesdato: 21-10-2025


Varighed: 1 semester

Version: Godkendt - aktiv

Indgangskrav

Kurset kan ikke følges af studerende, der: enten har fulgt, eller har bestået DM555, DM566, DM855, DM859, DM868, DM870 eller DS804.

Faglige forudsætninger

Studerende, der følger kurset, anbefales at

  • have basale programmeringsfærdigheder (eks. fra DM574),
  • have kendskab til basale algoritmer og data strukturer (eks. fra DM578),
  • have kendskab til de basale begreber af lineær algebra (eks. AI511),
  • have kendskab til de basale begreber af diskrete metoder for datalogi (eks. fra DM549) og
  • have kendskab til begreber inden for sandsyndlighed og matematisk statistik (eks. fra AI501 og AI512).

Formål

Kurset har til formål at sætte den studerende i stand til at vælge og bruge nøgleteknikker i datamining, hvilket er vigtigt i forhold til at kunne analysere store datasæt i mange finansielle, medicinske, kommercielle og videnskabelige anvendelser.

Datamining teknologier udstyrer beregningsmæssige systemer med evnen til at identificere meningsfulde mønstre i data.

Dette kursus introducerer de mest almindelige teknikker til at udføre grundlæggende opgaver indenfor datamining, og dækker den grundlæggende teori, algoritmer og applikationer. Kurset balancerer teori og praksis, og dækker de matematiske såvel som de heuristiske aspekter. For de fleste af teknikkerne i pensum vil såvel de grundlæggende ideer og intuition som en formel beregningsmæssig beskrivelse præsenteres. Desuden vil de studerende have mulighed for at eksperimentere og anvende teknikker fra datamining teknikker på udvalgte problemer. Teknikkerne til ikke-superviseret læring i dette kursus komplementerer tenikkerne til superviseret læring der læres i AI512.

Målbeskrivelse

For at opnå kursets formål er det læringsmålet for kurset, at den studerende demonstrerer evnen til at:
  • Beskrive datamining opgaver præsenteret i løbet af kurset
  • Beskrive de algoritmer og metoder, der præsenteres i kurset
  • Beskrive de emner, der præsenteres i kurset i præcist matematisk sprog
  • Forklare de enkelte trin i de matematiske afledninger præsenteret i klassen
  • Anvende metoderne på simple problemer
  • Anvendelse af metoderne til andre situationer end dem, der præsenteres i klassen
  • Reflektere over og vurdere design valg for datamining systemer
  • Foretage eksperimentel evaluering af datamining og rapportere om resultaterne

Indhold

Kurset omfatter følgende hovedemner:

  • Repræsentation af data og (u)lighedsmål.
  • Parametrisk og ikke-parametrisk tæthedsskøn (MLE, kernel-baseret, KNN-baseret).
  • Expectation Maximization og Gaussiske blandingsmodeller (EM-GMM).
  • Clustering (fx partitionsbaseret clustering som k-means, hierarkisk clustering, tæthedsbetinget clustering).
  • Uovervåget detektion af outliers/anomalier.
  • Mønsteranalyse (fx item set mining og associationsregler).
  • Evaluering af uovervåget læring.

Litteratur

Se itslearning for litteraturhenvisninger.

Eksamensbestemmelser

Eksamenselement a)

Tidsmæssig placering

Juni

Udprøvninger

Skriftlig eksamen

EKA

N330071102

Censur

Ekstern prøve

Bedømmelse

7-trinsskala

Identifikation

Studiekort - Eksamensnummer

Sprog

Følger, som udgangspunkt, undervisningssprog

Varighed

4 timer

Hjælpemidler

Alle almindelige hjælpemidler er tilladte, fx lærebøger, noter, computerprogrammer som ikke benytter internettet m.v. 

Internet er ikke tilladt. Du må dog gå ind på system DE-Digital Eksamen i forbindelse med udfyldelse af multiple choice testen. Noter fra kurset i itslearning, som du ønsker at anvende som hjælpemidler, skal downloades til din computer senest dagen før eksamenen. Under eksamenen må itslearning ikke anvendes.

ECTS-point

5

Vejledende antal undervisningstimer

34 timer per semester

Undervisningsform

Skemalagte undervisningstimer:
Antal undervisningstimer i alt: 34
Heraf:
Fællestimer i klasselokale/auditorium: 20
Holdtimer i klasselokale: 14

I fællestimer bliver emnerne introduceret, diskuteret og perspektiveret. I holdtimer træner de studerende de lærte koncepter gennem øvelser og computer-assisterede opgaver, og trænger dermed dybere ned i stoffet med mulighed for at videreudvikle deres samarbejdsevner.

Andre planlagte undervisningsaktiviteter:
  • Supplerende læsning af den tildelte litteratur
  • Lave yderligere øvelser som hjemmeopgaver

Ansvarlig underviser

Navn E-mail Institut
Ricardo Jose Gabrielli Barreto Campello campello@imada.sdu.dk Institut for Matematik og Datalogi

Skemaoplysninger

Administrationsenhed

Institut for Matematik og Datalogi (datalogi)

Team hos Registratur

NAT

Udbudssteder

Odense

Anbefalede studieforløb

Overgangsordninger

Overgangsordninger beskriver, hvordan et kursus erstatter et andet kursus, når der ændres i et studieforløb.
Hvis der er lavet en overgangsordning for et kursus vil den fremgå af oversigten.
Se overgangsordninger for alle kurser på Det Naturvidenskabelige Fakultet.