DM581: Introduktion til maskinlæring
Indgangskrav
Faglige forudsætninger
Studerende, der følger kurset, anbefales at have kendskab til:
- computer programmering (herunder evne til at programmere),
- de basale begreber af lineær algebra (vektorer, matricer og deres operationer),
- de basale data strukturer, algoritmer og deres egenskaber,
- de basale begreber af diskrete metoder for datalogi.
Formål
Maskinlæringsteknikker sætter beregningssystemer i stand til adaptivt at forbedre deres ydeevne med erfaringer akkumuleret fra de observerede data. Målet med kurset er at sætte den studerende i stand til at forstå og bruge eksisterende maskinlæringsteknikker og om nødvendigt udtænke deres varianter til at løse mønstergenkendelses- og forudsigelsesproblemer. De metoder, der gennemgås i kurset, er essentielle for at bygge softwaresystemer, der bruges til forudsigelse af komplekse fænomener inden for applikationsområder, herunder medicinsk diagnostik, porteføljestyring, procesautomatisering og beslutningsstøtte.
Dette kursus introducerer de mest almindelige teknikker til at udføre grundlæggende maskinlæringsopgaver og dækker den grundlæggende teori, algoritmer og applikationer. Kurset balancerer teori og praksis. Det dækker både matematiske og heuristiske aspekter af indledende maskinlæringsmetoder. Beregningsmæssige læringsmetoder introduceres på et generelt niveau med deres grundlæggende ideer og intuition. Desuden har de studerende mulighed for at eksperimentere og anvende maskinlæringsteknikker på udvalgte problemstillinger.
Kurset bygger på grundlæggende programmeringsfærdigheder (DM550), datastrukturer og algoritmer (DM507) i design af maskinlæringsalgoritmer og lineær algebra (DM561).
Kurset giver et akademisk grundlag for opbygning af prædiktormodeller for komplekse fænomener fra den virkelige verden, såsom objektgenkendelser, vejrudsigter og finansielle dataanalyser, samt for at gennemføre bachelor- og kandidatafhandlingsprojekter og andre praktisk orienterede studieaktiviteter, der indgår i af graden.
I forhold til uddannelsens kompetenceprofil er det kursets eksplicitte fokus at:
- Give viden om almindelige maskinlæringsopgaver og metoder
- Give færdigheder til at anvende almindelige maskinlæringsmetoder på problemer i den virkelige verden
- Give kompetence til at designe maskinlæringsmetoder
- Give viden til at forstå teorier, metoder og praksis inden for datalogi
- Give færdigheder til at tilegne sig ny viden på en effektiv og selvstændig måde og kunne anvende denne viden på en reflekteret måde
- Give færdigheder til at beskrive, analysere og løse computervidenskabelige problemer ved at anvende metoder og modellere formalismer fra kerneområdet og dets matematiske støttediscipliner
- Give færdigheder i at analysere fordele og ulemper ved forskellige algoritmer, især med hensyn til ressourceforbrug
- Give færdigheder til at træffe og begrunde professionelle beslutninger
- Give færdigheder til at beskrive, formulere og formidle problemstillinger og resultater til peers, ikke-specialister, projektpartnere og brugere
Målbeskrivelse
For at opnå kursets formål er det læringsmålet for kurset, at den studerende demonstrerer evne til at:
- Beskrive de maskinlæring problemstillinger, algoritmer, metoder og præstationsevalueringsprocedurer, der præsenteres på kurset i præcist matematisk sprog.
- Forklare de enkelte trin i de matematiske afledninger, der præsenteres på kurset.
- Anvende og om nødvendigt tilpasse de maskinlæringsmetoder og algoritmer, der præsenteres på kurset til datavidenskabelige problemer.
- Beskrive fordeler og ulemper ved maskinlæringsmetoder, algoritmer og præstationsevalueringsprocedurer til løsning af et givet datavidenskabelige problem.
- Lave computerprogrammering til eksperimentel evaluering af maskinlæringsmetoder.
Indhold
Kurset indeholder følgende faglige hovedområder:
- grundelementer af statistisk læringsteori (bl.a. bias/varians, klassifikation/regression, overfitting/underfitting)
- grundelementer af sandsynlighedsteori
- lineære og ikke-lineære superviserede læringsmetoder (bl.a. næste naboer klassifikation, kerne maskiner, neurale netværk)
- træning, testing og vurdering af maskinlæringsmetoder (bl.a. cross-validation, model valg).
Litteratur
Eksamensbestemmelser
Eksamenselement a)
Tidsmæssig placering
Udprøvninger
Skriftlig eksamen
EKA
Censur
Bedømmelse
Identifikation
Sprog
Varighed
Hjælpemidler
ECTS-point
Uddybende information
Vejledende antal undervisningstimer
Undervisningsform
På naturvidenskab er undervisningen tilrettelagt efter trefasemodellen dvs. intro, trænings- og studiefasen.
- Introfase (forelæsning) - 30 timer
- Træningsfase: 23 timer, heraf 22 timer eksaminatorie
- Læse den tildelte litteratur
- Løse hjemmeopgaver
- Anvende det tilegnede viden i praktiske projekter
Ansvarlig underviser
Skemaoplysninger
Administrationsenhed
Team hos Uddannelsesjura & Registratur
Udbudssteder
Anbefalede studieforløb
Overgangsordninger
Se overgangsordninger for alle kurser på Det Naturvidenskabelige Fakultet.