DM581: Introduktion til maskinlæring

Indgangskrav

Kurset kan ikke følges af studerende, der: enten har fulgt, eller har bestået DM555, DM855, DM859, DM868, DM870, DS804.

Faglige forudsætninger

Studerende, der følger kurset, anbefales at have kendskab til:

computer programmering (herunder evne til at programmere),
de basale begreber af lineær algebra (vektorer, matricer og deres operationer),
de basale data strukturer, algoritmer og deres egenskaber,
de basale begreber af diskrete metoder for datalogi.

Formål

Maskinlæringsteknikker sætter beregningssystemer i stand til adaptivt at forbedre deres ydeevne med erfaringer akkumuleret fra de observerede data. Målet med kurset er at sætte den studerende i stand til at forstå og bruge eksisterende maskinlæringsteknikker og om nødvendigt udtænke deres varianter til at løse mønstergenkendelses- og forudsigelsesproblemer. De metoder, der gennemgås i kurset, er essentielle for at bygge softwaresystemer, der bruges til forudsigelse af komplekse fænomener inden for applikationsområder, herunder medicinsk diagnostik, porteføljestyring, procesautomatisering og beslutningsstøtte.

Dette kursus introducerer de mest almindelige teknikker til at udføre grundlæggende maskinlæringsopgaver og dækker den grundlæggende teori, algoritmer og applikationer. Kurset balancerer teori og praksis. Det dækker både matematiske og heuristiske aspekter af indledende maskinlæringsmetoder. Beregningsmæssige læringsmetoder introduceres på et generelt niveau med deres grundlæggende ideer og intuition. Desuden har de studerende mulighed for at eksperimentere og anvende maskinlæringsteknikker på udvalgte problemstillinger.

Kurset bygger på grundlæggende programmeringsfærdigheder (DM550), datastrukturer og algoritmer (DM507) i design af maskinlæringsalgoritmer og lineær algebra (DM561).

Kurset giver et akademisk grundlag for opbygning af prædiktormodeller for komplekse fænomener fra den virkelige verden, såsom objektgenkendelser, vejrudsigter og finansielle dataanalyser, samt for at gennemføre bachelor- og kandidatafhandlingsprojekter og andre praktisk orienterede studieaktiviteter, der indgår i af graden.

I forhold til uddannelsens kompetenceprofil er det kursets eksplicitte fokus at:

Give viden om almindelige maskinlæringsopgaver og metoder
Give færdigheder til at anvende almindelige maskinlæringsmetoder på problemer i den virkelige verden
Give kompetence til at designe maskinlæringsmetoder
Give viden til at forstå teorier, metoder og praksis inden for datalogi
Give færdigheder til at tilegne sig ny viden på en effektiv og selvstændig måde og kunne anvende denne viden på en reflekteret måde
Give færdigheder til at beskrive, analysere og løse computervidenskabelige problemer ved at anvende metoder og modellere formalismer fra kerneområdet og dets matematiske støttediscipliner
Give færdigheder i at analysere fordele og ulemper ved forskellige algoritmer, især med hensyn til ressourceforbrug
Give færdigheder til at træffe og begrunde professionelle beslutninger
Give færdigheder til at beskrive, formulere og formidle problemstillinger og resultater til peers, ikke-specialister, projektpartnere og brugere

Målbeskrivelse

For at opnå kursets formål er det læringsmålet for kurset, at den studerende demonstrerer evne til at:

Beskrive de maskinlæring problemstillinger, algoritmer, metoder og præstationsevalueringsprocedurer, der præsenteres på kurset i præcist matematisk sprog.
Forklare de enkelte trin i de matematiske afledninger, der præsenteres på kurset.
Anvende og om nødvendigt tilpasse de maskinlæringsmetoder og algoritmer, der præsenteres på kurset til datavidenskabelige problemer.
Beskrive fordeler og ulemper ved maskinlæringsmetoder, algoritmer og præstationsevalueringsprocedurer til løsning af et givet datavidenskabelige problem.
Lave computerprogrammering til eksperimentel evaluering af maskinlæringsmetoder.

Indhold

Kurset indeholder følgende faglige hovedområder:

grundelementer af statistisk læringsteori (bl.a. bias/varians, klassifikation/regression, overfitting/underfitting)
grundelementer af sandsynlighedsteori
lineære og ikke-lineære superviserede læringsmetoder (bl.a. næste naboer klassifikation, kerne maskiner, neurale netværk)
træning, testing og vurdering af maskinlæringsmetoder (bl.a. cross-validation, model valg).

Litteratur

Se itslearning for pensumlister og yderligere litteraturhenvisninger.

Eksamensbestemmelser

Eksamenselement a)

Tidsmæssig placering

Januar

Udprøvninger

Skriftlig eksamen

EKA

N330066102

Censur

Ekstern prøve

Bedømmelse

7-trinsskala

Identifikation

Studiekort

Sprog

Følger, som udgangspunkt, undervisningssprog

Varighed

4 timer

Hjælpemidler

Alle almindelige hjælpemidler er tilladte fx lærebøger, egne noter, computerprogrammer som ikke benytter internettet m.v.

Internet er ikke tilladt. Du må dog gå ind på system DE-Digital Eksamen i forbindelse med udfyldelse af multiple choice testen. Noter fra kurset i itslearning, som du ønsker at anvende som hjælpemidler, skal downloades til din computer senest dagen før eksamenen. Under eksamenen må itslearning ikke anvendes.

ECTS-point

7.5

Uddybende information

Reeksamen ændres til en mundtlig eksamen hvis der er 10 eller færre studerende tilmeldt.

Vejledende antal undervisningstimer

53 timer per semester

Undervisningsform

På naturvidenskab er undervisningen tilrettelagt efter trefasemodellen dvs. intro, trænings- og studiefasen.

Introfase (forelæsning) - 30 timer
Træningsfase: 23 timer, heraf 22 timer eksaminatorie

I introfasen introduceres og perspektiveres begreber, teorier og modeller.

I træningsfasen træner de studerende færdigheder og trænger dybere ned i det stof.

I studiefasen får de studerende faglige, personlige og sociale erfaringer, der sætter dem i stand til at befæste og videreudvikle deres videnskabelige kompetencer. Der er fokus på fordybelse, forståelse og udvikling af samarbejdskompetencer.

Studiefaseaktiviteter:

Læse den tildelte litteratur
Løse hjemmeopgaver
Anvende det tilegnede viden i praktiske projekter

Ansvarlig underviser

Navn	E-mail	Institut
Melih Kandemir	kandemir@imada.sdu.dk	Data Science

Skemaoplysninger

Odense

Vis fuldt skema

Administrationsenhed

Institut for Matematik og Datalogi (datalogi)

Team hos Uddannelsesjura & Registratur

NAT

Udbudssteder

Odense

Anbefalede studieforløb

Profil	Uddannelse	Semester	Udbuds periode
BA Centralt fag datalogi et-faglig særligt forløb for datamatikere - optag 1. september 2023	Bachelor i datalogi \| Odense	3	E23
BA Centralt fag datalogi et-faglig særligt forløb for datamatikere - optag 1. september 2023	Bachelor i datalogi \| Odense	3	E22
BA centralt fag i datalogi et-faglig - optag 1. september 2022	Bachelor i datalogi \| Odense	3	E22
BA centralt fag i datalogi et-faglig - optag 1. september 2022 og 2023	Bachelor i datalogi \| Odense	3	E23
BA centralt fag i datalogi to-faglig med sidefag - optag 1. september 2022	Bachelor i datalogi \| Odense	3	E22
BA centralt fag i datalogi to-faglig med sidefag - optag 1. september 2022 og 2023	Bachelor i datalogi \| Odense	3	E23
BA centralt fag i datalogi to-faglig med sidefag i matematik - optag 1. september 2022	Bachelor i datalogi \| Odense	3	E22
BA centralt fag i datalogi to-faglig med sidefag i matematik - optag 1. september 2022 og 2023	Bachelor i datalogi \| Odense	3	E23
BA centralt fag i kunstig intelligens et-faglig - Optag 2023	Bachelor i kunstig intelligens \| Odense	3	E23
KA Sidefag i datalogi for centralt fag i biologi, kemi eller idræt og sundhed - optag 1. september 2023	Kandidat i datalogi \| Odense	3	E23
KA Sidefag i datalogi for centralt fag i fysik - optag 1. september 2023	Kandidat i datalogi \| Odense	3	E23
BA sidefag i Datalogi for central fag i Matematik - optag 1. september 2021 og 2022	Bachelor i datalogi \| Odense	5	E22
BA sidefag i Datalogi for central fag i Matematik - optag 1. september 2021, 2022 og 2023	Bachelor i datalogi \| Odense	5	E23

Overgangsordninger

Overgangsordninger beskriver, hvordan et kursus erstatter et andet kursus, når der ændres i et studieforløb.

Hvis der er lavet en overgangsordning for et kursus vil den fremgå af oversigten.
Se overgangsordninger for alle kurser på Det Naturvidenskabelige Fakultet.