DS800: Introduktion til databehandling
Kommentar
NYT kursus E19
Kurset kan ikke følges af studerende, der: har fulgt eller bestået DM561, eller DM562, eller et kursus med lignende indhold.
Indgangskrav
Faglige forudsætninger
Formål
Kurset har til formål at sætte den studerende i stand til at repræsentere og beskrive data og skrive små computerprogrammer til at læse, indsamle, integrere, rense, validere og forberede data til videnskabelige beregninger. Dette er vigtigt med hensyn til resten af uddannelsen i Data Science, da den giver grundlag for at gennemføre dataanalyseprojekter.
Kurset vil give studerende viden og kompetencer i metoder fra lineær algebra, såsom matricer og matrixberegninger, som giver mulighed for en matematisk beskrivelse af en datavidenskabsopgave. Derudover vil kurset give færdigheder i at skrive små computerprogrammer til at udføre videnskabelige beregninger, der opstår i lineær algebra eller i de metoder der vil introduceres senere i uddannelsen.
Kurset giver et fagligt grundlag for at studere emnerne Anvendt Statistik, Mutlivariat analyse, Datamining og maskinlæring, anvendt maskinlæring, Visualisering og Deep Learning, der er placeret senere i uddannelsen.
I forhold til uddannelsens kompetenceprofil har kurset eksplicit fokus på at:
- Give kompetence til håndtering, analyse og præsentation af data
- Give kendskab til programmering
- Give kompetence til at designe, udvælge, anvende og sammensætte de rette programmerings-værktøjer til at behandle og analysere større datamængder samt lave beregning med dem,
- Give kompetence til at anvende og videreudvikle eksisterende programmerings-værktøj til at foretage komplekse dataanalyser og arbejde med avancerede data
- Give færdigheder i softwareudvikling
- Give færdigheder i data indsamling, rengøring, validering, integration og forberedelse
- Give kendskab til metoder til at arbejde med større datamængder generelt samt indenfor et givent fagområde.
- Give viden om teorier som er grundlæggende for datavidenskabelige metoder
Målbeskrivelse
For at opnå kursets formål er det læringsmålet for kurset, at den studerende demonstrerer evnen til at:
- bruge datarepræsentationer fra linær algebra til at beskrive og rapportere dataanalyser
- genkende hvilke metoder fra linær algebra, der kan bruges til forskellige behov af dataanalyser
- udvikle små computerprogrammer (scripts) i et passende programmeringssprog til at behandle data
- udvælge og anvende programmerings-værktøj til at indsamle, rengøre og forberede af data
- anvende linær algebra metoder for at uddrage viden fra data
Indhold
Kurset indeholder følgende faglige hovedområder:
Lineær algebra:
- sæt og funktioner
- vektorrum
- lineære funktioner
- matrix operationer
- determinanter
- lineære ligningssystemer
- egenværdier og egenvektorer
- principle component analysis
Programmering:
- grundelementer
- værdier og datatyper
- kontrolflow (valg, sløjfer)
- datastrukturer (lister, associative)
- funktioner, klasser
- fil I/O, undtagelser
- grundlæggende data visualisering
Praktiske applikationer på lineær algebra og programmering
Litteratur
Eksamensbestemmelser
Eksamenselement a)
Tidsmæssig placering
Udprøvninger
Eksamen består af praktiske opgaver indleveret løbende gennem kurset og en skriftlig eksamen.
EKA
Censur
Bedømmelse
Identifikation
Sprog
Hjælpemidler
ECTS-point
Uddybende information
Eksamensformen ved reeksamen kan være en anden end eksamensformen ved den ordinære eksamen.
Vejledende antal undervisningstimer
Undervisningsform
På naturvidenskab er undervisningen tilrettelagt efter trefasemodellen dvs. intro, trænings- og studiefasen.
- Introfase (forelæsning, holdtimer) - Antal timer: 46
- træningsfase: Antal timer: 44, heraf eksaminatorietimer 44
Introfasen letter introduktionen af nyt materiale og emner, der i træningsfase behandles med øvelser, der forberedes hjemme og diskuteres i klassen for at validere den erhvervede viden. Studiefase i form af praktiske anvendelser giver eleverne mulighed for at anvende den opnåede viden.
Studiefaseaktiviteter:
- Læsning fra tekstbøger
- Løsning af hjemmeopgaver
- Anvendelse af erhvervet viden til praktiske projekter
Ansvarlig underviser
Navn | Institut | |
---|---|---|
John Bulava | bulava@imada.sdu.dk | CP3-origins |
Stefan Jänicke | stjaenicke@imada.sdu.dk | Institut for Matematik og Datalogi |