DS831: Programmering for Data Science
Indgangskrav
Kurset kan ikke følges hvis DM574, DM550, DM562, DM536, DM857, DS830, DS801 eller MM560 er bestået, eller indgår obligatorisk i din studieordning.
Faglige forudsætninger
Formål
Formålet med kurset er at gøre det muligt for den studerende at løse dataanalyseopgaver for en mangfoldighed af problemer fra forskellige forskningsområder.Ud over algoritmisk tænkning omfatter dataanalysearbejdsgange aktiviteter som datamodellering, indsamling, rengøring, behandling og midler til at visualisere visse attributter i grundlæggende plots. Dette er vigtigt i forhold til resten af datavidenskabsuddannelsen, da det danner grundlag for gennemførelsen af dataanalyseprojekter.
Kurset giver et akademisk grundlag for at studere emnerne Data Mining og Machine Learning, Applied Machine Learning, Visualization og Deep Learning, der er en del af uddannelsen.
I forhold til uddannelsens kompetenceprofil har kurset eksplicit fokus på at:
- Give kompetence til at udvikle løsninger til dataanalyseopgaver
- Give kompetence til at anvende og integrere eksisterende moduler til databehandling
- Give viden og forståelse af principperne for programmering
- Give viden og forståelse for algoritmisk behandling af store mængder data inden for forskellige fagområder
- Give færdigheder i softwareudvikling
- Give færdigheder i dataindsamling, rengøring, validering, integration og visualisering
Studerende, der deltager i kurset, vil især opnå følgende “21st Century Skills”:
- Evnen til at integrere og vurdere oplysninger
- Kompetence til at finde, udnytte og vurdere oplysninger
- Være i stand til at udføre og implementere software
- Være fleksibel og tilpasningsdygtig
- Deltage i løsning af problemer og arbejde effektivt i teams
Målbeskrivelse
Læringsmålet for kurset er, at den studerende skal kunne demonstrerer evnen til at:
- Anvende lærte problemløsningsstrategier på forskellige databehandlingsopgaver
- Tilpasse eksisterende løsninger til relaterede opgaver på tværs af domæner
- Udvikle nye dataanalysestrategier
- Udvikle Python-programmer, der implementerer databehandlingsarbejdsgange
- Finde, vælge og udnytte eksisterende moduler til at indsamle, rense og behandle data
- Udvikle data på tværs af dataanalyseløsninger i projekt-teams
Indhold
Kurset indeholder følgende faglige hovedområder:
1. Grundlæggende databehandling og algoritmisk tænkning
2. Python programmering:
• grundelementer
• valg
• løkker
• funktioner
• datastrukturer (lister, associative)
• moduler
• fil I/O, undtagelser
• klasser
• grundlæggende datavisualisering
3. Dataanalysearbejdsgange med datasæt fra forskellige domæner, f.eks.:
• biografidata
• klimadata
• tekster
• numeriske data
Litteratur
Eksamensbestemmelser
Eksamenselement a)
Tidsmæssig placering
Udprøvninger
Portfolio
EKA
Censur
Bedømmelse
Identifikation
Sprog
Hjælpemidler
ECTS-point
Uddybende information
Porteføljeeksamen består af små skriftlige opgaver og et gruppeprojekt med en skriftlig rapport og en mundtlig diskussion.
Vejledende antal undervisningstimer
Undervisningsform
På det naturvidenskabelige fakultet er undervisningen organiseret efter den trefasede model: intro-, uddannelse- og studiefase. Introfasen letter introduktionen til nyt materiale og emner, som i færdighedstræningsfasen behandles med øvelser, der er forberedt hjemmefra og drøftes i klassen for at validere den erhvervede viden.Studieaktiviteten i form af praktiske anvendelser giver de studerende mulighed for at anvende og bruge den erhvervede viden.