DS831: Programmering for Data Science

Det Naturvidenskabelige Studienævn

Undervisningssprog: På dansk eller engelsk afhængigt af underviser
EKA: N340103102
Censur: Intern prøve, to eller flere bedømmere
Bedømmelse: 7-trinsskala
Udbudssteder: Odense
Udbudsterminer: Efterår
Niveau: Kandidat

STADS ID (UVA): N340103101
ECTS-point: 10

Godkendelsesdato: 15-03-2021


Varighed: 1 semester

Version: Arkiv

Indgangskrav

Dette kursus kan ikke følges af kandidatstuderende på Datalogi. 
Kurset kan ikke følges af studerende, der: har fulgt eller bestået DM561, eller DM562, eller et kursus med lignende indhold.

Faglige forudsætninger

Ingen

Formål

Formålet med kurset er at gøre det muligt for den studerende at løse dataanalyseopgaver for en mangfoldighed af problemer fra forskellige forskningsområder.Ud over algoritmisk tænkning omfatter dataanalysearbejdsgange aktiviteter som datamodellering, indsamling, rengøring, behandling og midler til at visualisere visse attributter i grundlæggende plots. Dette er vigtigt i forhold til resten af datavidenskabsuddannelsen, da det danner grundlag for gennemførelsen af dataanalyseprojekter.

Kurset giver et akademisk grundlag for at studere emnerne Data Mining og Machine Learning, Applied Machine Learning, Visualization og Deep Learning, der er en del af uddannelsen.

I forhold til uddannelsens kompetenceprofil har kurset eksplicit fokus på at:

  • Give kompetence til at udvikle løsninger til dataanalyseopgaver
  • Give kompetence til at anvende og integrere eksisterende moduler til databehandling
  • Give viden og forståelse af principperne for programmering
  • Give viden og forståelse for algoritmisk behandling af store mængder data inden for forskellige fagområder
  • Give færdigheder i softwareudvikling
  • Give færdigheder i dataindsamling, rengøring, validering, integration og visualisering

Studerende, der deltager i kurset, vil især opnå følgende “21st Century Skills”:

  • Evnen til at integrere og vurdere oplysninger
  • Kompetence til at finde, udnytte og vurdere oplysninger
  • Være i stand til at udføre og implementere software
  • Være fleksibel og tilpasningsdygtig
  • Deltage i løsning af problemer og arbejde effektivt i teams

Målbeskrivelse

Læringsmålet for kurset er, at den studerende skal kunne demonstrerer evnen til at:

  • Anvende lærte problemløsningsstrategier på forskellige databehandlingsopgaver
  • Tilpasse eksisterende løsninger til relaterede opgaver på tværs af domæner
  • Udvikle nye dataanalysestrategier
  • Udvikle Python-programmer, der implementerer databehandlingsarbejdsgange
  • Finde, vælge og udnytte eksisterende moduler til at indsamle, rense og behandle data
  • Udvikle data på tværs af dataanalyseløsninger i projekt-teams

Indhold

Kurset indeholder følgende faglige hovedområder:

1. Grundlæggende databehandling og algoritmisk tænkning

2. Python programmering:
   • grundelementer
    • valg
    • løkker
    • funktioner
    • datastrukturer (lister, associative)
    • moduler
    • fil I/O, undtagelser
    • klasser
    • grundlæggende datavisualisering

3. Dataanalysearbejdsgange med datasæt fra forskellige domæner, f.eks.:
    • biografidata
    • klimadata
    • tekster
    • numeriske data

Litteratur

Se itslearning for pensumlister og yderligere litteraturhenvisninger.

Eksamensbestemmelser

Eksamenselement a)

Tidsmæssig placering

Efterår og januar

Udprøvninger

Portfolio

EKA

N340103102

Censur

Intern prøve, to eller flere bedømmere

Bedømmelse

7-trinsskala

Identifikation

Studiekort

Sprog

Følger, som udgangspunkt, undervisningssprog

Hjælpemidler

Tilladt, nærmere beskrivelse af eksamensreglerne vil blive offentliggjort i itlsearning.

ECTS-point

10

Uddybende information

Porteføljeeksamen består af små skriftlige opgaver og et gruppeprojekt med en skriftlig rapport og en mundtlig diskussion.

Vejledende antal undervisningstimer

90 timer per semester

Undervisningsform

På det naturvidenskabelige fakultet er undervisningen organiseret efter den trefasede model: intro-, uddannelse- og studiefase. Introfasen letter introduktionen til nyt materiale og emner, som i færdighedstræningsfasen behandles med øvelser, der er forberedt hjemmefra og drøftes i klassen for at validere den erhvervede viden.Studieaktiviteten i form af praktiske anvendelser giver de studerende mulighed for at anvende og bruge den erhvervede viden.

Ansvarlig underviser

Navn E-mail Institut
Stefan Jänicke stjaenicke@imada.sdu.dk Data Science

Skemaoplysninger

Administrationsenhed

Institut for Matematik og Datalogi (datalogi)

Team hos Uddannelsesjura & Registratur

NAT

Udbudssteder

Odense

Anbefalede studieforløb

Profil Uddannelse Semester Udbuds periode