DS800: Introduktion til databehandling

Det Naturvidenskabelige Studienævn

Undervisningssprog: På dansk eller engelsk afhængigt af underviser
EKA: N340041102
Censur: Ekstern prøve
Bedømmelse: 7-trinsskala
Udbudssteder: Odense
Udbudsterminer: Efterår
Niveau: Kandidat

STADS ID (UVA): N340041101
ECTS-point: 10

Godkendelsesdato: 13-01-2021


Varighed: 1 semester

Version: Arkiv

Kommentar

NEDLÆGGES E21 - DS800 er erstattet af et andet kursus (DS831: Programmering for Data Science 8, 10 ECTS).
DS800 nedlægges, men udbydes for yderligere to prøveforsøg i januar og marts 2022.
Studerende der ønsker en genopfriskning af kurset DS800, anbefales at følge kurserne DS831 og DS827 (uden officiel tilmelding til kurset).
(ingen identisk udtryk).
Studerende servicetilmeldes via Uddannelsesjura & Registratur til de to sidste prøveforsøg i DS800.

Indgangskrav

Dette kursus kan ikke følges af kandidatstuderende på Datalogi. 
Kurset kan ikke følges af studerende, der: har fulgt eller bestået DM561, eller DM562, eller et kursus med lignende indhold.

Faglige forudsætninger

Ingen

Formål

Kurset har til formål at sætte den studerende i stand til at repræsentere og beskrive data og skrive små computerprogrammer til at læse, indsamle, integrere, rense, validere og forberede data til videnskabelige beregninger. Dette er vigtigt med hensyn til resten af uddannelsen i Data Science, da den giver grundlag for at gennemføre dataanalyseprojekter.

Kurset vil give studerende viden og kompetencer i metoder fra lineær algebra, såsom matricer og matrixberegninger, som giver mulighed for en matematisk beskrivelse af en datavidenskabsopgave. Derudover vil kurset give færdigheder i at skrive små computerprogrammer til at udføre videnskabelige beregninger, der opstår i lineær algebra eller i de metoder der vil introduceres senere i uddannelsen.

Kurset giver et fagligt grundlag for at studere emnerne Anvendt Statistik, Mutlivariat analyse, Datamining og maskinlæring, anvendt maskinlæring, Visualisering og Deep Learning, der er placeret senere i uddannelsen.

I forhold til uddannelsens kompetenceprofil har kurset eksplicit fokus på at:

  • Give kompetence til håndtering, analyse og præsentation af data
  • Give kendskab til programmering 
  • Give kompetence til at designe, udvælge, anvende og sammensætte de rette programmerings-værktøjer til at behandle og analysere større datamængder samt lave beregning med dem,
  • Give kompetence til at anvende og videreudvikle eksisterende programmerings-værktøj til at foretage komplekse dataanalyser og arbejde med avancerede data
  • Give færdigheder i softwareudvikling
  • Give færdigheder i data indsamling, rengøring, validering, integration og forberedelse
  • Give kendskab til metoder til at arbejde med større datamængder generelt samt indenfor et givent fagområde. 
  • Give viden om teorier som er grundlæggende for datavidenskabelige metoder

Blandt andet vil studerende, der deltager i kurset, især opnå følgende 21st Century Skills:

  • Evnen til at integrere og vurdere information
  • Find, udnytte og vurdere information kompetent
  • At kunne eksekvere og implementere
  • Vær fleksibel og omstillingsparat
  • Samskabe løsninger på eksisterende problemer og arbejde effektivt i teams

Målbeskrivelse

For at opnå kursets formål er det læringsmålet for kurset, at den studerende demonstrerer evnen til at:

  • bruge datarepræsentationer fra linær algebra til at beskrive og rapportere dataanalyser
  • genkende hvilke metoder fra linær algebra, der kan bruges til forskellige behov af dataanalyser
  • udvikle små computerprogrammer (scripts) i et passende programmeringssprog til at behandle data 
  • udvælge og anvende programmerings-værktøj til at indsamle, rengøre og forberede af data
  • anvende linær algebra metoder for at uddrage viden fra data

Indhold

Kurset indeholder følgende faglige hovedområder:

Programmering:

  • grundelementer
  • værdier og datatyper
  • kontrolflow (valg, sløjfer)
  • datastrukturer (lister, associative)
  • funktioner, klasser
  • fil I/O, undtagelser
  • grundlæggende data visualisering

Praktiske applikationer på lineær algebra og programmering

Litteratur

Se BlackBoard for pensumlister og yderligere litteraturhenvisninger.

Eksamensbestemmelser

Eksamenselement a)

Tidsmæssig placering

Januar

Udprøvninger

Skriftlig eksamen

EKA

N340041102

Censur

Ekstern prøve

Bedømmelse

7-trinsskala

Identifikation

Studiekort

Sprog

Følger, som udgangspunkt, undervisningssprog

Hjælpemidler

Tilladt, nærmere beskrivelse af eksamensreglerne vil blive offentliggjort in itslearning.

ECTS-point

10

Uddybende information

Eksamensformen ved reeksamen kan være en anden end eksamensformen ved den ordinære eksamen. 

Vejledende antal undervisningstimer

90 timer per semester

Undervisningsform

 På naturvidenskab er undervisningen tilrettelagt efter trefasemodellen dvs. intro, trænings- og studiefasen.

  • Introfase (forelæsning, holdtimer) - Antal timer: 46
  • træningsfase: Antal timer: 44, heraf eksaminatorietimer 44

Introfasen letter introduktionen af nyt materiale og emner, der i træningsfase behandles med øvelser, der forberedes hjemme og diskuteres i klassen for at validere den erhvervede viden. Studiefase i form af praktiske anvendelser giver eleverne mulighed for at anvende den opnåede viden.

Studiefaseaktiviteter:

  • Læsning fra tekstbøger
  • Løsning af hjemmeopgaver
  • Anvendelse af erhvervet viden til praktiske projekter

Ansvarlig underviser

Navn E-mail Institut
Arthur Zimek zimek@imada.sdu.dk Data Science
Stefan Jänicke stjaenicke@imada.sdu.dk Data Science

Skemaoplysninger

Administrationsenhed

Institut for Matematik og Datalogi (datalogi)

Team hos Uddannelsesjura & Registratur

NAT

Udbudssteder

Odense

Anbefalede studieforløb