DS800: Introduktion til databehandling

Det Naturvidenskabelige Studienævn

Undervisningssprog: På dansk eller engelsk afhængigt af underviser
EKA: N340041102
Censur: Ekstern prøve
Bedømmelse: 7-trinsskala
Udbudssteder: Odense
Udbudsterminer: Efterår
Niveau: Kandidat

STADS ID (UVA): N340041101
ECTS-point: 10

Godkendelsesdato: 09-03-2020


Varighed: 1 semester

Version: Godkendt - aktiv

Kommentar

NYT kursus E19
Kurset kan ikke følges af studerende, der: har fulgt eller bestået DM561, eller DM562, eller et kursus med lignende indhold.


Indgangskrav

Dette kursus kan ikke følges af kandidatstuderende på Datalogi. 

Faglige forudsætninger

Ingen

Formål

Kurset har til formål at sætte den studerende i stand til at repræsentere og beskrive data og skrive små computerprogrammer til at læse, indsamle, integrere, rense, validere og forberede data til videnskabelige beregninger. Dette er vigtigt med hensyn til resten af uddannelsen i Data Science, da den giver grundlag for at gennemføre dataanalyseprojekter.

Kurset vil give studerende viden og kompetencer i metoder fra lineær algebra, såsom matricer og matrixberegninger, som giver mulighed for en matematisk beskrivelse af en datavidenskabsopgave. Derudover vil kurset give færdigheder i at skrive små computerprogrammer til at udføre videnskabelige beregninger, der opstår i lineær algebra eller i de metoder der vil introduceres senere i uddannelsen.

Kurset giver et fagligt grundlag for at studere emnerne Anvendt Statistik, Mutlivariat analyse, Datamining og maskinlæring, anvendt maskinlæring, Visualisering og Deep Learning, der er placeret senere i uddannelsen.

I forhold til uddannelsens kompetenceprofil har kurset eksplicit fokus på at:

  • Give kompetence til håndtering, analyse og præsentation af data
  • Give kendskab til programmering 
  • Give kompetence til at designe, udvælge, anvende og sammensætte de rette programmerings-værktøjer til at behandle og analysere større datamængder samt lave beregning med dem,
  • Give kompetence til at anvende og videreudvikle eksisterende programmerings-værktøj til at foretage komplekse dataanalyser og arbejde med avancerede data
  • Give færdigheder i softwareudvikling
  • Give færdigheder i data indsamling, rengøring, validering, integration og forberedelse
  • Give kendskab til metoder til at arbejde med større datamængder generelt samt indenfor et givent fagområde. 
  • Give viden om teorier som er grundlæggende for datavidenskabelige metoder

Målbeskrivelse

For at opnå kursets formål er det læringsmålet for kurset, at den studerende demonstrerer evnen til at:

  • bruge datarepræsentationer fra linær algebra til at beskrive og rapportere dataanalyser
  • genkende hvilke metoder fra linær algebra, der kan bruges til forskellige behov af dataanalyser
  • udvikle små computerprogrammer (scripts) i et passende programmeringssprog til at behandle data 
  • udvælge og anvende programmerings-værktøj til at indsamle, rengøre og forberede af data
  • anvende linær algebra metoder for at uddrage viden fra data

Indhold

Kurset indeholder følgende faglige hovedområder:

Lineær algebra:

  • sæt og funktioner
  • vektorrum
  • lineære funktioner
  • matrix operationer
  • determinanter
  • lineære ligningssystemer
  • egenværdier og egenvektorer
  • principle component analysis

Programmering:

  • grundelementer
  • værdier og datatyper
  • kontrolflow (valg, sløjfer)
  • datastrukturer (lister, associative)
  • funktioner, klasser
  • fil I/O, undtagelser
  • grundlæggende data visualisering

Praktiske applikationer på lineær algebra og programmering

Litteratur

Se BlackBoard for pensumlister og yderligere litteraturhenvisninger.

Eksamensbestemmelser

Eksamenselement a)

Tidsmæssig placering

Januar

Udprøvninger

Skriftlig eksamen

EKA

N340041102

Censur

Ekstern prøve

Bedømmelse

7-trinsskala

Identifikation

Studiekort

Sprog

Følger, som udgangspunkt, undervisningssprog

Hjælpemidler

Tilladt, nærmere beskrivelse af eksamensreglerne vil blive offentliggjort under 'Course Information' på kursets side i BlackBoard.

ECTS-point

10

Uddybende information

Eksamensformen ved reeksamen kan være en anden end eksamensformen ved den ordinære eksamen. 

Vejledende antal undervisningstimer

90 timer per semester

Undervisningsform

 På naturvidenskab er undervisningen tilrettelagt efter trefasemodellen dvs. intro, trænings- og studiefasen.

  • Introfase (forelæsning, holdtimer) - Antal timer: 46
  • træningsfase: Antal timer: 44, heraf eksaminatorietimer 44

Introfasen letter introduktionen af nyt materiale og emner, der i træningsfase behandles med øvelser, der forberedes hjemme og diskuteres i klassen for at validere den erhvervede viden. Studiefase i form af praktiske anvendelser giver eleverne mulighed for at anvende den opnåede viden.

Studiefaseaktiviteter:

  • Læsning fra tekstbøger
  • Løsning af hjemmeopgaver
  • Anvendelse af erhvervet viden til praktiske projekter

Ansvarlig underviser

Navn E-mail Institut
John Bulava bulava@imada.sdu.dk Institut for Matematik og Datalogi, Anvendt Matematik
Peter Schneider-Kamp petersk@imada.sdu.dk Institut for Matematik og Datalogi, Datalogi
Stefan Jänicke stjaenicke@imada.sdu.dk Institut for Matematik og Datalogi, Datalogi

Skemaoplysninger

Administrationsenhed

Institut for Matematik og Datalogi (datalogi, fiktiv)

Team hos Registrering & Legalitet

NAT

Anbefalede studieforløb