DM847: Introduktion til bioinformatik

Det Naturvidenskabelige Studienævn

Undervisningssprog: På dansk eller engelsk afhængigt af underviser, men engelsk ved internationale studerende
EKA: N340004112, N340004102
Censur: Intern prøve, en bedømmer, Ekstern prøve
Bedømmelse: Bestået/Ikke bestået, 7-trinsskala
Udbudssteder: Odense
Udbudsterminer: Efterår
Niveau: Kandidat

STADS ID (UVA): N340004101
ECTS-point: 10

Godkendelsesdato: 25-04-2019


Varighed: 1 semester

Version: Godkendt - aktiv

Kommentar

15017301 (tidligere UVA) er identisk med denne kursusbeskrivelse.
Kurset samlæses med MM552

Indgangskrav

Igen

Faglige forudsætninger

Studerende, der følger kurset, forventes at:

  • Have grundlæggende viden i sandsynlighedsregning
  • Have grundlæggende viden i algoritmik
  • Have færdigheder i programmering

Formål

Formålet af kurset er at give en introduktion til forskning i bioinformatik. I hver forelæsning vil vi begynde med et konkret biologisk og/eller medicinsk spørgsmål, lave det om til et problemformulering, der kan løses af en computer, designe en matematisk model, løse denne og endelig aflede og evaluere svar fra modellen, som giver mening i den virkelige verden. Kursets formål er at give grundlæggende indsigt i moderne forskning i bioinformatik. Kurset giver viden om datalogiske modeller og metoder beregnet til anvendelser i biologi og medicin.

Kurset giver et videnskabeligt grundlag for at løse bioinformatik problemer ved modellering og implementering af edb-programmer. Kurset giver også et videnskabeligt grundlag for at analysere fordele og ulemper ved forskellige datalogiske metoder in bioinformatik, udvikle nye varianter af de lærte metoder, hvor det konkrete problem kræver det, og formidle forskningsbaseret viden og diskutere professionelle og videnskabelige problemstillinger med både fagfæller og ikke-specialister.

I forhold til uddannelsens kompetenceprofil har kurset eksplicit fokus på:

  • at give kompetence til at planlægge og udføre grundlæggende bioinformatiske opgaver
  • viden om typisk supervised og unsupervised data mining metoder
  • anvendelse af typisk netværk enrichment og NGS sekventering data analysemetoder
  • udvikling af nye omik data mining platforme og software
  • planlægge og udføre videnskabelige projekter på højt fagligt niveau herunder styre arbejds- og udviklingssituationer, der er komplekse, uforudsigelige og forudsætter nye løsningsmodeller
  • kunne igangsætte og gennemføre fagligt og tværfagligt samarbejde og påtage sig professionelt ansvar
  • kunne tage ansvar for egen faglig udvikling og specialisering

Målbeskrivelse

For at opnå kursets formål er det læringsmålet for kurset, at den studerende demonstrerer evnen til at:

  • forklare og forstå det centrale dogma i molekulær biologi, centrale aspekter af genregulering, basisprincipper af epigenetisk DNA-ændringer og specialiteter m.h.t. bakterie & phage genetik
  • modellere ontologier for biomedicinske dataafhængigheder
  • designe databaser til systems biologi
  • forklare og implementere metoder til analyse af DNA & aminosyre sekvenser (HMMs, scoringmatricer og efficient statistik med disse på datastrukturer som for eksempel suffix arrays)
  • forklare og implementere statistiske læringsmetoder på biologiske netværk (network enrichment, GraphLets)
  • forklare specialiteter af bakteriel genetik (operonforudsigelsestrick)
  • forklare og implementere metoder for suffixtræer, suffixarrays og Burrows-Wheeler-transformationen
  • forklare de novo sekvensmønster screening med EM algoritmen og entropimodeller.
  • Forklare og implementere grundlæggende metoder til supervised og unsupervised data mining, samt deres anvendelse på biomedicinske omik datasæt

Indhold

Kurset indeholder følgende faglige hovedområder:

  • det centrale dogme i molekulær genetik, epigenetik og bakteriel og phage genetik
  • design og konstruktion af databaser for molekulærbiologiske data (ontologies, eksempler på databaser: NCBI, CoryneRegNet, ONDEX)
  • analyse af DNA og aminosyre sekvens mønster model (HMMS, scoringsmatricer, blandede modeller, efficient statistik med dem på store datasæt)
  • specialiteter i bakteriel genetik (sekvens modeller og funktionelle modeller for operonforudsigelse)
  • de novo identifikation af transkriptionsfaktorbindingsmotifer (rekursiv forventingsmaksimering, entropi-baserede modeller)
  • analyse af næste generations DNA sekvens datamængder (memory-aware short sequence read mapping data ved hjælp af Burrows Wheeler transformationen og suffix arrays, bi-modal peak calling)
  • visualisering af biologiske netværk (graflayout: små men stærk variable grafer vs. store men mere statiske grafer)
  • systems biologi og statistik på netværk (network enrichment with CUSP
  • jActiveModules og KeyPathwayMiner, Graphlet degree signatures)
  • Grundlæggende supervised og unsupervised metoder klassificeringskriterierne for omics dataanalyse

Litteratur

Se BlackBoard for pensumlister og yderligere litteraturhenvisninger.

Eksamensbestemmelser

Forudsætningsprøve a)

Tidsmæssig placering

Efterår

Udprøvninger

Obligatoriske opgaver

EKA

N340004112

Censur

Intern prøve, en bedømmer

Bedømmelse

Bestået/Ikke bestået

Identifikation

Fulde navn og SDU brugernavn

Sprog

Følger, som udgangspunkt, undervisningssprog

Hjælpemidler

Oplyses på kurset

ECTS-point

0

Uddybende information

 Forudsætningsprøven er en forudsætning for deltagelse i eksamenselement a)

Eksamenselement a)

Tidsmæssig placering

Januar

Forudsætninger

Type Forudsætningsnavn Forudsætningsfag
Forudsætning ikke fundet

Udprøvninger

Mundtlig eksamen

EKA

N340004102

Censur

Ekstern prøve

Bedømmelse

7-trinsskala

Identifikation

Studiekort

Sprog

Følger, som udgangspunkt, undervisningssprog

Hjælpemidler

Oplyses på kurset

ECTS-point

10

Uddybende information

Eksamensformen ved reeksamen kan være en anden end eksamensformen ved den ordinære eksamen.

Vejledende antal undervisningstimer

86 timer per semester

Undervisningsform

På naturvidenskab er undervisningen tilrettelagt efter trefasemodellen dvs. intro, trænings- og studiefasen.
Disse undervisningsaktiviteter udmønter sig i en anslået vejledende fordeling af arbejdsindsatsen hos en gennemsnitsstuderende på følgende måde:

  • Introfase (forelæsning, holdtimer) - Antal timer: 41
  • Træningsfasen: Antal timer: 45 heraf; eksaminatorie: 41 timer og ekskursion: 4 timer

Aktiviteter i studiefasen:

  • Løse opgaver
  • Læse den tildelte literatur
  • Øve at anvende den tilegnede viden

Ansvarlig underviser

Navn E-mail Institut
Konrad Krawczyk konradk@imada.sdu.dk Institut for Biokemi og Molekylær Biologi
Richard Röttger roettger@imada.sdu.dk Institut for Matematik og Datalogi, Datalogi, Datavidenskab & Statistik

Skemaoplysninger

49
Monday
30-11-2020
Tuesday
01-12-2020
Wednesday
02-12-2020
Thursday
03-12-2020
Friday
04-12-2020
08 - 09
Class h1e
Undervisning
Online
09 - 10
Class h1e
Undervisning
Online
10 - 11
11 - 12
12 - 13
Class h1e
Undervisning
Online
13 - 14
Class h1e
Undervisning
Online
14 - 15
15 - 16
Vis fuldt skema

Administrationsenhed

Institut for Matematik og Datalogi (datalogi, fiktiv)

Team hos Registrering & Legalitet

NAT

Anbefalede studieforløb