Inhaltsverzeichnis

1 Skizze des Fachs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1

1.1 Zum Begriff Bioinformatik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
1.2 Ideengeschichte der Genomanalyse . . . . . . . . . . . . . . . . . . . . . . . . . .
9
1.3 Einige biologische Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13
1.4 Kernfragen der Bioinformatik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21
1.5 Einführung in das Computeralgebra-Programm Mathematica . . . . . . .
25
Quellen und weiterführende Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . .
32
2 Statistische Analyse von DNA-Sequenzen . . . . . . . . . . . . . . . . . . . . . . . .

35
2.1 Grundidee . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
35
2.2 Wahrscheinlichkeitsmodelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
36
2.3 BedingteWahrscheinlichkeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . .
43
2.4 Parameterschätzung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
49
2.5 Diskrete und stetige Verteilungen . . . . . . . . . . . . . . . . . . . . . . . . . .
57
2.6 Nullhypothesen und Eigenschaften realer Sequenzen . . . . . . . . . . . .
72
2.7 Markov-Modelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
77
2.7.1 Formale Definition von Markov-Ketten . . . . . . . . . . . . . . .
77
2.7.2 Anwendungsbeispiel . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
80
2.8 Hidden-Markov-Modelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
85
2.8.1 Parameter von Hidden-Markov-Modellen . . . . . . . . . . . . .
85
2.8.2 Viterbi-Decodierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
90
2.8.3 Posterior-Decodierung . . . . . . . . . . . . . . . . . . . . . . . . . . .
103
2.8.4 Fortgeschrittene Themen und allgemeine Bemerkungen zu Markov-Modellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
113
2.9 Anwendung von Hidden-Markov-Modellen . . . . . . . . . . . . . . . . . .
118
2.9.1 CpG-Inseln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
118
2.9.2 Genidentifkation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
127
2.9.3 Membranproteine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
134
Quellen und weiterführende Literatur . . . . . . . . . . . . . . . . . . . . . . . . . .
139
3 Praktische Bioinformatik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

141
3.1 Grundlagen des Sequenzalignment . . . . . . . . . . . . . . . . . . . . . . . . . . .
141

3.1.1 Scoring-Modelle und Dotplot-Visualisierungen . . . . . . . . . .

141
3.1.2 Algorithmen für paarweises Alignment . . . . . . . . . . . . . . . .
150

3.1.3 Implementierungen und weitere Beispiele . . . . . . . . . . . . . .

159
3.2 Weitere Aspekte des Sequenzalignments . . . . . . . . . . . . . . . . . . . . .
173
3.2.1 Heuristische Methoden des Sequenzvergleichs . . . . . . . . . .
173
3.2.2 Multiples Alignment . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
179
3.2.3 Alignment-Scores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
187
3.3 Phylogenetische Analysen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
190
3.3.1 Grundidee phylogenetischer Analysen . . . . . . . . . . . . . . . .
190
3.3.2 Phylogenetische Bäume . . . . . . . . . . . . . . . . . . . . . . . . . . .
191
3.3.3 Der UPGMA-Algorithmus . . . . . . . . . . . . . . . . . . . . . . . .
197
3.3.4 Der Neighbor-Joining-Algorithmus . . . . . . . . . . . . . . . . .
202
3.3.5 Baumbewertung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
208
3.3.6 Implementierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
210
3.4 Datenbanken und Annotation . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
214
Quellen und weiterführende Literatur . . . . . . . . . . . . . . . . . . . . . . . . . .
219
4 Informationstheorie und statistische Eigenschaften von Genomen . . .

221

4.1 Grundlagen der Informationstheorie . . . . . . . . . . . . . . . . . . . . . . . .
221
4.1.1 Entropie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
222
4.1.2 Transinformation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
228
4.1.3 Allgemeine Markov-Prozesse und der DAR(p)-Algorithmus
231
4.2 Genomeigenschaften und Korrelationen in DNA-Sequenzen . . . . . .
240
4.2.1 Globale statistische Eigenschaften eines Genoms. . . . . . . . .
240
4.2.2 Korrelationen in DNA-Sequenzen . . . . . . . . . . . . . . . . . . .
243
Quellen und weiterführende Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . .
256
5 Neue Entwicklungen und angrenzende Themenfelder . . . . . . . . . . . . . .

257

5.1 DNA-Sequenzen und fraktale Geometrie . . . . . . . . . . . . . . . . . . . . .
257
5.2 Netzwerke . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
283
5.3 Mathematische Modellierung und Systembiologie . . . . . . . . . . . . . . .
315
Quellen und weiterführende Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . .
329
Sachverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 331