Didaktik der Chemie / Universität Bayreuth

Stand: 11.06.19


Multimedia

8 Datenbanken


Ziel der Lehreinheit ist es, Sie in die Lage zu versetzen, Datenbank-Inhalte im WWW für Unterrichtszwecke zu bewerten und zu nutzen.

Hinweis: Wenn Laien von "Internet" sprechen, meinen sie meistens nur den Internet-Dienst World Wide Web (WWW).


Folie: Dienste des Internet


8.1 Datenbanken im WWW

Bioinformatik: Wissenschaft zur Entwicklung und zum Einsatz von „computerbasierte[n] Algorithmen und mathematische[n] Methoden zur Verarbeitung und Analyse (…) biologischer Daten“ [1, S. 10].

Arten von (schulrelevanten) Datenbanken:

  • Protein-,
  • Gen-,
  • RNA-,
  • Organismen-,
  • Chemikaliendatenbanken...

Sie haben Bedeutung in der Bereitstellung von Grundlage für die Analyse biologischer, biochemischer oder chemischer Datenbanken sowie zum Vergleich solcher Daten.

Didaktische Bedeutung. Der Einsatz von biologischen Datenbanken im Unterricht kann alle Kompetenzbereiche der Bildungsstandards fördern. Daher sollte die Schule den Lernenden den Zugang zu diesen Datenbanken ermöglichen. Beispiele:

  • Kompetenzbereich Fachwissen: Bedeutung von Bio-Daten in der Omics-Ära der Biologie mit Bezug zum Basiskonzept Entwicklung (Biologie [5]);
  • Kompetenzbereich Erkenntnisgewinnung:
    • Zugang zu Datenbanken, Abbau von „Scheu“ vor Datenmengen,
    • Arbeit mit Originaldaten aus der Forschung: Förderung der Motivation,
    • Vergleich von Sequenzen: z.B. Zuordnung eines Proteins zu einer Proteinfamilie
  • Kompetenzbereich Kommunikation: Visualisierung von Recherche-Ergebnissen
  • Kompetenzbereich Bewertung: Bewusstsein für die Bedeutung von „open access“ im Internet zu den Daten in der Forschung (vgl. z.B. [2]).

Unterrichtliche Vorteile.

  • Daten und Anwendungen kostenlos
  • nur Computer mit Netzzugang, Browser und u.U. Moleküldarstellungsprogramm notwendig
  • i.d.R. keine zusätzliche Software notwendig

Mögliche Aufgaben (vergl. [4]:

  • Aufgaben zu Proteindatenbanken, z.B.
    • Vergleich von zwei Aminosäuresequenzen
    • Suche nach der vollständigen Aminosäuresequenz des Proteins.
  • Aufgaben zu DNA-Datenbanken, z.B.
    • Vergleich von DNA-Sequenzen: Berechnung der prozentualen Unterschiede und Erstellen eines theoretischen Stammbaums
    • Unbekannte DNA Sequenz suchen und mit Referenzsequenz vergleichen.
  • Aufgaben zu Gendatenbanken, z.B.
    • Suche nach einem Gen (Funktion und vollständige Nukleotid-Sequenz)
    • Sequenzanalyse im Internet
    • Ermittlung der Sequenzen anhand einer Datenbank.
  • Aufgaben zu Protein- und DNA-Datenbanken, z.B.
    • Übersetzen von DNA-Sequenzen in Proteinsequenzen
    • Eingabe einer Nukleotidsequenz und Suche nach evtl. zugehörigen Proteinen (Voraussetzung: zu suchende Sequenz ist schon gegeben).

Mögliche Probleme: Alle internationalen Datenbanken sind englischsprachig. Mögliche Änderungen in der Struktur von Datenbanken werden oft nicht in Unterrichtsvorschläge übernommen, die sich auf diese Datenbanken beziehen.


8.2 Übungen

Übung 1: Proteindatenbank, Bsp. menschliches Insulin.

  1. Öffnen Sie im Browser die Proteopedia-Hauptseite:
    http://proteopedia.org/wiki/index.php
    und geben Sie in die Suchmaske (search in der Navigationsleiste links) Insulin ein; klicken Sie anschließend auf Go.
  2. Klicken Sie auf Display Interactive Model und stoppen Sie nach dem Laden der JSmol-Datei durch Klicken auf auf +/- spin die Rotation.
  3. Testen Sie einen Linksklick in das Molekülbild mit gedrückter SHIFT-Taste und Ziehen mit der linken Maustaste.
  4. Durch einen Rechtsklick in das Molekülbild (JSmol) können Sie die möglichen Veränderungen des Insulin-Moleküls überprüfen: Testen Sie die verschiedenen Möglichkeiten z.B. unter Stil, Farbe und Oberflächen.
  5. Drehen Sie das Molekül so, dass Sie möglichst gut zwischen den beiden Ketten hindurchschauen können. Suchen Sie die Disulfidbrücken.
  6. Geben Sie nun in die Suchmaske links den pdb-Code für Insulin ein: 3i40 (Go). Klicken Sie ggf. auf Load ful und stoppen Sie anschließend wieder die Rotation.
  7. Scrollen Sie ggf. im mittleren Fenster nach unten zum Abschnitt Evolutionary Conservation und setzen Sie das Häkchen Check. Für das Molekül wird eine andere Darstellung berechnet. Untersuchen Sie, welche AS sich wie häufig evolutionär verändern, indem Sie die Mouseover-Funktion einsetzen. Identifizieren Sie z.B. zwei Aminosäuren, die stark konserviert sind.
  8. Scrollen Sie ggf. wieder nach oben und wechseln Sie über den Link OCA unter Resources in die Datenbank des Weizmann-Instituts (Israel).
  9. Zur weiteren Verwendung, z.B. Anzeige mit einem Molekül-Viewer im Unterricht, können Sie unter Data retrieval/Save to disk eine pdb-Datei abspeichern.
  10. Stellen Sie über den Link Contacts of Structural units fest, wie viele Aminosäuren in α-helikalen Strukturen enthalten sind. Schließen Sie danach das Fenster.
  11. Identifizieren Sie die Primärsequenzen der beiden Ketten A und B über die entsprechenden Links unter Sequence-derived information (z.B. 3i40_A). Sichern Sie sich diese zur Verwendung im Unterricht durch copy/paste in ein Text-Dokument. Schließen Sie danach das Fenster.
  12. Wechseln Sie über den Link P01308 in die UniProtKB/Swiss-Prot-Datenbank. Finden Sie heraus, welches ‚Insulin’ mit 110 AS hier dargestellt wird. Klicken Sie links auf Feature Viewer und öffnen Sie dann Molecule processing. Klären Sie die einzelnen Molekül-Abschnitte über entsprechende Klicks auf die Balken. Informieren Sie sich über die Begriffe "signal peptide" und "propeptide" im Web.
  13. Stellen Sie den genauen Ort der drei Disulfid-Bindungen fest (link PTM). Notieren Sie dies auch im Text-Dokument.
  14. Bestimmen Sie, wo helicale und wo ß-Faltblatt-Bereiche sind (vergl. Link Structural features).
  15. Wechseln Sie auf Feature Table. Bewerten Sie die beiden Darstellungsvarianten Viewer und Table im Hinblick auf den Einsatz im Unterricht.
  16. Wechseln Sie zurück zu Entry und scrollen Sie nach unten zu Sequences (2+), klicken Sie auf Align, um die beiden Isoformen zu vergleichen. Speichern Sie abschließend die beiden Sequenzen der Primärstrukturen.
  17. Gehen Sie zurück zur IMB Jena Image Library of Biological Macromolecules und geben Sie oben rechts 3i40 in die Search-Maske ein. Die Abbildung können Sie zur Verwendung im Unterricht mit Rechtsklick von dieser Seite als gif- bzw. bei Seitenansicht (Klick ins Bild) als png-Bild abspeichern. Vergleichen Sie die Qualität der Formate.

Lösungshinweise Übung 1

Kontrollfragen:

  1. Woher beziehen Sie 3D-Dateien für ein gewünschtes Protein?
  2. Woher beziehen Sie 2D-Bilder für Proteinstrukturen?

Übung 2: Kopplung von Gen- und Proteindatenbank am Beispiel menschliche Amylase

  1. Öffnen Sie die Startseite der Datenbank Genecards des Weizmann-Instituts (Israel): http://www.genecards.org.
  2. Geben Sie in die Suchmaske human amylase ein. Klicken Sie ggf. auf das -(minus)-Symbol der AMY2A.
    Stellen Sie fest, wie viele menschliche Amylasen-Gene es gibt (Seitensuche mit AMY). Notieren Sie, in welchen Organen diese exprimiert werden.
  3. Klicken Sie auf das +(plus)-Symbol der Amylase AMY1A. Untersuchen Sie die unterschiedlichen Informationen hinter den Links Summaries und Function. Schließen Sie die Fenster danach jeweils wieder und klicken Sie abschließend auf das -(minus)-Symbol von AMY1A.
  4. Geben Sie in die Suchmaske AMYP1 für das Amylase-Pseudogen 1 ein und klicken Sie dann auf den Link AMYP1.
  5. Scrollen Sie zu Genomics und halten Sie fest, auf welchem Chromosom das Pseudogen liegt.
  6. Scrollen Sie zu Functions und stellen Sie über den Link AMYP1 und dann erneut über AMYP1 unter Map über den Link AMY@ fest, in welchem Gencluster das Pseudogen liegt. Halten Sie die EC-Nr. fest.
  7. Wechseln Sie zur NCBI-Datenbank: siehe Eintrag im Menü oben, oder http://www.ncbi.nlm.nih.gov und wählen Sie im Auswahlfenster links oben aus der Gruppe All Databases die Auswahl Structure. Geben Sie die EC-Nr. ein und klicken Sie auf Search. Filtern Sie Ihre Suche rechts unter Refine your results, indem Sie über Complexes Protein-Protein die Ergebnisse einschränken.
    Scrollen Sie nach unten, suchen Sie das menschliche Protein (ggf. auf S. 2 wechseln)und klicken Sie auf den Link in der Überschrift Crystal Structure Of Human Salivary Alpha-Amylase Dimer[Hydrolase]. Stellen Sie fest, welche Informationen man aus dieser Seite über das Protein entnehmen kann. Auf dieser Seite finden Sie auch die Freeware Cn3D zur Darstellung der Proteinstrukturen. Testen Sie.
  8. Scrollen Sie ggf. nach unten zu "molecular components". Durch Klicken auf A können Sie die Aminosäuresequenz finden (scrollen Sie ganz nach unten). Sie können die Sequenz markieren und über Strg+C und Einfügen in eine Text-Datei kopieren.
  9. Wechseln Sie über das Symbol NCBI-Button (ganz oben links) zurück zur Startseite und starten Sie über Genes & Expression, dann über Databases und Gene die Gendatenbank Gene. Geben Sie den Gencode AMY1A[sym] AND "Homo sapiens" ein. Stellen Sie fest, wie viele Klicks Sie von dieser Seite aus benötigen, um die Länge des Gens und die Sequenz festzustellen. Sie können die Sequenz markieren und über Strg+C und Einfügen in eine Text-Datei kopieren.

Lösungshinweise Übung 2


Übung 3: Unterrichtsvorschläge zur Bioinformatik im Internet (vgl. [3])

  1. Öffnen Sie im Browser die Seite
    http://extras.springer.com/2011/978-3-8274-2785-4/15_genetische-Analysen/
    15.3_genetische-Analysen_Unterrichtsmaterial.pdf und speichern Sie die Datei lokal ab.
  2. Gehen Sie zu Material 5 (S. IV) und lösen Sie die Aufgaben 6 und 7 (S. V). Recherchieren Sie dazu die Bedeutung des Ds im Sequenzpaar 1.
  3. Fahren Sie mit Material 6, Teil 1 (S. V), fort: Öffnen Sie die NCBI-Startseite http://www.ncbi.nlm.nih.gov und geben Sie in das Search-Fenster die accession version number YP_003024038.1 für das mitochondriale Cytochrom b ein.
  4. Klicken Sie auf den Link FASTA, kopieren Sie die Aminosäure-Sequenz und speichern Sie diese in einer Text-Datei.
  5. Gehen Sie zurück zur Ergebnis-Webseite. Klicken Sie auf Gene. Auf der geöffneten Seite finden Sie unter Primary source den Link HGNC:HGNC:7427. Auf der nächsten Seite finden Sie unter Gene resources den Link ENSG00000198727, über den Sie die DNA-Sequenz (Link Sequence) erhalten. Über den Link BLAST this sequence können Sie die DNA-Sequenz mit Rechtsklick/Kopieren ebenfalls speichern.
  6. Die Schritte zur Ermittlung der Aminosäure- und DNA-Sequenzen für ein Protein (z. B. Cytochrom b) für einen der weiteren drei angegebenen Organismen (Schimpanse, Westlicher Flachlandgorilla, Sumatra-Orang-Utan) wiederholen:
    • NP_008198.1: Gemeiner Schimpanse (Pan troglodytes; Aminosäure- und DNA-Sequenz unter Links FASTA bzw. Gene -> FASTA);
    • NP_008224.1: Westlicher Gorilla (Gorilla gorilla);
    • NP_007847.1: Sumatra-Orang-Utan (Pongo abelii).
  7. Gehen Sie weiter zu Aufgabenteil 2 (S. XI) und lösen Sie dann Aufgabe 8. Rufen Sie dazu die Website des European Bioinformatics Institute (EBI) auf: http://www.ebi.ac.uk/Tools/psa und wählen Sie unter Global Alignment, Needle (EMBOSS) den Button Protein auf.
  8. Geben Sie nun die zu vergleichenden Sequenzen aus Ihrer Text-Datei (jeweils ohne die Startzeile) ein (z. B. Aminosäuresequenzen für Mensch und Schimpanse) und starten Sie das Tool. Speichern Sie das Ergebnis in Ihrer Text-Datei ab. Fassen Sie zusammen, wie viele AS bzw. DNA-Bausteine jeweils identisch bzw. unterschiedlich sind.
  9. Lösen Sie mit Ihren Ergebnissen in Abschnitt 3 die Aufgabe 9 (S. XIV f).
  10. Öffnen Sie abschließend in der NCBI-Startseite http://www.ncbi.nlm.nih.gov über das „Aufklappmenue“ All Databases die Datenbank OMIM und geben Sie cytochrome b negative ein, um eine Erbkrankheit mit fehlendem Cytochrom b zu finden. Öffnen Sie den ersten Link. Stellen Sie fest, welche Informationen Sie über diese Datenbank erhalten. Markieren Sie zusätzlich einzelne Fachbegriffe. Überprüfen Sie auch andere, Ihnen bekannte menschliche Proteine in dieser Datenbank.

Lösungshinweise Übung 3


Übung 4: Die Enzymdatenbank BRENDA.

  1. Öffnen Sie die Startseite der Datenbank BRENDA.

  2. Geben Sie in die Suchmaske ethanol ein. Klicken Sie im sich öffnenden Kontext-Menü auf ethanol dehydrogenase 1.1.1.1..

  3. Wählen Sie im Kontext-Menü Select one or more organisms (Klicken mit gedrückter Strg-Taste) Homo sapiens aus und klicken Sie dann auf submit.

  4. Öffnen Sie links durch Klicken auf das (+)-Zeichen das links stehende Kontext-Menü Enzyme Nomenclature und klicken Sie dann auf Systematic Name. Übernehmen Sie die Informationen in Ihr Lösungsblatt (danach wieder durch Klick auf (-) -Zeichen schließen).

  5. Öffnen Sie links durch Klicken auf das (+)-Zeichen das links stehende Kontext-Menü Enzyme Ligand Interactions und klicken Sie dann auf Natural Substrates. Identifizieren Sie die natürlichen Substrate, die angegeben sind. Übernehmen Sie sie in Ihr Lösungsblatt. Ein Klick auf das Symbol unter Reaction Diagram öffnet entsprechende Reaktionsgleichungen (danach wieder durch Klick auf (-) -Zeichen schließen).

  6. Öffnen Sie links durch Klicken auf das (+)-Zeichen das links stehende Kontext-Menü Functional Parameters und klicken Sie dann auf KM Value. Notieren Sie die Zahl der 10er-Potenzen für das Substrat Ethanol. Entsprechende Aussagen lassen sich auch für die Turnover Number und die Specific Activity angeben. Diskutieren Sie mögliche Ursachen für diese Differenzen.

  7. Weitere, angegebene Werte sind der pH- und der Temperaturbereich (pH range und Temp. Optimum). Übertragen Sie die Werte in Ihr Lösungsblatt (danach wieder durch Klick auf (-) -Zeichen schließen).

  8. Öffnen Sie links durch Klicken auf das (+)-Zeichen das links stehende Kontext-Menü Organism related Information und klicken Sie dann auf Source Tissue. Identifizieren Sie nicht-krankheitsbezogenen Organe. Über Localization zeigt sich die zelluläre Ebene.

  9. Wechseln Sie zur Uni-Prot-Datenbank [6] und geben Sie in das Suchfeld EC1.1.1.1 ein (Klick auf Search). Klicken Sie dann auf Filter by Popular organism/Human. Stellen Sie fest, wie viele Proteine und entsprechende Isoformen angezeigt werden (ev. bei Columns Häkchen in Alternative Products setzen und dann mit Back-Pfeil zurück).


Übung 5: Die Stoffwechseldatenbank KEGG

  1. Öffnen Sie die Datenbank KEGG.

  2. Geben Sie in die Suchmaske Search KEGG for für die Glykolyse Glycolysis ein und klicken Sie auf Go.

  3. Klicken Sie in der Übersichtsseite links auf map0010. Sie erhalten eine schematische Darstellung mit allen Enzymen, die Sie durch Klicken in die Graphik vergrößern können.

  4. In dieser Ansicht sind alle dargestellten Stoffe (über die o-Symbole), Enzyme (über die EC-Nummer) und benachbarte Stoffwechselwege verlinkt. Testen Sie entsprechende Beispiele.

  5. Wiederholen Sie die Analyse für die schulrelevanten Beispiele Citrat cycle und Calvin cycle. Vergleichen Sie die unterschiedlichen Darstellungsformen.


Übung 6: Die Pflanzendatenbank Floraweb

  1. Öffnen Sie die Datenbank Floraweb.

  2. Öffnen Sie das Register Pflanzenarten und verschaffen Sie sich einen Überblick über die angebotenen Daten.

  3. Öffnen Sie den Link Artensteckbriefe (links) und anschließend die Seite Eigenschaftssuche. Wählen Sie drei Eigenschaften aus und überprüfen Sie das Ergebnis Ihrer Suche.

  4. Öffnen Sie den Link Neophyten (links) und beurteilen Sie die Informationen zu zwei von Ihnen ausgewählten, invasiven Neophyten. Vergleichen Sie dann Ihr Ergebnis aus fachdidaktischer Sicht mit den Informationen über den entsprechenden Link zur Datenbank Neobiota zu Ihrer Art.


Übung 7: Datenbank zu Klimahüllen der Bayerischen Landesanstalt für Wald und Forstwirtschaft

  1. Öffnen Sie die Datenbank zu den Klimahüllen und laden Sie sich das zusammenfassende Dokument [6] herunter.

  2. Verschaffen Sie sich einen Überblick über die Prognosen zum Klimawandel und die angebotenen Daten.

  3. Öffnen Sie die Klimahülle für die Rotbuche (2. Reihe, 4. Hülle) und speichern Sie die Graphik in Ihrem Dokument ab. Beschreiben Sie die unterrichtlich möglichen Aussagen des Diagramms.

  4. Öffnen Sie die Klimahüllen für die Fichte und die Weißtanne (1. Reihe, 2. und 3. Hülle). Speichern Sie auch diese beiden Diagramme und formulieren Sie mögliche, unterrichtliche Ziele zu einem Diagrammvergleich.


Quellen:

[1] Chalwatzis, N. (2013). Bioinformatik für den Unterricht. MINTZirkel, Jan./Febr. 2013, 10-11.

[2] Bickel, S. (2005). Arbeitsmaterialien und Unterrichtsverlauf.
http://www.lehrer-online.de/463234.php?sid=38990722289341774836872487249350, (17.5.2013).

[3] Fenner, A., & Wünschiers, R. (2011). 15.3 Unterrichtsmaterialien. Online-Zusatzangebot zu Dreesmann, D., Graf, D., & Witte, K. (2011) Evolutionsbiologie – Moderne Themen für den Unterricht. Heidelberg: Spektrum Akademischer Verlag. http://extras.springer.com/2011/978-3-8274-2785-4/15_genetische-Analysen/15.3_genetische-Analysen_Unterrichtsmaterial.pdf (online 22.05.2019).

[4] Kolb, K. (2014). Unterrichtliche Ansätze zum Thema Bioinformatik am Gymnasium: Recherche, Kategorisierung und Optimierung für mögliche Umsetzungen. Masterarbeit Fachdidaktik Biologie. Unveröffentlichtes Manuskript, Universität Bayreuth.

[5] http://www.kmk.org/fileadmin/veroeffentlichungen_beschluesse/2004/2004_12_16-Bildungsstandards-Biologie.pdf, 22.05.2019

[6] Kölling, C. (2007). Klimahüllen für 27 Waldbaumarten. AFZ-Der Wald, 23, 1242-145 (online: http://www.lwf.bayern.de/mam/cms04/boden-klima/dateien/afz-klimahuellen-fuer-27-baumarten.pdf, 22.05.2019).


Download der Folie als PowerPoint-Datei


top

E-Mail: Walter.Wagner ät uni-bayreuth.de