Didaktik der Chemie / Universität Bayreuth

Stand: 07.06.16


Multimedia

8 Datenbanken


Ziel der Lehreinheit ist es, Sie in die Lage zu versetzen, Datenbank-Inhalte im WWW für Unterrichtszwecke zu bewerten und zu nutzen.

Hinweis: Wenn Laien von "Internet" sprechen, meinen sie meistens nur den Internet-Dienst World Wide Web (WWW).


Folie: Dienste des Internet


8.1 Datenbanken im WWW

Bioinformatik: Wissenschaft zur Entwicklung und zum Einsatz von „computerbasierte[n] Algorithmen und mathematische[n] Methoden zur Verarbeitung und Analyse (…) biologischer Daten“ [1, S. 10].

Arten von (schulrelevanten) Datenbanken:

  • Protein-,
  • Gen-,
  • RNA-,
  • Organismen-,
  • Chemikaliendatenbanken...

Sie haben Bedeutung in der Bereitstellung von Grundlage für die Analyse biologischer, biochemischer oder chemischer Datenbanken sowie zum Vergleich solcher Daten.

Didaktische Bedeutung. Der Einsatz von biologischen Datenbanken im Unterricht kann alle Kompetenzbereiche der Bildungsstandards fördern. Daher sollte die Schule den Lernenden den Zugang zu diesen Datenbanken ermöglichen. Beispiele:

  • Kompetenzbereich Fachwissen: Bedeutung von Bio-Daten in der Omics-Ära der Biologie mit Bezug zum Basiskonzept Entwicklung (Biologie [5]);
  • Kompetenzbereich Erkenntnisgewinnung:
    • Zugang zu Datenbanken, Abbau von „Scheu“ vor Datenmengen,
    • Arbeit mit Originaldaten aus der Forschung: Förderung der Motivation,
    • Vergleich von Sequenzen: z.B. Zuordnung eines Proteins zu einer Proteinfamilie
  • Kompetenzbereich Kommunikation: Visualisierung von Recherche-Ergebnissen
  • Kompetenzbereich Bewertung: Bewusstsein für die Bedeutung von „open access“ im Internet zu den Daten in der Forschung (vgl. z.B. [2]).

Unterrichtliche Vorteile.

  • Daten und Anwendungen kostenlos
  • nur Computer mit Netzzugang, Browser und u.U. Moleküldarstellungsprogramm notwendig
  • i.d.R. keine zusätzliche Software notwendig

Mögliche Aufgaben (vergl. [4]:

  • Aufgaben zu Proteindatenbanken, z.B.
    • Vergleich von zwei Aminosäuresequenzen
    • Suche nach der vollständigen Aminosäuresequenz des Proteins.
  • Aufgaben zu DNA-Datenbanken, z.B.
    • Vergleich von DNA-Sequenzen: Berechnung der prozentualen Unterschiede und Erstellen eines theoretischen Stammbaums
    • Unbekannte DNA Sequenz suchen und mit Referenzsequenz vergleichen.
  • Aufgaben zu Gendatenbanken, z.B.
    • Suche nach einem Gen (Funktion und vollständige Nukleotid-Sequenz)
    • Sequenzanalyse im Internet
    • Ermittlung der Sequenzen anhand einer Datenbank.
  • Aufgaben zu Protein- und DNA-Datenbanken, z.B.
    • Übersetzen von DNA-Sequenzen in Proteinsequenzen
    • Eingabe einer Nukleotidsequenz und Suche nach evtl. zugehörigen Proteinen (Voraussetzung: zu suchende Sequenz ist schon gegeben).

Mögliche Probleme: Alle internationalen Datenbanken sind englischsprachig. Mögliche Änderungen in der Struktur von Datenbanken werden oft nicht in Unterrichtsvorschläge übernommen, die sich auf diese Datenbanken beziehen.


8.2 Übungen

Übung 1: Proteindatenbank, Bsp. menschliches Insulin.

  1. Öffnen Sie im Browser die Proteopedia-Hauptseite:
    http://proteopedia.org/wiki/index.php
    und geben Sie in die Suchmaske (search in der Navigationsleiste links) Insulin ein; klicken Sie anschließend auf go.
  2. Stoppen Sie durch Klicken auf toggle spin die Rotation.
  3. Testen Sie einen Linksklick in das Molekülbild mit gedrückter SHIFT-Taste und Ziehen mit der linken Maustaste.
  4. Durch einen Rechtsklick in das Molekülbild (JSmol) können Sie die möglichen Veränderungen des Insulin-Moleküls überprüfen: Testen Sie die verschiedenen Möglichkeiten z.B. unter Stil, Farbe und Oberflächen.
  5. 3i40 unter der Abb. (ggf. nach unten scrollen) ist der pdb-Code des Proteins. Folgen Sie dem Link und öffnen Sie die entsprechende Seite. Klicken Sie auf load full unter der Abbildung, um die vollständige Darstellung erreichen. Beachten Sie, welche Strukturen neu zu sehen sind.
    Stoppen Sie die Rotation und drehen Sie das Molekül so, dass Sie möglichst gut zwischen den beiden Ketten hindurch schauen können. Suchen Sie die Disulfidbrücken.
  6. Scrollen Sie ggf. im mittleren Fenster nach unten zum Abschnitt Evolutionary Conservation und setzen Sie das Häkchen Check. Für das Molekül wird eine andere Darstellung berechnet. Untersuchen Sie, welche AS sich wie häufig evolutionär verändern, indem Sie die Mouseover-Funktion einsetzen. Identifizieren Sie z.B. zwei Aminosäuren, die stark konserviert sind.
  7. Scrollen Sie ggf. wieder nach oben und wechseln Sie über den Link OCA unter Resources in die Datenbank des Weizmann-Instituts (Israel).
  8. Zur weiteren Verwendung, z.B. Anzeige mit einem Molekül-Viewer im Unterricht, können Sie unter Data retrieval/Save to disk eine pdb-Datei abspeichern.
  9. Stellen Sie fest, wie viele Aminosäuren in α-helikalen Strukturen enthalten sind. Scrollen Sie nach unten und öffnen Sie dazu den Link Cartoon representation unter Visual 3D analysis of 3i40. Schließen Sie danach das Fenster.
  10. Identifizieren Sie die Primärsequenzen der beiden Ketten A und B über die entsprechenden Links unter Sequence-derived information (z.B. 3i40_A). Sichern Sie sich diese zur Verwendung im Unterricht durch copy / paste in ein Text-Dokument. Schließen Sie danach das Fenster.
  11. Wechseln Sie über den Link P01308 in die UniProtKB/Swiss-Prot-Datenbank. Finden Sie heraus, welches ‚Insulin’ mit 110 AS hier dargestellt wird. Scrollen Sie ggf. nach unten und untersuchen Sie dazu die Bereiche Sequence Features unter Molecule processing. Informieren Sie sich über die Begriffe "signal peptide" und "propeptide" im Web.
  12. Stellen Sie den genauen Ort der drei Disulfid-Bindungen fest. Notieren Sie dies auch im Text-Dokument.
  13. Bestimmen Sie, wo helicale und wo ß-Faltblatt-Bereiche sind (secondary structure). Speichern Sie abschließend die gesamte Primärstruktur des Proteins.
  14. Gehen Sie zurück zur OCA-Seite. Die Bilder (Images) aus der IMB Jena Image Library of Biological Macromolecules können Sie zur Verwendung im Unterricht mit Rechtsklick von dieser Seite als gif- bzw. bei Seitenansicht (Klick ins Bild) png-Bilder abspeichern. Vergleichen Sie die Qualität der Formate.

Lösungshinweise Übung 1

Kontrollfragen:

  1. Woher beziehen Sie 3D-Dateien für ein gewünschtes Protein?
  2. Woher beziehen Sie 2D-Bilder für Proteinstrukturen?

Übung 2: Kopplung von Gen- und Proteindatenbank am Beispiel menschliche Amylase

  1. Öffnen Sie die Startseite der Datenbank Genecards des Weizmann-Instituts (Israel): http://www.genecards.org.
  2. Geben Sie in die Suchmaske human amylase ein. Klicken Sie ggf. auf das -(minus)-Symbol der AMY2A.
    Stellen Sie fest, wie viele menschliche Amylasen-Gene es gibt. Notieren Sie, in welchen Organen diese exprimiert werden.
  3. Klicken Sie auf das +(plus)-Symbol der Amylase AMY1A. Untersuchen Sie die unterschiedlichen Informationen hinter den Links Summaries und Function. Schließen Sie die Fenster danach jeweils wieder und klicken Sie abschließend auf das -(minus)-Symbol von AMY1A.
  4. Öffnen Sie das (+) für das Amylase-Pseudogen. Folgen Sie dem Link Function, dann unter "Genatlas biochemistry entry" dem Link AMYP1 abschließend zu AMYP1.
  5. Scrollen Sie zum Link Function und klicken Sie unter GENATLAS Biochemistry erneut auf den Link AMYP1. Halten Sie fest, auf welchem Chromosom das Pseudogen liegt.
  6. Stellen Sie erneut über den Link AMYP1 und dann unter Map über den Link AMY@ fest, in welchem Gencluster das Pseudogen liegt. Halten Sie die EC-Nr. (weiter oben) fest.
  7. Wechseln Sie zur NCBI-Datenbank: siehe Eintrag im Menü oben, oder http://www.ncbi.nlm.nih.gov und wählen Sie im Auswahlfenster links oben aus der Gruppe All Databases die Auswahl Structure. Geben Sie die EC-Nr. ein und klicken Sie auf Search. Filtern Sie Ihre Suche rechts unter Refine your results, indem Sie über Complexes Protein-Protein die Ergebnisse einschränken.
    Scrollen Sie nach unten, suchen Sie das menschliche Protein und klicken Sie auf den Link in der Überschrift Crystal Structure Of Human Salivary Alpha-Amylase Dimer[Hydrolase, EC: 3.2.1.1]. Stellen Sie fest, welche Informationen man aus dieser Seite über das Protein entnehmen kann. Auf dieser Seite finden Sie auch die Freeware Cn3D zur Darstellung der Proteinstrukturen. Testen Sie.
  8. Scrollen Sie ggf. nach unten zu "molecules and interactions". Durch Klicken auf A können Sie die Aminosäuresequenz finden (scrollen Sie ganz nach unten). Sie können die Sequenz markieren und über Strg+C und Einfügen in eine Text-Datei kopieren.
  9. Wechseln Sie über das Symbol NCBI-Button (ganz oben links) zurück zur Startseite und starten Sie über Genes & Expression, dann über Databases und Gene die Gendatenbank Gene. Geben Sie den Gencode AMY1A[sym] AND "Homo sapiens" ein. Stellen Sie fest, wie viele Klicks Sie von dieser Seite aus benötigen, um die Länge des Gens und die Sequenz festzustellen. Sie können die Sequenz markieren und über Strg+C und Einfügen in eine Text-Datei kopieren.

Lösungshinweise Übung 2


Übung 3: Unterrichtsvorschläge zur Bioinformatik im Internet (vgl. [3])

  1. Öffnen Sie im Browser die Seite
    http://extras.springer.com/2011/978-3-8274-2785-4/15_genetische-Analysen/
    15.3_genetische-Analysen_Unterrichtsmaterial.pdf und speichern Sie die Datei lokal ab.
  2. Gehen Sie zu Material 5 (S. IV) und lösen Sie die Aufgaben 6 und 7 (S. V). Recherchieren Sie dazu die Bedeutung des Ds im Sequenzpaar 1.
  3. Fahren Sie mit Material 6, Teil 1, fort: Öffnen Sie die Startsite des National Center for Biotechnology Information (NCBI) http://www.ncbi.nlm.nih.gov und geben Sie in das Search-Fenster die accession version number YP_003024038.1 für das mitochondriale Cytochrom b.
  4. Klicken Sie auf den Link FASTA, kopieren Sie die Aminosäure-Sequenz und speichern Sie diese in einer Text-Datei.
  5. Gehen Sie zurück zur Ergebnis-Webseite. Klicken Sie auf gene. Auf der geöffneten Seite finden Sie unter Primary source den Link HGNC:HGNC:7427. Auf der nächsten Seite finden Sie unter Gene resources den Link ENSG00000198727, über den Sie die DNA-Sequenz (Sequence links) erhalten, die Sie über Rechtsklick/Kopieren ebenfalls speichern können.
  6. Die Schritte zur Ermittlung der Aminosäure- und DNA-Sequenzen für ein Protein (z. B. Cytochrom b) für einen der weiteren drei angegebenen Organismen (Schimpanse, Westlicher Flachlandgorilla, Sumatra-Orang-Utan) wiederholen:
    • NP_008198.1: Gemeiner Schimpanse (Pan troglodytes; DNA-Sequenz unter NC_01643.1));
    • NP_008224.1: Westlicher Gorilla (Gorilla gorilla; DNA-Sequenz unter NC_001645.1);
    • NP_007847.1: Sumatra-Orang-Utan (Pongo abelii; DNA-Sequenz unter NC_002083.1).
  7. Gehen Sie weiter zu Aufgabenteil 2 (S. XI) und lösen Sie dann Aufgabe 8. Rufen Sie dazu die Website des European Bioinformatics Institute (EBI) auf: http://www.ebi.ac.uk/Tools/psa und wählen Sie unter Global Alignment, Needle (EMBOSS) den Button Protein aus.
  8. Geben Sie nun die zu vergleichenden Sequenzen aus Ihrer Text-Datei (jeweils ohne die Startzeile) ein (z. B. Aminosäuresequenzen für Mensch und Schimpanse) und starten Sie das Tool. Speichern Sie das Ergebnis in Ihrer Text-Datei ab. Fassen Sie zusammen, wie viele AS bzw. DNA-Bausteine jeweils identisch bzw. unterschiedlich sind.
  9. Lösen Sie mit Ihren Ergebnissen in Abschnitt 3 die Aufgabe 9 (S. XIV f).
  10. Öffnen Sie abschließend in der NCBI-Startseite http://www.ncbi.nlm.nih.gov über das „Aufklappmenue“ All Databases die Datenbank OMIM und geben Sie cytochrome b negative ein, um eine Erbkrankheit mit fehlendem Cytochrom b zu finden. Öffnen Sie den ersten Link. Stellen Sie fest, welche Informationen Sie über diese Datenbank erhalten. Markieren Sie zusätzlich einzelne Fachbegriffe. Überprüfen Sie auch andere, Ihnen bekannte menschliche Proteine in dieser Datenbank.

Lösungshinweise Übung 3


Übung 4: Das lac-Operon: ein Unterrichtsvorschlag zur Bioinformatik [vgl. 1, S. 11]

  1. Öffnen Sie auf der Startseite den Ordner Home Verzeichnis und dort das Laufwerk USR (\\STDATA) (P:). Im Ordner Kurse_Bio finden Sie im Ordner Unterrichtsmaterialien Scharfenberg das Arbeitsblatt Bioinformatik [2]. Öffnen Sie das Arbeitsblatt und speichern Sie es für sich ab.
  2. Wählen Sie Beispiel 1 und folgen Sie den Anweisungen auf dem Arbeitsblatt. Beurteilen Sie Genauigkeiten bzw. Ungenauigkeiten der Anleitung. Notieren Sie Änderungsvorschläge in dem Sinn, dass das Arbeitsblatt für die Schüler nutzbar wird.
  3. Informieren Sie sich über die Länge des lacZ-Gens und der ß-Galactosidase.
  4. Exportieren Sie abschließend zwei Graphiken, eine, die zeigt, wie weit das lac-Repressor-Gen vom Operon entfernt ist, und eine, die das ganze Operon zeigt. Überlegen und notieren Sie Hinweise, die man eigentlich benötigt, um diese Aufgabe zu lösen.

Lösungshinweise Übung 4


Übung 5: Die Enzymdatenbank BRENDA.

  1. Öffnen Sie die Startseite der Datenbank BRENDA.

  2. Geben Sie in die Suchmaske ethanol ein. Klicken Sie im sich öffnenden Kontext-Menü auf ethanol dehydrogenase. Halten Sie in Ihrem Lösungsblatt die EC-Nummer fest.

  3. Wählen Sie im Kontext-Menü Select one or more organisms (Klicken mit gedrückter Strg-Taste) Homo sapiens aus und klicken Sie dann auf submit.

  4. Öffnen Sie links durch Klicken auf das (+)-Zeichen das links stehende Kontext-Menü Enzyme Nomenclature und klicken Sie dann auf Systematic Name. Übernehmen Sie die Informationen in Ihr Lösungsblatt (danach wieder durch Klick auf (-) -Zeichen schließen).

  5. Öffnen Sie links durch Klicken auf das (+)-Zeichen das links stehende Kontext-Menü Enzyme Ligand Interactions und klicken Sie dann auf Natural Substrates. Identifizieren Sie natürlichen Substrate, die angegeben sind. Übernehmen Sie sie in Ihr Lösungsblatt. Ein Klick auf das Symbol unter Reaction Diagram öffnet entsprechende Reaktionsgleichungen (danach wieder durch Klick auf (-) -Zeichen schließen).

  6. Öffnen Sie links durch Klicken auf das (+)-Zeichen das links stehende Kontext-Menü Functional Parameters und klicken Sie dann auf KM Value. Notieren Sie die Zahl der 10er-Potenzen für das Substrat Ethanol. Entsprechende Aussagen lassen sich auch für die Turnover Number und die Specific Activity angeben. Diskutieren Sie mögliche Ursachen für diese Differenzen.

  7. Weitere, angegebene Werte sind der pH- und der Temperaturbereich (pH range und Temp. Optimum). Übertragen Sie die Werte in Ihr Lösungsblatt (danach wieder durch Klick auf (-) -Zeichen schließen).

  8. Öffnen Sie links durch Klicken auf das (+)-Zeichen das links stehende Kontext-Menü Organism related Information und klicken Sie dann auf Source Tissue. Identifizieren Sie nicht-krankheitsbezogenen Organe. Über Localization zeigt sich die zelluläre Ebene.

  9. Wechseln Sie zur Uni-Prot-Datenbank [6] und geben Sie in das Suchfeld EC1.1.1.1 ein (Klick auf Search). Klicken Sie dann auf Filter by Popular organism/Human. Stellen Sie fest, wie viele Proteine und entsprechende Isoformen angezeigt werden (ev. bei Columns Häkchen in Alternative Products setzen und dann mit Back-Pfeil zurück).


Übung 6: Die Stoffwechseldatenbank KEGG

  1. Öffnen Sie die Datenbank KEGG.

  2. Geben Sie in die Suchmaske Search KEGG for für die Glykolyse Glycolysis ein und klicken Sie auf Go.

  3. Klicken Sie in der Übersichtsseite links auf map0010. Sie erhalten eine schematische Darstellung mit allen Enzymen, die Sie durch Klicken in die Graphik vergrößern können.

  4. In dieser Ansicht sind alle dargestellten Stoffe (über die o-Symbole), Enzyme (über die EC-Nummer) und benachbarte Stoffwechselwege verlinkt. Testen Sie entsprechende Beispiele.


Übung 7: Die Pflanzendatenbank Floraweb

  1. Öffnen Sie die Datenbank Floraweb.

  2. Öffnen Sie das Register Pflanzenarten und verschaffen Sie sich einen Überblick über die angebotenen Daten.

  3. Öffnen Sie den Link Artensteckbriefe (links) und anschließend die Seite Eigenschaftssuche. Wählen Sie drei Eigenschaften aus und überprüfen Sie das Ergebnis Ihrer Suche.

  4. Öffnen Sie den Link Neophyten (links) und beurteilen Sie die Informationen zu einem ausgewählten, invasiven Neophyten. Vergleichen Sie dann nach didaktischen Grundsätzen Ihr Ergebnis mit den Informationen über den entsprechenden Link zur Datenbank NeoFlora zu Ihrer Art.


Quellen:

[1] Chalwatzis, N. (2013). Bioinformatik für den Unterricht. MINTZirkel, Jan./Febr. 2013, 10-11.

[2] Bickel, S. (2005). Arbeitsmaterialien und Unterrichtsverlauf.
http://www.lehrer-online.de/463234.php?sid=38990722289341774836872487249350, (17.5.2013).

[3] Fenner, A., & Wünschiers, R. (2011). 15.3 Unterrichtsmaterialien. Online-Zusatzangebot zu Dreesmann, D., Graf, D., & Witte, K. (2011) Evolutionsbiologie – Moderne Themen für den Unterricht. Heidelberg: Spektrum Akademischer Verlag. http://extras.springer.com/2011/978-3-8274-2785-4/15_genetische-Analysen/15.3_genetische-Analysen_Unterrichtsmaterial.pdf (online 13.6.2014).

[4] Kolb, K. (2014). Unterrichtliche Ansätze zum Thema Bioinformatik am Gymnasium: Recherche, Kategorisierung und Optimierung für mögliche Umsetzungen. Masterarbeit Fachdidaktik Biologie. Unveröff. Manuskript, Universität Bayreuth.

[5] http://www.kmk.org/fileadmin/veroeffentlichungen_beschluesse/2004/2004_12_16-Bildungsstandards-Biologie.pdf, 16.06.2014

[6] http://www.uniprot.org/  (online 22.10.15). http://www.uniprot.org/proteomes/ 


Download der Folie als PowerPoint-Datei


top

E-Mail: Walter.Wagner ät uni-bayreuth.de