Didaktik der Chemie / Universität Bayreuth

Stand: 16.06.14


Multimedia

8 Internet I: Datenbanken


Ziel der Lehreinheit ist es, Sie in die Lage zu versetzen, Datenbank-Inhalte im WWW für Unterrichtszwecke zu bewerten und zu nutzen.

Hinweis: Wenn Laien von "Internet" sprechen, meinen sie meistens nur den Internet-Dienst World Wide Web (WWW).


Folie: Dienste des Internet


8.1 Datenbanken im WWW

Bioinformatik: Wissenschaft zur Entwicklung und zum Einsatz von „computerbasierte[n] Algorithmen und mathematische[n] Methoden zur Verarbeitung und Analyse (…) biologischer Daten“ [1, S. 10].

Arten von (schulrelevanten) Datenbanken:

  • Protein-,
  • Gen-,
  • RNA-,
  • Organismen-,
  • Chemikaliendatenbanken...

Sie haben Bedeutung in der Bereitstellung von Grundlage für die Analyse biologischer, biochemischer oder chemischer Datenbanken sowie zum Vergleich solcher Daten.

Didaktische Bedeutung. Der Einsatz von biologischen Datenbanken im Unterricht kann alle Kompetenzbereiche der Bildungsstandards fördern. Daher sollte die Schule den Lernenden den Zugang zu diesen Datenbanken ermöglichen. Beispiele:

  • Kompetenzbereich Fachwissen: Bedeutung von Bio-Daten in der Omics-Ära der Biologie mit Bezug zum Basiskonzept Entwicklung (Biologie [5]);
  • Kompetenzbereich Erkenntnisgewinnung:
    • Zugang zu Datenbanken, Abbau von „Scheu“ vor Datenmengen,
    • Arbeit mit Originaldaten aus der Forschung: Förderung der Motivation,
    • Vergleich von Sequenzen: z.B. Zuordnung eines Proteins zu einer Proteinfamilie
  • Kompetenzbereich Kommunikation: Visualisierung von Recherche-Ergebnissen
  • Kompetenzbereich Bewertung: Bewusstsein für die Bedeutung von „open access“ im Internet zu den Daten in der Forschung (vgl. z.B. [2]).

Unterrichtliche Vorteile.

  • Daten und Anwendungen kostenlos
  • nur Computer mit Netzzugang, Browser und u.U. Moleküldarstellungsprogramm notwendig
  • i.d.R. keine zusätzliche Software notwendig

Mögliche Aufgaben (vergl. [4]:

  • Aufgaben zu Proteindatenbanken, z.B.
    • Vergleich von zwei Aminosäuresequenzen
    • Suche nach der vollständigen Aminosäuresequenz des Proteins.
  • Aufgaben zu DNA-Datenbanken, z.B.
    • Vergleich von DNA-Sequenzen: Berechnung der prozentualen Unterschiede und Erstellen eines theoretischen Stammbaums
    • Unbekannte DNA Sequenz suchen und mit Referenzsequenz vergleichen.
  • Aufgaben zu Gendatenbanken, z.B.
    • Suche nach einem Gen (Funktion und vollständige Nukleotid-Sequenz)
    • Sequenzanalyse im Internet
    • Ermittlung der Sequenzen anhand einer Datenbank.
  • Aufgaben zu Protein- und DNA-Datenbanken, z.B.
    • Übersetzen von DNA-Sequenzen in Proteinsequenzen
    • Eingabe einer Nukleotidsequenz und Suche nach evtl. zugehörigen Proteinen (Voraussetzung: zu suchende Sequenz ist schon gegeben).

Mögliche Probleme: Alle internationalen Datenbanken sind englischsprachig. Mögliche Änderungen in der Struktur von Datenbanken werden oft nicht in Unterrichtsvorschläge übernommen, die sich auf diese Datenbanken beziehen.


8.2 Übungen

Übung 1: Proteindatenbank, Bsp. menschliches Insulin.

  1. Öffnen Sie im Browser die Proteopedia-Hauptseite:
    http://proteopedia.org/wiki/index.php
    und geben Sie in die Suchmaske Insulin ein; klicken Sie anschließend auf go.
  2. Stoppen Sie durch Klicken auf toggle spin die Rotation.
  3. Testen Sie einen Linksklick in das Molekülbild mit gedrückter Maustaste und einen Linksklick mit der Shift-Taste ("Großschreibung").
  4. Durch einen Rechtsklick in das Molekülbild (Jmol) können Sie die möglichen Veränderungen des Insulin-Moleküls überprüfen: Testen Sie die verschiedenen Möglichkeiten unter Stil, Farbe und Oberflächen.
  5. Der Link 3i40 unter der Abb. (nach unten scrollen) ist der pdb-Code des Proteins. Öffnen Sie die entsprechende Seite durch einen Doppelklick. Stoppen Sie die Rotation und drehen Sie das Molekül so, dass Sie möglichst gut zwischen den beiden Ketten hindurch schauen können. Suchen Sie die Disulfidbrücken.
  6. Öffnen Sie das Fenster Structural annotation; show.
  7. Informieren Sie sich über die Proteinfamilie, zu der Insulin gehört: öffnen Sie dazu zunächst den Link Ipr022352. Dahinter verbirgt sich die Insulin-Seite der Datenbank InterPro (protein sequence analysis & classification). Ändern Sie die vorhandene Angabe in der Suchmaske auf lpr022352. Nach Klick auf Search gelangen Sie zur Proteinfamilie.
  8. Gehen Sie zurück zum Fenster mit 3i40. Öffnen Sie das Fenster Evolutionary conservation: show. Untersuchen Sie, welche AS sich wie häufig verändern, indem Sie die Mouseover-Funktion einsetzen. Identifizieren Sie z.B. zwei Aminosäuren, die stark konserviert sind.
  9. Wechseln Sie über den Link OCA unter About this structure in die Datenbank des Weizmann-Instituts (Israel).
  10. Zur weiteren Verwendung, z.B. Anzeige mit ChemSketch3D im Unterricht, können Sie unter Data retrieval eine pdb-Datei abspeichern. Untersuchen Sie ggf. die Leistungsfähigkeit des pdb-Formates, indem Sie die gespeicherte Datei öffnen und mit der rechten Maustaste das Menü holen.
  11. Zurück zu OCA. Stellen Sie fest, wie viele Aminosäuren in alpha-helikalen Strukturen enthalten sind. Scrollen Sie nach unten und öffnen Sie dazu den Link Cartoon representation unter Visual 3D analysis of 3i40.
  12. Identifizieren Sie die Primärsequenzen der beiden Ketten A und B über die entsprechenden Links unter Sequence-derived information. Sichern Sie sich diese zur Verwendung im Unterricht durch copy / paste in ein Text-Dokument.
  13. Scrollen Sie weit nach unten und wechseln Sie über den Link P01308 in die UniProtKB/Swiss-Prot-Datenbank. Finden Sie heraus, welches ‚Insulin’ mit 110 AS hier dargestellt wird. Scrollen Sie nach unten und untersuchen Sie dazu die Bereiche Sequence annotation (Features), Molecule processing.
  14. Stellen Sie den genauen Ort der drei Disulfid-Bindungen fest. Notieren Sie dies auch im Text-Dokument.
  15. Bestimmen Sie, wo helicale und wo ß-Faltblatt-Bereiche sind (secondary structure).
    Speichern Sie abschließend die gesamte Primärstruktur des Proteins.
  16. Die Bilder aus der IMB Jena Image Library of Biological Macromolecules können Sie zur Verwendung im Unterricht als gif- bzw. png-Bilder abspeichern, z.B. 1AI0 als png.

Lösungshinweise Übung 1

Kontrollfragen:

  1. Woher beziehen Sie 3D-Dateien für ein gewünschtes Protein?
  2. Woher beziehen Sie 2D-Bilder für Proteinstrukturen?

Übung 2: Kopplung von Gen- und Proteindatenbank am Beispiel menschliche Amylase

  1. Öffnen Sie die Startseite der Datenbank Genecards des Weizmann-Instituts (Israel): http://www.genecards.org.
  2. Geben Sie in die Suchmaske human amylase ein. Klicken Sie ggf. auf das -(minus)-Symbol der AMY2A.
    Stellen Sie fest, wie viele menschliche Amylasen-Gene es gibt. Notieren Sie, in welchen Organen diese exprimiert werden.
  3. Klicken Sie auf das +(plus)-Symbol der Amylase AMY1A. Untersuchen Sie die unterschiedlichen Informationen hinter den Links Summary und Function.
  4. Öffnen Sie die mini card für das Amylase-Pseudogen. Gehen Sie über den Link Function, dann oben Genatlas biochemistry entry for AMYP1 abschließend zu AMYP1.
  5. Stellen Sie fest, auf welchem Chromosom das Pseudogen liegt (Sie können oben auf die Sprache Deutsch umstellen).
  6. Stellen Sie über den Link AMY@ fest, in welchem Gencluster das Pseudogen liegt. Halten Sie die EC-Nr. fest.
  7. Wechseln Sie zur NCBI-Datenbank http://www.ncbi.nlm.nih.gov und stellen Sie unter All Databases die Auswahl Structure ein. Geben Sie die EC-Nr. ein und klicken Sie auf Search. Filtern Sie Ihre Suche rechts unter Refine your results, indem Sie über Complexes Protein-Protein die Ergebnisse einschränken. Scrollen Sie nach unten, suchen Sie das menschliche Protein und klicken Sie auf den Link in der Überschrift Crystal Structure Of Human Salivary Alpha-Amylase Dimer[Hydrolase, EC: 3.2.1.1]. Stellen Sie fest, welche Informationen man aus dieser Seite über das Protein entnehmen kann. Auf dieser Seite finden Sie auch die Freeware Cn3D zur Darstellung der Proteinstrukturen. Testen Sie.
  8. Durch Clicken auf A können Sie die Aminosäuresequenz finden (scrollen Sie nach unten). Sie können die Sequenz markieren und über Strg+C und Einfügen in eine Text-Datei kopieren.
  9. Wechseln Sie über den NCBI-Button (oben links) zurück zur Startseite und starten Sie über Genes & Expression, dann über Databases Gene die Gendatenbank Gene. Geben Sie den Gencode AMY1A[sym] AND "Homo sapiens" ein. Stellen Sie fest, wie viele Klicks Sie von dieser Seite aus benötigen, um die Länge des Gens und die Sequenz festzustellen. Sie können die Sequenz markieren und über Strg+C und Einfügen in eine Text-Datei kopieren.

Lösungshinweise Übung 2


Übung 3: Unterrichtsvorschläge zur Bioinformatik im Internet (vgl. [3])

  1. Öffnen Sie im Browser die Seite
    http://extras.springer.com/2011/978-3-8274-2785-4/15_genetische-Analysen/
    15.3_genetische-Analysen_Unterrichtsmaterial.pdf  und speichern Sie die Datei lokal ab.
  2. Gehen Sie zu Material 5 (S. V) und lösen Sie die Aufgaben 6 und 7. Recherchieren Sie dazu die Bedeutung des Ds im Sequenzpaar 1.
  3. Fahren Sie mit Material 6, Teil 1, fort: Öffnen Sie die Startsite des National Center for Biotechnology Information (NCBI) http://www.ncbi.nlm.nih.gov . Klicken Sie auf DNA & RNA und anschließend auf Gen Bank. Geben Sie in das Search-Fenster die accession number J01415 für das mt-Genom des Menschen ein und starten Sie die Suche.
  4. Geben Sie in die Suchfunktion (Bearbeiten/Suchen) zur Ergebnis-Webseite den Protein-Namen cytochrome b ein und klicken Sie auf die angezeigte protein_id="AAB58955.3" (= accession number). Nach Klick auf die accession number des Proteins erhält man die entsprechende Übersichtsseite. Unter „Display Settings“ das Format „FASTA“ auswählen, die Aminosäuresequenz kopieren und in einer Text-Datei speichern.
  5. Nach der gleichen Vorgehensweise lässt sich auch die DNA-Sequenz für das Cytochrom b -Gen durch einen Klick auf CDS recherchieren. Auch hier über Display FASTA DNA-Sequenz anzeigen, kopieren und speichern.
  6. Die Schritte zur Ermittlung der Aminosäure- und DNA-Sequenzen für ein Protein (z. B. Cytochrom b) für einen der weiteren drei angegebenen Organismen (Schimpanse, Westlicher Flachlandgorilla, Sumatra-Orang-Utan) wiederholen:
    • NC_001643: Gemeiner Schimpanse (Pan troglodytes);
    • NC_001645: Westlicher Gorilla (Gorilla gorilla);
    • X97707: Sumatra-Orang-Utan (Pongo abelii).
  7. Gehen Sie weiter zu Aufgabenteil 2 (S. XI) und lösen Sie dann Aufgabe 8. Rufen Sie dazu die Website des European Bioinformatics Institute (EBI) auf: http://www.ebi.ac.uk/Tools/psa und wählen Sie unter Global Alignment, Needle (EMBOSS) den Button Protein aus.
  8. Geben Sie nun die zu vergleichenden Sequenzen aus Ihrer Text-Datei (jeweils ohne die Startzeile) einfügen (z. B. Aminosäuresequenzen für Mensch und Schimpanse) und starten Sie das Tool. Speichern Sie das Ergebnis in Ihrer Text-Datei ab. Fassen Sie zusammen, wie viele AS bzw. DNA-Bausteine jeweils identisch bzw. unterschiedlich sind.
  9. Lösen Sie mit Ihren Ergebnissen Teil 3 mit der Aufgabe 9.
  10. Öffnen Sie abschließend in der NCBI-Startseite http://www.ncbi.nlm.nih.gov über das „Aufklappmenue“ All Databases die Datenbank OMIM und geben Sie cytochrome b negative ein, um eine Erbkrankheit mit fehlendem Cytochrom b zu finden. Öffnen Sie den ersten Link. Stellen Sie fest, welche Informationen Sie über diese Datenbank erhalten. Markieren Sie zusätzlich einzelne Fachbegriffe. Überprüfen Sie auch andere, Ihnen bekannte menschliche Proteine in dieser Datenbank.

Lösungshinweise Übung 3


Übung 4: Das lac-Operon: ein Unterrichtsvorschlag zur Bioinformatik [vgl. 1, S. 11]

  1. Öffnen Sie im Browser die Seite www.mint-zirkel.de und suchen Sie das Arbeitsblatt Bioinformatik unter Arbeitsblätter 1 + 2 2013. Öffnen Sie das Arbeitsblatt und speichern Sie es für sich ab.
  2. Wählen Sie Beispiel 1 und folgen Sie den Anweisungen auf dem Arbeitsblatt. Beurteilen Sie Genauigkeiten bzw. Ungenauigkeiten der Anleitung. Notieren Sie Änderungsvorschläge in dem Sinn, dass sie für die Schüler nachvollziehbarer wird.
  3. Informieren Sie sich über die Länge des lacZ-Gens und der ß-Galactosidase.
  4. Exportieren Sie abschließend zwei Graphiken, eine, die zeigt, wie weit das lac-Repressor-Gen vom Operon entfernt ist, und eine, die das ganze Operon zeigt. Überlegen und notieren Sie Hinweise, die man eigentlich benötigt, um diese Aufgabe zu lösen.

Lösungshinweise Übung 4


Quellen:

[1] Chalwatzis, N. (2013). Bioinformatik für den Unterricht. MINTZirkel, Jan./Febr. 2013, 10-11.

[2] Bickel, S. (2005). Arbeitsmaterialien und Unterrichtsverlauf.
http://www.lehrer-online.de/463234.php?sid=38990722289341774836872487249350, (17.5.2013).

[3] Fenner, A., & Wünschiers, R. (2011). 15.3 Unterrichtsmaterialien. Online-Zusatzangebot zu Dreesmann, D., Graf, D., & Witte, K. (2011) Evolutionsbiologie – Moderne Themen für den Unterricht. Heidelberg: Spektrum Akademischer Verlag. http://extras.springer.com/2011/978-3-8274-2785-4/15_genetische-Analysen/15.3_genetische-Analysen_Unterrichtsmaterial.pdf (online 13.6.2014).

[4] Kolb, K. (2014). Unterrichtliche Ansätze zum Thema Bioinformatik am Gymnasium: Recherche, Kategorisierung und Optimierung für mögliche Umsetzungen. Masterarbeit Fachdidaktik Biologie. Unveröff. Manuskript, Universität Bayreuth.

[5] http://www.kmk.org/fileadmin/veroeffentlichungen_beschluesse/2004/2004_12_16-Bildungsstandards-Biologie.pdf, 16.06.2014


Download der Folien als PowerPoint-Datei


top

E-Mail: Walter.Wagner ät uni-bayreuth.de