Das Kefk Network Wiki befindet sich im Testbetrieb.


UniProt

Aus Kefk.

Wechseln zu: Navigation, Suche

UniProt (universal protein database) ist die größte bioinformatische Datenbank für tierische und pflanzliche Proteine und enthält Informationen über die Proteinfunktion und -struktur. Sie kombiniert die Daten von Swiss-Prot, TrEMBL und Protein Information Resource (PIR) und wird in einem 14-tägigen Rhythmus heraus gegeben.

Inhaltsverzeichnis

Woraus setzt sich UniProt zusammen?

UniProt ist ein Konsortium, das sich 2002 aus folgenden Komponenten zusammengeschlossen hat:

Das EBI verfügt über eine große Quelle bioinformatischer Daten, das SIB beherbergt die Server des (ExPASy) (Expert Protein Analysis System), welche essentielle Informationen für die Proteomik bereitstellen. PIR, die von der National Biomedical Research Foundation (NBRF) betrieben wird, leitet sich von der ältesten Proteinsequenzdatenbank (Margaret Dayhoff's Atlas of Protein sequence and structure) ab.

Die UniProt-Datenbanken

Jedes Mitglied des UniProt Konsortiums "pflegt" die Datenbanken. Bis vor kurzem (Quelle: UniProt-Hintergrundinformationen) produzierten EBI und SIB zusammen Swiss-Prot und TrEMBL. Das PIR stellte die Datenbank PIR-PSD (Protein sequence database) zur Verfügung.

Swiss-Prot ist wohl die bekannteste Proteindatenbank auf Grund ihrer ausführlichen Querverweise, Literaturzitate, der Integration anderer Datenbanken und ihrer minimalen Redundanz. TrEMBL (Translated EMBL Nucleotide Sequence Data Library) ist eine Computer-annotierte Ergänzung der Swiss-Prot-Datenbank, die alle Übersetzungen von EMBL Nukleotideinträgen enthält, die noch nicht in Swiss-Prot integriert vorliegen. Dies ermöglicht eine schnelle Datenbereitstellung.

Organisation der UniProt-Datenbanken

UniProt beinhaltet drei Elemente, die auf einen bestimmten Gebrauch spezialisiert sind:

  • Die UniProt Knowledgebase (UniProtKB) ist die zentrale Datenbank für Proteinsequenzen. Sie gibt Informationen über die Funktion und Klassifikationen der Proteine und stellt Querverweise her.
  • Das UniProt Archive (UniParc) speichert die Gesamtheit aller öffentlich erhältlichen Proteinsequenzdaten.
  • Die UniProt Reference Clusters (UniRef) sind Datenbanken, die dem Benutzer eine schnellere Suche ermöglichen, indem sie verhindern, dass redundante Verknüpfungen verfügbarer Sequenzen erscheinen. So werden unter anderem identische Sequenzen und Vor-Fragmente (von verschiedenen Organismen) in einer Dateneintragung kombiniert.

Literatur

  • Bairoch A, Apweiler R, Wu CH, Barker WC, Boeckmann B, Ferro S, Gasteiger E, Huang H, Lopez R, Magrane M, Martin MJ, Natale DA, O'Donovan C, Redaschi N, Yeh LS (2005)

The Universal Protein Resource (UniProt), Nucleic Acids Res. 33: D154-159. [PubMed]

  • Apweiler R, Bairoch A, Wu CH, Barker WC, Boeckmann B, Ferro S, Gasteiger E, Huang H, Lopez R, Magrane M, Martin MJ, Natale DA, O'Donovan C, Redaschi N, Yeh LS (2004)

UniProt: the Universal Protein Knowledgebase, Nucleic Acids Res. 32: D115-D119. [PubMed]

Weblinks

Wikipedia
Dieses Dokument entstammt in seiner ersten oder einer späteren Version der deutschsprachigen Wikipedia. Es ist dort zu finden unter dem Stichwort UniProt, die Liste der bisherigen Autoren befindet sich in der Versionsliste; die Originalfassung kann dort auch bearbeitet werden. Alle Texte der Wikipedia und ihre Derivate stehen unter der GNU-Lizenz für freie Dokumentation.
Wikipedia
Dieses Dokument entstammt in seiner ersten oder einer späteren Version der deutschsprachigen Wikipedia. Es ist dort zu finden unter dem Stichwort UniProt, die Liste der bisherigen Autoren befindet sich in der Versionsliste; die Originalfassung kann dort auch bearbeitet werden. Alle Texte der Wikipedia und ihre Derivate stehen unter der GNU-Lizenz für freie Dokumentation.
Persönliche Werkzeuge
Andere Sprachen