PSORT ist eine Datenbank, die eine Vorhersage von Proteinlokalisationen in Zellen trifft. Dies geschieht durch Analyse der eingegebenen Aminosäuresequenz. Sequenzen, die charakteristisch für Sortiersignale sind (beispielsweise Länge der N-terminalen Region, der hydrophoben Region, Nettoladungen), werden mit bekannten Sortiersignalen verglichen. Daraus wird eine Lokalisationswahrscheinlichkeit für Zytoplasma, Periplasma, innere Membran und Außenmembran errechnet.

QS-Informatik
Beteilige dich an der Diskussion!
Dieser Artikel wurde wegen inhaltlicher Mängel auf der Qualitätssicherungsseite der Redaktion Informatik eingetragen. Dies geschieht, um die Qualität der Artikel aus dem Themengebiet Informatik auf ein akzeptables Niveau zu bringen. Hilf mit, die inhaltlichen Mängel dieses Artikels zu beseitigen, und beteilige dich an der Diskussion! (+)


Begründung: Begründung --YMS 14:24, 7. Mai 2011 (CEST)

PSORT besteht aus mehreren Subdatenbanken, aus denen man zunächst eine geeignete auswählen muss:

  • PSORT (alte Version; Bakterien, Pflanzen)
  • PSORT II (Tiere, Hefe; in Bearbeitung: Pflanzen, Gram-positive und Gram-negative Bakterien)
  • Wolf PSORT (basierend auf PSORT II; Pilze, Tiere, Pflanzen)
  • iPSORT (Detektion von N-terminalen Sortiersignalen)
  • PSORT-B (Gram-negative Bakterien)

PSORT untersucht Proteinsequenzen mithilfe der Aminosäuresequenzen. Mit einer anfänglichen Kategoriebestimmung wird die Herkunft (Tier, Pflanze etc.) des Proteins bestimmt. Im Anschluss wird der Standard-Buchstabencode für Aminosäuren eingegeben. Die Ausgabe erfolgt in drei Abschnitten: Zunächst wird die eingegebene Sequenz (ggf. korrigiert) gelistet. Daran anschließend sind die Ergebnisse der Subprogramme zu ersehen. Die errechnete Wahrscheinlichkeit der Lokalisation erfolgt im dritten Abschnitt.

Ergebnisbeispiel

Bearbeiten

1. Abschnitt: Wiederholung der Eingabesequenz

2. Abschnitt: Ergebnisse der Subprogramme (Auswahl)

  • PSG: Signalpeptidvorhersage

Aufgrund von Sequenzvergleichen mit eingespeisten Aminosäuresequenzen wird eine Vorhersage getroffen, ob das eingegebene Protein ein Signalpeptid besitzt. Dies geschieht aufgrund der Länge der N-terminalen Region und aufgrund der Nettoladungen in dieser Region.

  • GvH: Signalsequenzerkennung

Weitere Methode zur Signalsequenzbestimmung, die auf der Weight-Matrix-Methode beruht. Dabei werden die Input-Sequenzen an den Konsensussequenzen in der Nähe der möglichen Schnittstellen mit bekannten Signal-Sequenzen verglichen.

3. Abschnitt: Lokalisationswahrscheinlichkeit

Hier werden die von den Subprogrammen errechneten Daten durch Algorithmen zu einer Lokalisationswahrscheinlichkeit zusammengerechnet. Angegeben werden die Orte mit den fünf höchsten Wahrscheinlichkeiten.

Stärken und Schwächen

Bearbeiten
  • Die Datenbank beruht auf einem Algorithmus, der 2003 verbessert wurde.
  • Die eingespeisten Daten sind nicht aktuell.
  • Seit 2003 wurde die Datenbank nicht verbessert.
  • Formaler Vorteil: Die Eingabesequenz wird automatisch von Fehlern bereinigt.
  • Tipp: Ergebnisse sollten nur als Hinweis auf mögliche Lokalisationen gesehen werden. Vergleiche mit Lokalisationsdatenbanken, die auf Experimenten beruhen, haben ergeben, dass die Vorhersage von PSORT nicht immer zu einer Übereinstimmung führt.
  • Genaue Auswertung aller Teilergebnisse in PSORT erfordert eine gründliche Einarbeitung in die Datenbank.
Bearbeiten