Benutzer:Dirk123456/Baustellenbaustelle 001/Baustelle-D/Baustelle-D.6

Ziel(e) der Baustelle

Bearbeiten

Ziel 1: Anfangs sollte Baustelle D.6 einen Diskussionsbeitrag zum „Ersten Prototyp“ vorbereiten, zu einem Vorschlag der Wikimedia Deutschland (bzw. zu einer Gruppe von Vorschlägen), die Suche nach Vorlagen zu verbessern.

Ziel 2: Im Laufe des Anwachsens meiner ausschweifenden Erörterungen wurde ein Punkt immer umfassender: die Darstellung eines Beispiels für komplexe Vorlagen. Das Beispiel ist eine sehr leistungsfähige Vorlage, die aber nicht einfach anwendbar ist.

Ziel 3: Im Mai 2020 war die Recherche zum ersten Prototyp abgeschlossen und der „Zweite Prototyp“ stand auf dem Programm. Der Beitrag dazu wurde in Baustelle D.7 vorbereitet und dann „gepostet“. Es verblieb das Ziel 2 ohne das Ziel 1, die Darstellung der komplexen Verhältnisse in einer leistungsfähigen, aber schwer anzuwendenden Vorlage.

Bearbeiten

Prototyp 1 (Ziel 1, Antwort-Beitrag für Prototyp 1)

Start

Ende

Baustelle D.6

Letzte Version mit den Zielen 1 und 2:

  • Benutzer:Dirk123456/Baustellenbaustelle 001/Baustelle-D/Baustelle-D.6, oldid=199674579

Protokoll

Bearbeiten

Es wird Folgendes gegenüber der Vorversion oldid=199674579 gelöscht:

  • "Beitrag" bis ausschließlich "Leistungsfähigkeit und Übersichtlichkeit" gelöscht.
  • "A.1     Versuche zur Einbeziehung von allen relevanten Parametern" und "z" gelöscht ("z" war eine lediglich als Markierung gedacht).
  • "Zum Schluss" gelöscht.
  • "Eigenheiten des VE" bis ausschließlich "Drei Formen von Genname(n) -- Material" gelöscht.
  • "Inhibitor_fam nicht in der Untervorlage" -- ausgelagert gelöscht.

"Verbannung" der Ziele 1 und 2 aus der Vorversion oldid=199674579; Fokussierung auf Ziel 3.

Eigentlicher Beitrag

Bearbeiten

Einleitung

Bearbeiten

Im September 2019 stieß ich (Benutzer:Dirk123456/ Disk) in einem Artikel über eine Protein-Gruppe (DNA-Methyltransferasen) auf eine Infobox, eine Einbindung der Vorlage „Infobox Protein“. Dort wollte ich einen Punkt zur Enzymklassifikation der DNA-Methyltransferasen editieren, der mir sub-optimal dargestellt erschien (einzeln stehendes Komma am Beginn eines Schriftzugs). Ich stellte dann fest, dass ich ohne tiefere Kenntnis über diese Vorlage keine nachhaltige Verbesserung der Infobox erreichen würde.

Da zuvor das Thema „Leichter mit Vorlagen arbeiten“ als Schwerpunkt der technischen Wünsche gewählt worden war (Juli 2019), konnte das konkrete Problem mit der Anwendung der Vorlage „Infobox Protein“ meiner Ansicht nach gut als Beispiel dienen, weshalb ich mich dafür entschied, die Arbeit am Problem zu dokumentieren.

Für eine solche Dokumentation verwendete ich primär ein Textbearbeitungsprogramm, da ich dort Screenshots und andere bildliche Darstellungen besser anwenden konnte, als mit Wikitext. Später habe ich diese Dokumentation auf eine Benutzerseite in der Wikipedia verlagert.

Das Hauptziel dieser Ausarbeitung besteht darin, innerhalb der Wikipedia ein konkretes Beispiel für die Diskussion rund um das Thema „Leichter mit Vorlagen arbeiten“ zu haben.

Nicht wenige Schwierigkeiten, die bei der Beispiel-Vorlage („Infobox Protein“) auftreten, kommen in ähnlicher Form auch bei anderen Vorlagen vor.

Es ergeben sich einige Nebenziele. Die Themen, die an die Beispiel-Vorlage selbst gekoppelt sind, erfordern hier teilweise die Darstellung eben dieser Themen und der Zusammenhänge zur Vorlage „Infobox Protein“. Solche Themen sind z. B. die Darstellung von Proteinen und Proteingruppen, die Regeln der Enzymklassifikation und die Funktionalität von Infoboxen allgemein.

Text-Hervorhebungen und Anführungszeichen

Bearbeiten

Je nachdem, wie stark die Abgrenzung vom umgebenden Text sein soll, werden neben Textauszeichnungen (wie Fett, Kursiv, Unterstrichen usw.) verschiedene Anführungszeichen als Hervorhebung verwendet.

Code-Tags: Die häufigste hier angewendete Textauszeichnung dürfte Computercode sein (Tags im Wikitext: <code>…</code>). Die Code-Tags werden hier meist dazu verwendet, um Parameter-Namen und andere Code-Elemente kenntlich zu machen (z. B. EC-Nummer).

: Die „normalen“ deutschen Anführungszeichen werden in üblicher Weise verwendet; also dann, wenn keine zusätzliche, spezielle Hervorhebung angestrebt wird.

"": Die einfachen Anführungszeichen werden hier vor allem für Code-Elemente gebraucht, zumeist für Parameter ( z. B. "EC-Nummer"). Weiterhin werden sie verwendet, wenn Anführungszeichen sprachneutral eingesetzt werden sollen (für Ausdrücke in deutschen und englischen Anwendungen) und wenn die Verwendung verschiedener Anführungszeichen unübersichtlich erscheint.

': Der Apostroph wird als solcher praktisch nur als Ersatzzeichen bei der Darstellung von Code verwendet. Das betrifft vor allem Wikitext ('', ''' und ähnliches).

und : Die englischen Anführungszeichen werden im Zusammenhang mit der englischen Sprache verwendet.

»«: Die Guillemets oder Spitzzeichen werden verwendet, um Anfang und Ende längerer Schriftzüge zu kennzeichnen, vor allem, wenn das Potential von Klammern, anderen Anführungszeichen und Ähnlichem ausgeschöpft ist.

: Die einfachen Guillemets ober „halben Spitzzeichen“ haben eine Sonderfunktion; sie schließen spezielle Ausdrücke ein, die hier „erfunden“ wurden und als Arbeitsbegriffe dienen. Das betrifft solche Wörter und Wortgruppen, wie:

  • ›optischer Parameter‹,
  • ›optisches Argument‹,
  • ›Block A‹ bis ›Block H‹,
  • ›Gehört-in‹-Sichtweise und
  • ›Entspricht‹-Sichtweise.

Überblick – Leistungsfähigkeit der Vorlage Infobox_Protein

Bearbeiten

Nach meinem Erleben ist z. B. die Vorlage:Infobox Protein leistungsfähig, aber nicht einfach anzuwenden. Die Vorlage hat um die 40 Parameter und die resultierende Infobox (H:Infoboxen), eine komplexe Tabelle in der Normalansicht, kann bis zu acht Abschnitte aufweisen. Die Abschnitte entstehen durch Hervorhebung einer entsprechenden Tabellenzeile, die optisch als Überschrift wirkt.

Im einfachsten Fall wird ein Parameter mit seinem Wert mit gleichlautenden Schriftzügen in genau einer Tabellenzeile eingetragen, der Parameter links und der Wert rechts; so wird z. B. aus |Wirkstoffklasse=RNase-Hemmer im Wikitext eine Tabellenzeile, die etwa so aussieht:

Wirkstoffklasse RNase-Hemmer

In anderen Fällen werden zusätzlich automatische Verknüpfungen erzeugt, so werden aus |DrugBank=DB00062 z. B. die „verlinkten“ Schriftzüge DrugBank und DB00062, die dann auf der linken bzw. rechten Seite angeordnet sind. Diese resultierenden Schriftzüge nenne ich hier ›optischer Parameter‹ und ›optisches Argument‹, um „Arbeitsbegriffe“ zu haben.

Der Grund für diese Begriffsabgrenzung ist, dass sich vor allem der ›optische Parameter‹ vom Parameter unterscheiden kann, von dem er abstammt. Ein Beispiel ist der Schriftzug „Sekundär- bis Quartärstruktur“ der vom Parameter Struktur herrührt. Dieser ›optische Parameter‹ (also Sekundär- bis Quartärstruktur) teilt das Wort „Struktur“ mit anderen Schriftzügen („Vorhandene Strukturdaten:“ und Masse/Länge Primärstruktur“), die ebenfalls ›optische Parameter‹ sind.

Die genaue Zuordnung lässt sich am einfachsten über den Wert des Parameters (das Argument) und die resultierende Anzeige (das ›optische Argument‹) herstellen, da sich diese beiden meist wenig unterscheiden: |Struktur=βαββαβ führt zu „Sekundär- bis Quartärstruktur“ auf der linken und „βαββαβ“ auf der rechten Seite in der entsprechenden Tabellenzeile einer Infobox.

Es gibt aber auch ›optische Parameter‹ und ›optische Argumente‹, die auf mehreren Werten verschiedener Parameter beruhen. So bewirken die beiden Parameter↔Argument-Paare |Symbol=ALB und |HGNCid=399 zusammen das „Anzeige-Paar“ mit den Schriftzügen „Gen-Name“ und „ALB“ in der resultierenden Infobox-Tabelle, wobei der Text von |Symbol=ALB herrührt, was halbwegs offensichtlich ist, während die Verknüpfungen vom Parameter HGNCid und seinem Wert 399 stammen, was eher versteckt ist. Der ›optische Parameter‹ „Gen-Name“ erhält eine interne Verknüpfung in die Wikipedia (Human Genome Organisation) und das ›optische Argumente‹ erhält eine Verknüpfung zu einer Datenbank (https://www.genenames.org/tools/search/#!/all?query=399).

Es gibt weitere Mehrfach-Zuordnungen. So kann das Auftreten des ›optischen Parameters‹ „MEROPS“ auf Peptidase_fam oder auf Inhibitor_fam beruhen.

Neben Überschriften gibt es auch so etwas, wie „übergeordnete Rubriken“, z. B. den Schriftzug „Externe IDs“, der links steht, während sich rechts eine Aufzählung befindet, in der allgemeinen Form:

  • ›Optischer Parameter‹: ›optisches Argument‹  oder anders ausgedrückt:
  • Einzel-Rubrik: Konkreter Inhalt

Es gibt vielfältige Abhängigkeiten, die nicht in jedem Fall einfach nachzuvollziehendes Verhalten der Parameter und ihrer Werte erzeugen.

Eine Code-Komponente mit vielen Abhängigkeiten ist beispielsweise der bereits erwähnte Parameter HGNCid (HGNC: Human Genome Nomenclature; siehe Human Genome Organisation), der zwei bis drei verschiedene Abschnitte in der resultierenden Infobox beeinflussen kann. Setzt man einen Wert ein, dann wird eine Überschrift „Eigenschaften des menschlichen Proteins“ zwischen die Einleitung und die Eigenschaften gesetzt (auch bei einem unsinnigen Wert, z. B. |HGNCid=ß). Ohne "HGNCid", wenn der Parameter in der Einbindung der Vorlage fehlt oder leer ist, verschmelzen Einleitung und Eigenschaften zu einem Abschnitt.

Um zwischen einzelnen Abschnitten und kombinierten Abschnitten – die durch das Ausbleiben einer Überschrift entstehen – zu unterscheiden, habe ich einen weiteren „Arbeitsbegriff“ eingeführt, den ›Block‹. Ein ›Block‹ ist ein Bereich innerhalb der Infobox Protein, der eine Überschrift haben kann, aber nicht muss, während ein Abschnitt in dem von mir hier angewendeten „Begriffssystem“ immer eine Überschrift hat.

Ich habe acht Blöcke ausfindig gemacht und diese ›Block A‹ bis ›Block H‹ genannt. Der erste Abschnitt, die Einleitung, kann also aus den beiden Blöcken ›Block A‹ und ›Block B‹ bestehen, wenn die entsprechenden Parameter angewendet werden oder auch nur aus ›Block A‹, je nachdem, ob "HGNCid" eine zusätzliche Überschrift bewirkt. Die Blöcke ›C‹ bis ›H‹ treten immer als einzelne Abschnitte in Erscheinung, d. h., sie haben immer eine eigene Überschrift. In einem Fall (bei ›Block F‹) kann die Überschrift variabel lauten: „Enzymklassifikation“, „Enzymklassifikationen“ oder „Inhibitorklassifikation“.

Einschub – „Überschriften, Abschnitte und die Blöcke A bis H“ ↙↙

Die meisten Parameter wirken sich jeweils in genau einem Block aus. Für die Überschrift des Blocks ist fast nie ein einzelner Parameter zuständig, sondern es sind dann nahezu alle, die auch entsprechende ›optische Parameter‹ in „ihrem“ Block aufweisen. Die Ausnahme ist ›Block B‹, dessen Überschrift durch nur einen Parameter (HGNCid) bedingt wird.

Es gibt – soweit ich das überblicke – zwei Parameter, die sich in mehreren Blöcken auswirken. Das ist zum einen UniProt und zum anderen HGNCid.

Der Parameter UniProt kann sich mit ein und dieselbe Eingabe (z. B. |UniProt=P12345) in zwei Blöcken auswirken:

  • in ›Block C‹ (Überschrift „Bezeichner“) tritt der Schriftzug „UniProt:“ als ›optischer Parameter‹ auf, dessen ›optisches Argument‹ einer Verknüpfung zu einer Datenbank dient (z. B. „P12345“ → https://www.uniprot.org/uniprot/P12345), und
  • in ›Block G‹ (Überschrift „Vorkommen“) bedingt der Parameter UniProt gegebenfalls eine Verknüpfung zu einer Datenbank (z. B. https://pbil.univ-lyon1.fr/cgi-bin/acnuc-ac2tree?query=P12345&db=HOGENOM), je nachdem ob und wie andere Parameter angewendet werden, die „Block-G-spezifisch“ sind (Homolog_db, Homolog_fam, Homolog_url).

Der bereits erwähnte Parameter HGNCid der das Ende von ›Block A‹ und den Anfang von ›Block B‹ definiert, weil er eine Überschrift zwischen beide Blöcke setzen kann, beeinflußt einen dritten Block, den ›Block C‹, der die Überschrift „Bezeichner“ trägt. Es bestehen Abhängigkeiten zwischen den Parametern "Symbol" (Gen-Symbol), "AltSymbols" (alternative Gen-Symbole) und "HGNCid".

Sowohl "Symbol" als auch "AltSymbols" (wie auch andere Parameter) können das Auftreten des Abschnitts mit der Überschrift „Bezeichner“ auslösen. Wenn die Überschrift „Bezeichner“ ausgelöst wird, dann kann ein Schriftzug zur Benennung einer Zeile in diesem Abschnitt der Infobox drei verschiedene Formen annehmen: Gen-Name(n), Gen-Name und Gen-Namen. Vereinfacht ausgedrückt ist "Symbol" für die Einzahl, "AltSymbols" für die Mehrzahl und "HGNCid" für Verknüpfungen zuständig.

Diese Auswirkungen eines einzelnen Parameters an mehreren Stellen hat Vor- und Nachteile.

Der größte Vorteil dürfte sein, dass mit relativ wenig Text viel erreicht werden kann. Der Code |HGNCid=399 innerhalb der Vorlagen-Einbindung {{Infobox Protein...}}

  • deklariert einen Satz von Protein-Eigenschaften als „Eigenschaften des menschlichen Proteins“ (mithilfe der entsprechenden Überschrift),
  • verknüpft den Schriftzug „Gen-Name“ oder „Gen-Namen“ zum Artikel Human Genome Organisation (HUGO) und
  • verknüpft den Wert des Parameters "Symbol" (z. B. |Symbol=399) als Verknüpfungstext zu einer Datenbank für HUGO-Gennamen: https://www.genenames.org/tools/search/#!/all?query=399.

Der größte Nachteil der vielfältigen Abhängigkeiten dürfte sein, dass diese schwer zu beschreiben sind.

Es werden, falls ich nicht etwas übersehen habe, sieben Parameter durch HGNCid direkt beeinflusst: fünf durch die Überschrift „Eigenschaften des menschlichen Proteins“ (Groesse, Struktur, Kofaktor, Precursor, Isoformen) von ›Block B‹ und die zwei genannten (Symbol, AltSymbols) in ›Block C‹.

Im Grunde genommen wird auch der ›Block A‹ durch HGNCid beeinflusst, da die An- oder Abwesenheit der ›Block-B‹-Überschrift („Eigenschaften des menschlichen Proteins“) dazu führt, dass die fünf ›Block-A‹-Parameter (Name, Bild, Bild_legende, Andere Namen, PDB) mal allein und mal zusammen mit den ›Block-B‹-Parametern den ersten Abschnitt, die Einleitung der Infobox, gestalten. Das macht dann alles zusammen zwölf zusätzliche Parameter (neben "HGNCid" selbst), bei denen in der Dokumentation zu den Abhängigkeiten von HGNCid etwas stehen müsste.

Die Untersuchung als detaillierte Erzählung

Bearbeiten

Start der Analyse – EC-Nummer und Kategorie

Bearbeiten

Dass es recht komplexe Zusammenhänge zwischen den Parametern geben kann, habe ich anhand der beiden Parameter "EC-Nummer" und "Kategorie" herausgefunden, die ich in der Vorlagen-Einbindung innerhalb des Artikels DNA-Methyltransferasen entdeckte. Dort fand ich in der „Infobox Protein“ eine Zeile vor, die etwa so aussah (2019-09):

EC, Kategorie , Methyltransferase

Das Komma am Anfang eines Schriftzugs irritierte mich und deshalb sah ich mir die Infobox genauer an – der Code für diese Infobox ist links, die resultierende Infobox ist rechts dargestellt:

Vorlage-Einbindung:
{{Infobox Protein
|Name             = DNA-Methyltransferasen
|Bild             = 
|CAS              = 
|EC-Nummer        = <!--2.1.1.- -->
|Kategorie        = Methyltransferase
|Reaktionsart     = [[Methylierung]]
|Substrat         = [[Nukleotide]]
|Produkte         = Methylnukleotide
}}

Resultierende Infobox (nachgestaltete Tabelle):

DNA-Methyltransferasen
Enzymklassifikation
EC, Kategorie , Methyltransferase
Reaktionsart Methylierung
Substrat Nukleotide
Produkte Methylnukleotide

Es fällt auf, dass ein Parameter auf verschiedene Arten leer sein kann:

  • „richtig leer“, dann folgt dem Gleichheits-Zeichen nichts und
  • „eigentlich leer“, dann folgt dem Gleichheits-Zeichen nur ein Kommentar: "<!--2.1.1.- -->", der von der auswertenden Software ignoriert wird.

Für die auswertende Software sieht der Code an der entsprechenden Stelle wahrscheinlich ungefähr so aus:

  • {{...|EC-Nummer=|...}} und

für einen Leser – wie mich – ungefähr so:

  • {{...|EC-Nummer = <!--2.1.1.- -->|...}}.

Zu der Zeit (2019-09) als ich das erste Mal auf diesen Code der Vorlagen-Einbindung stieß, wusste ich noch nicht, wie "EC-Nummer" und "Kategorie" zusammenarbeiten und dachte, ich könnte in der Infobox etwas ähnliches, wie das Folgende unterbringen:

EC, Kategorie Die DNA-Methyltransferasen sind eine Gruppe von Enzymen mit mehreren EC-Nummern (EC 2.1.1.37; EC 2.1.1.72; EC 2.1.1.113), Methyltransferase

Das ging nicht ohne Weiteres. Deshalb habe ich Experimente durchgeführt oder besser gesagt, „herumprobiert“, um über die beiden Parameter ("EC-Nummer" und "Kategorie") und die „Infobox Protein“ als ganzes mehr zu lernen. Ich lernte dabei z. B.:

  • dass mehrere Parameter gleichermaßen für die Überschrift „Enzymklassifikation“ zuständig sind,
  • dass man einen Parameter mehrfach eingeben kann und der Wert des letzten Eintrags relevant ist (der Code: »...|EC-Nummer = A |Kategorie = Methyltransferase |EC-Nummer = B |...« ergibt den Text: »B, Methyltransferase«),
  • dass bei externen Verknüpfungen nicht alle angegebenen Wörter gleichermaßen wirken, weil nur das erste Wort für das Linkziel genutzt wird (der Code: »...|EC-Nummer = eins zwei drei |...«  wird zum Text: »zwei drei eins zwei drei«,  weil folgender Wikitext entsteht:  »[https://www.brenda-enzymes.org/php/result_flat.php4?ecno=eins zwei drei eins zwei drei]«).

Letztlich war mir nicht klar, ob die Programmierung von „Vorlage:Infobox Protein“ zwischen abwesenden und leeren Parametern unterscheidet. Ich dachte, dass ich vielleicht den Programm-Code selbst mal ansehe.

Einschub – „Kommentiertes Code-Segment“ ↙↙

Die Formulierungen der Form: {{#if: ... {{Parameter|}}}... deuteten darauf hin, dass jeweils ein Parameter erwartet wurde, der weder abwesend noch leer ist. Allerdings ist der Code auch mit Syntaxhervorhebung nicht unbedingt übersichtlich (|}}}{{{, |}}}|, }}}]]}} }} usw.), so dass ich nicht mit mit Bestimmtheit voraussagen konnte, ob es für die beiden Parameter EC-Nummer und Kategorie egal ist, ob sie "Abwesend" oder "Leer" sind.

Systematische Testung von EC-Nummer und Kategorie
Bearbeiten

Deshalb hatte ich eine Untersuchung mit den Zuständen "Abwesend" (0), "Leer" (1) und "Befüllt" (2) durchgeführt – für die zwei Parameter EC-Nummer und Kategorie. Das ergibt 32 = 9 Kombinationen. Diese wurden von 2*0 + 1*0 = 0 bis 2*3 + 1*3 = 8 nummeriert. Das sah etwa so aus:

  • 0 – Beide Parameter, EC-Nummer und Kategorie, sind abwesend: {{Infobox Protein|Name=Name_0}}
  • ...
  • 4 – Beide Parameter leer: {{Infobox Protein|Name=Name_4|EC-Nummer=|Kategorie=}}
  • 7 – EC-Nummer befüllt; Kategorie leer: {{Infobox Protein|Name=Name_7|EC-Nummer=1.2.3.4|Kategorie=}}
  • 8 – Beide Parameter befüllt: {{Infobox Protein|Name=Name_8|EC-Nummer=1.2.3.4|Kategorie=Kategorisch}}

Daraus ließ sich nach visueller Prüfung der neun Infoboxen in der Normalansicht ableiten, dass die beiden Zustände "Abwesend" und "Leer" zumindest für diese beiden Parameter (EC-Nummer und Kategorie) keinen Unterschied ergeben.

Das EC-Nummern-System und das Komma zwischen EC, Kategorie
Bearbeiten

Die ursprüngliche Frage, was man mit einer Protein-Gruppe macht (DNA-Methyltransferasen), die nach dem EC-Nummern-System selbst keine einzelne EC-Nummer hat, sondern mehrere Mitglieder, von denen jedes eine EC-Nummer besitzt, war damit noch nicht geklärt.

Alle drei Mitglieder (EC 2.1.1.37; EC 2.1.1.72; EC 2.1.1.113) gehören zwar in die gleiche Gruppe, die “sub-subclass Methyltransferases”, also in die Unter-Unterklasse Methyltransferasen, so dass man eine „Kategorie“ hätte; die vorangestellte Nummer dieser Unter-Unterklasse – EC 2.1.1 oder 2.1.1.- oder auch EC 2.1.1.- – entspricht aber einer anderen Gruppe, den „Methyltransferasen“ und eben nicht den „DNA-Methyltransferasen“, für die die „Infobox Protein“ im konkreten Fall übersichtliche Informationen liefern soll.

Es ergeben sich die Fragen,

  1. wie das EC-Nummern-System „im Original“ aufgebaut ist,
  2. wie dieses System in der hier betrachteten Vorlage umgesetzt wird und
  3. wie sich das auf die Anwendung der Vorlage in Wikipedia-Artikeln auswirkt.
Die Empfehlungen zum EC-Nummern-System
Bearbeiten

Die heute oft verwendete, griffige Bezeichnung „EC-Nummern-System“ oder „EC-System“ führt zur Tätigkeit einer früheren Kommission, zur Enzyme Commission (EC). Heute liegt die Pflege dieses Systems in der Hand der IUBMB, bzw. ihres Nomenklatur-Komitees (NC-IUBMB). Das EC-System hat offiziell einen langen Namen, das in der Übersetzung etwa:

  • „Empfehlungen zur Nomenklatur und Klassifizierung von Enzymen anhand der von ihnen katalysierten Reaktionen“

lautet. Es sind also Empfehlungen für den Fall, dass Enzyme nach chemischen Gesichtspunkten katalogisiert werden sollen. Das System hat vier Hierarchie-Ebenen mit Nummern und Benennungen. Es ähnelt in gewisser Weise einem gegliederten Dokument mit nummerierten Überschriften; allerdings sind beim EC-System die Nummern wichtiger als die Benennungen, weil sie eindeutiger sind.

Die Empfehlungen zu den vier Ebenen des EC-Nummern-Systems laufen – wie auch ihre häufig gefundenen Umsetzungen – darauf hinaus,

  • dass Ebenen von der höchsten Ebene zur untersten Ebene
    • von oben nach unten oder
    • von links nach rechts angeordnet werden.
  • Innerhalb einer Ebene steht
    • die EC-Nummer vorn und
    • ein zutreffender Name (wenn angegeben) unmittelbar dahinter.
  • Die Ebenen werden stark voneinander abgegrenzt,
    • die EC-Nummer hat als eindeutigere Komponente Vorrang
    • gegenüber einer Benennung.

Hier sind Beispiele für die Umsetzung in Datenbanken gezeigt:

Einschub – „Beispiele für die Umsetzung des EC-Nummern-Systems“ ↙↙
Enzymklassen, Enzymeinträge und Kategorien
Bearbeiten

Letzlich ist jede der vier Ebenen im EC-Nummern-System eine „Kategorie“, da nicht nur die drei höheren Ebenen, die Enzymklassen (Klasse, Unterklasse und Unter-Unterklasse) jeweils Mitglieder beherbergen, sondern auch die unterste Ebene, die sogenannten Enzymeinträge oder Seriennummern. Nach den „Empfehlungen zur Nomenklatur und Klassifizierung von Enzymen anhand der von ihnen katalysierten Reaktionen“, welche von einem Nomenkalturausschuss (NC-IUBMB) im Auftrag des IUBMB gegeben werden, gehören alle Enzyme, die innerhalb von DNA die Nukleinbase Cytosin an der Position 5 methylieren (DNA-Methylierung) zur Seriennummer EC 2.2.1.37 mit der Benennung (akzeptierter Name) "DNA (cytosine-5-)-methyltransferase". Das sind sehr viele verschiedene Enzyme in allen möglichen Lebewesen.

EC, Kategorie – ein optischer Doppel-Parameter
Bearbeiten

In der Vorlage „Infobox Protein“ werden die beiden Parameter "EC-Nummer" und "Kategorie" zusammen abgearbeitet, wie der Programmcode zeigt.

Einschub – „Kommentiertes Code-Segment“ ↙↙

In der resultierenden Infobox wird links wird ein Schriftzug generiert, der zu beiden Parametern passen soll und rechts einer, der zu beiden Argumenten passen soll. Um diese Beziehung zu verdeutlichen, nenne ich dieses Paar aus den beiden Parametern "EC-Nummer" und "Kategorie" hier einen „Doppel-Parameter“. Entsprechend sind die beiden Werte ein „Doppel-Wert“ oder „Doppel-Argument“. Die resultierenden Anzeige-Elemente nenne ich folglich „optischer Doppel-Parameter“ (Schriftzug "EC, Kategorie") und „optisches Doppel-Argument“.

Einschub – Doppel-Parameter schematisch ↙↙
EC, Kategorie – Hierarchie-Ebenen und Sichtweisen
Bearbeiten

Der „optische Doppelparameter“ erklärt sich nicht unbedingt selbst; man kann die Formulierung „EC, Kategorie“ auf verschiedene Art und Weise verstehen.

Zum einen wäre „EC“ eine EC-Nummer und „Kategorie“ die Benennung einer Kategorie, in welche die zuvor genannte EC-Nummer hinein gehört und zum anderen könnte man die Formulierung „EC, Kategorie“ durchaus so verstehen, dass „EC“ die Nummer sein soll und „Kategorie“ die Bezeichnung der zugeordneten Gruppe, die all die Enzyme umfasst. Es gäbe also zwei Sichtweisen in Bezug auf den Schriftzug „EC, Kategorie“:

  • die ›Gehört-in‹-Sichtweise – die EC-Nummer gehört in die Kategorie und
  • die ›Entspricht‹-Sichtweise – die EC-Nummer entspricht der Kategorie.

Gegen die ›Gehört-in‹-Sichtweise spricht, dass die Reihenfolge der Hierarchie-Ebenen bei Anwendung des EC-Systems unüblich ist und gegen die die ›Entspricht‹-Sichtweise ist einzuwenden, dass das Wort „Kategorie“ selbst andeutet, dass es sich um eine eine übergeordnete Ebene handelt.

Für die ›Gehört-in‹-Sichtweise spricht, dass man sie in entsprechenden Wikipedia-Artikeln häufig findet. Die ›Entspricht‹-Sichtweise ist seltener zu finden; es gibt sie aber.

Der Volltändigkeit halber wäre noch eine dritte (wenngleich abwegige) Sichtweise anzuführen: die Kategorie läge eine Hierarchie-Ebene unterhalb der EC-Nummer. „EC“ würde dann mit der EC-Nummer eine Gruppe von Proteinen ansprechen und die Mitglieder würden die „Kategorie“ bilden. Die Eingabe mehrerer Mitglieder ist allerdings nicht möglich, da der Wert des Parameters "Kategorie" automatisch zum gleich benannten Wikipedia-Artikel verknüpft wird.

Es folgen Beispiele, die in der Wikipedia gefunden wurden:

Einschub – „Beispiele – Sichtweisen zu Hierarchie-Ebenen von Kategorie und EC-Nummer“ ↙↙
Kategorien im EC-Nummern-System und in der Wikipedia
Bearbeiten

In der Wikipedia könnte man, wenn man das Wort Kategorie liest, auch an die Wikipedia:Kategorien denken. In der deutschen Wikipedia überlappen die Unterkategorien der Kategorie:Enzym zum Teil mit den Enzym-Klassen der ersten Hierarchie-Ebene des EC-Nummern-Systems der IUBMB. Allerdings habe ich in den „Infobox Protein“-Anwendungen entsprechender Artikel bisher keinen Eintrag mit einem entsprechenden Einbindungs-Code gefunden, z. B. ähnlich wie dieser: … |EC-Nummer = 2.1.1.37 |Kategorie = Kategorie:Methyltransferase | ….

So wie es in der deutschen Wikipedia die Kategorie:Enzym gibt, gibt es in der englischen Wikipedia eine ähnliche Category:Enzymes by function (die eine “subcategory” von Category:Enzymes ist, Mai 2020).

Die englischen Vorlagen (templates) "enzyme", "Infobox protein" und "Infobox protein family" auf der einen Seite und die deutschen Vorlagen "Infobox Enzym" (die am 7. Jan. 2009 gelöscht wurde) und "Infobox Protein" teilen (teilten) wohl einige Eigenschaften, weisen (wiesen) aber auch viel Divergenz auf.

Ein vergleichbares Wort, wie "Kategorie", also "Category", "EC_category" oder ähnliches, habe ich in den Infoboxen englischer Enzym-Artikel bisher nicht gefunden (Mai 2020).

In der englischen Wikipedia wurde versucht, das EC-Nummern-System mit seinen Enzymklassen und Enzym­ein­trä­gen so abzubilden, dass es sowohl dem Wikipedia-System mit Kategorien und Artikeln als auch den Empfehlungen hinsichtlich der zur Nomenklatur und Klassifizierung mit Nummern und Benennungen entsprechen kann:

Die oberste Einteilungsebene des EC-Systems (z. B. Hydrolases oder Transferases für die ‘EC 1: Hydrolases’ oder ‘EC 2: Transferases’) ist nur durch den Namen, aber nicht durch die EC-Nummer erreichbar, während die darunter lie­gen­den Enzymklassen eher durch die jeweilige EC-Nummer, als durch die Benennung erreichbar sind (z. B. "EC 2.1", aber nicht "Trans­ferring one carbon groups"). Die Enzym­klas­sen (Hierachie-Ebenen 1 bis 3) wurden in Wikipedia-Kategorien erfasst, während die Enzymeinträge (Hierachie-Ebene 4) oft als Weiterleitungen der jeweiligen EC-Nummer auf mehr oder weniger passende Artikel angelegt sind.

In der deutschen Wikipedia gibt es keine „Kategorie:EC 2.1“, „Kategorie:Trans­ferring one carbon groups“ oder „Kategorie:Eine Kohlenstoff-Gruppe übertragend“, so dass die Möglichkeit weitestgehend entfallen würde, den Parameter "Kategorie" gleichermaßen als Wikipedia-Kategorie und als Kategorie im EC-Nummern-System zu betrachten.

Unter-Vorlagen, auch für EC-Nummern
Bearbeiten

Egal, ob man mit der ›Gehört-in‹- oder der ›Entspricht‹-Sichtweise auf eine „Infobox Protein“ schaut; bei einer Proteingruppe, die drei EC-Nummern hat (wie das bei den DNA-Methyltransferasen der Fall ist), wäre die Angabe mehrerer EC-Nummern hilfreich. Dafür kann man die sogenannte Unter-Vorlage Vorlage:Infobox_Protein/MoreEC nutzen.

Es gibt drei Parameter in der Vorlage:Infobox Protein, MoreEC1, MoreEC2 und MoreEC3, die auf jeweils gleiche Weise diese Unter-Vorlage Vorlage:Infobox_Protein/MoreEC einbeziehen können, um so drei weitere „Enzymklassifikationen“ zu bekommen. Diese Mehrzahlform, die dann statt der Einzahl (Enzymklassifikation) als Überschrift auftaucht, irritiert etwas, da die gleiche Enzymklassifikation – nämlich die nach dem EC-Nummern-System – nur mehrfach angewendet wird.

Es sind sechs Parameter in der Unter-Vorlage, Vorlage:Infobox_Protein/MoreEC vorhanden (EC-Nummer, Kategorie, Peptidase_fam, Reaktionsart, Substrat, Produkte), die es sämtlichst auch mit gleichen Namen in der übergeordneten Vorlage:Infobox Protein gibt. Das Verhalten ist ähnlich; wahrscheinlich werden alle genannten sechs Parameter-Namen im gleichen Abschnitt angezeigt. Den ›optischen Doppel-Parameter‹ (Schriftzug „EC, Kategorie“) gibt mehrfach im selben Abschnitt der Infobox, durch die übergeordnete Vorlage und die (mehrfache) Einbeziehung der Unter-Vorlage. Der jeweilige Schriftzug „EC, Kategorie“ muss als eine Art Unter-Überschrift dienen, den zwischen den Angaben zu unterschiedlichen EC-Nummern gibt es sonst keine weiteren optischen Abgrenzungen.

Zur Zeit meiner ersten experimentellen Anwendungen der „Mehr-als-eine-EC-Nummer-Parameter“ (MoreEC1 bis 3) in der Vorlage:Infobox Protein der entsprechenden Unter-Vorlage war mir noch nicht klar, welche Vielfalt die Überschriften der Abschnitte aufweisen können und welche es überhaupt gibt (2019-10). Ich nahm zur Kenntnis, dass es eine weitere Unter-Vorlage gibt (Vorlage:Protein Orthologe) und das auch Parameter-Werte weitere Vorlagen enthalten können (z. B. |PDB = {{PDB2|1YY1}}, {{PDB2|ABCD}}), ging aber davon aus, das ich das für meine spezifischen Betrachtungen nicht brauche.

Möglichst alle Parameter

Bearbeiten

Langsam wurde klar, dass die Beziehung möglichst aller Parameter zueinander untersucht werden müsste – oder wenigsten der wichtigsten – wenn ersteres nicht gehen würde.

Der Hauptgrund war, dass ganz grundsätzlich die Anzeige-Elemente in der Infobox (Schriftzüge mit Formatierungen und Verknüpfungen) den Eingabe-Elementen einer Vorlage-Einbindung (den Parameter und Werten) zugeordnet werden sollten. Weiterhin hatte ich den Verdacht, dass einige Zusammenhänge in der Vorlage:Infobox Protein nicht notwendigerweise meiner eigenen Denkweise entsprechen könnten, weswegen es besser wäre, sie zu erkunden.

Ich wollte deshalb die Beispiele im Abschnitt „Parameter-Details“ der Vorlage „Infobox Protein“ entnehmen, um daraus eine „allumfassende Vorlage-Einbindung“ zu erstellen (2019-12).

Es wurde während der Analyse immer deutlicher, dass man sich hinsichtlich der möglichen Änderung von Komponenten auf einen Referenz-Zeitpunkt beziehen müsste.

Das Team Technische Wünsche der Wikimedia Deutschland (WP:WMDE) hatte auf der Seite „Häufigst genannte Probleme“ unter dem Abschnitt „Weitere Probleme“ zum Thema Zeitabhängigkeit Folgendes notiert:

  • „Ruft man eine alte Version eines Artikels auf, so wird er nicht mit den damaligen Versionen der genutzten Vorlagen angezeigt, sondern mit den aktuellen. Dadurch ist es nicht möglich, sicher zu sein wie der Artikel damals aussah.“ (oldid=194822419#Weitere_Probleme, Version am 11. Dezember 2019)
Stichtag und Referenzzeitpunkt
Bearbeiten

Da meine Untersuchungen Ende September 2019 begannen, habe ich den 29. September 2019 als Stichtag und 12:00 Uhr mittags (Mitteleuropäische Sommerzeit) als Referenzzeitpunkt gesetzt. Die genaue Uhrzeit spielt meist keine Rolle, da am Stichtag weder die hier betrachtete Vorlage, noch die relevanten Unter-Vorlagen, noch die Vorlage-Dokumentationen geändert worden sind.

Der Referenz-Artikel, „DNA-Methyltransferasen“, wurde zwar noch am Stichtag geändert, nicht aber die in diesem Artikel relevante Vorlage-Einbindung der „Infobox Protein“. Außerdem erfolgte die erste Änderung des Artikels am Stichtag deutlich später als zur Referenzzeit (nach 18:00 Uhr: oldid=192711864). Die Referenz-Version für den Artikel, „DNA-Methyltransferasen“, ist diejenige, die am 29. Sep. 2019 mittags bestand hatte (oldid=187579075, Version vom 15. April 2019).

Die Referenzversion der Vorlage mit dem entsprechenden Programmcode hat eine zeitliche Reichweite vom 19. Dezember 2018 bis zum 27. Dezember 2019; die Referenzversion der Dokumentation auf der entsprechenden Unterseite hat eine Gültigkeit vom 3. April 2018 bis zum 27. Dezember 2019. Beide Referenzversionen – die des Programmcodes und die der Dokumentation – gelten also auch für den Stichtag, den 29. September 2019, und sie haben eine „resultierende zeitliche Reichweite“ vom 19. Dezember 2018 bis zum 27. Dezember 2019.

Achtung! — Heute bindet die damalige Programm-Version („eigentliche Vorlage“) den Text der heutigen Dokumentation ein!

Das wird hier schematisch in einer allgemeinen Form (1.) und konkret am Beispiel des Abschnitts "Parameter-Details" (2.) dargestellt:

  1. [ Damaliger Programm-Code ] <== bindet [ heutige Doku ein, die ] ungleich [ der damaligen Doku ist. ]
  2. [ oldid=183851377#Parameter-Details ] <== [ Vorlage:Infobox Protein/Doku#Parameter-Details ] [ oldid=175729659#Parameter-Details ]
Einschub – „Die Referenzversionen im Einzelnen“ ↙↙
Verschiedene Zahlen von Parametern
Bearbeiten

Nach einigen Versuchen der Anwendung von Parametern und Beispielen aus zwei Abschnitten der „Doku“ (Infobox Protein/Doku oldid=175729659#Parameter-Details, oldid=175729659#Kopiervorlage) hatte ich eine Vorlage-Einbindung, die – ohne Mitzählen von Unter-Vorlagen – 40 Parameter enthielt. Einige Parameter von den 43 Parameter-Namen unter „Parameter-Details“ und von den 41 Namen unter „Kopiervorlage“ waren nicht gültig – "Bild2" und "Bild_legende2" (aus „Kopiervorlage“) sowie "AltSymbol" (aus „Parameter-Details“). Zwei Parameter, MoreEC2 und MoreEC3, wurden heraus genommen, da sie die gleiche Unter-Vorlage einbezogen, wie MoreEC1, so dass kein anderes Verhalten zu erwarten war.

Ich habe für Parameter von Unter-Vorlagen eindeutige Benennungen „erfunden“, um sie von den Parametern von der Vorlage „Infobox Protein“ (Programm-Code: oldid=183851377; Doku: oldid=175729659) unterscheiden zu können:

Tritt ein Parameter-Name, z. B. "Kategorie", in einer Vorlage-Einbindung zweimal auf, dann heißt der Parameter in der übergeordneten Vorlage einfach nur Kategorie, während der Parameter in der untergeordneten Vorlage auch den Namen des übergeordneten Parameters (z. B. MoreEC1) enthält: MoreEC1‑>Kategorie.

Im folgenden Beispiel-Code-Segment wird das gezeigt:

  • {{Infobox Protein |... | Kategorie = ... |MoreEC1 = {{Infobox Protein/MoreEC |... |Kategorie = ... |... }} ...|...}}

Die zuerst aufgeführten Parameter heißen Kategorie und MoreEC1, während ich den Parameter in der Vorlage-Verschachtelung als MoreEC1‑>Kategorie bezeichne.

Für die Unter-Vorlage "Infobox Protein/MoreEC" (Programm-Code und Doku: oldid=177045241) wurden nur zwei Parameter ausgewählt – MoreEC1‑>Name und MoreEC1‑>Kategorie.

Für die Unter-Vorlage "Protein Orthologe" (Programm-Code: oldid=177045241; Doku oldid=165298437) wurden nicht alle möglichen 20, sondern nur 6 Parameter, vor allem Pflichtparameter, einbezogen – z. B. Orthologe‑>Spezies1 und Orthologe‑>Spezies2.

Das Beispiel einer „Riesenvorlage“ mit über 40 direkten und „untergeordneten“ Parametern wurde an entsprechender Stelle eingebunden (Benutzerseite als Baustelle) und das Ergebnis – die als Infobox bezeichnete HTML-Tabelle in der Normalansicht – analysiert. Der erstaunlichste Aspekt war für mich, dass der Abschnitt „Enzymklassifikation“ jetzt „Inhibitorklassifikation“ hieß.

Die resultierende Tabelle in der Normal-Ansicht wurde in einen Schreib-Programm und einem Tabellenkalkulations-Programm weiter verarbeitet.

Die subjektiv als „atomar“ erscheinenden Schriftzüge wurden strukturiert, nummeriert und katalogisiert. Es erwies sich als sinnvoll, den Parametern möglichst markante und einmalige, wenn auch sachlich sinnlose Werte zuzuordnen, um sie als Schriftzüge in der Infobox wiederzufinden: z. B. |CASergänzend="CASergänzend" freier Text.

Zeichenketten
Bearbeiten

Anfangs unterschied ich zwischen allgemeinen und konkreten Schriftzügen, später wurde daraus ein Konzept

  • mit Eingabe-Elementen – den Parametern und Argumenten (Parameter-Werten) – und
  • mit Anzeige-Elementen – den Überschriften, ›optischen Parametern‹ und ›optischen Argumenten‹ –

auf der einen Seite sowie

  • mit allgemeinen Elementen – den Parametern, Überschriften und ›optischen Parametern‹ – und
  • mit konkreten Elementen – den Argumenten (Parameter-Werten) und ›optischen Argumenten‹ –

auf der anderen Seite.

Den Hintergrund dieser Überlegungen bildete meine Absicht, eine alphabetisch sortierte Tabelle zu erstellen, die alles enthält, was Buchstaben hat und bei Anwendung der Vorlage „Infobox Protein“ wiederkehrender Natur ist. Deshalb habe ich einen weiteren „Arbeitsbegriff“ eingeführt, die ›konstante, atomare Zeichenkette‹, die einen allgemein verwen­deten, nicht mehr verkürzbaren Textteil darstellt.

Das soll mit einem Beispiel verdeutlicht werden, bei dem ein zugrunde liegender Wikitext |OMIM=103600 in einer Vorlage-Einbindung den Schriftzug „OMIM: 103600“ in der resultierenden Infobox hervorruft: "OMIM" wäre in diesem Fall eine ›konstante, atomare Zeichenkette‹. Der Schriftzug in der Infobox hat einen allgemeinen Teil, nämlich „OMIM: “ und einen konkreten Teil, nämlich „103600“. Der zugrunde liegende Wikitext hat ebenfalls einen allgemeinen und einem konkreten Teil; den Parameter OMIM mit seinem konkreter Wert 103600. Die beiden allgemeinen, in gleicher Form wiederkehrenden (also ›konstanten‹) Komponenten der „Infobox Protein“ – das Anzeige-Element „OMIM: “ und das Eingabe-Element OMIM – beinhalten eine gemeinsame, nicht mehr sinnvoll teilbare Zeichenkette, die also ›atomar‹ ist, nämlich "OMIM".

Doppelpunkten mit Leerzeichen, die der optischen Abgrenzung dienen, habe ich einen Sonderstatus eingeräumt, es sind zwar Zeichenketten, werden aber als Hervorhebungen betrachtet, ähnlich wie die Umrandungen von Tabellenzellen. Es gibt ein Komma dass im Zusammenhang mit den Parametern EC-Nummer und Kategorie in die Infobox geschrieben wird; eigentlich sind es zwei Kommas. Dieses Komma findet sich zum einen innerhalb einer ›konstanten, atomaren Zeichenkette‹ – nämlich „EC, Kategorie“ – und zum zweiten vor dem Schriftzug, der durch den Wert des Parameters Kategorie hervorgerufen wird. Im zweiten Fall wird dieses Komma weniger als Teil eines Schriftzugs, sondern eher als Hervorhebung betrachtet.

Die Tabelle mit den allgemeinen Zeichenketten, die in der „Infobox Protein“ angewendet werden oder auftreten können, könnte also ungefähr so aussehen:

Zeichenketten Anzeige- und Eingabe-Elemente
...
EC, Kategorie Anzeige-Element, ›optischer Parameter‹: "EC, Kategorie" ...
...
Kategorie Eingabe-Element, Parameter: "Kategorie"; siehe ...
...
OMIM 1. Anzeige-Element, ›optischer Parameter‹: "OMIM:"; siehe ...
2. Eingabe-Element, Parameter: "OMIM"; siehe ...
...

Da ich unmöglich alle Varianten durchtesten konnte, die es geben könnte, entschied ich mich, den hauptsächlich zugrunde liegenden Programm-Code systematischer zu durchforsten (Vorlage „Infobox Protein“, Programm-Code: oldid=183851377). Ich habe den Quell-Code kopiert und in einem Schreibprogramm und einen Tabellenkalkulations-Programm weiter „verarbeitet“. Ähnlich wie bei den ›konstanten, atomaren Zeichenketten‹ ging es darum, alles zu erfassen, was allgemein auftreten kann. Ein Vorteil dieser Vorgehensweise gegenüber dem Testen ist, dass auch Code erkannt werden kann, der sich in einer konkreten Anwendung möglicherweise nicht auswirkt.

Der Code wurde mit „Suchen und Ersetzen“ schrittweise in möglichst sinnvolle Einzelteile zerlegt und zeilenweise geordnet. Anschließend wurde mit „Duplikate entfernen“ die Redundanz reduziert und dadurch das Vorkommen geprüft. Die Vorgehensweise erforderte einige „Handarbeit“ meinerseits, z. B., weil „Suchen und Ersetzen“ innerhalb eines Schreib-Programms kein professionelles Analyse-Werkzeug innerhalb einer Entwicklungsumgebung (IDE) ist.

So konnte ich beispielsweise durch „Abhacken“ der Zeilen hinter "]]" zwar ganz gut die internen Verknüpfungen zu Wikipedia-Seiten isolieren, aber nur umständlich herausfinden, wo ein einzelnes "en" herkam. Durch Rückverfolgung von Zeilennummern sah ich dann, dass dies die Endung eines Links war, nämlich von [[Isoform]]en.

Die Quell-Code-Analyse zeigte, dass zwei Parameter, die zuvor als ungültig (unbekannt) getestet worden sind – „Bild2“ und „Bild_legende2“ – durchaus im Quell-Code auftreten.

Der Grund dafür, dass der Programm-Inhalt für die Parameter „Bild2“ und „Bild_legende2“ nicht wie erwartet abgearbeitet wird, ist eine Code-Bereich, der dem „eigentlichen“ Programm-Code folgt und der „Parameterwartung“ genannt wird. In diesem Bereich werden „Bild2“ und „Bild_legende2“ nicht aufgeführt.

Einschub – „Die Bereiche im Programm-Code der Vorlage“ ↙↙

Ein weiterer, bereits zuvor als ungültig eingestufter Parameter-Name, der in der Dokumentation gefunden wurde, ist „AltSymbol“. Für diese Parameter-Bezeichnung habe ich im Code eine gültige Schreibweise gefunden: AltSymbols.

Es gibt – soweit ich das überblicken kann – innerhalb der Vorlage „Infobox Protein“ in den betrachteten Versionen fünf Bereiche, in denen Parameter-Namen auftauchen: drei in der Dokumentation und zwei im Programm-Code.

In der Dokumentation (oldid=175729659) waren drei Abschnitte vorhanden, in denen Listen oder Tabellen mit Parameter-Namen gefunden werden konnten. Im Abschnitt "Kopiervorlage" gibt es eine Vorlage-Syntax mit 41 Namen als Kopiervorlage für die Einbindung in Artikeln, im Abschnitt "Vorlagenparameter" stehen 43 Namen mit ihren „Features“, z. B. Datentypen, und im Abschnitt "Parameter-Details" steht eine Tabelle mit Erklärungen und Beispielen.

Im Programm-Code (oldid=183851377) habe ich zwei Bereiche entdeckt, in denen Parameter-Namen auftauchen: den „eigentlichen“ Programm-Code (43 Namen), der die Anweisungen für das Schreiben einer Infobox als Tabelle mit Wikitext enthält und den ich fürderhin "Programmablauf-Bereich" nenne und den Bereich "Parameterwartung" (41 Namen), in dem definiert wird, welche Parameter-Namen Gültigkeit haben.

Insgesamt habe ich 44 Parameter-Benennungen gefunden. Die meisten Parameter-Namen, 40 an der Zahl, sind konsistent, d. h., sie tauchen in allen oben genannten Bereichen auf. Es gibt drei bis vier Namen, die inkonsistent angewendet wurden: die beiden Namen „Bild2“ und „Bild_legende2“ und ein dritter Name, der in einer ungültigen Schreibweise, „AltSymbol“ und einer gültigen Schreibweise, AltSymbols auftaucht.

Überschriften, Abschnitte, Blöcke und die Zuordnung von Parametern
Bearbeiten

Sowohl bei der Betrachtung der Zeichenketten in Vorlage-Einbindungen und den resultierenden Infoboxen, als auch der Zeichenketten im Programm-Code und der Dokumentation wurde deutlich, dass die Einteilung von Abschnitten nach Überschriften nicht ausreicht, da deren Auftreten und die konkret genutzten Namen variieren können. Erst die „Erfindung“ der ›Blöcke‹, einer Art potentieller Abschnitte, machte es mir möglich, die Parameter den Abschnitten zuzuordnen, indem ich die ›Blöcke‹ als Vermittler genutzt habe:

  • Parameter   ↔   ›Block‹   ↔   Überschrift/ Abschnitt

Eigentlich hatte ich vor der Analyse folgende Verhältnisse erwartet:

  • Parameter  ←n:1→   Überschrift/ Abschnitt

Es sieht aber wohl eher so aus:

  • Parameter   ←m:n→   Überschrift/ Abschnitt

Mit ihrem ›Block‹ als Vermittler haben sowohl Parameter als auch Überschriften und Abschnitte eine „gemeinsame Anlaufstelle“; wobei die Adresse erst einmal nur für die Überschriften bzw. für die Abschnitte eindeutig ist:

  • Parameter   ←m:n→   ›Block‹   ←1:n→   Überschrift/ Abschnitt

Von den 42 Parametern, die unterm Strich in der Vorlage „Infobox Protein“ anwendbar waren (Programm-Code: oldid=183851377), wenn man von Unter-Vorlagen absieht, sind 40 eindeutig „ihrem ›Block‹“ zuzuordnen, während zwei Parameter die Ausnahme bilden:

  • Regel: Eindeutiger Parameter   ←n:1→   ›Block‹   ←1:n→   Überschrift/ Abschnitt
  • Ausnahme: Mehrdeutiger Parameter   ←m:n→   ›Block‹   ←1:n→   Überschrift/ Abschnitt

Durch die Art meiner Analyse ist folgende Aussage sehr sicher:

  • (Zahl aller Parameter) = 42 = (Zahl der eindeutigen Parameter) + (Zahl der mehrdeutigen Parameter)

Ich kann auch mit guter Glaubwürdigkeit die Aussage treffen, dass 40 Parameter bezüglich ihrer Wirkung in den ›Blöcken‹ eindeutig sind – allerdings nicht mit 100-%-iger Sicherheit.

Einschub – „Parameter-Namen an unterschiedlichen Stellen“ ↙↙
Extra-Analysen für mehrdeutig wirksame Parameter
Bearbeiten

Es ist relativ schwer, herauszufinden, welche Parameter mehrdeutig wirksam sind, d. h. in verschiedenen Bereichen einer Infobox eine Auswirkung zeigen, die ich ›Blöcke‹ genannt habe. Da der Programmablauf-Code streng prozedural abläuft, ließe sich auswerten, an welcher Stelle eine Tabellenzeile mit Überschrift (a) geschrieben und an welcher nächsten Stelle die nächste Überschrift (b) geschrieben wird:

Erscheint ein Parameter-Name dann in den Bedingungen für die Ausgabe von a oder zwischen den jeweiligen Bedingungen für die Ausgabe von a und b, dann hat er wahrscheinlich in Abschnitt a eine Auswirkung. (Andersherum entsprechend: erscheint ein Parameter-Name weder in den Bedingungen für die Ausgabe von a noch zwischen den jeweiligen Bedingungen für die Ausgabe von a und b, dann hat er wahrscheinlich in Abschnitt a keine Auswirkung.)

Allerdings gibt es variable Überschriften-Namen und rein theoretisch könnte man das Schreiben von Tabellenzeilen mit demselben Überschriften-Namen in verschiedenen Stellen auslösen, was meines Wissens in der Vorlage „Infobox Protein“ nicht gemacht wurde. Aber ich habe auch mal gedacht, dass jeder Parameter nur in einem Abschnitt wirkt.

Im Allgemeinen habe ich die ›optischen Argumente‹ in der Infobox den Argumenten (den Werten der Parameter) in der Vorlage-Einbindung gegenüber gestellt und diese bei ausreichender Ähnlichkeit „gematcht“. Dadurch konnten auch der jeweils passende Parameter und der entsprechende ›optische Parameter‹ gefunden werden:

Parameter   ←   Parameter-Wert   ≈   ›optisches Argument‹   →   ›optischer Parameter‹ 

Da Überschriften augenscheinlich jeweils von mehreren Parametern abhingen, aber nicht von den konkreten Parameter-Werten, wurde mit einer visuellen Zuordnung der Anzeige-Elemente, der ›optischen Parameter‹ eines Abschnitts zur entsprechenden Überschrift begonnen:

›optischer Parameter‹   ↔   Überschrift 

Beim Parameter HGNCid war es anders. Es blieb ein Element übrig, das erst einmal nicht zugeordnet werden konnte: ein Anzeige-Element, die Überschrift „Eigenschaften des menschlichen Proteins“. Unterhalb dieser Überschrift gab es zwar ›optische Parameter‹, die eine Überschrift namens „Eigenschaften des Proteins“ plausibel gemacht hätten, andererseits standen in der Infobox auch an anderer Stelle solche Eigenschaften.

Es ging also speziell um ein Protein, eines, das nur beim Menschen vorkommt und außerdem trat die Überschrift nicht immer auf. Es musste also irgendwo einen Parameter geben, dessen Anwesenheit die Überschrift bedingt. Im betreffenden Abschnitt hatte ich aber keinen passenden ›optischer Parameter‹ gefunden. Daher nahm ich an, dass dieser „vorausgesagte Parameter“ vom Typ Boolean wäre (also Ja / Nein) und kein ›optisches Argument‹ im Schlepptau hätte, sondern nur die bedingte Überschrift: wenn Ja, dann gäbe es die Überschrift und wenn Nein, dann nicht.

Die Suche nach der Zeichenkette „Eigenschaften des menschlichen Proteins“ im Programm-Code zeigte dann den Parameter "HGNCid" als Verursacher an:

  1. |-
  2. {{#if:{{{HGNCid|}}}|
  3. ! colspan="3" style="background:#90EE90;" {{!}} Eigenschaften des menschlichen Proteins
  4. }}
  5. |-

Das bedeutet etwa Folgendes:

  1. Schreibe einen Zeilenumbruch (|-).
  2. Starte ein Anfrage, ob ({{#if:) "HGNCid" irgendeinen Parameter-Wert hat ({{{HGNCid|}}}); wenn ja, dann (|),
  3. lege eine Tabellenzelle an (), die sich über drei Spalten erstreckt (colspan="3" ) und einen grünen Hintergrund hat (style="background:#90EE90;" ) und schreibe in diese Zeile ({{!}} ) einen Text (Eigenschaften des menschlichen Proteins).
  4. Schließe die Anfrage ab (}}).
  5. Schreibe einen Zeilenumbruch (|-).

Also alles wie gedacht: der Parameter "HGNCid" wirkt quasi wie eine boolsche Variable, also eine, die zwei Werte – Ja oder Nein – annehmen kann, nur, dass hier nicht der Wert selbst, sondern die Anwesenheit eines Parameters entscheidet. Hat "HGNCid" irgendeinen Parameter-Wert, dann wird eine Überschrift geschrieben und wenn kein Wert vorhanden ist (abwesender oder leerer Parameter), dann wird auch keine Überschrift eingefügt.

Merkwürdig blieb allerdings, dass die Dokumentation im Abschnitt „Parameter-Details“ beim Parameter "HGNCid" (oldid=175729659#Parameter-Details) in der Tabellenspalte „Möglicher Wert“ als Beispiel 399 angab, statt "Ja/ Nein" oder etwas ähnliches. Über eine bedingte Überschrift stand nichts in der Tabellenzeile zu "HGNCid" im Abschnitt „Parameter-Details“. Stattdessen wurde für den Parameter "HGNCid" erklärt, dass dieser eine externe Verknüpfung zu einer Datenbank herstellen würde. Für diese Datenbank, HUGO Gene Nomenclature Committee, wurde eine Verknüpfung zu einem Wikipedia-Artikel angegeben („HGNC“), den es allerdings nicht (mehr) gab/ gibt.

Ich testete den Parameter einzeln: abwesend, leer (|HGNCid=), mit dem Beispiel-Wert (|HGNCid=399) und mit einem sinnlosen Wert (|HGNCid=ß).

Es blieb dabei: kein Parameter-Wert bedeutete keine Überschrift und irgendein Parameter-Wert für HGNCid bedeutete, dass die Überschrift „Eigenschaften des menschlichen Proteins“ in der Infobox auftrat; sonst machte der Parameter nichts weiter.

Ich mutmaßte, dass das widersprüchliche Verhalten des Programm-Codes in Bezug zur Dokumentation der Vorlage „Infobox Protein“ (Programm-Code: oldid=183851377; Doku: oldid=175729659) darauf zurückzuführen sei, dass übersehen wurde, die Dokumentation anzupassen, nach dem der Code überarbeitet wurde.

Ich weis nicht mehr genau, wie ich zuerst erkannt habe, dass HGNCid in Bezug zum Parameter Symbol stand, wahrscheinlich in Zusammenhang mit der späten „Entdeckung“ des Parameters AltSymbols, der ebenfalls mit Symbol zusammenwirkt. (AltSymbols wurde nur im Programm-Code gefunden, da der Parameter-Name in der Dokumentation in einer ungültigen Schreibweise, „AltSymbol“, stand.) Wenn man bei der Betrachtung einzelner Parameter von AltSymbols ausgeht, erkennt man unschwer, dass der Parameter Symbol dazu gehört. Das ergibt sich aus dem Namen selbst und dadurch, dass es dann nahe liegt, die Dokumentations-Angaben zu der anderen Schreibweise („AltSymbol“) und zum Parameter Symbol als zutreffend zu betrachten.

Wenn man einen Parameter einzeln testet, kann man nicht erkennen, welche anderen Parameter diesen Parameter beeinflussen; daher muss man diesen Parameter, beispielsweise Symbol, mit allen in Frage kommenden anderen Parametern zusammen testen. Wenn man Symbol in einem Test zusammen mit sehr vielen anderen Parametern – unter anderem HGNCid – anwendet, erkennt man nicht ohne Weiteres, dass der Parameter-Wert von HGNCid das ›optische Argument‹ von Symbol modifiziert. Die Wirkung ist sehr versteckt, da HGNCid sich nur auf ein Verknüpfungsziel auswirkt. Man erkennt das letztlich mit meinen Mitteln nur, indem man den entsprechenden Link anklickt und im URL den Parameter-Wert von HGNCid erkennt, im verwendeten Beispiel die Zahl 399: "https://www.genenames.org/tools/search/#!/all?query=399".

Nachdem nun klar war, dass Symbol, AltSymbols und HGNCid eine Funktionseinheit bildeten, habe ich eine systematische Testserie durchgeführt. Die Untersuchung war ähnlich angelegt, wie eine vorausgegangene mit zwei anderen Parametern ("EC-Nummer" und "Kategorie") und drei Zuständen (Abwesend, Leer, Befüllt).

Eine Anwendung von drei Zuständen auf drei Parameter hätte wohl 27 Infoboxen ergeben (33 = 27). Um die Zahl geringer zu halten, habe ich nur zwei Zustände einbezogen – "Abwesend" und "Befüllt". Das würde nur 23 = 8 Kombinationen ergeben und zusätzlich habe ich die Kombination „Alle Parameter abwesend“ weg gelassen – also waren es sieben Kombinationen (23−1 = 7). Für die Zuordnung der genauen Abhängigkeiten habe ich jeden Parameter nummeriert (Symbol: 1, AltSymbols: 2 und HGNCid: 3) und mit der jeweils anderen Nummer kombiniert. Die Nummern entsprechen dem Zustand "Befüllt" und das Weglassen der Nummer dem Zustand "Abwesend", so dass sich sieben Kombinationen mit entsprechenden „Namen“ für die Vorlage-Einbindungen und die Infoboxen ergaben (1, 2, 3, 1+2, 1+3, 2+3 und 1+2+3).

Für die Kenntnis über das Verhalten des Parameters UniProt habe ich keine vollständige Analyse angewendet, sondern „herum probiert“. Die potentiellen Kandidaten für einen Zusammenhang zu "UniProt" wurden nacheinander in einer Vorlagen-Einbindung ausgetauscht, um dann das jeweilige Ergebnis – die Tabelle, welche die „Infobox Protein“ darstellt – zu betrachten.

Trotz der komplexen Zusammenhänge habe ich versucht, möglichst alle ›konstanten, atomaren Zeichenketten‹ (also die allgemeinen Eingabe- und Anzeige-Elemente), die mit der „Infobox Protein“ im Zusammenhang stehen, in einer Tabelle aufzulisten.

Einschub – „Konstante, atomare Zeichenketten“ ↙↙

Weitere Gedanken zu den Untersuchungen

Bearbeiten

Versionskontrolle

Bearbeiten

Wenn irgendwo Software weiterentwickelt wird, dann gibt es häufig Betaversionen, die man irgendwo testen kann, wo es nicht weh tut, wenn man sich dafür interessiert. Auch bei den stabilen Versionen ist es meist so, dass man sich gegen die allerneuste Version entscheiden kann, wenn man etwas mit einer älteren begonnen hat. Bei größeren Veränderungen wird versucht das Alte und das Neue parallel existieren zu lassen. Beispielsweise ließen sich die alten *.doc-Dateien durch die Word-Anwendungen von Microsoft weiter nutzen, nachdem die *.docx-Dateien dazu kamen.

Bei hochdynamischen Sachen – z. B. automatischen Updates – ist das anders, da „wird gegessen, was auf den Tisch kommt“. Die meisten Hersteller bemühen sich darum, dass die Änderungen kaum das Arbeitsergebnis des Anwenders betreffen.

In der Wikipedia ist das Arbeitsergebnis in vielen Fällen eine Artikel-Version, die in der Normalansicht einen Enzyklopädie-Eintrag darstellt. Der größte Teil des zugrunde liegenden Textes ist Wikitext, der nach festen Regeln funktioniert: wenn ich heute »''kursiv'' und '''fett'''« reinschreibe, dann wird das auch morgen »kursiv und fett« angezeigt.

In vielen Artikeln besteht ein nicht unerheblicher Teil des Wikitextes aus der Einbindung von Vorlagen – aus komplexen Anweisungen, die den Wikitext zu etwas anderem machen, als einer reinen Auszeichnungssprache. Eine Artikelschreiberin muss dadurch nicht bloß den überschaubaren Wikicode-Regeln lernen (H:Wikisyntax), sondern auch die „Parameter-Nutzungs-Codes“ der jeweiligen Vorlagen – mehr noch – auch die zur jeweiligen Zeit aktuellen Gegebenheiten der jeweiligen Vorlage (und ein Artikelschreiber muss das auch).

Ganz so schlimm, wie in dem vorausgehenden Satz dargestellt, ist es nicht, da sich die Vorlagen nicht jeden Tag ändern. Außerdem werden einige Vorlagen-Einbindungen auch „betreut“: der VE (VisualEditor: WP:VE, H:VE) macht aus Parametern und Werten Felder und speziell durch das Feature  Belegen wird die Verwaltung der komplexen <ref...>{{...}}</ref>-Anweisungen beim Schreiben handhabbar.

Dennoch halte ich es gegenwärtig – aus Gründen der zeitlichen Stabilität – für problematisch, Vorlagen zu verbessern, da der Name der Vorgängerversion beibehalten wird. Wenn jemand eine Vorlage in einem Artikel einbindet, dann optimiert er dies auf die Normalansicht des Artikels zur Zeit der Einbindung. Verbessert jemand danach die Vorlage, kann sie/ er den/ die Artikel zwar anpassen, die Vorgängerversion des Artikels wird aber vermutlich suboptimal bis falsch angezeigt:

Schema der asynchronen Änderung von Komponenten mit Harmonie-Brüchen im Zusammenspiel
Programm-Version Version der Einbindung Anzeige-Ergebnis im Artikel
Alt Alt Gut. Eine bestehende Vorlage (Programm-Version: Alt) wurde so in einem Artikel eingebunden (Version der Einbindung: Alt), dass in diesem Artikel in der Normalansicht alles einigermaßen passt (Artikel-Version: Alt).
Neu Alt Schlecht. Der neue Vorlage-Programm-Code (Programm-Version: Neu) passt nicht gut zum alten Wikitext im Artikel (Version der Einbindung: Alt).
Neu Neu Sehr gut. Der Artikel wurde angepasst. Der Wikitext im Artikel, welcher die Einbindung der Vorlage gewährleistet (Version der Einbindung: Neu), setzt nun den zuvor veränderten Programm-Code (Programm-Version: Neu) um.

Man mag jetzt sagen, dass die Übergänge, in denen der alte Vorlage-Einbindungs-Code mit dem neuen Vorlage-Programm-Code nicht gut zusammenarbeitet, nur drei Minuten dauert; aber es gibt nicht selten mehr als einen Artikel, in dem die jeweilige Vorlage eingebunden wurde. Um ein Beispiel zu nennen, wurden für die Vorlage „Infobox Protein“ am 4. Juli 2020 1679 Artikel gefunden, in denen diese Vorlage eingebunden war. Ein Artikel hatte sechs Einbindungen (Signalerkennungspartikel), ein anderer Artikel hatte fünf Einbindungen (Pertussis-Toxin), kein Artikel hatte vier Einbindungen, 11 Artikel hatten drei Einbindungen (z. B. Endothelin), 43 Artikel (43=56-13) hatten zwei Einbindungen und 1679-43-11-0-1-1 Artikel hatten genau eine Einbindung.

Weiterhin ist es so, dass man in älteren Artikelversionen teilweise nicht mehr erkennen kann, was damals eigentlich gewollt wurde, da viele Vorlagen geändert worden, die ihrerseits auf Vorlagen zurückgreifen, die geändert oder gelöscht worden sind.

Wenn man sich mit den Zusammenhängen zwischen den Parametern einer einzelnen Vorlage auseinander gesetzt hat, dann kann es sein, dass die gewonnenen Erkenntnisse durch die Verbesserungen einer Vorlage mit der Zeit obsolet werden. Es ist auch schwierig, eine bestimmte Version der Dokumentation einer Vorlage der jeweiligen Version des Programm-Codes der Vorlage zuzuordnen, da diese beiden Sachen zumeist – wie sich das gehört – an verschiedenen Stellen untergebracht sind.

Unter #Es gibt zahlreiche historisch gewachsene Altlasten steht zwar :

  • „...Namen von Vorlagen oder deren Parametern können praktisch nicht mehr geändert werden...“.

Ich denke aber, dass die Namen von Parametern durchaus geändert werden könnten, wenn nicht die alten Vorlagen geändert, sondern neue Vorlagen erstellt werden würden, die etwas anders heißen. Es wird immer so sein, dass eine Maßnahme von heute die Altlast von morgen sein wird. (-; Und glaubt mir, morgen kommt ganz schnell... ;-)

Ich denke, wir sollten dem Alten das Neue hinzu gesellen, statt es radikal zu ersetzen. Es gibt immer Übergangszeiten, die man möglichst smart überbrücken muss.

  • Kleiner Vergleich aus der Biologie: Manch ein Krebs wirft seine alte, schützende Hülle zwar weg, wenn er eine größere braucht, er hat dann aber unter der alten Hülle schon was „vorbereitet“. Die Übergangszeit als weicher, angreifbarer „Butterkrebs“ ist dadurch überschaubar und der Krebs kann sich zurückziehen, solange bis seine neue Hülle ausgehärtet ist.

Die Wikipedia ist immer online, deshalb ist Zurückziehen, solange eine Vorlage überarbeitet wird, keine Option. Die alte Version muss weiter Dienst tun. Würde man eine Vorlage zur weiteren Optimierung außerhalb der „Produktiv-Umgebung“ überarbeiten und dann dort testen wollen, könnte man sie zwar wieder mit dem gleichen Namen in die „Produktiv-Umgebung“ zurück bringen, wenn das Ziel erreicht wäre, die bereits genannten Nachteile blieben aber.

Ein Kompromiss wäre, dass man eine z. B. hinsichtlich der VE-Kompatibilität anzupassende Vorlage anders nennt, als das möglicherweise in einigen Punkten leistungsfähigere Vorbild.

So könnte der „Vorlage:Infobox Protein“ eine neue „Vorlage:VE Infobox Protein“ (der Name ist nur ein Beispiel) zur Seite gestellt werden, wobei letztlich beide Vorlagen ungefähr das gleiche machen, nämlich eine Infobox für die Eigenschaften eines Proteins zur Verfügung zu stellen. Der Unterschied wäre nur, dass die bewährte „Vorlage:Infobox Protein“ es einem Kompaktcodeprofi einfacher macht, damit direkt den prägnanten Quelltext zu lesen, während ein Liebhaber der Normalansicht wohl eher die umständliche, VE-angepasste „Vorlage:VE Infobox Protein“ nehmen würde, in der wohl jedes Anzeige-Element der resultierenden Infobox einzeln durch ein Eingabe-Element in Vorlage (Parameter+Wert) unterlegt sein müsste.

Unter Wikipedia:Technische WünscheTopwünscheLeichter mit Vorlagen arbeitenHäufigst genannte Probleme #Es gibt zahlreiche historisch gewachsene Altlasten steht:

  • „...Namen von Vorlagen oder deren Parametern können praktisch nicht mehr geändert werden...“.

Es ist auch schwierig, einen Optimierungs-Gedanken an die Community heranzutragen, wenn sich die Gegebenheiten, auf die sich die Ausführungen beziehen, zwischenzeitlich geändert haben.

Anhang des Beitrags

Bearbeiten

Überschriften, Abschnitte und die Blöcke A bis H

Bearbeiten

Eine Anwendung der „Infobox Protein“ (Version von Vorlage:Infobox_Protein: oldid=183851377) kann acht Bereiche enthalten, die ich ›Blöcke‹ genannt habe und die zumeist in etwa Abschnitten entsprechen.

Blöcke A bis H Mögliche Überschriften Angenommene Funktion A bis H↔
Block A Entspricht zumeist dem Wert des Parameters "Name" Titel der jeweiligen Infobox Protein und Einleitung. A↔
Block B Keine Überschrift oderEigenschaften des menschlichen Proteins Fortsetzung der Einleitung durch weitere Eigenschaften oder neuer Abschnitt mit speziellen Eigenschaften, nämlich denen der menschlichen Protein-Variante. B↔
Block C Bezeichner Aufzählung von Symbolen und Identifikationsnummern mit ihren Fundorten in externen Datenbanken. C↔
Block D Arzneistoff­anga­ben Angaben zum Protein, wenn es ein Arzneistoff ist. D↔
Block E Transporter-Klassi­fikation Angaben zum Protein, wenn es ein Membranprotein mit Transportfunktion ist. E↔
Block F EnzymklassifikationoderEnzymklassi­fikationenoderInhibitorklassifikation Angaben zum Protein, wenn es ein Enzym ist. F↔
Block G Vorkommen Angaben zum Vorkommen und Fehlen des Proteins in Lebewesen. G↔
Block H Orthologe Angaben zu sogenannten orthologen Proteinen, d. h. verwandten Gen- bzw. Proteinvarianten in verschiedenen Lebewesen als Tabelle. H↔

Kommentiertes Code-Segment

Bearbeiten

Code-Ausschnitt der Vorlage:Infobox_Protein (oldid=183851377), welcher sich mit dem Teil der Infobox beschäftigt, in dem die Parameter EC-Nummer und Kategorie zur Anwendung kommen.

Code Beschreibung
... Der vorausgehende Code kümmert sich nicht um die Parameter "EC-Nummer" und/ oder "Kategorie" und wird deshalb ausgelassen.
|- Zeilenumbruch für die Wikitext-Tabelle.
{{#if: {{{EC-Nummer|}}}{{{Kategorie|}}}
{{{Peptidase_fam|}}}{{{Inhibitor_fam|}}}
{{{Reaktionsart|}}}{{{Substrat|}}}{{{Produkte|}}}
{{{MoreEC1|}}}{{{MoreEC2|}}}{{{MoreEC3|}}} |
Prüfung der aufgeführten Parameter. Wenn min­destens einer dieser Para­meter auftritt, dann ...
  ! colspan="3" style="background:#90EE90;" 
{{!}} {{#if:
{{{Inhibitor_fam|}}}|Inhibitorklassifikation|
{{#if:
{{{MoreEC1|}}}{{{MoreEC2|}}}
{{{MoreEC3|}}}|Enzymklassifikationen|Enzymklassifikation}}}}
... werden die Formatierungsangaben der Tabellenzelle geschrieben; es wird auf Inhibitor_fam geprüft und gegebenfalls „Inhi­bitor­klassifi­kation“ eingetragen. Ansonsten wird noch ausgewertet, ob MoreEC1 bis 3 auftreten und wenn das so ist, wird „Enzym­klassifi­ka­tionen“ eingetragen. Wenn weder Inhibitor_fam, noch MoreEC1 bis 3 auftreten, wird „Enzymklassifikation“ eingetragen.
  {{!}}- Zeilenumbruch für die Wikitext-Tabelle.
  Nachdem diese Überschriftenzeile der Infobox geschrieben wurde, werden die beiden Parameter EC-Nummer und Kategorie ausgewertet. Zutreffende Code-Segmente werden in runden Klammern angegeben:
  {{#if: {{{EC-Nummer|}}}{{{Kategorie|}}}| Wenn ({{#if:) mindestens einer der beiden Parameter auftritt ({{{EC-Nummer|}}}{{{Kategorie|}}}), dann (|) ...
  {{!}} [[EC-Nummer|EC, Kategorie]] ... wird eine neue Tabellenzelle eröffnet ({{!}}) und ein Verknüpfungstext geschrieben ([[EC-Nummer|EC, Kategorie]]), der „EC, Kategorie“ lautet und den Artikel EC-Nummer als Linkziel hat. Die Tabellenzelle ist die erste einer Zeile, da bereits eine Zeilenumbruch geschrieben wurde (siehe weiter oben).
  {{!}} colspan="2" style="text-align:center;" {{!}} {{#if:{{{EC-Nummer|}}}|<span class="plainlinks">[https://www.brenda-enzymes.org/php/result_flat.php4?ecno={{{EC-Nummer}}} {{{EC-Nummer}}}]</span>}}{{#if: {{{Kategorie|}}}|,&nbsp;[[{{{Kategorie}}}]]}} }} Es wird eine zweite Tabellenzelle eröffnet ({{!}}), die ein Verbund von zwei Zellen werden soll (colspan="2") und deren Text zentriert werden soll (style="text-align:center;"). Diesen Forma­tierungs­anweisungen soll der eigentliche Text folgen ({{!}}), dessen Inhalt an Bedingungen geknüpft wird ({{#if:...}}). Und zwar soll beim Auftreten von EC-Nummer ({{{EC-Nummer|}}}|) ein formatierter (<span ...>...</span>), externer Link ([https://...]) geschrieben werden, der einen allgemeinen (www.brenda-enzymes.org/php/result_flat.php4?ecno=) und einen speziellen Teil ({{{EC-Nummer}}}) beinhaltet. Dieser spezielle Teil entpricht, wie auch der Verknüpfungstext ({{{EC-Nummer}}}), der EC-Nummer.
Die Verknüpfung wird wie eine interne Wikipedia-Verknüpfung formatiert (class=“plainlinks“) und nicht wie eine externe Verknüpfung, die sie eigentlich ist.
Falls der Parameter Kategorie auftritt ({{#if: {{{Kategorie|}}}|), werden ein Komma und ein geschütztes Leerzeichen angehängt (,&nbsp;) und es folgt die Wikipedia-intern verknüpfte „Kategorie“-Angabe ([[{{{Kategorie}}}]]).
  {{!}}- Umbruch der Tabellenzeile
... Es folgt weiterer Code, der die beiden Parameter "EC-Nummer" und "Kategorie" nicht unmittelbar einbezieht.

Beispiele für die Umsetzung des EC-Nummern-Systems

Bearbeiten
Unter BRENDA wurde ein Schema gefunden (2019-11), das – wenn man einige graphische Elemente weg lässt – in etwa so aussah, wie rechts dargestellt.
EC Tree
2 Transferases
2.1 Transferring one-carbon groups
2.1.1 Methyltransferases
2.1.1.37 DNA (cytosine-5-)-methyltransferase
Unter MetaCyc wurde eine Zeichenkette gefunden (2019-11), die die Hierarchie­verhält­nisse versinnbildlicht, wie rechts dargestellt. Parent class: EC-Numbers → 2 -- Transferases → 2.1 -- Transferring one-carbon groups → 2.1.1 -- Methyltransferases

Doppel-Parameter schematisch

Bearbeiten
Allgemeine Form Konkretes Beispiel
 
Der allgemeine Einbindungs-Code einer Vorlage:

{{...|Parameter1 = Argument1 |Parameter2 = Argument2 |...}}

wird als:

„Doppel-Parameter“ mit „Doppel-Argument“

interpretiert und erzeugt zwei Spalten:

„Optischer Doppel-Parameter“

basiert optisch auf dieser Anordnung:

„Optisches Doppel-Argument“

basiert optisch auf dieser Anordnung:

Parameter1, Parameter2 Argument1, Argument2
Dies ergibt Schriftzüge, etwa dieser Form:
Teil 1, Teil 2 des optischen Doppel-Parameters Teil 1, Teil 2 des optischen Doppel-Arguments
 
Ein konkreter Einbindungs-Code der Vorlage „Infobox Protein“:

{{...|EC-Nummer = 2.1.1.37 |Kategorie = Methyltransferase |...}}

wird als:

„Doppel-Parameter“ mit „Doppel-Argument“

interpretiert und erzeugt zwei Spalten:

„Optischer Doppel-Parameter“

basiert optisch auf dieser Anordnung:

„Optisches Doppel-Argument“

basiert optisch auf dieser Anordnung:

EC-Nummer, Kategorie 2.1.1.37, Methyltransferase
Dies ergibt diese Schriftzüge:
EC, Kategorie 2.1.1.37, Methyltransferase

Beispiele – Sichtweisen zu Hierarchie-Ebenen von Kategorie und EC-Nummer

Bearbeiten

Die Beispiele 1.a), 1.b) und 1.c) wurden im Zeitraum der Gültigkeit der Referenzversionen geprüft (siehe #Die Referenzversionen im Einzelnen) und die Beispiele 2.a) sowie 2.b) wurden später gefunden. Zwischen 1. [ 1.a), … ] und 2. [ 2.a),  ] traten zwar Änderungen am Programmcode der Vorlage auf (Vorlage:Infobox_Protein, Referenzversion vom 19.12.2018 und nächste Version vom 27.12.2019, Versionsvergleich: diff=195259690&oldid=183851377), diese Änderungen betreffen die dargestellten Aspekte der Beispiel-Infoboxen jedoch nicht. Somit sind alle Beispiele vergleichbar.

Hierarchie-Ebene der Kategorie Beispiele für Infoboxen (schematisch)

oldid= Artikelversion

1. Übergeordnete Ebene

Wenn die Kategorie als übergeordnete Ebene betrachtet wird, dann gehört die angegebene EC-Nummer in diese Kategorie (›Gehört-in‹-Sichtweise).

  • Das Beispiel 1.a) zeigt eine Enzymklasse in der höchsten Ebene des EC-Systems; da keine höhere Kategorie vorhanden ist, wurde die "Kategorie" weggelassen.
  • Das Beispiel 1.b) zeigt die EC-Nummer passend zum Titel und eine übergeordnete Kategorie, die allerdings nicht eine Stufe, sondern zwei Stufen oberhalb der Kategorie liegt. Eine Stufe oberhalb (EC 2.1) wäre die Unterklasse mit dem sperrigen Titel "Transferring one-carbon groups" angesiedelt, für die es keinen Wikipedia-Artikel gibt.
  • Das Beispiel 1.c) hat einen Titel (DNA-Methyltransferasen), zu dem keine einzelne EC-Nummer passt. Daher wurden die drei passenden EC-Nummern weg gelassen (2.1.1.37; 2.1.1.72 und 2.1.1.113) und es wurde nur eine gemeinsame Unterklasse des EC-Systems als Kategorie benannt (Methyltransferase). Das Komma am Anfang eines Schriftzugs, dass dadurch entsteht, liefert keine sehr schlüssige Information.
1.a)
Transferasen
Enzymklassifikation
EC, Kategorie 2.-.-.-

oldid=170072500 (17.10.2017)

1.b)
Methyltransferasen
Enzymklassifikation
EC, Kategorie 2.1.1.-Transferase

oldid=192342265 (17.9.2019)

1.c)
DNA-Methyltransferasen
Enzymklassifikation
EC, Kategorie Methyltransferase

oldid=193718634 (3.11.2019)

2. Gleiche Ebene

Wenn die Kategorie als ergänzende Benennung zur EC-Nummer betrachtet wird, dann entspricht sie der Nummer und hat die gleiche Hierarchie-Ebene (›Entspricht‹-Sichtweise).

  • Das Beispiel 2.a) hat drei Bezeichnungen für Protein-Gruppen, die zugeordnet werden müssen. Es bleibt bei dieser Darstellung offen, welchen Bezug der Titel (DNA-Methyltransferasen) zu EC (2.1.1.-) und Kategorie (Methyltransferase) hat. Weder EC noch Kategorie meinen den Titel.
  • Das Beispiel 2.b) weist ebenfalls mehrere Bezeichnungen für Protein-Gruppen auf, wobei sich EC-Nummer und Kategorie auf die gleiche Hierachie-Ebene beziehen.

Die ›Entspricht‹-Sichtweise wurde in beiden hier gezeigten Fällen dort verwirklicht, wo der Titel der jeweiligen Infobox jeweils eine Gruppe von Proteinen präsentiert, die keine „Kategorie“ in EC-System ist; also weder eine Klasse, Unterklasse oder Unter-Unterklasse, noch ein Enzym-Eintrag bzw. eine Seriennummer. Die Mitglieder beider Gruppen – sowohl die der DNA-Methyltransferasen als auch die der Glycosidasen – gehören jeweils in genau eine Unter-Unterklasse des EC-Systems.

2.a)
DNA-Methyltransferasen
Enzymklassifikation
EC, Kategorie 2.1.1.-Methyltransferase

oldid=197225232 (27.2.2020)

2.b)
Amylasen
Enzymklassifikation
EC, Kategorie 3.2.1.-, Glycosidasen

oldid=196940224 (18.2.2020)

3. Untergeordnete Ebene

In diesem Fall wäre "Kategorie" ein einzelnes Beispiel innerhalb der Gruppe von Proteinen, die durch die EC-Nummer präsentiert wird, sozusagen eine Unterkategorie. Das ist vermutlich die unwahrscheinlichste Sichtweise, die eine Leserin oder ein Leser auf die Kategorie haben kann. Daher habe ich dazu kein Beispiel gefunden.

Die Referenzversionen im Einzelnen

Bearbeiten

Die folgenden Tabellen stellen die relevanten Versionen in Bezug zur Referenzzeit bzw. zum Stichtag zusammen; die Referenzversionen enthalten:

Artikel-Namensraum – Vorlage-Einbindung im Artikel
Name – Vorlage und Artikel Vorlagen-Einbindung wie am Stichtag (29. Sep. 2019) Gültigkeit "bis" und Nachfolge-Version der Vorlage-Einbindung Aktueller Link
Vorlage-Einbindung der „Infobox Protein“ im Artikel „DNA-Methyltransferasen ab 15. April 2019, oldid=187579075 – Artikel-Version gültig am Stichtag zur Referenzzeit;

es gibt weitere Artikel-Versionen mit derselben Vorlage-Einbindung – späteste am 3. Nov. 2019, oldid=193718634

bis 27. Februar 2020, ab da oldid=197225232 – Artikel-Version mit einer geänderten Vorlage-Einbindung DNA-Methyltransferasen
Vorlagen-Namensraum – Programmcode und Dokumentation
Name – Vorlage oder Dokumentation Gültigkeit "ab", Version am Stichtag (29. Sep. 2019) Gültigkeit "bis" und Nachfolge-Version Aktueller Link
Infobox Protein ab 19. Dez. 2018, oldid=183851377 bis 27. Dez. 2019, ab da oldid=195259690 Vorlage:Infobox Protein
Infobox Protein/Doku ab 3. April 2018, oldid=175729659 bis 27. Dez. 2019, ab da oldid=195259871 Vorlage:Infobox Protein/Doku
Infobox Protein/MoreEC ab 13. Sep. 2013, oldid=122513315 später als 29. April 2020 Vorlage:Infobox Protein/MoreEC
Protein Orthologe ab 1. Mai 2018, oldid=177045241 bis 16. März 2020, ab da oldid=197818503 Vorlage:Protein Orthologe
Protein Orthologe/Doku ab 7. Mai 2017, oldid=165298437 später als 29. April 2020 Vorlage:Protein Orthologe/Doku

Die Bereiche im Programm-Code der Vorlage

Bearbeiten
Rechts: Code-Auschnitte aus der Vorlage „Infobox Protein“.
  • „Eigentlicher Programmcode“ oder Programmablauf-Code (oben),
  • Parameterwartung (Mitte) und
  • Dokumentation (unten).

Vorlage:Infobox_Protein, Version: https://de.wikipedia.org/w/index.php?oldid=183851377;

gültig zwischen 19. Dez. 2018 und 27. Dez. 2019, also auch zur Referenzzeit (Stichtag 29. Sep. 2019).

  •  <onlyinclude>{| class="float-right hintergrundfarbe2 infobox wikitable" id="Vorlage_Infobox_Protein" style="fo ... 

 ... ausgelassener Text ... 

  •  ... ologe|}}} | {{{Orthologe}}} }}
  •  |}<!--
  •  
  •  Parameterwartung
  •  
  •  --><includeonly><span class="editoronly" style="display:none;">{{#invoke:TemplatePar|check
  •  |opt= Name= Bild= Bild_legende= Andere Namen= PDB= Groes ... 

 ... ausgelassener Text ... 

  •  ... ate= [[Vorlage:Infobox Protein]]
  •  }}</span></includeonly><!--
  •  
  •  --></onlyinclude>
  •  
  •  {{Dokumentation}}

Parameter-Namen an unterschiedlichen Stellen

Bearbeiten

Überblick zum Aufbau der Tabelle:

  • In der Tabelle werden alle 44 in der Vorlage „Infobox Protein“ gefundenen Parameter-Bezeichnungen (Programmcode oldid=183851377, Dokumentation oldid=175729659) alphabetisch sortiert dargestellt (Spalte Namen) und sind mit einem Index versehen (Spalte Idx, 1 bis 44).
  • Das jeweilige Vorkommen von Namen wird in den verschiedenen Abschnitten der Dokumentation (Spalten Kv, Vp und Pd; ) und in den verschiedenen Bereichen des Programmcodes (Spalten Pa und Pw) der Vorlage angegeben.
  • Dazu steht im jeweiligen Spaltenkopf die Anzahl der im zugeordneten Abschnitt bzw. Bereich gefun­denen Namen und in den einzelnen Zellen steht ein Index, der auf dem ersten Vorkommen des jewei­ligen Namens im jeweiligen Abschnitt oder Bereich basiert. Eine solche Reihenfolge wird als Index-Zahl größer null (>0) angegeben; beim Fehlen eines Namens ersetzt eine rot markierte Zahl Null (0) diesen Index.
  • Die Parameternamen werden hinsichtlich ihrer Gültigkeit und ihres Vorkommens bewertet (Spalte Q) und es wird jeweils auf zutreffende Abschnitte in der Infobox verwiesen (Spalte Blöcke).

Tabelle:

Parameter-Namen an unterschiedlichen Stellen
Idx – Index, alphabetische Sortierung der Parameternamen (44 Namen)
Namen – Alle gültigen und ungültigen Parameternamen (44 Namen)
Kv – Abschnitt "Kopiervorlage" (41 Namen)
Vp – Abschnitt "Vorlagenparameter" (43 Namen)
Pd – Abschnitt "Parameter-Details" (43 Namen)
Pa – Programmablauf (43 Namen)
Pw – Parameterwartung (41 Namen)
Q – Qualität, eindeutig (1), fraglich (0,5), ungültig (0)
Idx Namen Kv Vp Pd Pa Pw Q Blöcke – Wirkung in den Blöcken A bis H
1 AltSymbol 0 0 15 0 0 0 Wäre Block C (C↔)
2 AltSymbols 13 15 0 15 13 0,5 Block C (C↔)
3 Andere Namen 4 6 6 6 4 1 Block A (A↔)
4 ATC-Code 21 23 21 23 21 1 Block D (D↔)
5 Bild 2 2 2 2 2 1 Block A (A↔)
6 Bild_legende 3 3 3 4 3 1 Block A (A↔)
7 Bild_legende2 0 5 5 5 0 0 Wäre Block A (A↔)
8 Bild2 0 4 4 3 0 0 Wäre Block A (A↔)
9 CAS 19 21 22 17 19 1 Block C (C↔)
10 CASergänzend 20 22 23 22 20 1 Block C (C↔)
11 CID 18 20 20 21 18 1 Block C (C↔)
12 DrugBank 22 24 24 24 22 1 Block D (D↔)
13 EC-Nummer 26 28 26 28 26 1 Block F (F↔)
14 GeneCards 14 16 16 20 14 1 Block C (C↔)
15 Groesse 6 8 8 9 6 1 Block B (B↔)
16 HGNCid 11 13 14 8 11 1 Blöcke A (A↔), B (B↔) und C (C↔)
17 Homolog_db 36 38 38 41 36 1 Block G (G↔)
18 Homolog_fam 37 39 39 40 37 1 Block G (G↔)
19 Homolog_url 38 40 40 42 38 1 Block G (G↔)
20 Inhibitor_fam 29 31 29 31 32 1 Block F (F↔)
21 Isoformen 10 12 12 13 10 1 Block B (B↔)
22 Kategorie 27 29 27 29 30 1 Block F (F↔)
23 Kofaktor 7 9 10 11 7 1 Block B (B↔)
24 MGIid 17 19 19 19 17 1 Block C (C↔)
25 MoreEC1 33 35 33 35 27 1 Block F (F↔)
26 MoreEC2 34 36 34 36 28 1 Block F (F↔)
27 MoreEC3 35 37 35 37 29 1 Block F (F↔)
28 Name 1 1 1 1 1 1 Block A (A↔)
29 OMIM 15 17 17 18 15 1 Block C (C↔)
30 Orthologe 41 43 43 43 41 1 Block H (H↔)
31 PDB 5 7 7 7 5 1 Block A (A↔)
32 Peptidase_fam 28 30 28 30 31 1 Block F (F↔)
33 Precursor 8 10 11 12 8 1 Block B (B↔)
34 Produkte 32 34 32 34 35 1 Block F (F↔)
35 Reaktionsart 30 32 30 32 33 1 Block F (F↔)
36 Struktur 9 11 9 10 9 1 Block B (B↔)
37 Substrat 31 33 31 33 34 1 Block F (F↔)
38 Symbol 12 14 13 14 12 1 Block C (C↔)
39 Taxon 39 41 41 38 39 1 Block G (G↔)
40 Taxon_Ausnahme 40 42 42 39 40 1 Block G (G↔)
41 TCDB 24 26 36 26 24 1 Block E (E↔)
42 TranspText 25 27 37 27 25 1 Block E (E↔)
43 UniProt 16 18 18 16 16 1 Blöcke C (C↔) und G (G↔)
44 Wirkstoffklasse 23 25 25 25 23 1 Block D (D↔)

Legende zur Tabelle:

Hervorhebungen:

  • Fett im Tabellenkopf – Abkürzung, Spaltenname
  • Hellgrau unterlegte Zellen – Besonderheit: ungültiger Name oder Verwechslungsgefahr oder Zuordnung eines Parameters zu mehreren Blöcken
  • Roter Parameter-Name – ungültiger Name
  • Rote Null (0) – fehlender Index (abwesende Parameter-Bezeichnung im jeweiligen Abschnitt/ Bereich, Spalte Kv, Vp, Pd, Pa oder Pw) bzw. ungültiger Namen (Spalte Q).

Tabellenspalten:

  • Idx – Index, alphabetische Sortierung der Parameter-Namen
    • Index für 44 alphabetisch sortierte Bezeichnungen (Namen), die sich in der Vorlage Infobox Protein auf Parameternamen beziehen.
  • Namen – Alle gültigen und ungültigen Parameternamen (44 Namen)
    • Alle Bezeichnungen, die in der Dokumentation und im Programmcode als Parameternamen auftauchen (Referenz-Versionen).
  • Kv – Abschnitt "Kopiervorlage" (41 Namen)
    • Enthält alle gültigen Namen (41) für die Parameter und keine ungültigen Namen – ähnlich wie Pw.
  • Vp – Abschnitt "Vorlagenparameter" (43 Namen)
    • Enthält alle 41 gültigen Namen sowie zwei ungültige (Bild2 und Bild_legende2) – ähnlich wie Pa.
  • Pd – Abschnitt "Parameter-Details" (43 Namen)
    • Enthält 40 von 41 gültigen Namen, eine unkorrekte Schreibweise ("AltSymbol" statt AltSymbols) und zwei weitere ungültige Namen (Bild2 und Bild_legende2).
  • Pa – Programmablauf (43 Namen)
    • Enthält alle 41 gültigen Namen sowie zwei ungültige (Bild2 und Bild_legende2) – ähnlich wie Vp.
  • Pw – Parameterwartung (41 Namen)
    • Enthält alle gültigen Namen (41) für die Parameter und keine ungültigen Namen – ähnlich wie Kv.
  • Q – Qualität, eindeutig (1), fraglich (0,5), ungültig (0)
    • Die „Qualität“ eines Parameter-Namens wird hier jeweils als 1 (100 %) gewertet, wenn er überall gleich lautet und gültig ist, als 0 (0 %), wenn er ungültig ist und in einem Fall (AltSymbols) als 0,5 (50 %, „halbgut“), da der gültige Namen an einer Stelle in der Dokumentation anders geschrieben wurde.
  • Blöcke – Wirkung in den Blöcken A bis H
    • Für jeden Parameternamen wird seine Zugehörigkeit zu den ›Blöcken‹ angegeben. In den meisten Fällen ist das genau ein ›Block‹ unter den Blöcken A bis H. Bei ungültigen Parameternamen wird der mutmaßliche Block genannt („Wäre ...“). In zwei Fällen sind mehrere Blöcke relevant.

Auswirkungsorte der Parameter

Bearbeiten

Die meisten der 41 Parameter, die zur Referenzzeit wirksam waren, hatten genau eine Stelle der Auswirkung in der Anzeige einer Infobox (das galt für 39 Parameter). Zwei Parameter hatten mehrere Stellen der Auswirkung; einer hatte zwei Stellen (UniProt) und ein anderer hatte drei Stellen (HGNCid). Es ergaben sich 44 Stellen der Auswirkung. Kein Parameter hatte mehrere Stellen der Auswirkung in ein und demselben Block (Blöcke A bis H).

Die folgende Tabelle enthält die Auswirkungsorte der Parameter

  • i — Index; Stelle des Auftretens einer Anzeige innerhalb der Infobox, die auf den jeweiligen Parameter zurückgehen kann. Es wurden 44 Stellen identifiziert, die entsprechend ihres Auftretens von oben nach unten und von links nach rechts sortiert wurden.
  • Name des Parameters
  • Der Parameter wirkt an:
  • n — Anzahl der Stellen (maximal drei Stellen), an denen der Parameter wirkt.
  • Stellen.
  • Die
  • x-te — erste bis maximal dritte Auswirkung
  • Auswirkung des Parameters erfolgt in Block:
  • A bis H
  • Siehe Stelle: — Es folgt die Verknüpfung zur detaillierten Beschreibung des Parameters im jeweiligen Block.
  • #PRMA.BL-<A bis H>.<Bezeichnung des Parameters> — Verknüpfung (#) zur Stelle der Parameter-Auswirkung (PRMA) in Block A, B, C, D, E, F, G oder H (.BL-<A bis H>) innerhalb der detaillierten Beschreibung zum Parameter-Namen, welcher durch eine angepasste Bezeichnung angegeben wurde (.<Bezeichnung des Parameters>).

Keine Anker

i Name des Parameters Der Parameter wirkt an: n Stellen. Die x-te Auswirkung des Parameters erfolgt in Block: A bis H Siehe Stelle: #PRMA.BL-<A bis H>.<Bezeichnung des Parameters>
1 Name Der Parameter wirkt an: 1 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: A Siehe Stelle: #PRMA.BL-A.Name
2 Bild Der Parameter wirkt an: 1 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: A Siehe Stelle: #PRMA.BL-A.Bild
3 Bild_legende Der Parameter wirkt an: 1 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: A Siehe Stelle: #PRMA.BL-A.Bildlegende
4 Andere Namen Der Parameter wirkt an: 1 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: A Siehe Stelle: #PRMA.BL-A.AndereNamen
5 PDB Der Parameter wirkt an: 1 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: A Siehe Stelle: #PRMA.BL-A.PDB
6 HGNCid Der Parameter wirkt an: 3 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: A Siehe Stelle: #PRMA.BL-A.HGNCid
7 HGNCid Der Parameter wirkt an: 3 Stellen. Die 2. Auswirkung des Parameters erfolgt in Block: B Siehe Stelle: #PRMA.BL-B.HGNCid
8 Groesse Der Parameter wirkt an: 1 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: B Siehe Stelle: #PRMA.BL-B.Groesse
9 Struktur Der Parameter wirkt an: 1 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: B Siehe Stelle: #PRMA.BL-B.Struktur
10 Kofaktor Der Parameter wirkt an: 1 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: B Siehe Stelle: #PRMA.BL-B.Kofaktor
11 Precursor Der Parameter wirkt an: 1 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: B Siehe Stelle: #PRMA.BL-B.Precursor
12 Isoformen Der Parameter wirkt an: 1 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: B Siehe Stelle: #PRMA.BL-B.Isoformen
13 Symbol Der Parameter wirkt an: 1 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: C Siehe Stelle: #PRMA.BL-C.Symbol
14 HGNCid Der Parameter wirkt an: 3 Stellen. Die 3. Auswirkung des Parameters erfolgt in Block: C Siehe Stelle: #PRMA.BL-C.HGNCid
15 AltSymbols Der Parameter wirkt an: 1 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: C Siehe Stelle: #PRMA.BL-C.AltSymbols
16 GeneCards Der Parameter wirkt an: 1 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: C Siehe Stelle: #PRMA.BL-C.GeneCards
17 OMIM Der Parameter wirkt an: 1 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: C Siehe Stelle: #PRMA.BL-C.OMIM
18 UniProt Der Parameter wirkt an: 2 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: C Siehe Stelle: #PRMA.BL-C.UniProt
19 MGIid Der Parameter wirkt an: 1 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: C Siehe Stelle: #PRMA.BL-C.MGIid
20 CID Der Parameter wirkt an: 1 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: C Siehe Stelle: #PRMA.BL-C.CID
21 CAS Der Parameter wirkt an: 1 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: C Siehe Stelle: #PRMA.BL-C.CAS
22 CASergänzend Der Parameter wirkt an: 1 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: C Siehe Stelle: #PRMA.BL-C.CASergnzend
23 ATC-Code Der Parameter wirkt an: 1 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: D Siehe Stelle: #PRMA.BL-D.ATCCode
24 DrugBank Der Parameter wirkt an: 1 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: D Siehe Stelle: #PRMA.BL-D.DrugBank
25 Wirkstoffklasse Der Parameter wirkt an: 1 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: D Siehe Stelle: #PRMA.BL-D.Wirkstoffklasse
26 TCDB Der Parameter wirkt an: 1 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: E Siehe Stelle: #PRMA.BL-E.TCDB
27 TranspText Der Parameter wirkt an: 1 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: E Siehe Stelle: #PRMA.BL-E.TranspText
28 EC-Nummer Der Parameter wirkt an: 1 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: F Siehe Stelle: #PRMA.BL-F.ECNummer
29 Kategorie Der Parameter wirkt an: 1 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: F Siehe Stelle: #PRMA.BL-F.Kategorie
30 Peptidase_fam Der Parameter wirkt an: 1 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: F Siehe Stelle: #PRMA.BL-F.Peptidasefam
31 Inhibitor_fam Der Parameter wirkt an: 1 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: F Siehe Stelle: #PRMA.BL-F.Inhibitorfam
32 Reaktionsart Der Parameter wirkt an: 1 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: F Siehe Stelle: #PRMA.BL-F.Reaktionsart
33 Substrat Der Parameter wirkt an: 1 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: F Siehe Stelle: #PRMA.BL-F.Substrat
34 Produkte Der Parameter wirkt an: 1 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: F Siehe Stelle: #PRMA.BL-F.Produkte
35 MoreEC1 Der Parameter wirkt an: 1 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: F Siehe Stelle: #PRMA.BL-F.MoreEC1
36 MoreEC2 Der Parameter wirkt an: 1 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: F Siehe Stelle: #PRMA.BL-F.MoreEC2
37 MoreEC3 Der Parameter wirkt an: 1 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: F Siehe Stelle: #PRMA.BL-F.MoreEC3
38 Homolog_fam Der Parameter wirkt an: 1 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: G Siehe Stelle: #PRMA.BL-G.Homologfam
39 Homolog_db Der Parameter wirkt an: 1 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: G Siehe Stelle: #PRMA.BL-G.Homologdb
40 UniProt Der Parameter wirkt an: 2 Stellen. Die 2. Auswirkung des Parameters erfolgt in Block: G Siehe Stelle: #PRMA.BL-G.UniProt
41 Homolog_url Der Parameter wirkt an: 1 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: G Siehe Stelle: #PRMA.BL-G.Homologurl
42 Taxon Der Parameter wirkt an: 1 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: G Siehe Stelle: #PRMA.BL-G.Taxon
43 Taxon_Ausnahme Der Parameter wirkt an: 1 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: G Siehe Stelle: #PRMA.BL-G.TaxonAusnahme
44 Orthologe Der Parameter wirkt an: 1 Stellen. Die 1. Auswirkung des Parameters erfolgt in Block: H Siehe Stelle: #PRMA.BL-H.Orthologe

Verknüpfungsknoten – Elemente der Vorlage Infobox_Protein

Bearbeiten

Blöcke

Zu den Beschreibungen einzelner ›Blöcke‹
Blöcke A bis H knapp: A bis H ← detailliert: A bis H ←
Block A knapp: A ← detailliert: A ←
Block B knapp: B ← detailliert: B ←
Block C knapp: C ← detailliert: C ←
Block D knapp: D ← detailliert: D ←
Block E knapp: E ← detailliert: E ←
Block F knapp: F ← detailliert: F ←
Block G knapp: G ← detailliert: G ←
Block H knapp: H ← detailliert: H ←

Parameter

Anzeige- und Eingabe-Elemente

Detaillierte Beschreibung der Vorlage Infobox_Protein – Blöcke und Parameter

Bearbeiten

Zu den einzelnen Blöcken: A↓ / B↓ / C↓ / D↓ / E↓ / F↓ / G↓ / H↓ und zum Verknüpfungsknoten: Blöcke A bis H ←.

Block Überschrift(en) Funktion
A Entspricht zumeist dem Wert des Parameters "Name" Titel der jeweiligen Infobox Protein und Einleitung.
Beschreibung von Block A
Parameter Beschreibung Möglicher Wert
Name Name des Proteins Serumalbumin
Bild Bild des Proteins Serum Albumin.png
Bild_legende Legende von {{PDB|1YY1}}
Andere Namen Weitere Namen des Proteins BSA
PDB Schriftzug: „Vorhandene Strukturdaten:“; Liste von Einträgen bei PDB {{PDB2|1YY1}}, {{PDB2|ABCD}}
HGNCid Optionale Überschrift unterhalb der Einleitung; Achtung! "HGNCid" wirkt an mehreren Stellen – in Block A, B (←) und C (←). 399
Block Überschrift(en) Funktion
B Keine Überschrift oderEigenschaften des menschlichen Proteins Fortsetzung der Einleitung durch weitere Eigenschaften oder neuer Abschnitt mit speziellen Eigenschaften, nämlich denen der menschlichen Protein-Variante.
Beschreibung von Block B
Parameter Beschreibung Möglicher Wert
HGNCid Durch eine optionale Überschrift werden die Parameter in Block B als: „Eigenschaften des menschlichen Proteins“ gekennzeichnet. Achtung! "HGNCid" wirkt an mehreren Stellen – in Block A (←), B und C (←). 399
Groesse Schriftzug: „Masse/Länge Primärstruktur“; Anzahl Aminosäuren, Molgewicht in Dalton oder kD 1234 aa, 187,9 kD
Struktur Schriftzug: „Sekundär- bis Quartärstruktur“; βαββαβ
Kofaktor Für Funktion notwendiger Kofaktor [[Folsäure|Folat]]
Precursor Schriftzug: „Präkursor“; Link auf evtl. Präkursor-Protein [[Präalbumin]]
Isoformen Liste von Isoformen Alb-2a, Alb-2b
Block Überschrift(en) Funktion
C Bezeichner Aufzählung von Symbolen und Identifikationsnummern mit ihren Fundorten in externen Datenbanken.
Beschreibung von Block C
Parameter Beschreibung Möglicher Wert
Symbol Schriftzug: „Gen-Name“, auch „Gen-Namen“ oder „Gen-Name(n)“; Verlinkung durch "HGNCid" möglich ALB
HGNCid Optionale Verlinkung: Werte von "Symbol" als Text und von "HGNCid" als Linkziel; Eintrag bei HGNC (HUGO Gene Nomenclature Committee); Achtung! "HGNCid" wirkt an mehreren Stellen – in Block A (←), B (←) und C. 399
AltSymbols Alternative Gen-Symbole, werden rechts von "Symbol" (Schriftzug „Gen-Name“) angeordnet ; ALB-1
GeneCards Verlinkung auf den Eintrag bei GeneCards IDH1
OMIM Verlinkung auf den Eintrag bei OMIM 103600
UniProt Verlinkung auf den Eintrag bei UniProt, Achtung! "UniProt" wirkt an mehreren Stellen P12345
MGIid Verlinkung auf den Eintrag bei MGIid 98765
CID PubChem Compound CID; Verlinkung auf den Eintrag bei PubChem 64763
CAS CAS-Nummer des Proteins 1234-56-78
CASergänzend Zusätze zur CAS-Nummer, die in der Infobox unter dem Link auftauchen ?
Block Überschrift(en) Funktion
D Arzneistoff­anga­ben Angaben zum Protein, wenn es ein Arzneistoff ist.
Beschreibung von Block D
Parameter Beschreibung Möglicher Wert
ATC-Code ATC-Code des Proteins {{ATC|???|????}}
DrugBank Zugriffsnummer der DrugBank DB00062
Wirkstoffklasse [[RNase-Hemmer]]
Block Überschrift(en) Funktion
E Transporter-Klassi­fikation Angaben zum Protein, wenn es ein Membranprotein mit Transportfunktion ist.
Beschreibung von Block E
Parameter Beschreibung Möglicher Wert
TCDB Klassifikation bei TCDB (www.tcdb.org) 1.A.10
TranspText Bezeichnung Transporterklasse [[Kaliumkanal]]
Block Überschrift(en) Funktion
F EnzymklassifikationoderEnzymklassi­fikationenoderInhibitorklassifikation Angaben zum Protein, wenn es ein Enzym ist.
Beschreibung von Block F
Parameter Beschreibung Möglicher Wert
EC-Nummer Schriftzug: „EC, Kategorie“; EC-Nummer des Enzyms 2.1.1.14
Kategorie Enzym-Kategorie; Text ergänzt "EC-Nummer" und wird automatisch zur gleichnamigen Wikipedia-Seite verlinkt Hydrolasen
Peptidase_fam Schriftzug: „MEROPS“; Peptidase-Familie bei MEROPS M02
Inhibitor_fam Schriftzug: „MEROPS“; Proteaseinhibitor-Familie bei MEROPS I04
Reaktionsart Klassifizierung der kat. Reaktion [[Methylierung]]
Substrat Haupt-Substrat des Enzyms [[Traubenzucker|Glukose]]
Produkte Produkte der kat. Reaktion [[Ethanol]]
MoreEC1 Startet mit Schriftzug: „EC, Kategorie“; Zweiter möglicher Eintrag für Enzym- bzw. Inhibitorklassifikation; siehe Vorlage:Infobox Protein/MoreEC {{Infobox Protein/MoreEC|...}}
MoreEC2 Dritter möglicher Eintrag, siehe "MoreEC1"
MoreEC3 Vierter möglicher Eintrag, siehe "MoreEC1"
Block Überschrift(en) Funktion
G Vorkommen Angaben zum Vorkommen und Fehlen des Proteins in Lebewesen.
Beschreibung von Block G
Parameter Beschreibung Möglicher Wert
Homolog_fam Schriftzug: „Homologie-Familie“; Name der Gen- bzw. Proteinfamilie; der Text kann zu einer Datenbank verlinkt werden: "Homolog_fam"+"Homolog_db"+"UniProt" oder "Homolog_fam"+"Homolog_url" beliebiger Text
Homolog_db Verlinkung zu einer Datenbank: Text durch "Homolog_fam", Datenbank durch "Homolog_db" und Identifikations-Nummer durch "UniProt"; für eine Homologie-Recherche siehe http://pbil.univ-lyon1.fr/search/query_fam.php; mögliche Werte: HOGENOM, HOVERGEN und HOBACGEN HOGENOM
UniProt Siehe "Homolog_db"; Achtung! "UniProt" wirkt an mehreren Stellen 103600
Homolog_url URL zur HOGENOM-Datenbank, durch "Homolog_fam"+"Homolog_url" (nur nötig, falls abweichend von der automatisch generierten URL durch "Homolog_fam"+"Homolog_db"+"UniProt") http://doua.prabi.fr/cgi-bin/...
Taxon Schriftzug: „Übergeordnetes Taxon“; Taxon, das alle Organismen einschließt, wo das Protein vorkommt (kann bei http://pbil.univ-lyon1.fr/search/query_fam.php nachgelesen werden) [[Chordatiere|Chordata]]
Taxon_Ausnahme Schriftzug: „Ausnahmen“; Liste der Taxa, wo Protein nicht vorkommt [[Felis]]
Block Überschrift(en) Funktion
H Orthologe Angaben zu sogenannten orthologen Proteinen, d. h. verwandten Gen- bzw. Proteinvarianten in verschiedenen Lebewesen als Tabelle.

Beschreibung von Block H

Parameter Beschreibung Möglicher Wert
Orthologe Eine oder mehrere Ortholog-Boxen, siehe die Vorlage:Protein Orthologe {{Protein Orthologe |...}}

Konstante, atomare Zeichenketten

Bearbeiten

Durch Anwendungs-Beispiele konnte ich 73 Schriftzüge identifizieren, die ich als ›konstante, atomare Zeichenketten‹ bezeichnet habe.

Links zu den 73 einzelnen Zeichenketten:

Bei den ›konstante, atomare Zeichenketten‹ (kaZk) handelt es sich um wiederkehrende Schriftzüge. Diese kaZk können

  • sowohl Anzeige- als auch Eingabe-Elemente sein (15 kaZk sind Überschriften oder ›optische Parameter‹ und gleichzeitig Parameter) oder
  • sie sind nur Anzeige-Elemente (26 kaZk sind Überschriften und ›optische Parameter‹) oder
  • sie sind nur Eingabe-Elemente (32 kaZk sind Parameter).

Die meisten kaZk ergaben sich nur durch die Haupt-Vorlage „Infobox Protein“, wenige nur durch eine der Unter-Vorlagen "Infobox Protein/MoreEC" und "Protein Orthologe" und einige durch beides (siehe „Die Referenzversionen im Einzelnen“ ).

Zeichenketten Anzeige- und Eingabe-Elemente
AltSymbols Eingabe-Element, Parameter: "AltSymbols"; Block C (C↔)
Andere Namen 1. Anzeige-Element, ›optischer Parameter‹: "Andere Namen"; Block A (A↔)
2. Eingabe-Element, Parameter: "Andere Namen"; Block A (A↔)
Arzneistoffangaben Anzeige-Element, Überschrift: "Arzneistoffangaben"; Block A (A↔)
ATC-Code 1. Anzeige-Element, ›optischer Parameter‹: "ATC-Code"; Block D (D↔)
2. Eingabe-Element, Parameter: "ATC-Code"; Block D (D↔)
Ausnahmen Anzeige-Element, ›optischer Parameter‹: "Ausnahmen"; Block G (G↔)
Bezeichner Anzeige-Element, Überschrift: "Bezeichner"; Block C (C↔)
Bezeichnung Anzeige-Element, ›optischer Parameter‹: "Bezeichnung"; Block E (E↔)
Bild Eingabe-Element, Parameter: "Bild"; Block A (A↔)
Bild_legende Eingabe-Element, Parameter: "Bild_legende"; Block A (A↔)
CAS Eingabe-Element, Parameter: "CAS"; Block C (C↔)
CASergänzend Eingabe-Element, Parameter: "CASergänzend"; Block C (C↔)
CAS-Nummer Anzeige-Element, ›optischer Parameter‹: "CAS-Nummer:"; Block C (C↔)
CID 1. Anzeige-Element, ›optischer Parameter‹: "CID:" Block C (C↔)
2. Eingabe-Element, Parameter: "CID"; Block C (C↔)
DrugBank 1. Anzeige-Element, ›optischer Parameter‹: "DrugBank"; Block D (D↔)
2. Eingabe-Element, Parameter: "DrugBank"; Block D (D↔)
EC, Kategorie Anzeige-Element, ›optischer Parameter‹: "EC, Kategorie"; Block F (F↔)
EC-Nummer Eingabe-Element, Parameter: "EC-Nummer"; Block F (F↔)
Eigenschaften des menschlichen Proteins Anzeige-Element, Überschrift: "Eigenschaften des menschlichen Proteins"; Block B (B↔)
Entrez Anzeige-Element, ›optischer Parameter‹: "Entrez"; Block H (H↔)
Enzymklassifikation Anzeige-Element, Überschrift: "Enzymklassifikation"; Block F (F↔)
Enzymklassifikationen Anzeige-Element, Überschrift: "Enzymklassifikationen"; Block F (F↔)
Externe IDs Anzeige-Element, ›optischer Parameter‹: "Externe IDs"; Block C (C↔)
GeneCards 1. Anzeige-Element, ›optischer Parameter‹: "GeneCards:"; Block C (C↔)
2. Eingabe-Element, Parameter: "GeneCards"; Block C (C↔)
Gen-Name Anzeige-Element, ›optischer Parameter‹: "Gen-Name"; Block C (C↔)
Gen-Name(n) Anzeige-Element, ›optischer Parameter‹: "Gen-Name(n)"; Block C (C↔)
Gen-Namen Anzeige-Element, ›optischer Parameter‹: "Gen-Namen"; Block C (C↔)
Groesse Eingabe-Element, Parameter: "Groesse"; Block B (B↔)
HGNCid Eingabe-Element, Parameter: "HGNCid"; Blöcke A (A↔), B (B↔) und C (C↔)
Homolog_db Eingabe-Element, Parameter: "Homolog_db"; Block G (G↔)
Homolog_fam Eingabe-Element, Parameter: "Homolog_fam"; Block G (G↔)
Homolog_url Eingabe-Element, Parameter: "Homolog_url"; Block G (G↔)
Homologie-Familie Anzeige-Element, ›optischer Parameter‹: "Homologie-Familie"; Block G (G↔)
Inhibitor_fam Eingabe-Element, Parameter: "Inhibitor_fam"; Block F (F↔)
Inhibitorklassifikation Anzeige-Element, Überschrift: "Inhibitorklassifikation"; Block F (F↔)
Isoformen 1. Anzeige-Element, ›optischer Parameter‹: "Isoformen"; Block B (B↔)
2. Eingabe-Element, Parameter: "Isoformen"; Block B (B↔)
Kategorie Eingabe-Element, Parameter: "Kategorie"; Block F (F↔)
Kofaktor 1. Anzeige-Element, ›optischer Parameter‹: "Kofaktor"; Block B (B↔)
2. Eingabe-Element, Parameter: "Kofaktor"; Block B (B↔)
Masse/Länge Primärstruktur Anzeige-Element, ›optischer Parameter‹: "Masse/Länge Primärstruktur"; Block B (B↔)
MEROPS Anzeige-Element, ›optischer Parameter‹: "MEROPS"; Block F (F↔)
MGI Anzeige-Element, ›optischer Parameter‹: "MGI:"; Block C (C↔)
MGIid Eingabe-Element, Parameter: "MGIid"; Block C (C↔)
MoreEC1 Eingabe-Element, Parameter: "MoreEC1"; Block F (F↔)
MoreEC2 Eingabe-Element, Parameter: "MoreEC2"; Block F (F↔)
MoreEC3 Eingabe-Element, Parameter: "MoreEC3"; Block F (F↔)
Name Eingabe-Element, Parameter: "Name"; Block A (A↔)
OMIM 1. Anzeige-Element, ›optischer Parameter‹: "OMIM:"; Block C (C↔)
2. Eingabe-Element, Parameter: "OMIM"; Block C (C↔)
Orthologe 1. Anzeige-Element, Überschrift: "Orthologe"; Block H (H↔)
2. Eingabe-Element, Parameter: "Orthologe"; Block H (H↔)
PDB Eingabe-Element, Parameter: "PDB"; Block A (A↔)
Peptidase_fam Eingabe-Element, Parameter: "Peptidase_fam"; Block F (F↔)
Präkursor Anzeige-Element, ›optischer Parameter‹: "Präkursor"; Block B (B↔)
Precursor Eingabe-Element, Parameter: "Precursor"; Block B (B↔)
Produkte 1. Anzeige-Element, ›optischer Parameter‹: "Produkte"; Block F (F↔)
2. Eingabe-Element, Parameter: "Produkte"; Block F (F↔)
PubMed-Suche Anzeige-Element, ›optischer Parameter‹: "PubMed-Suche"; Block H (H↔)
Reaktionsart 1. Anzeige-Element, ›optischer Parameter‹: "Reaktionsart"; Block F (F↔)
2. Eingabe-Element, Parameter: "Reaktionsart"; Block F (F↔)
S1_EntrezGene Eingabe-Element, Parameter: "S1_EntrezGene"; Block H (H↔)
S1_Uniprot Eingabe-Element, Parameter: "S1_Uniprot"; Block H (H↔)
S2_EntrezGene Eingabe-Element, Parameter: "S2_EntrezGene"; Block H (H↔)
S2_Uniprot Eingabe-Element, Parameter: "S2_Uniprot"; Block H (H↔)
Sekundär- bis Quartärstruktur Anzeige-Element, ›optischer Parameter‹: "Sekundär- bis Quartärstruktur"; Block B (B↔)
Spezies1 Eingabe-Element, Parameter: "Spezies1"; Block H (H↔)
Spezies2 Eingabe-Element, Parameter: "Spezies2"; Block H (H↔)
Struktur Eingabe-Element, Parameter: "Struktur"; Block B (B↔)
Substrat 1. Anzeige-Element, ›optischer Parameter‹: "Substrat"; Block F (F↔)
2. Eingabe-Element, Parameter: "Substrat"; Block F (F↔)
Symbol Eingabe-Element, Parameter: "Symbol"; Block C (C↔)
Taxon Eingabe-Element, Parameter: "Taxon"; Block G (G↔)
Taxon_Ausnahme Eingabe-Element, Parameter: "Taxon_Ausnahme"; Block G (G↔)
TCDB 1. Anzeige-Element, ›optischer Parameter‹: "TCDB"; Block E (E↔)
2. Eingabe-Element, Parameter: "TCDB"; Block E (E↔)
Transporter-Klassifikation Anzeige-Element, Überschrift: "Transporter-Klassifikation"; Block E (E↔)
TranspText Eingabe-Element, Parameter: "TranspText"; Block E (E↔)
Übergeordnetes Taxon Anzeige-Element, ›optischer Parameter‹: "Übergeordnetes Taxon"; Block G (G↔)
UniProt 1. Anzeige-Element, ›optischer Parameter‹: "UniProt:"; Block C (C↔)
2. Eingabe-Element, Parameter: "UniProt"; Blöcke C (C↔) und G (G↔)
Vorhandene Strukturdaten Anzeige-Element, ›optischer Parameter‹: "Vorhandene Strukturdaten:"; Block A (A↔)
Vorkommen Anzeige-Element, Überschrift: "Vorkommen"; Block G (G↔)
Wirkstoffklasse 1. Anzeige-Element, ›optischer Parameter‹: "Wirkstoffklasse"; Block D (D↔)
2. Eingabe-Element, Parameter: "Wirkstoffklasse"; Block D (D↔)

Vollständig ausgelagert

Bearbeiten
Anker für detaillierte Beschreibung (Blöcke und Parameter) -- Material
Bearbeiten

Detaillierte Beschreibung der Vorlage Infobox_Protein – Blöcke und Parameter

Ineinander geschachtelte Tabellen mit Ankern.

  • Anker BLD.BL-<A bis H>: BLöcke Detailiert, BLock A, B, C usw. bis H.
  • Anker PRMA.BL-<A bis H>.<Name des Parameters>: PaRaMeter-Auswirkung, BLock, welcher diese Auswirkungsstelle aufweist und Name des Parameters. Umlaute und Ähnliches (ä, ö, ü, ß), Minuszeichen (-), Unterstriche (_) und Leerzeichen sind für die Anker bzw. die Verknüpfungen aus den ursprünglichen Parameternamen entfernt worden.
Anker für ›Konstante, atomare Zeichenketten‹ -- Material
Bearbeiten

Anker für ›Konstante, atomare Zeichenketten‹: {{Anker|KAZK_<Bezeichnung für den Parameter>}};

Bezeichnung für den Parameter: basiert auf dem jeweiligen Namen des Parameters, wobei Umlaute und Ähnliches (ä, ö, ü, ß), Kommas (ein Komma: ,), Minuszeichen (-), Unterstriche (_) und Leerzeichen ( ) aus den Parameter-Namen entfernt wurden.

Weitere Sonderzeichen wurden anfangs nicht gefunden. Es sollten eigentlich nur große und kleine lateinische Buchstaben übrig geblieben, zwei Klammern [( und ) in "KAZK_GenName(n)"] sowie ein Schrägstrich (/ in "KAZK_Masse/LngePrimrstruktur") wurden aber übersehen (entdeckt: 2020-09-08). Während der Schrägstrich einfach zu entfernen wäre, ist das bei den Klammern nicht so einfach, weil es bisher nicht nur "KAZK_GenName(n)" sondern auch "KAZK_GenNamen" gibt. „GenName(n)“ und „GenNamen“ werden in dieser Reihenfolge sortiert und daher werden aus den die alten Benennungen "KAZK_GenName(n)" und "KAZK_GenNamen" die neuen Benennungen "KAZK_GenNamen1" und "KAZK_GenNamen2" gemacht; aus "KAZK_Masse/LngePrimrstruktur" wird "KAZK_MasseLngePrimrstruktur".

Mehrdeutig wirksame Parameter HGNCid und UniProt -- Material
Bearbeiten

HGNCid

Der Parameter HGNCid existiert seit Anbeginn der Vorlage am 8. Januar 2007 „Infobox Protein“ (oldid=26161029), als sie aus der englischen Wikipedia übernommen und angepasst wurde.

Seit dem 3. Oktober 2012 fügt der Parameter HGNCid die Überschrift „Eigenschaften des menschlichen Proteins“ ein (oldid=108815396).

https://de.wikipedia.org/w/index.php?title=Vorlage%3AInfobox_Protein&type=revision&diff=108815396&oldid=106682866

UniProt

Der Parameter UniProt existiert seit Anbeginn der Vorlage „Infobox Protein“ am 8. Januar 2007 (oldid=26161029), als sie aus der englischen Wikipedia übernommen und angepasst wurde.

Am 15. September 2008 (oldid=50758588) ist UniProt beseitigt worden und statt dessen ist z. B. der Block „Externe IDs“ eingefügt worden.

Am 26. September 2008 wurde UniProt zwischen OMIM und MGlid (oldid=51180706) wieder eingefügt. Weiterhin wurde am 26. September 2008 (oldid=51181083) die Wirkung auf den zweiten Bereich ausgedehnt ("Homolog handling umgestellt").

Seit dem 30. September 2008 (oldid=51314051) wird die Homologie-Familie bedingt durch UniProt u. a. angezeigt ("zeige Homolog-Fam. nur wenn sowohl UniProt && Homolog_fam && Homolog_db").

Vorlage:CID und Vorlage:PubChem
Bearbeiten

Beim Stöbern auf Benutzerseiten habe ich zufällig gesehen, dass es mal eine Vorlage:CID gab (2020-07, Benutzer:Ghilthttps://xtools.wmflabs.org/pages/de.wikipedia.org/Ghilt/all). Diese Seite wurde vermutlich zweimal angelegt und zweimal gelöscht:

Vorlage:CID

Diese Seite wurde gelöscht oder verschoben. Zur Information folgt das Lösch- und Verschiebungs-Logbuch dieser Seite.

HTML-Entitäten und Pfeile
Bearbeiten
Einschub – „Überschriften, Abschnitte und die Blöcke A bis H“ #x2196-2199 #8598-8601 /

x2196↖ x2197↗ x2198↘ x2199↙

Referenzversionen -- Material
Bearbeiten

Die Analyse möglichst aller Parameter begann also mit dem Kopieren einer Tabelle aus dem Abschnitt „Parameter-Details“,

  • aus der Vorlage, Vorlage:Infobox Protein, oldid=183851377#Parameter-Details, Programm-Version vom 19. Dez. 2018
  • oder aus der Dokumentation, Vorlage:Infobox Protein/Doku, oldid=175729659#Parameter-Details, Dokumentations-Version vom 3. April 2018.

Am Stichtag (29.9.'19) und darüber hinaus (bis zum 27.12.'19) band die damals aktuelle Programm-Version (oldid=183851377) den Text der damals aktuellen Dokumentations-Version (oldid=175729659) ein, so dass es keinen Unterschied machte, ob die Tabelle indirekt aus der Einbindung oder aus der Dokumentation entnommen wurde (am 5.12.'19).

Drei Formen von Genname(n) -- Material
Bearbeiten

Ein weiterer Abschnitt, der durch "HGNCid" beeinflußt werden kann, heißt „Bezeichner“. Allerdings löst "HGNCid" das Erscheinen des Abschnitts mit der Überschrift „Bezeichner“ nicht aus. Es bestehen Abhängigkeiten zwischen den Parametern "Symbol" (Gen-Symbol), "AltSymbols" (alternative Gen-Symbole) und "HGNCid".

Sowohl "Symbol" als auch "AltSymbols" (wie auch andere Parameter) können die Überschrift „Bezeichner“ auslösen. Wenn die Überschrift „Bezeichner“ ausgelöst wird, dann kann ein Schriftzug zur Benennung einer Zeile in diesem Abschnitt der Infobox drei verschiedene Formen annehmen:

  • Gen-Name(n) – Text ohne Verknüpfung; HGNCid fehlt und mindestens einer der beiden anderen Parameter, Symbol oder AltSymbols, hat einen Wert.
  • Gen-Name – Text mit Verknüpfung zum Wikipedia-Artikel Human_Genome_Organisation; "AltSymbols" fehlt und die beiden anderen Parameter, "Symbol" und "HGNCid", haben einen Wert.
  • Gen-Namen – Text mit Verknüpfung zum Wikipedia-Artikel Human_Genome_Organisation; alle drei Parameter ("Symbol", "AltSymbols" und "HGNCid") haben einen Wert.

Vereinfacht ausgedrückt ist "Symbol" also für die Einzahl, "AltSymbols" für die Mehrzahl und "HGNCid" für eine spezielle Verknüpfung zuständig. Ohne diese Verknüpfung wird ein „zahlneutraler“ Schriftzug angegeben. Diese Auswirkung eines einzelnen Parameters an mehreren Stellen hat Vor- und Nachteile. Der größte Vorteil dürfte sein, dass ...

Kombinatorik -- Material
Bearbeiten

Als Werte bzw. Argumente wurden die Vorschläge aus der Tabelle unter "Parameter-Details" der Dokumentation angewendet (1: |Symbol=ALB, 2: |AltSymbols=; ALB-1 und 3: |HGNCid=399). Jeder Kombination wurde ein entsprechender Name gegeben (allgemeine Form: |Name=Beispiel … …).

Der Parameter HGNCid löst allein (ohne die beiden anderen Parameter) die Überschrift "Eigenschaften des menschlichen Proteins" aus (der zugeordnete Abschnitt wird hier Block B genannt).

Sowohl Symbol als auch AltSymbols lösen jeweils allein die Überschrift "Bezeichner" aus. Wenn die Überschrift "Bezeichner" ausgelöst wird, dann kann ein Schriftzug zur Benennung einer Zeile im zugehörigen Abschnitt (Block C) drei verschiedene Formen annehmen:

▪ "Gen-Name(n)" – Text ohne Verknüpfung; HGNCid fehlt und mindestens einer der beiden anderen Parameter, Symbol oder AltSymbols, hat einen Wert.

▪ "Gen-Name" – Text mit Verknüpfung (Wikipedia, https://de.wikipedia.org/wiki/Human_Genome_Organisation); AltSymbols fehlt und die beiden anderen Parameter, Symbol und HGNCid, haben einen Wert.

▪ "Gen-Namen" – Text mit Verknüpfung (Wikipedia, https://de.wikipedia.org/wiki/Human_Genome_Organisation); Alle drei Parameter (Symbol, AltSymbols und HGNCid) haben einen Wert.

Vereinfacht ausgedrückt ist Symbol also für die Einzahl, AltSymbols für die Mehrzahl und HGNCid für eine Verknüpfung zuständig. Ohne Verknüpfung wird ein „zahlneutraler“ Schriftzug ["Gen-Name(n)"] angegeben.

Setzt man eine gültige ID ein (z. B. |HGNCid=399), dann wird die Überschrift „Eigenschaften des menschlichen Proteins“ auch zwischen Einleitung und Eigenschaften gesetzt.

Engl. Wikipedia -- Auslagerung
Bearbeiten

In der Wikipedia könnte man auch an die Wikipedia:Kategorien denken. In der englischen Wikipedia wurde versucht, das EC-System mit seinen Enzymklassen und Enzym­ein­trä­gen relativ deckungsgleich abzubilden.

Die oberste Einteilungsebene des EC-Systems (z. B. EC 1 Hydrolases oder EC 2 Transferases) ist nur durch den Namen, nicht durch die EC-Nummer erreichbar (wahrscheinlich, weil solche Angaben wie "EC 1" oder "EC 2" mehrdeutig sind), während die darunter lie­gen­den Klassen meist nur durch die jeweilige EC-Nummer, aber nicht durch den Namen erreichbar sind (wahrscheinlich, weil z. B. "Trans­ferring one carbon groups" deutlich sperriger ist, als "EC 2.1").

Die Enzym­klas­sen (Hierachie-Ebenen 1 bis 3) wurden in Wikipedia-Kategorien erfasst (Category: ...), während die Enzymeinträge (Hierachie-Ebene 4) oft als Weiterleitungen der jeweiligen EC-Nummer auf mehr oder weniger passende Artikel angelegt sind.

Die folgende Tabelle enthält die sechs EC-Nummern, die zu den DNA-Methyltransferasen bzw. "DNA methyltransferases" (https://en.wikipedia.org/wiki/DNA_methyltransferase) einen Bezug haben, zusammen mit deren Umsetzung in der englischen Wikipedia.

EC-Nummer  Name/Bezeichnung.

Kategorie oder Weiterleitung in der englischen Wikipedia

·       Artikel in der englischen Wikipedia

EC 2  Transferases.

https://en.wikipedia.org/wiki/Category:Transferases (Verknüpfung zum Artikel)

·       https://en.wikipedia.org/wiki/Transferase

EC 2.1  Transferring one carbon groups.

https://en.wikipedia.org/wiki/Category:EC_2.1

·       kein Artikel

EC 2.1.1  Methyltransferases.

https://en.wikipedia.org/wiki/Category:EC_2.1.1 (keine Verknüpfung zum Artikel)

·       https://en.wikipedia.org/wiki/Methyltransferase

EC 2.1.1.37  DNA (cytosine-5-)-methyltransferase.

https://en.wikipedia.org/w/index.php?title=EC_2.1.1.37&redirect=no

·       https://en.wikipedia.org/wiki/DNA_methyltransferase

EC 2.1.1.72  Site-specific DNA-methyltransferase (adenine-specific).

https://en.wikipedia.org/w/index.php?title=EC_2.1.1.72&redirect=no

·       https://en.wikipedia.org/wiki/Site-specific_DNA-methyltransferase_(adenine-specific)

EC 2.1.1.113  Site-specific DNA-methyltransferase (cytosine-N(4)-specific).

https://en.wikipedia.org/w/index.php?title=EC_2.1.1.113&redirect=no

·       https://en.wikipedia.org/wiki/Site-specific_DNA-methyltransferase_(cytosine-N4-specific)

Textblock Programmablauf Doppel-Parameter
Bearbeiten

Zuerst fragt der Programmcode der Vorlage, ob mindestens einer der beiden Parameter (also "EC-Nummer" und "Kategorie") einen Wert hat. Und wenn dem so ist, werden eine Tabellenzeile, eine Tabellenzelle und eben dort ein Schriftzug erzeugt, der „EC, Kategorie“ lautet.

Darauf folgend wird eine weitere Tabellenzelle angelegt, in welcher das Argument des Parameters "EC-Nummer" – falls ein Wert angegeben wurde – als ›optisches Argument‹ geschrieben wird. In die gleiche Tabellenzelle wird – falls ein Wert für den Parameter "Kategorie" angegeben wurde – ein Komma geschrieben, dem ein geschütztes Leerzeichen und das ›optische Argument‹ vom Parameter "Kategorie" folgt. Das Komma mit dem Leerzeichen hängt laut Programmcode nicht von "EC-Nummer", sondern ausschließlich vom Auftreten des Parameters "Kategorie" ab.

Da zuerst ein Schriftzug generiert wird, der zu beiden Parametern passen soll und danach einer, der zu beiden Argumenten passen soll, nenne ich dieses Paar aus den beiden Parametern "EC-Nummer" und "Kategorie" hier einen „Doppel-Parameter“. Entsprechend sind die beiden Werte eine „Doppel-Wert“ oder „Doppel-Argument“. Die resultierenden Anzeige-Elemente sind folglich „optischer Doppel-Parameter“ und „optisches Doppel-Argument“.

Das Wort Enzym -- Stichproben
Bearbeiten

https://de.wikipedia.org/w/index.php?title=Vorlage:Infobox_Protein&action=edit&oldid=52053905, am 20. Oktober 2008 um 19:21 Uhr durch Leyo (Diskussion | Beiträge)

  • Überschrift Enzymklassifikation (keine Mehrzahl), "EC, Kategorie", zwei Leerzeichen, Doku: Zwei Hintergrundfarben, nicht erklärt "Mit * bezeichnete Felder müssen angegeben werden." --> *(Enzyme) EC-Nummer des Enzyms

Programmablauf:

  • {{#if: {{{EC-Nummer|}}}{{{Kategorie|}}}{{{Peptidase_fam|}}}{{{Reaktionsart|}}}{{{Substrat|}}}{{{Produkte|}}} |
  • {{!-}}
  • {{!}} align="center" colspan="3" bgcolor="#90ee90" {{!}} '''Enzymklassifikation'''
  • {{!-}} {{!}} bgcolor="#ffffff" {{!}} [[EC-Nummer|EC, Kategorie]]
  • {{!}} bgcolor="#ffffff" colspan="2" align="center" {{!}} <span class=plainlinks>[http://www.expasy.org/enzyme/{{{EC-Nummer}}} {{{EC-Nummer}}}]</span>  [[{{{Kategorie}}}]]

Integrierte Dokumentation:

  • |- class="hintergrundfarbe7"
  • | EC-Nummer || *(Enzyme) [[EC-Nummer]] des Enzyms || <code>2.1.1.14</code>


Blöcke A bis H detailliert
Bearbeiten
  1. | #Blöcke A bis H detailliert -- 1 | "Prototyp", Erst Blöcke (Beschreibungs-Tabelle), dann Parameter-Tabellen für Blöcke A bis H.
  2. | #Blöcke A bis H detailliert -- 2 | Jeder Block in einer einzelnen Tabelle.
  3. | #Blöcke A bis H detailliert -- 3 | Ineinander geschachtelte Tabellen. Die äußere Tabelle enthält die Blöcke A bis H, die inneren Tabellen enthalten die jeweiligen Parameter.
  4. | War mal ""; ist nun "#Detaillierte Beschreibung der Vorlage Infobox_Protein – Blöcke und Parameter" |
Blöcke A bis H detailliert -- 1
Bearbeiten

↑ Blöcke A bis H detailliert ↑

Block Überschrift(en) Funktion
Block A Entspricht zumeist dem Wert des Parameters "Name" Titel der jeweiligen Infobox Protein und Einleitung.
Block Überschrift(en) Funktion
Block B Keine Überschrift oderEigenschaften des menschlichen Proteins Fortsetzung der Einleitung durch weitere Eigenschaften oder neuer Abschnitt mit speziellen Eigenschaften, nämlich denen der menschlichen Protein-Variante.
Block Überschrift(en) Funktion
Block C Bezeichner Aufzählung von Symbolen und Identifikationsnummern mit ihren Fundorten in externen Datenbanken.
Block Überschrift(en) Funktion
Block D Arzneistoff­anga­ben Angaben zum Protein, wenn es ein Arzneistoff ist.
Block Überschrift(en) Funktion
Block E Transporter-Klassi­fikation Angaben zum Protein, wenn es ein Membranprotein mit Transportfunktion ist.
Block Überschrift(en) Funktion
Block F EnzymklassifikationoderEnzymklassi­fikationenoderInhibitorklassifikation Angaben zum Protein, wenn es ein Enzym ist.
Block Überschrift(en) Funktion
Block G Vorkommen Angaben zum Vorkommen und Fehlen des Proteins in Lebewesen.
Block Überschrift(en) Funktion
Block H Orthologe Angaben zu sogenannten orthologen Proteinen, d. h. verwandten Gen- bzw. Proteinvarianten in verschiedenen Lebewesen als Tabelle.
Blöcke A bis H detailliert -- 2
Bearbeiten

↑ Blöcke A bis H detailliert ↑

Jeder Block in einer einzelnen Tabelle.

Beschreibung von Block A

Parameter Beschreibung Möglicher Wert
Name Name des Proteins Serumalbumin
Bild Bild des Proteins Serum Albumin.png
Bild_legende Legende von {{PDB|1YY1}}
Andere Namen Weitere Namen des Proteins BSA
PDB Schriftzug: „Vorhandene Strukturdaten:“; Liste von Einträgen bei PDB {{PDB2|1YY1}}, {{PDB2|ABCD}}
HGNCid Optionale Überschrift unterhalb der Einleitung; Achtung! "HGNCid" wirkt an mehreren Stellen

Beschreibung von Block B

Parameter Beschreibung Möglicher Wert
HGNCid Durch eine optionale Überschrift werden die Parameter in Block B als: „Eigenschaften des menschlichen Proteins“ gekennzeichnet.  Achtung! "HGNCid" wirkt an mehreren Stellen.
Groesse Schriftzug: „Masse/Länge Primärstruktur“; Anzahl Aminosäuren, Molgewicht in Dalton oder kD 1234 aa, 187,9 kD
Struktur Schriftzug: „Sekundär- bis Quartärstruktur“; βαββαβ
Kofaktor Für Funktion notwendiger Kofaktor [[Folsäure|Folat]]
Precursor Schriftzug: „Präkursor“; Link auf evtl. Präkursor-Protein [[Präalbumin]]
Isoformen Liste von Isoformen Alb-2a, Alb-2b

Beschreibung von Block C

Parameter Beschreibung Möglicher Wert
Symbol Schriftzug: „Gen-Name“, auch „Gen-Namen“ oder „Gen-Name(n)“; Verlinkung durch "HGNCid" möglich ALB
HGNCid Optionale Verlinkung: Werte von "Symbol" als Text und von "HGNCid" als Linkziel; Eintrag bei HGNC (HUGO Gene Nomenclature Committee); Achtung! "HGNCid" wirkt an weiteren Stellen. 399
AltSymbols Alternative Gen-Symbole, werden rechts von "Symbol" (Schriftzug „Gen-Name“) angeordnet ; ALB-1
GeneCards Verlinkung auf den Eintrag bei GeneCards IDH1
OMIM Verlinkung auf den Eintrag bei OMIM 103600
UniProt Verlinkung auf den Eintrag bei UniProt, Achtung! "UniProt" wirkt an mehreren Stellen P12345
MGIid Verlinkung auf den Eintrag bei MGIid 98765
CID PubChem Compound CID; Verlinkung auf den Eintrag bei PubChem 64763
CAS CAS-Nummer des Proteins 1234-56-78
CASergänzend Zusätze zur CAS-Nummer, die in der Infobox hinter dem Link auftauchen ?

Beschreibung von Block D

Parameter Beschreibung Möglicher Wert
ATC-Code ATC-Code des Proteins {{ATC|???|????}}
DrugBank Zugriffsnummer der DrugBank DB00062
Wirkstoffklasse [[RNase-Hemmer]]

Beschreibung von Block E

Parameter Beschreibung Möglicher Wert
TCDB Klassifikation bei TCDB (www.tcdb.org) 1.A.10
TranspText Bezeichnung Transporterklasse [[Kaliumkanal]]

Beschreibung von Block F

Parameter Beschreibung Möglicher Wert
EC-Nummer Schriftzug: „EC, Kategorie“; EC-Nummer des Enzyms 2.1.1.14
Kategorie Enzym-Kategorie; Text ergänzt "EC-Nummer" und wird automatisch zur gleichnamigen Wikipedia-Seite verlinkt Hydrolasen
Peptidase_fam Schriftzug: „MEROPS“; Peptidase-Familie bei MEROPS M02
Inhibitor_fam Schriftzug: „MEROPS“; Proteaseinhibitor-Familie bei MEROPS I04
Reaktionsart Klassifizierung der kat. Reaktion [[Methylierung]]
Substrat Haupt-Substrat des Enzyms [[Traubenzucker|Glukose]]
Produkte Produkte der kat. Reaktion [[Ethanol]]
MoreEC1 Startet mit Schriftzug: „EC, Kategorie“; Zweiter möglicher Eintrag für Enzym- bzw. Inhibitorklassifikation; siehe Vorlage:Infobox Protein/MoreEC {{Infobox Protein/MoreEC|...}}
MoreEC2 Dritter möglicher Eintrag, siehe "MoreEC1"
MoreEC3 Vierter möglicher Eintrag, siehe "MoreEC1"

Beschreibung von Block G

Parameter Beschreibung Möglicher Wert
Homolog_fam Schriftzug: „Homologie-Familie“; Name der Gen- bzw. Proteinfamilie; der Text kann zu einer Datenbank verlinkt werden: "Homolog_fam"+"Homolog_db"+"UniProt" oder "Homolog_fam"+"Homolog_url" beliebiger Text
Homolog_db Verlinkung zu einer Datenbank: Text durch "Homolog_fam", Datenbank durch "Homolog_db" und Identifikations-Nummer durch "UniProt"; für eine Homologie-Recherche siehe http://pbil.univ-lyon1.fr/search/query_fam.php; mögliche Werte: HOGENOM, HOVERGEN und HOBACGEN HOGENOM
UniProt Siehe "Homolog_db"; Achtung! "UniProt" wirkt an mehreren Stellen 103600
Homolog_url URL zur HOGENOM-Datenbank, durch "Homolog_fam"+"Homolog_url" (nur nötig, falls abweichend von der automatisch generierten URL durch "Homolog_fam"+"Homolog_db"+"UniProt") http://doua.prabi.fr/cgi-bin/...
Taxon Schriftzug: „Übergeordnetes Taxon“; Taxon, das alle Organismen einschließt, wo das Protein vorkommt (kann bei http://pbil.univ-lyon1.fr/search/query_fam.php nachgelesen werden) [[Chordatiere|Chordata]]
Taxon_Ausnahme Schriftzug: „Ausnahmen“; Liste der Taxa, wo Protein nicht vorkommt [[Felis]]

Beschreibung von Block H

Parameter Beschreibung Möglicher Wert
Orthologe Eine oder mehrere Ortholog-Boxen, siehe die Vorlage:Protein Orthologe {{Protein Orthologe |...}}
Blöcke A bis H detailliert -- 3
Bearbeiten

Ineinander geschachtelte Tabellen ohne Anker.

↑ Blöcke A bis H detailliert ↑

Block Überschrift(en) Funktion
A Entspricht zumeist dem Wert des Parameters "Name" Titel der jeweiligen Infobox Protein und Einleitung.
Beschreibung von Block A
Parameter Beschreibung Möglicher Wert
Name Name des Proteins Serumalbumin
Bild Bild des Proteins Serum Albumin.png
Bild_legende Legende von {{PDB|1YY1}}
Andere Namen Weitere Namen des Proteins BSA
PDB Schriftzug: „Vorhandene Strukturdaten:“; Liste von Einträgen bei PDB {{PDB2|1YY1}}, {{PDB2|ABCD}}
HGNCid Optionale Überschrift unterhalb der Einleitung; Achtung! "HGNCid" wirkt an mehreren Stellen 399
Block Überschrift(en) Funktion
B Keine Überschrift oderEigenschaften des menschlichen Proteins Fortsetzung der Einleitung durch weitere Eigenschaften oder neuer Abschnitt mit speziellen Eigenschaften, nämlich denen der menschlichen Protein-Variante.
Beschreibung von Block B
Parameter Beschreibung Möglicher Wert
HGNCid Durch eine optionale Überschrift werden die Parameter in Block B als: „Eigenschaften des menschlichen Proteins“ gekennzeichnet.  Achtung! "HGNCid" wirkt an mehreren Stellen. 399
Groesse Schriftzug: „Masse/Länge Primärstruktur“; Anzahl Aminosäuren, Molgewicht in Dalton oder kD 1234 aa, 187,9 kD
Struktur Schriftzug: „Sekundär- bis Quartärstruktur“; βαββαβ
Kofaktor Für Funktion notwendiger Kofaktor [[Folsäure|Folat]]
Precursor Schriftzug: „Präkursor“; Link auf evtl. Präkursor-Protein [[Präalbumin]]
Isoformen Liste von Isoformen Alb-2a, Alb-2b
Block Überschrift(en) Funktion
C Bezeichner Aufzählung von Symbolen und Identifikationsnummern mit ihren Fundorten in externen Datenbanken.
Beschreibung von Block C
Parameter Beschreibung Möglicher Wert
Symbol Schriftzug: „Gen-Name“, auch „Gen-Namen“ oder „Gen-Name(n)“; Verlinkung durch "HGNCid" möglich ALB
HGNCid Optionale Verlinkung: Werte von "Symbol" als Text und von "HGNCid" als Linkziel; Eintrag bei HGNC (HUGO Gene Nomenclature Committee); Achtung! "HGNCid" wirkt an weiteren Stellen. 399
AltSymbols Alternative Gen-Symbole, werden rechts von "Symbol" (Schriftzug „Gen-Name“) angeordnet ; ALB-1
GeneCards Verlinkung auf den Eintrag bei GeneCards IDH1
OMIM Verlinkung auf den Eintrag bei OMIM 103600
UniProt Verlinkung auf den Eintrag bei UniProt, Achtung! "UniProt" wirkt an mehreren Stellen P12345
MGIid Verlinkung auf den Eintrag bei MGIid 98765
CID PubChem Compound CID; Verlinkung auf den Eintrag bei PubChem 64763
CAS CAS-Nummer des Proteins 1234-56-78
CASergänzend Zusätze zur CAS-Nummer, die in der Infobox unter dem Link auftauchen ?
Block Überschrift(en) Funktion
D Arzneistoff­anga­ben Angaben zum Protein, wenn es ein Arzneistoff ist.
Beschreibung von Block D
Parameter Beschreibung Möglicher Wert
ATC-Code ATC-Code des Proteins {{ATC|???|????}}
DrugBank Zugriffsnummer der DrugBank DB00062
Wirkstoffklasse [[RNase-Hemmer]]
Block Überschrift(en) Funktion
E Transporter-Klassi­fikation Angaben zum Protein, wenn es ein Membranprotein mit Transportfunktion ist.
Beschreibung von Block E
Parameter Beschreibung Möglicher Wert
TCDB Klassifikation bei TCDB (www.tcdb.org) 1.A.10
TranspText Bezeichnung Transporterklasse [[Kaliumkanal]]
Block Überschrift(en) Funktion
F EnzymklassifikationoderEnzymklassi­fikationenoderInhibitorklassifikation Angaben zum Protein, wenn es ein Enzym ist.
Beschreibung von Block F
Parameter Beschreibung Möglicher Wert
EC-Nummer Schriftzug: „EC, Kategorie“; EC-Nummer des Enzyms 2.1.1.14
Kategorie Enzym-Kategorie; Text ergänzt "EC-Nummer" und wird automatisch zur gleichnamigen Wikipedia-Seite verlinkt Hydrolasen
Peptidase_fam Schriftzug: „MEROPS“; Peptidase-Familie bei MEROPS M02
Inhibitor_fam Schriftzug: „MEROPS“; Proteaseinhibitor-Familie bei MEROPS I04
Reaktionsart Klassifizierung der kat. Reaktion [[Methylierung]]
Substrat Haupt-Substrat des Enzyms [[Traubenzucker|Glukose]]
Produkte Produkte der kat. Reaktion [[Ethanol]]
MoreEC1 Startet mit Schriftzug: „EC, Kategorie“; Zweiter möglicher Eintrag für Enzym- bzw. Inhibitorklassifikation; siehe Vorlage:Infobox Protein/MoreEC {{Infobox Protein/MoreEC|...}}
MoreEC2 Dritter möglicher Eintrag, siehe "MoreEC1"
MoreEC3 Vierter möglicher Eintrag, siehe "MoreEC1"
Block Überschrift(en) Funktion
G Vorkommen Angaben zum Vorkommen und Fehlen des Proteins in Lebewesen.
Beschreibung von Block G
Parameter Beschreibung Möglicher Wert
Homolog_fam Schriftzug: „Homologie-Familie“; Name der Gen- bzw. Proteinfamilie; der Text kann zu einer Datenbank verlinkt werden: "Homolog_fam"+"Homolog_db"+"UniProt" oder "Homolog_fam"+"Homolog_url" beliebiger Text
Homolog_db Verlinkung zu einer Datenbank: Text durch "Homolog_fam", Datenbank durch "Homolog_db" und Identifikations-Nummer durch "UniProt"; für eine Homologie-Recherche siehe http://pbil.univ-lyon1.fr/search/query_fam.php; mögliche Werte: HOGENOM, HOVERGEN und HOBACGEN HOGENOM
UniProt Siehe "Homolog_db"; Achtung! "UniProt" wirkt an mehreren Stellen 103600
Homolog_url URL zur HOGENOM-Datenbank, durch "Homolog_fam"+"Homolog_url" (nur nötig, falls abweichend von der automatisch generierten URL durch "Homolog_fam"+"Homolog_db"+"UniProt") http://doua.prabi.fr/cgi-bin/...
Taxon Schriftzug: „Übergeordnetes Taxon“; Taxon, das alle Organismen einschließt, wo das Protein vorkommt (kann bei http://pbil.univ-lyon1.fr/search/query_fam.php nachgelesen werden) [[Chordatiere|Chordata]]
Taxon_Ausnahme Schriftzug: „Ausnahmen“; Liste der Taxa, wo Protein nicht vorkommt [[Felis]]
Block Überschrift(en) Funktion
H Orthologe Angaben zu sogenannten orthologen Proteinen, d. h. verwandten Gen- bzw. Proteinvarianten in verschiedenen Lebewesen als Tabelle.

Beschreibung von Block H

Parameter Beschreibung Möglicher Wert
Orthologe Eine oder mehrere Ortholog-Boxen, siehe die Vorlage:Protein Orthologe {{Protein Orthologe |...}}

/ AltSymbols / Andere Namen / Arzneistoffangaben / ATC-Code / Ausnahmen / Bezeichner / Bezeichnung / Bild / Bild_legende / CAS / CASergänzend / CAS-Nummer / CID / DrugBank / EC, Kategorie / EC-Nummer / Eigenschaften des menschlichen Proteins / Entrez / Enzymklassifikation / Enzymklassifikationen / Externe IDs / GeneCards / Gen-Name / Gen-Name(n) / Gen-Namen / Groesse / HGNCid / Homolog_db / Homolog_fam / Homolog_url / Homologie-Familie / Inhibitor_fam / Inhibitorklassifikation / Isoformen / Kategorie / Kofaktor / Masse/Länge Primärstruktur / MEROPS / MGI / MGIid / MoreEC1 / MoreEC2 / MoreEC3 / Name / OMIM / Orthologe / PDB / Peptidase_fam / Präkursor / Precursor / Produkte / PubMed-Suche / Reaktionsart / S1_EntrezGene / S1_Uniprot / S2_EntrezGene / S2_Uniprot / Sekundär- bis Quartärstruktur / Spezies1 / Spezies2 / Struktur / Substrat / Symbol / Taxon / Taxon_Ausnahme / TCDB / Transporter-Klassifikation / TranspText / Übergeordnetes Taxon / UniProt / Vorhandene Strukturdaten / Vorkommen / Wirkstoffklasse /

d

d

d

d

d

d

d

d

d

d

dd

d

d

d

d

d

d

d

d

d

d

/ AltSymbols / Andere Namen / Arzneistoffangaben / ATC-Code / Ausnahmen / Bezeichner / Bezeichnung / Bild / Bild_legende / CAS / CASergänzend / CAS-Nummer / CID / DrugBank / EC, Kategorie / EC-Nummer / Eigenschaften des menschlichen Proteins / Entrez / Enzymklassifikation / Enzymklassifikationen / Externe IDs / GeneCards / Gen-Name / Gen-Name(n) / Gen-Namen / Groesse / HGNCid / Homolog_db / Homolog_fam / Homolog_url / Homologie-Familie / Inhibitor_fam / Inhibitorklassifikation / Isoformen / Kategorie / Kofaktor / Masse/Länge Primärstruktur / MEROPS / MGI / MGIid / MoreEC1 / MoreEC2 / MoreEC3 / Name / OMIM / Orthologe / PDB / Peptidase_fam / Präkursor / Precursor / Produkte / PubMed-Suche / Reaktionsart / S1_EntrezGene / S1_Uniprot / S2_EntrezGene / S2_Uniprot / Sekundär- bis Quartärstruktur / Spezies1 / Spezies2 / Struktur / Substrat / Symbol / Taxon / Taxon_Ausnahme / TCDB / Transporter-Klassifikation / TranspText / Übergeordnetes Taxon / UniProt / Vorhandene Strukturdaten / Vorkommen / Wirkstoffklasse / |]] /