Diskussion:Genom
Definition
BearbeitenDietmar13 hat eine neue Definition des Begriffs Genom eingebracht. Ich stimme aus folgenden Gründen nicht damit überein und würde gern die Meinung Anderer dazu kennen. Die bisher im Artikel enthaltene Definition, nach der "Genom" die Summe der Erbanlagen eines Lebewesens bezeichnet, ist die ältere und sie erscheint mir praktikabel. Man weiß zwar inzwischen, daß die zur Ausprägung von Erbanlagen erforderliche Information aus den Basensequenzen der DNA (bzw. bei RNA-Viren der RNA) besteht. Das bedeutet aber nicht notwendigerweise, dass die gesamte DNA Erbinformationen enthält, also auch nicht, dass man nun einfach statt "Summe der Erbanlagen" "Gesamtheit der DNA-Basensequenz" setzen kann. Die Gesamtheit der DNA-Basensequenz enthält nach unserem heutigen Wissen mehr als die Summe der Erbinformationen, stellt also einen anderen, neuen Begriff dar. Deshalb darf man dafür auch nicht die Bezeichnung "Genom" verwenden, die ja für den Begriff "Summe der Erbanlagen" stand und weiterhin stehen sollte. Für einen neuen Begriff muss man auch eine neue Bezeichnung wählen. Homonyme geben Verwirrungen, die man vermeiden soll! Man kann sich auf den Standpunkt stellen, hier läge ein Bedeutungswandel des Worts "Genom" vor und man bezeichne heute eben nicht mehr die Summe der Erbanlagen damit, sondern nun verstünde man darunter die Gesamtheit der DNA-Basensequenzen. Ich halte das aber nicht für gut, denn hier handelt es sich nicht um den Gebrauch von Alltagssprache, sondern um wissenschaftliche Termini, die sauber und dauerhaft definiert werden müssen und keinem Wandel unterliegen sollten. --Brudersohn 22:23, 25. Nov 2004 (CET)
- danke für die diskussion. so wie der begriff genom ist der begriff gen in der (molekular)biologie praktisch nicht definiert, oder wenn, dann sehr stark kontextabhängig. der begriff gen z.b. ist sicher dreifach definiert. 1) gen als substrat der evolutionären selektion (mendelscher faktor) - hier ist aber praktisch höchstens ein allel gemeint, aber eigentlich nur eine bestimmte variante (z.b. nur eine base als mutation) 2) gen als proteincodierender DNA-abschnitt (nur der open reading frame oder mit dem promoter oder mit allen regulatorischen elementen (enhancer, silencer)) - sind jetzt alle splicevarianten eigene gene, oder umfasst dieser genbegriff alle varianten. 3) warum eigentlich nur die proteincodierenden DNA-abschnitte, wo bleiben die funktionellen RNAs, die immer wichtiger werdenden regulativen siRNAs, usw...
- ich glaube die molekularbiologie ist gerade sehr erfolgreich mit ihren versuchen, macht sich aber keine gedanken über ihre terminologie. intuititv wissen alle wovon sie reden. ähnlich bei genom. die definition 'summe der erbanlagen' kommt aus einer zeit, wo praktisch niemand wußte was das eigentlich sein sollte. was soll summe der erbanlagen heißen? summe bezeichnet das ergebnis eines mathematischen vorganges, und das ergebnis für das menschliche genom könnte dann 28.000 erfaktoren heißen? oder würdest du die wikipedia als summer aller artikel definieren - und da ist es noch einiges klarer? und was sind hier die erbanlagen? die gene (siehe oben)? m.E. (und hier ist es erlaubt) sagt diese definition praktisch nichts aus. und im artikel unten stehen z.b. genomgrößen (sollte eigentlich genomgrößen der haploiden genome (bei diploiden organismen) heißen), die exakt nach meiner definition berechnet werden könnten. die durchsequenzierung der verschiedenen genome zielt auch exakt auf meinen genombegriff ab (spiegelt sich auch in den diversen datenbanken wieder - wenn du dir ein (haploides) genom der hefe runterlädst, bekommst du exakt meine definition), und nicht auf die summe der erbanlagen. der genotyp, den man sich im mikroskop anschaut sieht auch exakt genau so aus wie ich ihn beschreibe (exkl. plastom und mitochondriom, die man da nicht sieht).
- ich glaube es wäre durchaus möglich die wikipedia auch zur durchsetztung eines adequateren genombegriffes zu benützen, besonders weil dieser hier von vielen kundigen ausgehandelt werden könnte.
- ich bin nicht abgeneigt die beiden definitionen gleichwertig und hintereinander in dem artikel zu beschreiben.
- und wenn du meinst, die gesamtheit der DNA-sequenz ist nicht das genom, warum werden dann gerade hunderte genome sequenziert. ich wiederhole mich. die (molekualr)biologen verwenden den genombegriff (intuitiv) so wie ich ihn beschreibe, und die definition 'summer der erbinfomation' hat in der wissenschatflichen diskussion keine sinn. mir fällt kein fall ein, wo ich in einem wiss. artikel das genom mit dieser definition sinnvoll verwenden könnte.-Dietmar13 23:59, 25. Nov 2004 (CET)
Persönliche Meinungen
Im Artikel wird die Formulierung "Meines Erachtens ..." verwendet. Das gehört "meines Erachtens" nicht in den Text des Artikels. Sollen überhaupt in Artikeln persönliche Meinungen der Verfasser dargelegt werden? Besser wäre es doch wohl, nur Fakten zu nennen und relevante Meinungen Anderer zu zitieren. Wenn aber doch die Meinung des Verfassers gebracht werden soll (vielleicht ist das in Einzelfällen erforderlich), dann muss auch der Autor, also der Vertreter dieser Meinung genannt werden. Das ist hier aber nicht geschehen. --Brudersohn 22:36, 25. Nov 2004 (CET)
- ok. den satz könnte man auch so starten: Daher ist es aus wissenschaftlicher Sicht nicht sinnvoll ... -Dietmar13 23:59, 25. Nov 2004 (CET)
Vorschlag zur Korrektur der Definition:
Soweit ich weiß beinhaltet ein Genom die Sequenzen des HAPLOIDEN Chromosomensatzes (bei Eukaryoten) inklusive aller Geschlechtschromosomen (beim Menschen also die Sequenz von 24 Chromosomen). Extrachromosomale DNA wird m.E. nicht dazugerechnet.
Bei Prokaryoten wird die Sequenz des gesamten ringförmigen DNA-Moleküls angegeben.
Der Begriff "Information" ist in Bezug auf das Genom irreführend, da der Großteil eines Genoms aus nichtcodierenden Sequenzen bestehen kann (beim Menschen ca. 95%), die gar keine Informationen enthalten.(nicht signierter Beitrag von 88.70.100.155 (Diskussion) 13:09, 29. Apr. 2008)
Ich bin der meinung das man in der definition unbedingt den zusammenhang zwischen genen und genomen erklären sollte. --Quantumvii (Diskussion) 08:02, 11. Jan. 2014 (CET)
@Brudersohn und interessierte
Bearbeitenich habe gerade eine definition von genom aus dem jahr 1988 (herder: lx der biologie) ausgehoben, und die deckt sich (schon) weitgehend mit meiner. war etwas überrascht. wen du (oder wer auch immer) mir deinen (seine) email-adresse an die "wiki_dietmar13@yahoo.de" schickst (werde sie natürlich vertraulich behandeln), schicke ich dir einen scan dieser seite. ich werde den text ein wenig modifizieren, bin aber - wie schon gesagt - natürlich bereit auch größere änderungen vorzunehmen. es sollte aber gut argumentierbar sein. -Dietmar13 09:32, 26. Nov 2004 (CET)
neue Einleitung
BearbeitenDa in der Einleitung einiges Widersprüchliche zum nachfolgenden Text steht, habe ich eine Neufassung vorgenommen. Auch hängen die Sätze mit essentiell etc, ziemlich in der Luft. Damit nix in der Versionsgeschichte versinkt, habe ich das Herausgenommene hierer verschoben, so dass Wesentliches, das ich nicht berücksichtigt haben sollte, eingesehen und evtl wieder eingearbeitet werden kann. Der Artikel soll noch um das Kapitel Bestandteile des Genoms erweitert werden. Dann lässt sich vielleicht das Lemma nichtcodierende Desoxyribonukleinsäure hierher redirecten. -Hati 19:15, 25. Jan 2005 (CET)
Das Genom bezeichnet die Information (in Form der Basensequenz) der DNA eines Lebewesens, das heißt die Gesamtheit der Erbanlagen dieses Lebewesens. Dazu gehören auch die Teilgenome der Mitochondrien und Plastiden, nicht aber die Sequenz extrachromosomaler DNA-Moleküle wie zum Beispiel Plasmide). Bei manchen RNA-Viren wird auch die Gesamtheit der RNA- Moleküle als Genom bezeichnet.
Die allgemein benutzte Definition "Gesamtheit der Erbanlagen eines Lebewesens" greift wesentlich zu kurz, da zum Genom auch alle nicht codierenden (Heterochromatin, Introns, intergene Regionen) und alle strukturell wichtigen DNA-Abschnitte (Centromere und Telomere) zählen. Einmalig vorkommend zielt auf die Tatsache, dass alle sich sexuell fortpflanzenden Organismen je zwei weitgehend gleiche Chromosomen in einer Zelle besitzen (Ausnahmen: teilweise Geschlechtschromosomen und die haploiden Genom der Keimzellen), und beide Chromosomen - soweit sie sich unterscheiden - zum Genom einer Zelle beitragen. Man spricht daher auch von haploiden, diploiden (usw.) Genomen. Essentiell bedeutet, dass die DNA-Abschnitte lebensnotwendig unter normalen Lebensbedingungen sind, und im wesentlichen in allen Zellen dieser Art vorkommen. Manche extrachromosomale DNA-Moleküle (Plasmide) die z.B. Antibiotika-Resistenzgene tragen, zählen nicht zum Genom des Organismus in dem sie sich befinden. Epigenetische Informationen (Imprinting, DNA-Methylierung) werden nicht zum Genom gezählt (Epigenom).
Als das Genom eines mehrzelligen Organismus könnte man die Summe aller Genome seiner Einzelzellen definieren. Der Mensch hat nach dieser Definition zigtausende Genome, die sich aber nur sehr wenig voneinander unterscheiden (Genome der Keimzellen, die sich nach meiotischer Rekombination alle voneinader unterscheiden, Mutationen, die zwangsläufig in den einzelnen Zellen stattfinden, und DNA-Rearrangements, die im Zuge der Immunzellreifung stattfinden).
Erbgut
BearbeitenErbgut ist mE alles vererbt wird, als das Genom der Keimzellen. Da im Verlauf der Ontogenie bei der Reifung der Somazellen die DNA stark verändert, deren DNA aber nicht vererbt wird, ist das Gesamt-Genom mehr als das Erbgut. -Hati 11:07, 26. Jan 2005 (CET)
- Was wird denn an der DNA in somatischen Zellen alles verändert? Die Änderungen sind winzig, in Relation zu der Menge der nicht veränderten Abschnitte, von daher kann man die Begriffe schon gleichsetzen. Sonst würde das Klonen ja auch nicht funktionieren. Mutationen sind außerdem nicht vorgesehen (außer bei somatischer Hypermutation, aber das ist ein Sonderfall, der nur in sehr sehr wenigen Zelltypen überhaupt stattfindet) und daher eher als Fehlfunktionen zu betrachten. --Nina 12:20, 31. Jan 2005 (CET)
Wenn man an die Differenzierung der T- und B-Zellen des Immunsystems denkt, geht da einiges an DNA veloren; Klonen funktioniert doch nicht so einfach wie man sich das vorstellt, siehe "Alter" der Chromsomen; auch wenn der Anteil der Veränderungen minimal wäre, sind die Veränderungen doch so prinzipieller Natur, dass es mE einer Erwähnung wert ist - der Vollständigkleit halber. -Hati 17:15, 31. Jan 2005 (CET)
- In den B-und T-Zellen werden nur die Gene für die B-Zell bzw T-Zell Rezeptoren neu zusammengesetzt (V(D)J-Rekombination). Das betrifft eine winzige Anzahl von Zellen. Was die Telomere betrifft, hast Du recht, die werden kürzer bei jeder mitotischen Teilung. Trotzdem wäre es irreführend, die Veränderungen zu betonen, denn eigentlich ist viel wesentlicher, dass in jeder Zelle dieselben Informationen abrufbar sind. Erwähnt werden die Unterschiede jetzt ja auch- ist das so ok? --Nina 18:21, 31. Jan 2005 (CET)
Bezüglich des Begriffs Genom (od. Erbgut) sollte man vorsichtig sein. Denn das Wort bezeichnet den gesamten genetischen Informationsgehalt einer Zelle oder eines Lebewesens (Viren sind keine Lebewesen), der insbesondere in Form von DNA vorliegt. Das heißt, dass selbst die mRNA als Teil des Genoms gelten kann, denn sie enthält einen Teil der oben genannten Information (aber sehr kurzfristig). Das Wort bezeichnet also keine chemische Strukturen, auch wenn es sich bei dem Träger dieser Information um eine chemische Struktur handelt. Sondern die Information, wenn man so will der Bauplan für die Entwicklung eines Lebewesens, ist hier das bezeichnete. Übrigens stammt die Metapher "Information" aus den 40igern und 50igern des letzten Jahrhunderts, ist also relativ jung. Aber der Begriff Genom bezieht sich nicht auf Viren. Dies ist der eigentliche Kritikpunkt. 213.23.219.200 15:07, 2. Aug 2005 (CEST)
Ich muss mich hier selber korrigieren (wie peinlich). In der Literatur wird der Begriff Genom auch bezüglich Viren verwendet. Im Glossar vom Alberts (Molekularbiologie der Zelle) wird Zelle/Lebewesen explizit genannt. Hierauf hatte ich meine Kritik gegründet. Dennoch frage ich mich, ob der Bezug auf Viren-DNA od. -RNA legitim ist. Denn das Genom von Lebewesen ist in allen mir bekannten Fällen bezüglich der Nutzung genetischer Information autark. Na ja, vielleicht findet sich ja ein anderer Begriff?!?! PBolbrinker 12:43, 16. Aug 2005 (CEST)
Ein Basenpaar hat einen Informationsgehalt von 1 bit?!
BearbeitenEs scheint mir, als sei die im Artikel gemachte Aussage "Ein Basenpaar hat einen Informationsgehalt von 1 bit..." falsch. Jede Base auf dem codogenen Strang der DNA kann vier Zustände annehmen (A, T, C & G) und somit gibt es auch vier Basenpaare, da es nicht egal ist, ob auf dem codogenen Strang z.B. die Base A oder T ist. Somit hat ein Basenpaar den Informationsgehalt von 2 bit (2² Zustände) was zur Folge hätte, dass sich die im Artikel gegebenen MB Angaben verdoppeln würden. Ich würde gerne die Meinung anderer hierzu hören.
Bin genau derselben Meinung. Mit 2 Bit lassen sich 4 Werte darstellen. Heute ist das ja nicht mehr "In", aber ich habe noch in Assembler programmiert. Wenn man sich ein fremdes Programm in Maschinencode ansieht(Assembler ist noch elementar lesbar, Maschinencode nicht mehr), ist es praktisch ausgeschlossen, erkennen zu können, worum es sich in dem Programm eigentlich handelt. Ein gutes Betriebssystem (z.B. HP-Basic) hat etwa 1 MB und kann selbst bei bequemer Ansichtsmöglichkeit auf dem Bildschirm in Assembler nur sehr rudimentär in seiner Funktion erkannt werden. Bei GB Größe und noch dazu in Maschinencode (=DNA) ist nichts von einer Funktion zu erkennen. Auch im Rechnerbetriebssystem sind Stellen zu erkennen, welche als interne Wertablagen oder Zwischenspeicher dienen. Diese Plätze sind positionsmäßig definiert, Wert kann beliebig sein. Die funktionale Entschlüsselung der DNA halte ich für aussichtslos.
Bin auch über diese Formulierung gestoßen. Ich meine aber, Mb steht hier nicht für "Megabit" sondern für "Mega-Basen" d.h. 10^6 Basenpaare. das mit dem 1 Basenpaar == 1 Bit würde ich trotzdem streichen. Die MB-Angaben zu verdoppeln halte ich für keine gute idee.
Ich bin derjenige, der diese Frage gestellt hatte. Ich habe noch einmal darüber nachgedacht und bin jetzt zu folgendem Schluss gekommen: Ein BasenbPAAR hat wirklich nur den Informationsgehalt von 1 bit, da es nur entscheidend ist, welche der beiden Basen auf dem codogenen Strang liegt. Eine Base auf dem, für die Informationen interessanten, codogenen Strang hat aber den Informationsgehalt von 2 bit aus genannten Gründen. Rechnet man das ganze mit 3×109 Basenpaaren für den Menschen (entspricht hier den Basen auf dem codogenen Strang), so kommt man zu ca. 715 Mbyte und im Text stand auch früher schon ausdrücklich "Mbyte", daher habe ich dies nun geändert.
"Somit hat das Genom des Menschen einen Informationsgehalt von ca. 715 Mbyte (ausgegangen von 3×109 Basenpaaren)."
Das ist ein Hammer!
Ich bin zutiefst beeindruckt und gerührt.
--84.185.181.25 00:19, 4. Sep 2005 (CEST)
Die Aussage, ein Basenpaar enthalte die Information von 1 bit finde ich auch unnötig und verwirrend, da ja die Base auf dem codogenen Strang Informationsträger ist. Hier noch ein weiterer Beitrag zur Verwirrung: Laut Artikel Speicherkapazität basiert die Definition des Megabyte (MB) heute auf dem Dezimalsystem, . Das Mebibyte (MiB) basiert auf dem Dualsystem: . Nach meiner Rechnung hat das menschliche Genom danach einen Informationsgehalt von 750 MB oder 715 MiB.
Gelack 21:53, 6. Nov 2005 (CET)
anonym trägt nach: das ganze ist mehr als die Summer seiner Teile! So ist das auch beim Genom!
Also unter diesem Abschnitt gibt es Widersprüche. Hat das gesamte menschliche Genom nun die (anscheinend richtig berechneten) 715MiB bzw. 750Mb oder 3000Mb ? --194.166.198.50 20:08, 18. Mär 2006 (CET)
Wegen der Zweideutigkeit der Abkürzung "Mb/MB" ist prinzipiell beides richtig: ca. 3000Mb (im Sinne von Megabasen) entsprechen ca. 750Mb/MB (im Sinne von Megabytes), wobei im Sinne dieses Artikels sicherlich die erste Definition die relevantere ist.
Nochmal im Detail:
Das menschliche Genom (in der haploiden Version) hat eine Gesamtlänge von ca. 3.000.000.000 Basenpaaren ( = Basen = Nucleotide, jedenfalls im Hinblick auf den Informationsgehalt). Das heisst, dass die gesamte DNA-Sequenz (z.B. ACGGTCATGCAGTCGTTGA... etc.) aus insgesamt ca. 3.000.000.000 einzelnen "Buchstaben" besteht und in dieser Form ist das menschliche Genom z.B. auch in den Sequenzdatenbanken verfügbar.
In der einschlägigen Fachliteratur (Molekularbiologie, Genetik, Genomik) werden üblicherweise die Abkürzungen kb (für Kilobasen), Mb (für Megabasen) und Gb (für Gigabasen) verwendet.
Die in Artikel und Diskussion angestellten Überlegungen und Berechnungen zur Berechnung der Größe des menschlichen Genoms in Bytes (oder kilo-, Megabytes etc.) haben allerdings für die meisten Fragestellungen in der Genomforschung selbst keine Relevanz und sind daher im Artikel möglicherweise überflüssig (?), insbesondere da sie offensichtlich für Verwirrung sorgen.
Wenn ein entsprechender Abschnitt sinnvoll erscheint, bitte daran denken, dass die prinzipiell richtige Überlegung "vier verschiedene Basen = 2 Bit pro Base = 4 Basen pro Byte = 750Mbytes für 3000Mbasen" weder in der Theorie noch in der Praxis wirklich aufgeht.
FALLS man im Sinne der Informationstheorie den Informationsgehalt des menschlichen Genoms in bits oder bytes bestimmen wollte, ist zu berücksichtigen, dass weite Teile des menschlichen Genoms aus repetitiven Sequenzen mit niedriger Komplexität bestehen, der tatsächliche Informationsgehalt des Genoms also geringer als die o.g. 750Mbytes ist.
In der Praxis ist jedoch auch zu berücksichtigen, daß in aller Regel in Genomsequenzierungsprojekten ein (wenn auch sehr kleiner) Anteil der Basenpositionen nicht mit Sicherheit bestimmt werden kann, und diese Positionen werden dann mit anderen Buchstaben als A,C,T,G, nämlich in der Regel dem Buchstaben N als Platzhalter gekennzeichnet. Für "reale" Genomsequenzen ist daher ein Codierungsverfahren mit 2 bit/Base nicht praktikabel.
Feezil 09:45, 19. Mär 2006 (CET)
Da hier pro Basenpaar 4 Zustände eintreten können, A,C,T,G handelt es sich nicht um ein binäres System sondern ein tertiäres System. Für das Genom mit 3*10^9 Basenpaare währen demnach 4^(3*10^9) Variationen möglich. Binär währen das 2^(2*3*10°9)und das sind 5,58GBit oder 689 MByte.monzinger 22:55, 12. Nov. 2008 (CET)
Hallo -
ich finde es schön, dass ein Ausdruck der Genomgröße in gewohnten (binären) Informationsmengen wie Byte in den Artikel gefunden hat. Die Berechnung eines Basenpaars mit 2 Bit hast sich zum Glück gegenüber dem Unsinn mit 1 Bit durchgesetzt. Die 750MB sind vorstellbar. Ich finde auch gut, dass der Komplementär-identische Part der Doppelhelix nicht mitgerechnet ist.
Leider ist auf keine Stelle verwiesen, wie der Text auf die weitere Angabe 50MB kommt, wegen "Shannonsher Informationstheorie". Das ergibt sich auch nicht aus den beiden verlinkten Begriffsdefinitionen. Ich finde, da müsste man schon eine nachvollziehbare Quelle haben, um sowas behaupten zu können.
Als Informatiker möchte ich noch darauf hinweisen, das es sich (zumindest, soweit Proteine codiert werden) nicht um einen Quartär-Code (A,C,T,G) handelt, sondern um Triplets aus 3 Basenpaaren, die jeweils eine Aminosäure codieren. Somit sind nicht alle Kombinationen von 3 Basen, die jeweils 4 Zustände annehmen können möglich, sondern nur 21 , entsprechend der Anzahl der Aminosäuren (ein paar mehr als 21 solltens sein, wegen der seltenen).
Kurz überschlagen: 3,27 *10**9 Basenpaare. Ergibt etwa 10**9 Triplets zu je 21 Zuständen, das wäre ein 21-er System mit 10**9 dieser Ziffern.
Gruß --Ingosp 12:54, 8. Sep. 2011 (CEST)
- Hallo Ingosp, die Angabe "50 MB" findet sich in der angegebenen Quelle bei Panda's Thumb. Dort steht auch was von Tripletts, womit ich als Nicht-Informatiker allerdings nicht viel anfangen kann. Wie ich auf die Shannonsche Theorie gekommen bin, kann ich jetzt auf die Schnelle nicht nachvollziehen. Ich fände es gut, wenn du dich mit Fachkenntnis der Passage annehmen könntest. --Klaus Frisch 16:23, 8. Sep. 2011 (CEST)
- Bin auch Informatiker und habe auch mal ein an einem Seminar zur Shannonschen Informationstheorie teilgenommen. Da muss man sehr aufpassen, da kann man viel falsch machen und auch viel falsch verstehen. Ich habe die Passage jetzt rausgestrichen, da sie mir sofort negativ aufgefallen war. Die Quelle halte ich nicht für so vertrauenswürdig, als dass man das unkritisch übernehmen darf. --80.138.40.144 12:10, 16. Jan. 2014 (CET)
Wie passt das?
BearbeitenZitat aus dem Artikel: "Mit etwa 3 Milliarden Basenpaaren hätte das Genom des Menschen demnach einen maximal möglichen Informationsgehalt von 6 Milliarden bit" D.h. doch, dass es max. 6 Mrd. verschiedene gibt. Bei 7 Mrd. Menschen (+ nochmal ca. 7 Mrd. schon gelebt habender) kann dann doch die DNA nicht eindeutig einen Menschen identifizieren, oder? --Cami de Son Duc 19:23, 16. Jan. 2012 (CET)
- Du lässt die Möglichkeit der verschiedenen Anordnung der Paare außer Acht. Es könnte Billionen und mehr verschiedene Genome geben. Umgekehrt ist es auch möglich, dass es gleichartige Genome gibt (nur weil sie „anordnungstechnisch“ sehr verschieden sein können, heißt’s ja nicht, dass auch alle verschieden sind ;-)
- Allerdings ist die Angemessenheit der shannonschen oder sonst einer (bereits erfundenen/entdeckten) mathematischen Informationstheorie zur Beschreibung von Gensequenzen… umstritten. Bei Interesse: Eine vielbeachtete Kritik lieferte zum Beispiel Lily E. Kay: Who Wrote the Book of Life?: A History of the Genetic Code. Stanford University Press
- Gruß, Hæggis 22:49, 16. Jan. 2012 (CET)
- OK, danke! --Cami de Son Duc 19:18, 17. Jan. 2012 (CET)
DNA/DNS
BearbeitenWarum wird denn hier dauernd die Abkürzung DNA verwendet? Das hier ist die deutsche Wikipedia! Das ist ja wohl sehr verwirrend!
Hallo Unbekannt, Du kannst Deine Diskussionsbeiträge unterschreiben, indem Du vier Tilden setzt ~~~~. Wir verwenden auch in der deutschsprachigen Wikpedia die Abkürzung DNA, da sie sich inzwischen durchgesetzt hat. Gruß, --Nina 10:21, 12. Jul 2005 (CEST)
Hallo seit den 80er Jahren wird im Schulunterricht bereits DNA gelehrt. Gruß FrankT
Habe heute die umfangreiche Änderung eines Anonymus von DNA und RNA in DNS bzw. RNS wieder rückgängig gemacht. --Brudersohn 15:54, 8. Mär. 2009 (CET)
Genom-Enschlüsselung
BearbeitenWenn die Basensequenz von DNA ermittelt wird ("DNA-Sequenzierung"), ist damit keine "Entschlüsselung" erreicht, auch wenn das oft so ausgedrückt wird. Der Schlüssel zur Umsetzung von Basensequenzen in Aminosäuresequenzen, der genetische Code, ist lange bekannt, der wird nicht durch DNA-Sequenzierung an Genomen ermittelt. Also was könnte mit "Genom-Entschlüsselung" gemeint sein? Das könnte zum Beispiel die Aufklärung sein, welche Funktion einzelne Abschnitte der DNA haben, für welche Proteine sie stehen und dergleichen. Aber das wird durch die bloße DNA-Sequenzierung noch nicht geleistet, das kommt erst danach! Deshalb habe ich im Abschnitt "DNA-Sequenzen im Internet" den Ausdruck "Entschlüsselung" durch "DNA-Sequenzierung" ersetzt. --Brudersohn 22:35, 13. Jul 2005 (CEST)
Zahlenwirrwarr
BearbeitenOfenbar setzt sich der Artikel aus sich widersprechenden Quellen zusammen. So wird im Kap. "Typische Genomgröße" in der Tabelle 13.500 Gene für die Taufliege und 28.000 Gene für den Menschen angegeben, später im Text spricht man aber von 3.000 bis 4.400 Genen für Drosophila (gleiches Kapitel, bei Bemerkungen) und von 20.000 - 25.000 Genen beim Menschen (Kapitel "Bestandteile des menschlichen Genoms"). Vielleicht kann jemand mit Fachwissen dieses Problem lösen. --Andibrunt 08:33, 10. Apr 2006 (CEST)
Länge der DNA in einer menschlichen Zelle
BearbeitenVorab: Ich bin völliger Laie in der Thematik und versuche mir gerade gewisse Kenntnisse anzueignen. Meine Frage zum Artikel Genom/Bemerkungen: Die Länge der gesamten menschlichen DNA wird mit 1,8 m angegeben. An gleicher Stelle wird gesagt, dass das menschliche Genom 3.000.000.000 Basenpaare umfasst. Im Artikel über DNA wird gesagt, dass sich die Basenpaare in einem Abstand von 0,34 nm befinden. Ich bekomme nun diese Zahlen nicht ganz unter einen Hut: Ich gehe wohl zu Recht davon aus, dass die 3.000.000.000 Basenpaare sich auf haploide Zellen beziehen. Also rechne ich für die 46 Chromosomen einer normalen Zelle 6.000.000.000 Basenpaare. Die Multiplikation mit 0,34 nm Abstand zweier Basenpaare ergibt dann eine Länge von 2,04 m. Wo liegt mein Fehler oder wie lassen sich die 1,8 m herleiten? Ändert sich die Gesamtlänge der DNA z.B. durch Super-Coiling?
Zweite Frage zur Anzahl der menschlichen Gene (Artikel Genom): In der Tabelle steht die Zahl 28.000. Darunter steht: "Da die Anzahl der Gene je nach Organismus unterschiedlich genau bestimmt und Gegenstand aktueller Forschungen ist, können Angaben aus unterschiedlichen Quellen um wenige tausend Gene voneinander abweichen (Beispiel: Die Anzahl der Gene beim Homo sapiens sapiens liegt etwa im Bereich 20 000-30 000)." Also ist sich noch nicht einmal die eine Quelle ganz einig, wie viele menschliche Gene es gibt? Woher kommt diese große Schwankungsbreite? Bei http://www.gensuisse.ch/act/sdadpa041020.html steht etwas von 20-25.000. Gleichzeitig steht dort, dass 93,5 % des menschlichen Genoms entschlüsselt sei. Ist man sich nicht ganz darüber einig, wie die 3 Milliarden Basenpaare in Gene aufzuteilen sind? Aber wie kann man dann sagen, das Genom sei zu 93,5% entschlüsselt?
Eben lese ich: Die neuen Erkenntnisse über die Maus könnten den Menschen in ein ganz anderes Licht stellen. Bis zu 70.000 Gene wollen Forscher bei der Maus lokalisiert haben - und sie schließen daraus: "Der Mensch hat sicherlich genau so viele." Quelle: http://www.3sat.de/3sat.php?http://www.3sat.de/nano/news/40511/index.html Artikel von 2002 Was ist denn da der Stand der Erkenntnis?
Konsassen Konsassen 08:38, 23. Aug 2006 (CEST)
- Ein Problem ist das es keine Quellenangabe gibt. Ich bezweifle die Zahl zwar nicht, aber ich kenne auch die Zahl 1.85 Meter statt 1.80 Meter und wollte nachlesen, wie man auf diese Zahl gekommen ist. Leider gibt es aktuell (2018) keinen Link zur Quellenangabe hierzu. 2A02:8388:1603:CB00:3AD5:47FF:FE18:CC7F 12:32, 3. Jun. 2018 (CEST)
- Wie dehnbar ist denn so eine DNS und gibts Unterschiede zwischen "Trocken- und Lebendgewicht"? --Georg Hügler (Diskussion) 12:38, 3. Jun. 2018 (CEST)
Bitte aktualisieren
BearbeitenDa die meisten Angaben aus dem Jahre 2005 stammen sollte der Artikel in diesem sich sehr rasant entwickelnden Feld aktualisiert werden. Es fehlt ein Abschnitt zur Paläogenomik, zumal es keinen Artikel darüber gibt. Die PG ist aber in letzter Zeit beachtlich fortgeschritten.--Löschfix 03:49, 4. Feb. 2007 (CET)
- apropos: Carsonella ruddii
---Betreff Definition: Genom---
BearbeitenIch kann der Definition so nicht zustimmen. Ein Genom enthält ganz eindeutig nicht die DNA der Mitochondrien oder Chloroplasten sondern nur die des Zellkerns. Es wäre ja aberwitzig die Organellen-DNA mitzuzählen da diese in mehrhundertfacher Kopienzahl vorkommt die noch nicht einmal identisch sein müssen. Des weiteren sind die Informationen des "Chondroms" und "Plastoms" (Bezeichnungen für die Organellengenome) nicht immer sondern zum Teil nur maternal oder paternal erblich, was der Definition der Vererbarkeit widerspräche. Meine persönliche Meinung, die sich aus 15 Jahren molekularbiologischer Forschung ergibt ist die, daß es im Augenblick keine gültige Definition des Begriffes "Genom" gibt, die alles erfasst. Wie in anderen Diskussionspunkten schon erwähnt sind soviele Abweichungen von der ursprünglichen Definition bekannt (epigenetische Modifikationen, Organellen-DNA, extrachromosmale DNA, Introns, regulatorische Bereiche, micro RNAs, snRNAs, guide RNAs und so weiter), so daß man hier sehr genau nachdenken muß bevor man den Begriff hierauf anwenden möchte. A.dent
---Betreff Rechtschreibung: Genom---
Bearbeitenmuß es nicht Genome heißen (DNA)? --> FrankT
"Weibliches Genom" (oder Genomin?)
BearbeitenWill jemand von Euch das einarbeiten (die Daten sind noch ganz warm...): => http://www.sciencedaily.com/releases/2008/05/080526155300.htm
Ich tippe gerade an andernen Fronten. Gruss --Grey Geezer 11:59, 27. Mai 2008 (CEST)
Genomgröße in Basenpaaren gemessen
BearbeitenIm Text steht: „... die Genomgröße (in Basenpaaren gemessen) kleiner sein kann als die Anzahl der durch das Genom kodierten Merkmale.“ Wie ist das gemeint. Dass die Anzahl der Basenpaare geringer sein kann als die Merkmale, ist ja wohl nicht gemeint, denn das ist sicherlich unmöglich. Aber was bedeutet dann „Genomgröße (in Basenpaaren gemessen)“? Kann man den Satz klarar fassen? --Brudersohn 17:58, 9. Aug. 2008 (CEST)
Historie
BearbeitenIn der Einleitung wird „Genom“ definiert als „die Gesamtheit der vererbbaren Informationen einer Zelle ... , die als Desoxyribonukleinsäure (DNA) vorliegt. ... Das Genom enthält die Informationen, die zur Entwicklung (Ontogenese) und zur Ausprägung der spezifischen Eigenschaften des Lebewesens oder Virus notwendig sind. Diese Informationen sind in der Basensequenz der DNA enthalten.“ Und dann steht da „Der Begriff wurde 1920 von Hans Winkler geprägt.“ Ist das richtig? Dieser so definierte Begriff soll schon von Hans Winkler geprägt worden sein? Woher kannte er schon 1920 die Nukleinbasen und ihre Bedeutung für die genetische Information? Ist nicht eher gemeint, die Bezeichnung „Genom“ für den Begriff der Gesamtheit der vererbbaren Informationen einer Zelle sei von ihm geprägt worden? --Brudersohn 21:56, 2. Dez. 2008 (CET)
Datei:NichtGenMenge.png und Datei:GenomMenge.png
BearbeitenIn Datei:NichtGenMenge.png komme Wirbeltiere zweimal mit unterschiedlichen Angaben vor. Der Mensch, welcher ebenfalls Wirbeltier ist, kommt zudem außerhalb beider Bereiche vor. Dies ist verwirrend. Da der Autor der Bilder Wikipedia verlassen hat, scheint mir eine Klärung auf diesem Weg nicht möglich. Aus dem Artikel löschen? In Datei:GenomMenge.png wird nicht klar, was die Y-Achse ausdrückt. Aus dem Artikel löschen? Ocolon (20:12, 15. Apr. 2010 (CEST), Datum/Uhrzeit nachträglich eingefügt, siehe Hilfe:Signatur)
- Habe beide Grafiken entfernt und einen Teil des zugehörigen Textes auskommentiert. Das stammt anscheinend alles von einem seit 2007 nicht mehr aktiven Benutzer und dürfte komplett TF sein. Genommenge.png stimmt nicht mit detaillierteren Darstellungen überein und erweckt einen falschen Eindruck. --Klaus Frisch 17:43, 31. Okt. 2010 (CET)
Sequenzierte Genome
BearbeitenWenn ich die FAZ (http://www.faz.net/s/Rub80665A3C1FA14FB9967DBF46652868E9/Doc~E67A05D78E717473ABE3F994E4E3D3D2C~ATpl~Ecommon~Scontent.html?nwl_wissenschaft) richtig gelesen habe, gehört das Genom der Erbsenblattlaus jetzt (Frühjahr 2010) auch zu denen, deren Sequenz publiziert wurde. Vgl. http://www.innovations-report.de/html/berichte/biowissenschaften_chemie/international_aphid_genomics_consortium_publishes_149238.html. Vielleicht kann jemand was draus machen, gibt mehr her als nur einen Listeneintrag. --Peewit 22:52, 21. Apr. 2010 (CEST)
Informationsmenge
BearbeitenAus dem Artikel: "Auf der Grundlage der Shannonschen Informationstheorie ergibt sich jedoch ein Informationsgehalt von maximal 50 MB, und der tatsächliche Informationsgehalt liegt noch deutlich darunter, da große Teile der DNA zufällige Sequenzen aufweisen und daher praktisch keine Information enthalten." Dies muß genauer erläutert werden. Ansonsten muß man annehmen, daß der Schreiberling nicht über 50 Mio zählen konnte. Ich halte diese Angabe für ein Gerücht. Zwischenzeitlich wurde bereits festgestellt, daß die sogenannte "Junk" DNA eben nicht nur spaßig ist sondern tatsächlich eine Aufgabe hat. (nicht signierter Beitrag von 87.161.98.61 (Diskussion) 20:07, 5. Feb. 2012 (CET))
- Die Quelle für diese Aussage ist im Artikel angegeben, es handelt sich also nicht um ein Gerücht. --Klaus Frisch 20:25, 5. Feb. 2012 (CET)
Redirects auf das Lemma
BearbeitenDie Stichworte Erbinformation und Genetische Information leiten z. Zt. als Redirects auf das Lemma Genom weiter ... warum darf dies lt. Benutzer:Klaus Frisch ([1]) nicht einleitend erwähnt werden? ... Hafenbar (Diskussion) 00:55, 30. Mär. 2012 (CEST)
- Du hast zwei hilfreiche Links auf andere Artikel entfernt und zwei Begriffe gefettet. Macht beides keinen Sinn. Wer ungewöhnlicherweise wissen will, welche Artikel hierher verweisen, kann das über einen Klick links unter "Werkzeuge" erfahren. --Klaus Frisch (Diskussion) 02:25, 30. Mär. 2012 (CEST)
- Hallo Benutzer:Klaus Frisch:
- 1) Wenn Dir die Links auf Vererbung (Biologie) und Information „hilfreich“ erscheinen, dann solltest Du sie bitte in einer angemessenen Form in den Text integrieren, statt den (Gesamt)Ausdruck vererbbaren Information zu bilden, denn diese Vorgehensweise ist in zweifacher Hinsicht ungeeignet:
- 1a) Ein Leser muss erst durch Mousesover bzw. Ausbrobieren ermitteln, dass du da keine Mehrwortbenennung verlinkt hast, sondern zwei völlig unterschiedliche Artikel.
- 1b) Statt der Dir bevorzugten Mehrwortbenennung vererbbare Information findet sich im Deutschen *wesentlich häufiger* das Kompositum Erbinformation, oder aber die Mehrwortbenennung genetische Information, vgl. Ngram Viewer, daher wurden diese beiden Termini auch als Stichworte in die de.Wikipedia aufgenommen und leiten z.Zt. als Redirects auf das Lemma Genom weiter.
- 2) Die hervorgehobene Erwähnung von Redirects in der einleitenden Definition des Zielartikel ist wichtig für den nachschlagenden Leser: er sollte auf einen Blick feststellen können, ob es sich dabei um Synonyme, oder um Unterbegriffe, oder aber um Gegenwörter handelt.
- 1) Wenn Dir die Links auf Vererbung (Biologie) und Information „hilfreich“ erscheinen, dann solltest Du sie bitte in einer angemessenen Form in den Text integrieren, statt den (Gesamt)Ausdruck vererbbaren Information zu bilden, denn diese Vorgehensweise ist in zweifacher Hinsicht ungeeignet:
- Weil 2) im Artikel Genom z.Zt. *nicht* gegeben ist, ist die Mehrwortbenennung genetische Information (trotz hundertfacher Verwendung in deutschsprachiger Fachliteratur) z.Zt. auf den sog. Löschkandidaten gelistet - was Du, wenn du deinen obigen Ratschlag („kann das über einen Klick links unter "Werkzeuge" erfahren“) beherzigt hättest - auch selbst hättest feststellen können.
- Ich hoffe, ich konnte deiner Horizonterweiterung dienen und Du überdenkst deine Vorgehensweise nocheinmal selbstkritisch. Wenn Du zukünftig weitere Probleme oder Fragen zur Erstellung und Lemmatisierung einer Enzyklopädie hast, kannst Du dich an mich wenden ... Hafenbar (Diskussion) 18:06, 31. Mär. 2012 (CEST)
- Ich hatte die LD durchaus bemerkt, aber du hast anscheinend übersehen, dass man dir dort erläutert hat, dass und warum genetische Information oder Erbinformation eben keine Synonyme zu Genom sind. --Klaus Frisch (Diskussion) 18:25, 31. Mär. 2012 (CEST)
- Gerade wenn Stichwort x *kein* Synonym zu Lemma y darstellt, sondern (nur, z.Zt.) unter Lemma y behandelt wird, ist es *umso wichtiger* dies in der definitorischen Einleitung von y auch darzustellen. Dies wird naturgemäß nicht funktionieren, wenn ich dort x nichteinmal erwähne, dann muss der (ungefragt weitergeleitete) Leser nämlich Synonymie annehmen ... Hafenbar (Diskussion) 18:49, 31. Mär. 2012 (CEST)
- Der Artikel hier dient nicht dazu, unsinnige Redirects irgendwie verständlich zu machen. Man könnte stattdessen einen der betreffenden Redirects durch einen kleinen Artikel ersetzen und den anderen dorthin leiten. Solltest du dazu nicht in der Lage sein, dann kannst du dich an die Redaktion Biologie wenden. --Klaus Frisch (Diskussion) 21:43, 31. Mär. 2012 (CEST)
- Hallo Benutzer:Klaus Frisch, ich entnehme deinem Posting
- dass du meine obige Argumentation (inzwischen) nachvollziehen kannst
- dass Du als (Fach)Autor der in Genom agiert nicht willens(?) oder in der Lage(?) bist die Fachausdrücke Erbinformation([2]) bzw. Genetische Information([3]) adäquat zu behandeln
- sehe ich das richtig? ... Hafenbar (Diskussion) 22:46, 31. Mär. 2012 (CEST)
- Ich habe mich klar und deutlich ausgedrückt. Weitere persönliche Anmache, die nicht zur Verbesserung des Artikels beiträgt, werde ich ggf. löschen. Such woanders Streit. --Klaus Frisch (Diskussion) 00:11, 1. Apr. 2012 (CEST)
- Ich sach mal so: Du hast vererbbare Information ausdrücklich als defefinitorisch stützenden Unterbegriff von Genom verwendet die Fachsprachliche Realität bzgl. Erbinformation und genetische Information per Ngram Viewer mal locker ignoriert bzw. war dir unbekannt und gelöscht ... ich suche hier keine Streit, ich frage mich nur wie soetwas zustande kommt, ich kann mich da nur wundern ... Hafenbar (Diskussion) 01:13, 1. Apr. 2012 (CEST)
- Na warum fragst du dann nicht gleich? Dann hätte ich dir sagen können, dass der fragliche Passus nicht von mir stammt und seit langer Zeit unbeanstandet im Artikel steht.
- Aber nochmal zur Sache: Erbinformation, vererbbare Information und genetische Information sind offenbar Synonyme. Ein Artikel unter einem dieser drei denkbaren Lemmata wäre wünschenswert. Dann könnte man hier auch dahin verlinken. Aber so lange es da nur Redirects hierher gibt, müssen wir halt getrennt auf Vererbung und Information verlinken. --Klaus Frisch (Diskussion) 01:35, 1. Apr. 2012 (CEST)
- Ich sach mal so: Du hast vererbbare Information ausdrücklich als defefinitorisch stützenden Unterbegriff von Genom verwendet die Fachsprachliche Realität bzgl. Erbinformation und genetische Information per Ngram Viewer mal locker ignoriert bzw. war dir unbekannt und gelöscht ... ich suche hier keine Streit, ich frage mich nur wie soetwas zustande kommt, ich kann mich da nur wundern ... Hafenbar (Diskussion) 01:13, 1. Apr. 2012 (CEST)
- Ich habe mich klar und deutlich ausgedrückt. Weitere persönliche Anmache, die nicht zur Verbesserung des Artikels beiträgt, werde ich ggf. löschen. Such woanders Streit. --Klaus Frisch (Diskussion) 00:11, 1. Apr. 2012 (CEST)
- Hallo Benutzer:Klaus Frisch, ich entnehme deinem Posting
- Der Artikel hier dient nicht dazu, unsinnige Redirects irgendwie verständlich zu machen. Man könnte stattdessen einen der betreffenden Redirects durch einen kleinen Artikel ersetzen und den anderen dorthin leiten. Solltest du dazu nicht in der Lage sein, dann kannst du dich an die Redaktion Biologie wenden. --Klaus Frisch (Diskussion) 21:43, 31. Mär. 2012 (CEST)
- Gerade wenn Stichwort x *kein* Synonym zu Lemma y darstellt, sondern (nur, z.Zt.) unter Lemma y behandelt wird, ist es *umso wichtiger* dies in der definitorischen Einleitung von y auch darzustellen. Dies wird naturgemäß nicht funktionieren, wenn ich dort x nichteinmal erwähne, dann muss der (ungefragt weitergeleitete) Leser nämlich Synonymie annehmen ... Hafenbar (Diskussion) 18:49, 31. Mär. 2012 (CEST)
- Ich hatte die LD durchaus bemerkt, aber du hast anscheinend übersehen, dass man dir dort erläutert hat, dass und warum genetische Information oder Erbinformation eben keine Synonyme zu Genom sind. --Klaus Frisch (Diskussion) 18:25, 31. Mär. 2012 (CEST)
- Hallo Benutzer:Klaus Frisch:
Mechanismen zur Homogenität innerhalb mehrzelliger Organismen
Bearbeiten(1) Ein Genom ist die Gesamtheit der vererbbaren Information einer Zelle.
(2) Ein mehrzelliger Organismus kann durch lokale Mutationen zeitweise unterschiedliche Genome aufweisen.
Wie breitet sich eine Mutation auf andere/alle Körperzellen aus – beziehungsweise wie wird sie zurückgedrängt? Wie läuft die interzelluläre „Diskussion“ bzw. „Entscheidungsfindung“ darüber ab, sodass nachher die eine Mutation vom Organismus übernommen wird und die andere nicht. Der Artikel sollte mMn etwas dazu sagen.
Vielen Dank, Qesčn Marc (Diskussion) 19:34, 26. Apr. 2014 (CEST)
Fehlende Artikel
Bearbeitenfällt mir auf - dieser Artikel ist auf EN um ein Vielfaches länger, die auf En ellenlangen Artikel en:Human genome und en:Genomics, beide in Dutzende Sprachen übersetzt, sind gar nicht vorhanden. Man kann pc auch zu weit treiben. --tickle me 00:42, 12. Apr. 2015 (CEST)
- Hallo Tickle me, ich helfe Dir gerne dabei. Hinweise findest Du auf H:Übersetzung. Grüße, --Ghilt (Diskussion) 12:24, 12. Apr. 2015 (CEST)
Erbgut der Eizelle der Mutter
BearbeitenWoraus besteht das Erbgut der Eizelle der Mutter? Die Eizelle der Mutter (Jahr 1979) ist entstanden aus der Eizelle ihrer Mutter (Jahr 1850) und des Spermiums des Vater (Mutter). Die Eizelle ihres Vaters ist entstanden aus der Eizelle der einen Mutter (Jahr 1850) eine Generation frueher. Aus der Eizelle der Grossmutter (Jahr 1850) und dem Spermium des Grossvaters ist die Eizelle der Mutter entstanden. Von wem stammen die Spermien der Urgrossmutter, des Urgrossvater und das Spermium des Vater, welches aus der einer Eizelle und eines Spermium der Urgrosseltern auf seiten des Vaters entstanden ist. Damit es die Generation der Eltern eine Eizelle und eines Spermium gibt, baucht es auf Seiten der Grosseltern 2 Eizellen und 2 Spermien. Matematisch 4+2=1+1=1 (1= Eizelle oder Spermium). Stimmt doch so oder? Zwei Grossmuetter = 1 Grossmutter = 1 Mutter = 1 Tochter. Die Frage ist, woraus besteht die Eizelle der Tochter (Jahr 2016) in Bezug auf die sieben Eizellen (4 Urgrossmuetter, 2 Grossmuetter, 1 Mutter gleich 1 Tochter) Die Masse, Form und die Eigenschaften aller Genarationen Jahr 1850 bis Jahr 2016 der Eizellen des einzelnen Menschen ist biologisch, chemisch, physikal (Erbgut, Genom) gleich oder nicht gleich? 193.180.154.129 11:38, 20. Aug. 2016 (CEST)
individuelle Unterschiede
BearbeitenWenn es heißt, das menschliche Genom sei entschlüsselt - was genau wurde dann entschlüsselt? Jedes Individuum unterscheidet sich doch in vielen Merkmalen und damit Basen etc.? Hierauf hatte ich gehofft, eine Antwort zu finden... --2A00:C1A0:4886:C00:B930:1297:BE07:9C4F 15:16, 10. Okt. 2018 (CEST)
Informationgehalt, Bits und Bytes
BearbeitenHallo, in diesem Beitrag geht es mir (Dirk123456) um die Darstellung des Ausdrucks „Informationgehalt“ und seine Bedeutung. ↓zum Ende des Beitrags↓
Gegenwärtiger Zustand:
Das Wort „Informationsgehalt“ im Zusammenhang mit Genomgrößen kann mit „Wikiblame“ (http://wikipedia.ramselehof.de/) seit dem 22. Dez. 2004 im Artikel gefunden werden (diff=prev&oldid=3774013). Gegenwärtig wird zum Thema „Informationgehalt“ im Abschnitt „Genomgrößen“ (oldid=209379579#Genomgrößen) ein Beitrag zitiert (Referenz 12.: „Information content of DNA bei Panda's Thumb“), der vom 22. Oktober 2008 stammt und auf pandasthumb.org archiviert wurde. So, wie ich das erkenne, handelt sich bei diesem Beitrag um die persönlichen Betrachtungen von jemandem mit dem Kontonamen „PvM“; echte Belege, wie sie seit einiger Zeit in der Wikipedia gefordert werden (WP:BLG), fehlen dort. Der Beitrag ist also eher nicht so gut zitierbar (wenngleich die Urheberrechte unbedenklich sind: „... The Panda’s Thumb and original authors — Content provided under Creative Commons BY-NC-ND License 4.0“). Übersetzt steht im „Post“ von „PvM“ ungefähr Folgendes:
- „Der Informationsgehalt von DNA ist viel schwieriger zu bestimmen, als nur die Anzahl der Basenpaare zu betrachten und mit 2 zu multiplizieren, um die Größe in Bits zu erhalten (daran denken, dass jede Stelle bis zu 4 verschiedene Nukleotide oder 2 Bits haben kann). Dieser Ansatz kann uns jedoch eine Schätzung nullter Ordnung der maximal möglichen Informationen liefern, die in dieser Sequenz gespeichert werden können, die für das menschliche Genom mit 3 Milliarden Basenpaaren 6 Milliarden Bits oder 750 Mbytes betragen würde.“
In der englischen Wikipedia findet man im Artikel „Genome“ keinen „information content“ oder Ähnliches (weder belegt noch unbelegt).
Einige Berechnungen und Betrachtungen:
Die Zahlen (im englischen „Post“: „... with 3 billion base pairs would amount to 6 billion bits or 750 Mbytes“) sähen also so aus: 3e+09; 6e+09; und 750 * Mbytes. Was „Mbytes“ in diesem Fall sein soll, ergibt sich durch folgende Gleichungen:
- 1 Mbyte = 6e+09 / 750 = 8e+06 Bits.
Da ein Byte aus 8 Bits besteht, gilt Folgendes:
- 1 Mbyte = 8e+06 / 8 = 1.000.000 Bytes = 1 Megabyte.
Es wurden bei „The Panda’s Thumb" also dezimale Einheiten verwendet („Kilo“: 103
; „Mega“: 106
).
Man kann genauere Zahlen nehmen (z. B. 3,27 Milliarden bzw. 3,27e+09 Basenpaare und 6,54 Milliarden bzw. 6,54e+09 Bits) und zusätzlich binäre Einheiten verwenden („Kibibyte“: 1 KiB = 210 = 1024 Bytes
; „Mebibyte“: 1 MiB = 220 = 1048576 Bytes
), wie dass im Artikel „Genom“ gemacht wurde. Dann ergibt sich Folgendes:
- 6,54e+09 Bits = (6,54e+09 / 8) Bytes = 8,18e+08 Bytes;
- 8,18e+08 Bytes = (8,18e+08 / 1e+06) Megabytes = 818 Megabytes;
- 8,18e+08 Bytes = (8,18e+08 / 1048576) Mebibytes = 780,11 Mebibytes.
Anzumerken ist, dass die Abkürzungen Mbytes, MB, Mb, Mbp und MiB und Ähnliches nicht konsequent unterschieden werden. Vor allen MB und Mb sind mehrdeutig. Bspw. findet bei manchen Betriebssystemen auch so etwas: „3,32 MB (3.485.565 Bytes)“; es gibt hier also eine Abkürzung (MB), die den Faktor 1000 (103
) suggeriert, während die Berechnung mit dem Faktor 1024 (210
) läuft: 3485565 / (1024*1024) = 3,32
. (‑; Das ist dann wahrscheinlich ein „May‑be‑Byte“! ;‑)
Die Betrachtung zum „Informationsgehalt“ beginnt mit den Kombinationsmöglichkeiten: ein Schalter mit vier Zuständen, wie eine Nukleobase an einer bestimmten Stelle {A; C; T; G}, hätte die gleiche Ergebnismenge, wie zwei Schalter mit zwei Zuständen, also zwei benachbarten Bits {00; 01; 10; 11}. Da also
4(Anzahl_der_Basenpaare) = 2(2 * Anzahl_der_Basenpaare)
gelten würde, könnte man
Anzahl_imaginärer_Bits = (2 * Anzahl_der_Basenpaare)
gleichsetzen, was wohl auch stimmt. Allerdings wird im Weiteren nicht mehr weiter danach gefragt, wie viele Möglichkeiten sich daraus ergeben, sondern wie viel Platz der Code einnimmt.
Es gibt hier eigentlich zwei Aspekte, die man vermutlich gezielter ansprechen müsste: A, die „verschlüsselnde Datenmenge“ und B, die „verschlüsselte Datenmenge“. Für 3e+09 als Anzahl der Basenpaare im Genom ergäbe sich Folgendes:
A = (2 * 3e+09) Bits
B = 2(2 * Anzahl_der_Basenpaare) Möglichkeiten
Für mich ist B, die „verschlüsselte Datenmenge“, dichter an der Bedeutung des Wortes „Informationsgehalt“ als A. Es lohnt sich aber nicht, die Betrachtung fortzusetzen, da es Theoriefindung wäre (WP:TF), wenn man so etwas im Artikel unterbringen wollte, ohne einen guten Beleg zu haben.
Sollte ich mich irren und der „Post“ von „PvM“ aus dem Jahre 2008 wäre ein echter Beleg laut WP:BLG, müsste man wohl auch nah bei der Quelle bleiben und das Beispiel mit 3 Milliarden Basenpaaren, 6 Milliarden Bits und 750 MBytes „Informationsgehalt“ zitieren, statt eine eigene Berechnung mit z. B. 3,27 Milliarden Basenpaaren, 6,54 Milliarden Bits und /(818|780|780,11) (MB|MiB)/ anzuführen. (Etwas weiter oben werden weder 3 Mrd., noch 3,28 Mrd., sondern 3,1 Milliarden Basenpaare für das menschliche Genom zitiert.)
Der Abschnitt „Genomgröße“ als Ganzes:
Der Abschnitt „Genomgröße“ besteht gegenwärtig (oldid=209379579#Genomgrößen) aus fünf Absätzen mit einer Tabelle zwischen den ersten zwei und den letzten drei Absätzen. Die letzten drei Absätze (3. bis 5. Absatz) enthalten das Thema oder befinden sich in der Nachbarschaft des entsprechenden Textes und werden deshalb im Folgenden betrachtet.
Dritter Absatz:
- Stand 2020 hat das haploide Genom einer menschlichen Zelle eine Länge von etwa 3,1 Milliarden Basenpaaren.[Referenz 11. in oldid=209379579]
- Bei einem diploiden Genom und einer Länge von 0,34 nm pro Basenpaar ergibt sich damit in jedem Zellkern eine Gesamtlänge von 2,1 Metern DNA.
Der erste Satz könnte – für sich genommen – weggelassen werden, da bereits eine gleiche Referenz in der Tabelle darüber vorliegt („Beispiele für Genomgrößen“, Referenz 10. in oldid=209379579). Der zweite Satz hat keine eigenen Referenzen, bezieht sich aber auf den ersten Satz; also auch auf dessen Referenz. Diese Referenz bzw. Website, „[Human assembly and gene annotation.] Abgerufen am 2. März 2021.“ (Referenz-Nummern 10. und 11. in oldid=209379579), enthält keine Streckenlängen-Angaben für DNA (weder „nm“ für einzelne Basenpaare, noch Meter für DNA-Stränge). Sollte jemand ein Zitat finden, wie lang menschliche Zellkern-DNA wäre, wenn man sie außerhalb des Zellkerns abwickeln würde, wäre es auch angebracht, die dort angegeben Zahlen zu zitieren. Die doppelte Referenz mit den Referenz-Nummern 10. und 11. in oldid=209379579 (Wikitext: <ref>{{Internetquelle |url=https://www.ensembl.org/Homo_sapiens/Info/Annotation |titel=Human assembly and gene annotation |abruf=2021-03-02}}</ref>) ist zwar aktuell („Genebuild last updated/patched Aug 2020“ | „Ensembl release 103 - February 2021 © EMBL-EBI“), enhält aber mehrere Angaben zur Genomgröße („Base Pairs 3,096,649,726“ | „Golden Path Length 3,096,649,726“ | „contig length total 3.4 Gb.“ | „chromosome length total 3.1 Gb (excluding haplotypes).“), wobei sich keine dieser Angaben auf das Volumen, das Gewicht, die Masse oder die Länge des Genoms als Wegstrecke bezieht.
Vierter Absatz:
- Ein Basenpaar auf einem DNA-Strang hat theoretisch einen Informationsgehalt von 2 bit, da es 22 = 4 Zustände (A/T/G/C) annehmen kann.
- Mit etwa 3,27 Milliarden Basenpaaren hätte das Genom des Menschen demnach einen maximal möglichen Informationsgehalt von 6,54 Milliarden bit oder 818 MiB.
- Der tatsächliche Informationsgehalt liegt vermutlich deutlich darunter, da große Teile der DNA nichtcodierende Sequenzen aufweisen, die allerdings zumindest teilweise regulatorische Funktionen haben.[Referenz 12. in oldid=209379579]
Hier fällt z. B. auf, dass 22 = 4
nicht schlüssig wirkt, dass vorn vom Basenpaar die Rede ist und hinten die vier Zustände einzelner Basen angegeben werden. Zusammen mit den weiter oben angegeben Punkten zu Bits und Bytes schlage ich vor, die Aussagen viel allgemeiner zu formulieren und die Referenz als Beispiel eines Versuchs zu zitieren.
Textvorschlag: „Es ist naheliegend, die vier Zustände, die eine einzelne Basen-Position auf dem DNA-Strang einnehmen kann (A/T/C/G), hinsichtlich der zwei Zustände, die ein Bit einnehmen kann (0 und 1), umrechnen zu wollen, um sich so dem „Informationsgehalt“ des Genoms als Ganzes zu nähern. Das wird gelegentlich versucht (z. B.:[Zitat]); allerdings ist es deutlich schwerer, den tatsächlichen Informationsgehalt zu bestimmen.“
Fünfter Absatz:
- Ein Vergleich der Genomgröße mit der Komplexität und dem Organisationsgrad des Organismus ergibt keinen klaren Zusammenhang.[Referenz 13. in oldid=209379579]
- So haben Schwanzlurche größere Genome als Reptilien, Vögel und Säugetiere. Lungenfische und Knorpelfische haben größere Genome als Echte Knochenfische, und innerhalb von Taxa wie den Blütenpflanzen oder Protozoen variiert die Genomgröße in hohem Maß. Dies wird als „C-Wert-Paradoxon“ bezeichnet.
- Die größte DNA-Menge weisen einfache Eukaryoten wie einige Amöben sowie die Urfarne mit rund einer Billion Basenpaaren auf. Diese Arten enthalten einzelne Gene als tausendfache Kopien und lange nicht proteincodierende Abschnitte.
Unter der hier angegebenen Referenz 13. (in oldid=209379579) wird auf eine Materialsammlung verknüpft, die zwar im Download-Bereich der Universität Mainz öffentlich verfügbar ist, aber eher als Ergänzung für Vorlesungen gedacht sein dürfte („Folien“ im PDF-Format, Datei Molgen3.pdf). Es geht in der zitierten Material-Sammlung als auch im entsprechenden Absatz (im Abschnitt „Genomgröße“) um das „C-Wert-Paradoxon“. Die Materialsammlung ist keine einzelne Arbeit zum Vergleich von Genomgrößen mit der Komplexität und dem Organisationsgrad des Organismus, greift aber auf zitierbare Information zurück beinhaltet nichts offensichtlich Falsches und sollte daher als Referenz ausreichend sein.
Plan:
- Der dritte Absatz im Abschnitt „Genomgrößen" des Artikels „Genom“ soll entfernt werden (gegenwärtig oldid=209379579#Genomgrößen).
- Der vierte Absatz im Abschnitt „Genomgrößen" des Artikels „Genom“ soll gekürzt und allgemeiner formuliert werden. ↑zum Anfang des Beitrags↑
MfG --Dirk123456 (Diskussion) 16:44, 10. Mär. 2021 (CET)
- Umsetzung im Artikel
- Der oben genannte Plan wurde mit drei Edits umgesetzt (→Vorbereitung →Umsetzung →Ergebnis). Um die geänderten Textstellen in den Zwischenversionen besser vergleichen zu können, wurden Planungskommentare eingefügt und anschließend wieder entfernt.
- Vorher – oldid=209379579 – 2021-03-02T18:00:29 Elrond Diskussion Beiträge 18.881 Bytes 0 →Genomgrößen: 6,54 Milliarden bit sind rund 818 MiB.
- Vorbereitung – oldid=209656663 – 2021-03-10T16:00:43 Dirk123456 Diskussion Beiträge K 19.301 Bytes +420 →Genomgrößen: Planungskommentare eingefügt; (siehe Diskussion:Genom#Informationgehalt, Bits und Bytes).
- Umsetzung – oldid=209657234 – 2021-03-10T16:19:54 Dirk123456 Diskussion Beiträge 18.787 Bytes −514 →Genomgrößen: Planungskommentare umgesetzt; (siehe Diskussion:Genom#Informationgehalt, Bits und Bytes)).
- Vergleich der Zwischenversionen mit Planungskommentaren (Vorbereitung―Umsetzung) – diff=209657234&oldid=209656663
- Ergebnis – https://de.wikipedia.org/w/index.php?title=Genom&oldid=209657442 – 2021-03-10T16:26:42 Dirk123456 Diskussion Beiträge K 18.334 Bytes −453 →Genomgrößen: Planungskommentare entfernt; (siehe Diskussion:Genom#Informationgehalt, Bits und Bytes).
- Vergleich ohne Planungskommentare (Vorher―Ergebnis) – diff=209657442&oldid=209379579
- --Dirk123456 (Diskussion) 21:23, 10. Mär. 2021 (CET)
Ehrlich gesagt finde ich den Versuch, einen Informationsgehalt des Genoms angeben zu wollen relativ sinnfrei. Wir wissen ja das zum Beispiel die dritte Base im Code weniger Informationsgehalt hat als die ersten beiden. Wie soll das dann berechnet werden? Oder der Gehalt von repetitiven Sequenzen? Das kann man als akademische Rechenübung wohl durchführen, aber mehr auch nicht. Die Länge der DNA in einem Zellkern finde ich dagegen schon interessant. Denn das macht deutlich, wie gut die verpackt sein muss. Die Länge von Länge von 0,34 nm pro Basenpaar ist eigentlich allgemein bekannt, das dürfte in jedem Genetik-Lehrbuch drin stehen (habe gerade keins da). Siehe auch Desoxyribonukleinsäure#Die_Doppelhelix. Oder hier: We also confront the serious challenge of DNA packaging. Each human cell contains approximately 2 meters of DNA if stretched end-to-end; yet the nucleus of a human cell, which contains the DNA, is only about 6 μm in diameter.. Skopien (Diskussion) 23:44, 10. Mär. 2021 (CET)
- +1 Sehe ich ähnlich. Dazu kommt, dass man durch DNA-Methylierung eine zusätzliche Form des Cytosins erhält, welche genregulatorische Funktionen ausüben kann. Vergessen wir auch nicht das manche DNA-Abschnitte mittels alternativem Splicing mehrfach codieren. Ähnlich schwierig ist es die bereits oben erwähnten nichtcodierende Sequenzen zu bewerten. Pseudogene sind sicher Informationsträger auch wenn sie nicht codieren. Cis-/ und Trans-Elemente auch. Aber zwischen regulatorischen Sequenzen und Genen gibt es beispielsweise oftmals längere Abschnitte, bei denen häufig nur deren Länge nicht aber die genaue Sequenz relevant für die korrekte Ausübung regulatorische Funktion ist. Letztendlich können wir mit unserem aktuellen Wissen, den Informationsgehalt der DNA in Bits/Bytes nicht vollumfassend angeben. --Paramecium (Diskussion) 17:15, 11. Mär. 2021 (CET)
- Ich war mal entsprechend aktiv. Muss noch gesichtet werden. --Skopien (Diskussion) 23:29, 12. Mär. 2021 (CET)
- Hallo @Skopien, vielen Dank für die Referenz zu den zwei Metern! Der anderen Referenz zu den 3,1 Milliarden Basenpaaren habe ich einen „Namen“ gegeben (name="H-sapiens-annotation"), damit sie an zwei Stellen verwendet werden kann, ohne zweimal in der Einzelreferenz-Liste aufzutauchen (1.:
<ref name="...">{{...}}</ref>
und 2.:<ref name="..." />
; diff=209762996&oldid=209735139). - MfG --Dirk123456 (Diskussion) 12:32, 14. Mär. 2021 (CET)
- Hallo @Skopien, vielen Dank für die Referenz zu den zwei Metern! Der anderen Referenz zu den 3,1 Milliarden Basenpaaren habe ich einen „Namen“ gegeben (name="H-sapiens-annotation"), damit sie an zwei Stellen verwendet werden kann, ohne zweimal in der Einzelreferenz-Liste aufzutauchen (1.:
Kein redirect von Genomik bitte
BearbeitenAuf der englischen Wikipedia gibt es "genomics" als eigenständige Webseite. Das ist NICHT ident mit "genome".
Aka "Genomik" und "Genom".
Siehe hier: https://en.wikipedia.org/wiki/Genomics
Die deutschsprachige Wikipedia muss aufhören alles zu redirecten. Das ist eine unfassbare Unart.
Aktuell wird "Genomik" redirected hin zu "Genom". Das ist nicht das selbe!!! Ich habe extra die URL so angegeben, werde aber umgeleitet. Die englischsprachige Wikipedia hat dieses Problem nicht. Bitte lernt mehr von der englischsprachigen Wikipedia - die macht das besser als die deutschsprachige Wikipedia hier. VIEL ZU VIELE REDIRECTS!
Lasst doch bitte "Genomik" eigenständig stehen. Das ist NICHT das selbe wie ein Genom! 2A02:8388:1600:A200:A271:DF4A:C9F9:37E5 15:35, 4. Jul. 2022 (CEST)