Datentabellen

Bearbeiten

Konstruktion

Bearbeiten
Tabelle 1: Absolute Häufigkeiten der Augen- und Haarfarbenkombination von 592 Statistik-Studenten. Quelle: Paket datasets in R.[1]
Augenfarbe
Haarfarbe Braun Blau Grau Grün Summe
Braun 119 84 54 29 286
Blond 7 94 10 16 127
Schwarz 68 20 15 5 108
Rot 26 17 14 14 71
Summe 220 215 93 64 592
Tabelle 2: Bedingte Häufigkeiten der Augenfarben gegeben eine Haarfarbe.
Augenfarbe
Haarfarbe Braun Blau Grau Grün Summe
Braun 42% 29% 19% 10% 100%
Blond 5% 74% 8% 13% 100%
Schwarz 63% 18% 14% 5% 100%
Rot 36% 24% 20% 20% 100%
Gesamt 37% 36% 16% 11% 100%

Das Ziel der Tabellen ist es in kurzer und knapper Form detaillierte Informationen bereit zu stellen. Um aus Tabellen die relevanten Informationen entnehmen zu können, ist eine entsprechender Aufbau bzw. Gestaltung notwendig. Daher sollten einige Regeln zur besseren Lesbarkeit beachtet werden:[2][3][4][5][6]

1. Tabellen sollten erklärenden Text in einer Über- oder Unterschrift enthalten.

Denn Leser lesen vielleicht nur die Tabelle und dann sollten die wichtigsten Informationen in der Über- oder Unterschrift enthalten sein. Ausserdem schieben Satzprogramme, wie z.B. LaTeX aus Platzgründen, eine Tabelle auf die nächsten Seite nach dem beschreibenden Text und auch dann sind Zusatzinformationen wichtig.

2. Tabellenüber- oder -unterschriften sollten bei Dokumenten mit mehreren Tabellen eine eigene Nummerierung enthalten. 3. Dann kann man sich im Begleittext eindeutig auf eine bestimmte Tabelle beziehen. 4. Eine Tabelle sollte auch im Begleittext beschrieben werden.

Eine Tabelle ist oft nicht einfach zu lesen, deswegen sollte im Begleittext auf die wichtigen Aussagen in der Tabelle hingewiesen werden. Leser, die mit dem behandelten Sachgebiet nicht vertraut sind, könnten sonst die Aussage der Tabelle nicht erfassen.

5. Eine Tabelle sollte nicht zu viele Spalten und Zeilen enthalten

Der Psychologe George A. Miller wies 1956 nach, dass man sich im Kurzzeitgedächtnis nur   "Informationen" merken kann.[7] Daher ergibt sich als Anhaltspunkt für die Zahl der Spalten und Zeilen jeweils  .

6. Zeilen und Spalten sollten in natürlicher Ordnung oder nach Größe geordnet sein.

In Tabelle 1 sind die Zeilen und Spalten nach den Zeilen- bzw. Spaltensummen geordnet. Alternativ wäre hier auch ein alphabetische Sortierung nach dem Namen der Haar- bzw. Augenfarben möglich gewesen. Die Ordnung in Tabelle 2 richtet sich nach Tabelle 1, da der Leser mit der Ordnung in Tabelle 1 bereits vertraut ist.

7. Man sollte keine Wiederholungszeichen, wie z.B. "ditto", verwenden.

Besser man lässt die Stelle leer oder wiederholt die Zahl einfach.

8. Tabellen sollten keine unzusammenhängenden Informationen enthalten.

Besser ist es dann die Informationen in zwei oder mehr Tabellen aufzuteilen. Z.B. hätte man Tabelle 1 und 2 zu einer Tabelle zusammenfassen können, jedoch sind die Informationen in zwei Tabellen besser dargestellt.

9. Das Layout sollte das Auge "leiten":

  • Vermeide senkrechte Linien
  • Vermeide Doppellinien
  • Zur Unterstützung der Lesbarkeit sollte man besser Hintergrundfarben verwenden statt eines Linien"netzes"
Ein gutes Beispiel findet sich in der Dokumentation zum LaTeX-Paket booktabs auf Seite 2.[6]

10. Masseinheiten sollte man in den Kopf der jeweiligen Spalte schreiben.

Lässt man die Masseinheiten weg, ist es unklar in welcher Masseinheit die Daten angeben sind. Schreibt man sie an den Fuß der Tabelle, dann man muss man sie erst suchen.

11. Für Spalten und Zeilen sollten Summen (oder Durchschnitte) angegeben werden, wenn möglich/nötig.

Das erspart einem Leser das Berechnen der Summen und erlaubt ihm auch die Überprüfung der Tabellenwerte.

12. Werte, die verglichen werden sollen, sollten besser in verschiedenen Spalten und nicht in verschiedenen Zeilen stehen.

Aus jeder Spalte in Tabelle 2 kann ein Statistiker aufgrund der unterschiedlichen Werte sofort entnehmen, dass es einen Zusammenhang zwischen Haar- und Augenfarbe gibt.

13. Texte sollten linksbündig gesetzt werden.

Leser, deren Muttersprache Deutsch ist, sind daran gewöhnt, dass Text von rechts nach links geschrieben wird und können linksbündig gesetzten Text daher schneller erfassen. In Sprachen in denen die Schreibrichtung eine andere ist, z.B. Hebräisch oder Arabisch wird man rechtsbündig gesetzte Texte vorziehen.

14. Für Zahlen gilt:

  • Große Zahlen sollten möglichst nach oben gesetzt werden
  • Sie sollten rechtsbündig gesetzt werden
  • Sie sollten auf zwei bis drei signifikante Ziffern gerundet werden
  • Sie sollen führende Nullen enthalten, also "0,1" statt ",1
  • Die Dezimalkomma bei Zahlen in einer Spalte sollten immer untereinander stehen.
Tabelle 2 gibt ein Beispiel hierfür. Die Rundung der Einträge auf ganze Prozentzahlen mit der kaufmännischen Rundung führt jedoch zu dem Problem, dass die Zeilensummen nicht mehr 100% sondern 99% oder 101% ergibt. Daher ist hier das summenerhaltenden Runden genutzt worden.

Die Regeln sollen helfen das Verständnis und die Lesbarkeit von Tabellen zu verbessern und gelten nicht absolut. Tabelle 1 zeigt den Augen- und Haarfarbendatensatz mit den absoluten Häufigkeiten von Statistikstudenten mit dem Ziel eine Abhängigkeit zwischen Augen- und Haarfarbe zu zeigen. Die Regeln sind soweit wie möglich eingehalten worden, z.B. wechselt die Hintergrundfarbe von Zeile zu Zeile um das Ablesen der Werte in einer Zeile zu erleichtern oder die Augen- und Haarfarben sind nach der Größe der Spalten- bzw. Zeilensummen sortiert worden. Da der Tabellenstandard in der Wikipedia ein Liniennetz vorsieht, ist dies jedoch, im Gegensatz zu den Regeln, beibehalten worden. Aus Tabelle 2 kann man ablesen, dass es einen Zusammenhang zwischen der Haarfarbe und der Augenfarbe gibt.

Einzelnachweise

Bearbeiten
  1. R.D. Snee: Graphical display of two-way contingency tables. In: The American Statistician. Band 28, 1974, S. 9–12.
  2. Rüdiger Ostermann, Adalbert F.X. Wilhelm, Karin Wolf-Ostermann: Präsentation statistischer Daten in der Pflege, Teil 1 – Tabellen: Komplizierter als man denkt. In: Pflegezeitschrift. Band 1, 2004, S. 18–21.
  3. Michael Piefel: Goldene Regeln. Abgerufen am 15. Dezember 2012.
  4. Edward R. Tufte: The Visual Display of Quantitative Information. Graphics Press, 1983.
  5. Edward R. Tufte: Envisioning Information. Graphics Press, 1990.
  6. a b Simon Fear: Publication quality tables in LaTeX. (PDF) In: Comprehensive TeX Archive Network. 14. April 2005, abgerufen am 4. Januar 2013.
  7. George A. Miller: The magical number seven, plus or minus two: Some limits on our capacity for processing information. In: Psychological Review. Band 63, Nr. 2, 1956, S. 81–97, doi:10.1037/h0043158.

Visualisierung

Bearbeiten

Mit einer Heatmap

Bearbeiten
 
Abbildung 1: Tabelle 1 mit Grauwerten für die entsprechenden Häufigkeiten: Je dunkler desto öfter kommt die Kombination vor.

Es gibt verschiedene Möglichkeiten Tabellen mit numerischen Werten auch grafisch darzustellen. Eine Möglichkeit ist die numerischen Einträge durch Symbole oder Farben zu ersetzen.

In Abbildung 1 sind die Häufigkeiten in Tabelle 1 durch Rechtecke mit entsprechenden Graustufen ersetzt worden. Je dunkler ein Rechteck erscheint desto öfter ist die entsprechende Merkmalskombination bei den 592 Statistikstudenten aufgetreten. Also die Kombination braune Augen und Haare ist am häufigsten aufgetreten, die Kombinationen grüne Augen und schwarze Haare bzw. braune Augen und blonde Haare am seltensten.

Mit einem Mosaikplot

Bearbeiten
 
Abbildung 2: Tabelle 1 und 2 mit Hilfe eines Mosaikplots visualisiert.

Da Tabelle 1 und 2 absolute bzw. bedingte Häufigkeiten darstellen, können sie auch in einem sog. Mosaikplot dargestellt werden. Die Höhe jedes Rechteckes wird wird durch den relativen Anteil der entsprechenden Haarfarbe bestimmt. Also für die Haarfarbe Braun ergibt sich  , d.h. die Rechtecke in der 1. Zeile haben eine Höhe von ca. 48% der Gesamthöhe der Grafik. Die Breite der Rechtecke ergibt sich aus den bedingten Häufigkeiten in Tabelle 2. Also das Rechteck für braune Haare und braune Augen hat eine Breite von 42% der Gesamtbreite der Grafik. Die Anteile der Fläche für eine Merkmalskombination an der Gesamtfläche entspricht genau dem Anteil dieser Merkmalskombination. Also die Fläche für das braune Rechteck entspricht  , d.h. ca. einem Fünftel der Gesamtfläche.