Diskussion:AMD FX
Logische Kerne?
BearbeitenSind jetzt die 8 Integer Kerne, echte Kerne?
Afaik sind die FP Kerne Logische und die Integer Kerne echte 8 Stück.
Laut dem Artikel sind alle 8 Logisch (Integer wie FP) (nicht signierter Beitrag von Vamp898 (Diskussion | Beiträge) 20:50, 7. Nov. 2011 (CET))
- "Echte Kerne" also "vollständige Kerne" sind auch gleichzeitig logische Kerne, wenn sie sich dem Betriebssystem als solche zeigen. Ein Core i5 2500 hat Vier "echte Kerne=vollständige Kerne" und das Betriebssystem sieht auch vier logische Kerne. Ein Core i7 2600 hat vier "echte Kerne" und das Betriebssystem sieht acht logische Kerne.
- Ein 4-Modul-Bulldozer hat vier "echte Kerne=vollständige Kerne" und das Betriebssystem sieht acht logische Kerne.
- Eine Integerverarbeitungseinheit ist kein "vollständiger Kern", den die Decoder und der Rest gehören bei der x86-Architektur zum Kern. Ohne Decoder funktioniert der Prozessor nicht und hat damit 0 Kerne. Es ist dann nur noch Müll.
- Der grundlegende Unterschied zwischen Intel Core i7 2600 mit SMT und AMD FX 8100 mit CMT ist: Intel lässt auf drei Integerpielines eines Kerns jeweils zwei Threads laufen, bei Bedarf kann aber auch ein Thread die kompletten Resourcen für sich beanspruchen. Durch diese Dynamik kann sich der Prozessor den Anforderung der Software besser anpassen, je nach dem ob viele oder wenige Threads ausgeführt werden müssen. AMD lässt innerhalb eines Moduls auf vier Integerpielines ebenfalls zwei Threads laufen, mit dem Unterschied, dass die Threadausnutzung nicht dynamisch stattfindet, sondern dediziert zugewiesen wird. Das heißt, ein Thread nutzt nur zwei Integerpiliens und der andere nutzt die anderen zwei Integerpielines, ein gemeinsames nutzen aller vier Integerpipelines nur durch einen Thread ist nicht möglich. Durch diese Einschränkung werden die Integerpilines nicht zu "echten/vollständigen" Kernen. --Juri S. 19:16, 15. Nov. 2011 (CET)
- Ein Bulldozer Modul ist bei 2 Threads aber 80% Schneller als ein Kern bei 2 Threads (laut AMD) Also hat der Bulldozer 1,8 Echte Kerne. Da das eine unsinnige Rechnung ist hat ja AMD gesagt "Die dinger heissen nicht Kerne sondern Module" da sie nicht mit einem normalen Kern verglichen werden können. Somit finde ich es unsinnig wenn der Artikel sagt das Bulldozer einfach nur den Begriff "Modul" für "Kern" verwendet. Weil so denken die Leute das es nur eine simple Umbenennung ist und die 80% mehr Geschwindigkeit (was ja fast das doppelte ist) fallen einfach unter den Tisch.
- Aber das mit den logischen Kernen ist auf jeden Fall nachvollziehbar. Aber da bei keinem anderen Artikel über Prozessoren die Physikalischen Kerne als "Logische Kerne" bezeichnet werden und es starke Verwechslung mit Hyper Threading gibt denke ich sollte man die Bezeichnung "Logische Kerne" vermeiden. Es geht ja hier darum was physikalisch in dem Prozessor drin steckt und nicht was das Betriebssystem sieht. Wenn man ein schlechtes OS hat was z.b. nur 2 Logische Kerne sieht hat der Bulldozer ja trotzdem acht. Vamp898 19:54, 15. Nov. 2011 (CET)
So, werde nun mal den Artikel bearbeiten. Er ist grundweg falsch. Der AMD FX h at nicht einen einzigen logischen kern. Er hat 8 Integer Kerne und 4 FP Kerne aber nicht einen einzigen logischen. Wenn man 1 Integer Kern und hat und a 2 Threads drauf laufen lässt, dann hat man 2 logische Kerne. Aber wenn man 2 Integer Kerne hat und jeder Integer Kern einen Thread berechnet hat man doch nicht 2 logischen Kern Ö_Ö Vamp898 20:52, 14. Nov. 2011 (CET)
- Der Artikel war vor dir aus technischer Sicht Grundweg richtig. Es gibt keine Prozessoren, die keinen einzigen logischen Kern haben. Im Übrigen nennt vor allem das Marketing von AMD die Integercluster "Kerne", AMD-Intern bezeichnen die Ingenieure, die das Teil entwickelt haben die Integercluster als "Cluster" in den technischen Dokumenten und nicht als "Kerne", weil es keine Kerne sind, es sind lediglich zusammengehörende Integerpilenes mit einem Sheduler, die einem Thread zugewiesen werden. --Juri S. 19:48, 15. Nov. 2011 (CET)
- Ich dachte Logsiche Kerne sind das was ein Betriebssystem sieht. Ein Prozessor hat nur Physikalisch Kerne oder meinetwegen Module mit Integer Cluster. Das Betriebssystem macht Logische Kerne daraus und was das Betriebssystem mit dem Prozessor macht kann dem Prozessor egal sein und hat somit eig. auch nichts in dem Artikel über den Prozessor zu suchen Vamp898 20:03, 15. Nov. 2011 (CET)
Ich denke ob man jetzt 2 Integer Kerne hat die an 2 Threads rechnen oder 1 Integer Kern hat der an 2 Threads rechnet ist, vor allem was die Geschwindigkeit angeht, ein sehr tiefgreifender Unterschied. Vamp898 20:52, 14. Nov. 2011 (CET)
- Ja, ein großer Integercluster, der gleichzeitig an 2 Threads rechnet, ist in Softwareumgebungen, die unterschiedlich starke Threads dem Prozessor vorgeben, schneller, da innerhalb des Kerns dynamisch alle Resourcen entweder einem Thread oder zwei Threads gleichzeitig zugewiesen werden kann. Zwei kleine Integercluster, die dediziert an zwei Threads arbeiten, haben einen höheren Durchsatz bei Software, die jedem Kern seinen Thread geben und die Threads entweder unabhängig von einander sind, oder alle gleich viele Resourcen erfordern, in allen anderen Fällen ist der Prozessor mit einem Ingercluster schneller, was auch der Grund ist, warum die Core i-Prozessoren im Desktopsegment so viel besser abschneiden, als AMDs FX-Prozessor, während der FX-Prozessor mit angepasster und stark parallelisierbarer Software an Geschwindigkeit gewinnt. Problem ist nur, dass solche Software über alle Anwendungen hinweg im Desktopsegment und auch auch auf vielen Workstationen reine Utopie sind. Deswegen bewirbt AMD ihre Bulldozer-Architektur vor allem für Cloud-Computing.... --Juri S. 19:48, 15. Nov. 2011 (CET)
- Im Windows Desktopsegment. Phoronix hat in mehreren Benchmarks gezeigt dass das unter Linux alles andere als Utopie ist und sich die Performance unter Linux deswegen auch in anderen bereichen abspielt als unter Windows. Vamp898 20:52, 14. Nov. 2011 (CET)
- Phoronix hat die Multithreading-Fähigkeit untersucht. Zu diesem Zweck nimmt man natürlich Software, die sich gut parallelisieren lässt. Mit aktuellen Algorithmen ist es eine Utopie jegliche Probleme dermaßen gut zu Parallelisieren und auch mit zukünftigen Algorithmen kann man nicht alles parallelisieren. Wenn du dir Kaffee machst, kannst du ja auch nicht Wasser vorwärmen, bevor du es in die Kaffeemaschine eingegossen hast. Manches muss eben sequentiell erfolgen und kann nicht parallelisiert werden. Alles zu parallelisieren ist eine unerreichbare Utopie und hat nix mit Linux oder Windows zu tun. --Juri S. 22:36, 15. Nov. 2011 (CET)
- Im Windows Desktopsegment. Phoronix hat in mehreren Benchmarks gezeigt dass das unter Linux alles andere als Utopie ist und sich die Performance unter Linux deswegen auch in anderen bereichen abspielt als unter Windows. Vamp898 20:52, 14. Nov. 2011 (CET)
- Klar kann man nicht alles Parallelisieren. Es gibt immer dinge die nur auf einem Kern laufen. Aber vor allem unter KDE gibt es kaum noch was, was nicht alle Kerne nutzt dank den ThreadPools von Qt. Und in der Glib gibt es genauso ThreadPools. Schon alleine wenn ich nur einen Ordner mit Bildern öffnet macht der 9 Threads auf die mir die Vorschau der Bilder laden (auf meinem Phenom II 6-Kerner). Unter Windows läuft da ein einziger Thread der nach und nach jede Vorschau lädt. Und solche Kleinigkeiten sind es die sich durch die ganze Desktop Umgebung ziehen und da hat Windows noch einiges nachzuholen. Einen Schritt haben Sie ja schon getan. Sie haben eingestellt das wenn bei 2 Kernen einer voll ausgelastet ist und der andere nichts tut, der Task Manager 50% Auslastung bei beiden kernen anzeigt. Das nutzt zwar nicht besser das Threading, aber es merkt dann wenigstens keiner mehr. Siehe z.b. 50% CPU Bugs von Anwendungen. Auf einem QuadCore ist es auf einmal der25% CPU Bug. Sachen gibts die gibt es garnicht. Und in der Linux Welt fühlt sich ein Bulldozer nunmal besser zuhause als in der Windows Welt. Das hat inzwischen sogar AMD zugegeben.
- Das Nachladen der Vorschaubilder ist Festplattenlimmitiert und nicht CPU-Limitiert, deswegen dauert das ja so lange. Eine Festplatte ist aber bei sequentiellen Zugriffen schneller, als bei parallelen, daher macht Windows das einzig Richtige, alle Bildervorschaues in einem Thread der Reihe nach zu laden. So lange du also keine SSD (die sehr gut mit parallelen Zugriffen umgehen kann) im System hast oder die Vorschaubilder nicht auf mehreren HDDs verteilt sind, sollte man das Nachladen sequentiell vornehmen. Mit CPU hat aber wie gesagt das betreffende Problem nichts zu tun, da gar nicht CPU-limmiert. Wie wäre es also, wenn du dich einfach mal auf Benchmarks beschränkst, die man der Welt auch mit entsprechenden Quellen belegen kann? Deine Quelle untersucht die Multhitreading-Fähigkeit der CPUs und hat eben keine repräsentative Benchmarkzusammenstellung, die das Verhalten von Linux auf den Prozessoren im allgemeinen untersucht. Du sprichst im Artikel aber von Linux allgemein, womit deine Aussage mit der angegebenen Quelle nicht belegt ist. Entweder passt du deine Aussage also dem an, was deine Quelle tatsächlich belegt, oder deine Aussage wird als nicht belegte Aussage aus dem Artikel entfernt. --Juri S. 05:48, 16. Nov. 2011 (CET)
- Das war ein Beispiel. Ich glaube mit denen hast du es nicht so ganz. Jedes mal wenn ich aus 300 Anwendungsfällen ein Beispiel ziehe wird das als _Der Anwendungsfall_ behandelt. Du solltest lernen mit Beispielen umzugehen. Btw. nutzt z.b. Digikam ne Datenbank für Vorschaubilder die 1x kurz in Ram geladen werden, und dann werden daraus die Vorschaubilder erzeugt. Und ich denke mein Arbeitsspeicher sollte Parallele Zugriffe verarbeiten können. Wir können ja jetzt auch anfangen Erbsen zu zählen und jeden Thread einzeln auseinander zu nehmen. Sind wir jetzt bei "Beweis das Linux besser Multithreading nutzt"? Ich kann dir gerne über 50000 Anwendungsfällen in über 300 Anwendungen aufzählen, aber dann? Was nutzt die Mühe? Niemand hat vor das hier in den Artikel zu schreiben und nur weil du nicht wahrhaben willst das der bulldozer unter Linux akzeptable Leistung liefert ist mir das auch nicht wert. Vamp898 08:01, 16. Nov. 2011 (CET)
- Es geht nicht darum, was ich nicht wahr haben will und es geht auch nicht darum welch unsinnige Beispiele du bringst und auch nicht um meine Lernfähigkeit mit solchen unsinnigen Beispielen umzugehen. Es geht darum, dass die von dir genannte Quelle, deine Aussage im Artikel nicht belegt und nicht belegte Aussagen werden entfernt. --Juri S. 09:21, 16. Nov. 2011 (CET)
- Das Nachladen der Vorschaubilder ist Festplattenlimmitiert und nicht CPU-Limitiert, deswegen dauert das ja so lange. Eine Festplatte ist aber bei sequentiellen Zugriffen schneller, als bei parallelen, daher macht Windows das einzig Richtige, alle Bildervorschaues in einem Thread der Reihe nach zu laden. So lange du also keine SSD (die sehr gut mit parallelen Zugriffen umgehen kann) im System hast oder die Vorschaubilder nicht auf mehreren HDDs verteilt sind, sollte man das Nachladen sequentiell vornehmen. Mit CPU hat aber wie gesagt das betreffende Problem nichts zu tun, da gar nicht CPU-limmiert. Wie wäre es also, wenn du dich einfach mal auf Benchmarks beschränkst, die man der Welt auch mit entsprechenden Quellen belegen kann? Deine Quelle untersucht die Multhitreading-Fähigkeit der CPUs und hat eben keine repräsentative Benchmarkzusammenstellung, die das Verhalten von Linux auf den Prozessoren im allgemeinen untersucht. Du sprichst im Artikel aber von Linux allgemein, womit deine Aussage mit der angegebenen Quelle nicht belegt ist. Entweder passt du deine Aussage also dem an, was deine Quelle tatsächlich belegt, oder deine Aussage wird als nicht belegte Aussage aus dem Artikel entfernt. --Juri S. 05:48, 16. Nov. 2011 (CET)
- Klar kann man nicht alles Parallelisieren. Es gibt immer dinge die nur auf einem Kern laufen. Aber vor allem unter KDE gibt es kaum noch was, was nicht alle Kerne nutzt dank den ThreadPools von Qt. Und in der Glib gibt es genauso ThreadPools. Schon alleine wenn ich nur einen Ordner mit Bildern öffnet macht der 9 Threads auf die mir die Vorschau der Bilder laden (auf meinem Phenom II 6-Kerner). Unter Windows läuft da ein einziger Thread der nach und nach jede Vorschau lädt. Und solche Kleinigkeiten sind es die sich durch die ganze Desktop Umgebung ziehen und da hat Windows noch einiges nachzuholen. Einen Schritt haben Sie ja schon getan. Sie haben eingestellt das wenn bei 2 Kernen einer voll ausgelastet ist und der andere nichts tut, der Task Manager 50% Auslastung bei beiden kernen anzeigt. Das nutzt zwar nicht besser das Threading, aber es merkt dann wenigstens keiner mehr. Siehe z.b. 50% CPU Bugs von Anwendungen. Auf einem QuadCore ist es auf einmal der25% CPU Bug. Sachen gibts die gibt es garnicht. Und in der Linux Welt fühlt sich ein Bulldozer nunmal besser zuhause als in der Windows Welt. Das hat inzwischen sogar AMD zugegeben.
- Der Artikel schreibt: "Jeder Prozessor besteht aus mehreren sogenannten Modulen oder nach üblicher Bezeichnung "Kernen"". Laut http://de.wikipedia.org/wiki/Prozessor_%28Hardware%29#Prozessor-Kern und http://de.wikipedia.org/wiki/Prozessorkern ist das was beim Bulldozer ein Modul ist kein Kern und würde üblicherweise auch nicht als Kern bezeichnet werden. Der Artikel stellt das ganze immer noch hin als hätte AMD die Kerne einfach in Module unbenannt. Vamp898 08:01, 16. Nov. 2011 (CET)
- Das ist schlichtweg gelogen und falsch zitiert. Mehr nicht. Wenn du zitierst, solltest du zumindest vollständige Sätze zitieren. Das vollständige Zitat lautet: "Jeder Prozessor besteht aus mehreren sogenannten Modulen oder nach üblicher Bezeichnung "Kernen", auf diesen Kernen wird jedoch Core Multithreading betrieben. " Mit diesem Nebensatz wird eindeutig gesagt, dass AMD die Kerne nicht einfach "umbenannt" hat, sondern die Einheiten des Prozessors, die üblicherweise als Kerne bezeichnet werden um Core Multithreading erweitert wurden. In den nachfolgenden Sätzen wird auch erläutert, wie diese Erweiterung technisch realisiert wurde, nämlich durch einbringen von zwei Integercluster in die betreffenden Einheiten. Später wird auch der Unterschied zu einem Kern mit Simultanius Multithreading erläutert, womit sowohl die Abgrenzung zu "üblichen Kernen", als auch zu "Kernen mit SMT" im Artikel gegeben ist. Man darf nur nicht vor dem Komma aufhören zu lesen, so wie du das machst. Im Übrigen hab ich dies weiter Unten auf ein anderes Zitat von dir bereits alles schon gesagt. Weiß nicht, warum ich das hier noch mal machen muss. --Juri S. 09:21, 16. Nov. 2011 (CET)
- Der Artikel schreibt: "Jeder Prozessor besteht aus mehreren sogenannten Modulen oder nach üblicher Bezeichnung "Kernen"". Laut http://de.wikipedia.org/wiki/Prozessor_%28Hardware%29#Prozessor-Kern und http://de.wikipedia.org/wiki/Prozessorkern ist das was beim Bulldozer ein Modul ist kein Kern und würde üblicherweise auch nicht als Kern bezeichnet werden. Der Artikel stellt das ganze immer noch hin als hätte AMD die Kerne einfach in Module unbenannt. Vamp898 08:01, 16. Nov. 2011 (CET)
- Da ein Modul also kein Prozessorkern ist (was nicht heißt das er keinen Prozessorkern oder teile davon beinhalten kann, hier muss man ja anscheinend immer ganz genau sein sonst, wir wollen ja nicht das eine riesige Diskussion losbricht ;)) wird er weder von AMD, noch von dem Englischen Wikipedia Artikel über den Bulldozer, als Kern bezeichnet. Ich kenne auch sonst niemand der sagen würde das ein Modul üblicherweise als Kern bezeichnet wird außer dieser Artikel der damit falsch liegt. Nur weil ein Modul teile von einem Prozessor Kern in sich hat ist es keiner. Der Computer ist ja auch kein riesiger Prozessor nur weil einer drin steckt.Vamp898 08:01, 16. Nov. 2011 (CET)
- Ich finde es übrigens toll, dass du die Definition eins Prozessorkerns hier als Link postest, eine Definition, die in keinem Punkt den Kern so einschränkt, als das ein Modul nicht als "Prozessorkern mit CMT" bezeichnet werden könnte. Aber du kannst ja gerne eine Definition für ein "Modul" ausarbeiten. Am besten denkst du dir noch ein Wort für einen "Prozessorkern mit SMT" aus, weil das ist ja auch kein "üblicher" Kern, sonder einer, auf dem mehrere Threads laufen. Vielleicht sollten wir "Kerne mit SMT" dann "Hyperkerne" oder auch Module nennen, weil sonst ist es ja voll schlimm, dass ein üblicher Kern auch Kern heißt, obwohl er keine doppelten Registersätze für zusätzliche Threads hat im Gegensatz zum Kern mit SMT und natürlich ist es genau so schlimm, das andere Prozessorkerne ihre Integerpipelines nicht in zwei Cluster aufteilen. Wir brauchen für jeden Mist einen neuen Namen, eine Beschreibende aussage wie etwa "Prozessorkern mit SMT" und "Prozessorkern mit CMT" ist voll falsch, warum das falsch ist, weiß zwar keiner, aber wenn du es sagst, wird es schon falsch sein.... --09:21, 16. Nov. 2011 (CET)
- Da ein Modul also kein Prozessorkern ist (was nicht heißt das er keinen Prozessorkern oder teile davon beinhalten kann, hier muss man ja anscheinend immer ganz genau sein sonst, wir wollen ja nicht das eine riesige Diskussion losbricht ;)) wird er weder von AMD, noch von dem Englischen Wikipedia Artikel über den Bulldozer, als Kern bezeichnet. Ich kenne auch sonst niemand der sagen würde das ein Modul üblicherweise als Kern bezeichnet wird außer dieser Artikel der damit falsch liegt. Nur weil ein Modul teile von einem Prozessor Kern in sich hat ist es keiner. Der Computer ist ja auch kein riesiger Prozessor nur weil einer drin steckt.Vamp898 08:01, 16. Nov. 2011 (CET)
- Ich plädiere also immer noch dafür das der Artikel mit dieser Formulierung, nach wie vor, falsch liegt. Gerne kann ich auch ein paar Benchmarks nachliefern die die allgemeine Geschwindigkeit unter Linux mit dem Bulldozer beschreiben. Ich kann ja 30 Benchmarks als Quellen angeben damit das in den Artikel aufgenommen wird. Hat ja der abschnitt über die Performance unter Windows auch gemacht.... ach nein hat er ja garnicht. Nja egal Vamp898 08:01, 16. Nov. 2011 (CET)
- Es reichen so viele Quellen, die nötig sind, um das von dir gesagte zu belegen. Wenn es dafür 30 nötig sind, dann eben 30. Als Quelle für Performance unter Windows können die unzähligen Launchartikel gelten, die der Allgemeinheit bekannt sind und daher nicht verlinkt worden sind. Wenn du es wünscht, kann dies aber sehr schnell nachgetragen werden. Von mir aus können wir deine geänderte Formulierung bezüglich der Module stehen lassen, nur besser ist diese Formulierung nicht und "richtiger" auch nicht, weil die vorherige nicht falsch war. --Juri S. 09:21, 16. Nov. 2011 (CET)
- Ich plädiere also immer noch dafür das der Artikel mit dieser Formulierung, nach wie vor, falsch liegt. Gerne kann ich auch ein paar Benchmarks nachliefern die die allgemeine Geschwindigkeit unter Linux mit dem Bulldozer beschreiben. Ich kann ja 30 Benchmarks als Quellen angeben damit das in den Artikel aufgenommen wird. Hat ja der abschnitt über die Performance unter Windows auch gemacht.... ach nein hat er ja garnicht. Nja egal Vamp898 08:01, 16. Nov. 2011 (CET)
Zudem stellt der Artikel ein "Modul" da wie es bisher ein normaler Kern war. Mit dem Unterschied das ein "Modul" 3 Kerne beinhaltet (2 Integer und 1 FP) was somit in keinster weise mit einem normalen "Kern" vergleichbar ist. Vamp898 20:52, 14. Nov. 2011 (CET)
- Ein Modul ist ein Prozessorkern mit CMT (Core Multithreading) und kein normaler Kern. Genau so wie ein Core i7-Kern, ein Kern mit SMT (Simultenius Multithreading) ist und kein normaler Kern. Von normalen Kernen und unnormalen Kernen war nie die Rede im Artikel, sondern von Kernen mit SMT und Kernen mit CMT. --Juri S. 22:36, 15. Nov. 2011 (CET)
- Ein Modul beinhaltet 4 Integerpilines in zwei Cluster aufgeteilt, während ein Intel Core i7-Kern 3 Integerpilines mit gemeinsamer Nutzung für zwei Threads beinhaltet. Eine FPU hat sowohl der Intel Core i7-Kern, als auch der AMD FX-Modul. Ich wüsste nicht, warum man die FPU beim Bulldozer als Kern bezeichnen sollte, während sie weder beim Core i7 noch beim AMD Phenom als solche bezeichnet worden ist. --Juri S. 19:48, 15. Nov. 2011 (CET)
- Ein Modul beinhaltet 8 Integer Pipelines in zwei Cluster aufgeteilt. Wie gesagt die Bezeichnung Kern ist ungünstig gewählt. Ich entschuldige mich ja schon dafür Vamp898 21:34, 15. Nov. 2011 (CET)
- Er hält sie für 2 Threads bereit. Laut intel bringt HT aber maximal 30% wobei das Bulldozer Design bis zu 80% bringt. Ob man also 8 Pipelines in 2 Integer Clustern pro ""Kern"" hat oder nur 3 Pipelines mit einem Integer Modul macht einen riesen Unterschied. Somit kann ein "Kern" von Intel mit einem "Kern" vom Bulldozer nicht gleich gesetzt werden. Vamp898 19:56, 15. Nov. 2011 (CET)
So, ich hab den Artikel mal, hoffe ich, zum guten bearbeitet. Sry das es so viele Anläufe gebraucht hat ;) 93.222.161.27 21:26, 14. Nov. 2011 (CET)
- Aufgrund der oben stehenden Eräuterungen setze ich den Artikel mal zurück. --Juri S. 19:48, 15. Nov. 2011 (CET)
- Trifft hier auf vollstes Unverständnis. Der Artikel ist wieder Falsch. Das einzige was die Kerne vom Bulldozer von "richtigen" kernen trennt ist das sie sich den l2 cache teilen (der ist aber doppelt so groß). Was bleibt ist das sich die Kerne den "Fecht/Decode" teilen den sonst jeder Kern für sich alleine hat. Das heisst nur wegen dem Fetch/Decode sind die Bulldozer Kerne keine richtigen Kerne? Vamp898 20:22, 15. Nov. 2011 (CET)
- Der L2-Cache hat nichts mit der Kernbetrachtung zu tun. Frühere Prozessoren hatten gar keinen L2-Cache auf dem CPU-Die, sondern ausgelagert auf dem Prozessorslot. Die Decoereinheiten sind ein wichtiger Bestandteil eines x86-Kerns, ohne diesen funktioniert der Prozessor nicht. --Juri S. 21:05, 15. Nov. 2011 (CET)
- Aber wenn man eine Fetch/Decoder einheit für 2 Integer Cluster verwendet ist das deswegen ein ganzes Modul nicht 1 Kern. Es bleibt eine Mischung aus ein und zweikern.
- Es ist ja auch kein Kern, sondern ein Kern mit Core Multithreading, so wie dies im Artikel auch stand, nirgendwo wurde behauptet, dass es ein "gewöhnlicher Kern" ist. Es wurde von eine Kern gesprochen, auf dem Core Multithreading betrieben wird, womit es also kein gewöhnlicher Kern mehr ist. --Juri S. 22:36, 15. Nov. 2011 (CET)
- Aber wenn man eine Fetch/Decoder einheit für 2 Integer Cluster verwendet ist das deswegen ein ganzes Modul nicht 1 Kern. Es bleibt eine Mischung aus ein und zweikern.
- Ich meine, das kostet maximal 20% performance. Das heisst diese 20% trennen die Bulldozer Kerne von richtigen 2 Kernen? Das ergibt doch keinen Sinn. Die Integer Cluster sind die einheiten im Prozessor die die rechen arbeit verrichten. Das Herzstück eines Prozessor Kerns. Davon hat der Bulldozer 2. Das einzige was der Bulldozer nicht doppelt hat, also das einzige was ein Modul von einem DualCore trennt, ist das Fetch/Decode. Vamp898 20:22, 15. Nov. 2011 (CET)
- Zuallererst sollte man den Bezug nicht vergessen, wenn man mit virtuellen Prozenten um sich wirft. Vier Module von AMD sind langsamer, als vier Kerne von Intel mit Desktopsoftware. Letztendlich spielt aber die Leistung keine Rolle für die Betrachtung was ein "Kern" ist. Die hinter den Decodern liegenden Ingerpipelines und FPU-Pipelines können nur das bearbeiten was ihnen der Decoder liefert. Der Decoder kann beim Bulldozer 4 OPs generieren und diese 4 OPs können dann in Maschinensprache von der nachfolgender Hardware bearbeitet werden. Ein Intelkern kann in den Decodern ebenfalls 4 OPs bearbeiten. Der letztendliche Output kann im Idealfall also auf 4 OPs pro Takt in beiden Fällen hinauslaufen. Intel rechnet an diesen 4 OPs in einem Integercluster, AMD rechnet an diesen vier OPs in zwei Integerclustern. Der einzige Unterschied ist also lediglich die Aufteilung der Resourcen. Diese Aufteilung der Resourcen macht aus einem Modul, dessen Decoder nur 4 Ops pro Takt liefert aber keinen Doppelkerner, der 6 Ops pro Takt liefern könnte oder etwas ähnliches. --Juri S. 21:05, 15. Nov. 2011 (CET)
- Du solltest ebenfalls nicht den Bezug verlieren. Du redest von einem Windows Desktop. Unter Linux gibt es auch Desktops. Es gibt nicht nur Desktops, die typischen Linux Desktops hatten Widgets, Transparenz sowie 3D Effeckte und das ganze zeug vor allen anderen Desktops (siehe z.B. KDE welche als erste Grafische Oberfläche Widgets hatte).
- Und auf so einem Linux Desktop läuft, wenn er auf auf den Bulldozer optimiert wurde, ein Bulldozer mit 4 Modulen messbar schneller als ein Intel mit 4 Modulen. Ein FX 8150 unter einem auf den Bulldozer optimiertes System macht nämlich selbst die Intel 6 Kerner unter Windows 7 (ja ich weiss das kann man nicht vergleichen) fertig. Und da gibt es gleich mehrere Benchmarks die das zeigen Vamp898 21:32, 15. Nov. 2011 (CET)
- In dem von dir verlinkten Artikel wird "Multithreading-Fähigkeit" der Prozessoren mit sehr gut parallelisierter Software untersucht. Die Welt besteht aber nicht nur aus solcher Software. Die Softwareauswahl in de besagten Benchmarkparcour ist nicht Repräsentativ, sondern soll nur eine spezielle Seite des Prozessors untersuchen und daher sagen eben die Benchmarks auch nicht aus, dass Bulldozer unter Linux so viel toller ist, als unter Windows. Unter Windows gibt es auch Anwendungen, die stark parallelisierbar sind und alle Threads gleichmässig viele Resourcen fordern oder alle von einander unabhängig sind. Problem ist nur, dass das nicht so oft vorkommt und deswegen der dynamische Aufbau der Intel-Prozessoren verbunden mit starker Instruction per Clock-Fähigkeit den Sieg nach hause bringen. Wenn du jetzt Software nimmst, die diese dynamische Anpassung nicht braucht, dann gewinnt natürlich der dumme Prozessor mit mehr Durchsatz und nicht der intelligente, der sich an die Software anpasst, dafür aber weniger Maximaldurchsatz liefert. Entscheidend ist aber das, was es an Software in Realität gibt und das ist eben Software, die durchaus von der intelligenter Anpassung des Inte Core i7 mit SMT profitiert, vollkommen egal ob unter Windows oder Linux. --Juri S. 22:36, 15. Nov. 2011 (CET)
- Deswegen zu sagen es wäre nur ein Kern ist vollkommener Unsinn. Man kann sagen es sind 2 nicht ganz vollwertige Kerne oder das dieser Aufbau sich von normalen Kernen unterscheidet. Aber zu sagen das AMD die "Kerne" einfach in "Module" umbenannt hat ist einfach vollkommen falsch. Das sollte jedem klar sein der sich nur 1x angeschaut hat wie ein Bulldozer Modul aufgebaut ist. Somit ist der Artikel weiterhin falsch. Da meine Verbesserungen ja nicht akzeptiert werden soll meinetwegen jemand anders den Artikel berichtigen. Aber so wie er ist, ist er falsch und meine Bearbeitung war immerhin wesentlich präziser als diese wage und falsche Formulierung die der Artikel jetzt aufweist. Es bleibt der Nachgeschmack das der Artikel von jemand geschrieben wurde der den Bulldozer einfach nicht leidern kann Vamp898 20:22, 15. Nov. 2011 (CET)
- Unsinn ist es Teile eines Kerns als Kern zu bezeichnen, das geht eben nur beim Marketing. In den technischen Dokumentation hält sich sogar AMD an die richtige Nomenklatur. Ich habe mir den Bulldozer und vor allem die unterschiedlichen Prozessorarchitekturen öfters angeschaut als du, denn du scheinst nur das nachzuplappern, was AMDs Marketing auf bunten Folien zeigt, was den Vorgeschmack einer gefährlichen Halbwiesens zum Vorschein bringt. Der Artikel spricht vollkommen korrekt von vier Modulen und acht logischen Kernen, die sich dem Betriebssystem zeigen. Der Artikel sagt nichts über die stärke dieser logischen Kerne aus. Wenn du also sagen willst, dass die 8 logischen Kerne eines AMD-FX-Moduls einen höheren Durchsatz haben als 8 logische Kerne eines Core i7 mit SMT, dann steht dir frei das zu sagen. Dann muss man aber auch sagen, dass der maximale "Durchsatz" eben nicht alles ist und so weiter und so fort. Der Unterschiedliche Durchsatz der logischen Kernen von CMT und SMT macht aber aus Integerclustern keine "Kerne". --Juri S. 21:05, 15. Nov. 2011 (CET)
- Dafür hab ich mich doch schon entschuldigt Vamp898 21:38, 15. Nov. 2011 (CET)
- So am rande erwähnt, der Englische Wikipedia Artikel geht hier mit gutem Vorbild voran und ist wesentlich korrekter: http://en.wikipedia.org/wiki/Bulldozer_(microarchitecture) vielleicht sollte, wenn meine Formulierung nicht als passend erachtet wird, die Englische übernehmen. Die ist nämlich ebenso korrekt und beweist das die Formulierung in dem Artikel hier falsch ist. Vamp898 20:37, 15. Nov. 2011 (CET)
- Mal ebenfalls am Rand erwähnt. Nur weil auf der englischen Wikipdia-Seite jemand etwas geschrieben hat, muss es nicht richtig sein, genau wie das, was du hier geschrieben hast. Vielleicht solltest du erst mal lesen was ich geschrieben habe, bevor du weiter diskutierst, sonnst wiederholt sich bald alles. Juri S. 21:16, 15. Nov. 2011 (CET)
- So am rande erwähnt, der Englische Wikipedia Artikel geht hier mit gutem Vorbild voran und ist wesentlich korrekter: http://en.wikipedia.org/wiki/Bulldozer_(microarchitecture) vielleicht sollte, wenn meine Formulierung nicht als passend erachtet wird, die Englische übernehmen. Die ist nämlich ebenso korrekt und beweist das die Formulierung in dem Artikel hier falsch ist. Vamp898 20:37, 15. Nov. 2011 (CET)
- Also wenn man schon nicht mir glaubt, dann bitte wenigstens dem ausführlichen und eig. (soweit ich gesehen hab) korrekten Englischen Wikipedia Artikel. Der Artikel hier soll ja nicht die Meinung des Autors sondern eine Tatsache darlegen. Vamp898 20:37, 15. Nov. 2011 (CET)
- Der Artikel soll auch nicht die Meinung des Marketings darlegen, sondern neutral und technisch die Sache beleuchten. Und neutral und technisch richtig sind es vier Module und acht logische Kerne, was im Artikel auch steht. 21:16, 15. Nov. 2011 (CET)
- Das mit den logischen Kernen war nur eine Sache, das ist mir doch ganricht so wichtig. In dem Artikel wird es dargestellt als wär ein Modul das was man üblicherweise als Kern bezeichnet, nur hätte es AMD eben unbenannt. Und das ist falsch weil ein Modul ist nicht mit einem gewöhnlichen Prozessor Kern vergleichbar Vamp898 21:22, 15. Nov. 2011 (CET)
- Im Artikel war von einem Kern mit Core Multithreading (CMT) die Rede, ein Kern mit CMT ist kein gewöhnlicher Kern, es ist und bleibt ein Kern mit CMT. Oder hätte ich das "mit CMT" Fett hervorheben sollen, damit du diesen wichtigen Zusatz nicht überließt? Es wurden sogar die Unterschiede zum Kern mit SMT thematisiert. Wenn man Unterschiede aufzeigt, dann sagt man doch nicht, dass es beides ein und das gleiche ist, oder? weil sonnst gäbe es ja keine Unterschiede... --Juri S. 22:36, 15. Nov. 2011 (CET)
- Das mit den logischen Kernen war nur eine Sache, das ist mir doch ganricht so wichtig. In dem Artikel wird es dargestellt als wär ein Modul das was man üblicherweise als Kern bezeichnet, nur hätte es AMD eben unbenannt. Und das ist falsch weil ein Modul ist nicht mit einem gewöhnlichen Prozessor Kern vergleichbar Vamp898 21:22, 15. Nov. 2011 (CET)
- Der Artikel soll auch nicht die Meinung des Marketings darlegen, sondern neutral und technisch die Sache beleuchten. Und neutral und technisch richtig sind es vier Module und acht logische Kerne, was im Artikel auch steht. 21:16, 15. Nov. 2011 (CET)
- Also wenn man schon nicht mir glaubt, dann bitte wenigstens dem ausführlichen und eig. (soweit ich gesehen hab) korrekten Englischen Wikipedia Artikel. Der Artikel hier soll ja nicht die Meinung des Autors sondern eine Tatsache darlegen. Vamp898 20:37, 15. Nov. 2011 (CET)
Nochmal überarbeitet
BearbeitenDa es zu Missverständnisen kam hoffe ich das die nochmals von mir bearbeitete Version nun ein Kompromiss darstellt.
Wenn etwas falsch ist muss man ja nicht gleich alles verwerfen, man kann ja normal drüber reden =)
Um das nochmal klar zu stellen, das mit den logischen kernen, da hat mich lediglich die Formulierung wegen der Verwechslungsgefahr mit HT aufgeregt. Das war aber nicht falsch.
Was an dem Artikel falsch ist, ist das ein Modul mit einem Kern gleichgesetzt wird. Zudem wird nicht ausreichend genug erklärt warum ein Bulldozer Modul nicht das ist was man unter einem Prozessor Kern versteht und warum die Kerne vom "Bulldozer" ebenfalls nicht das sind was man unter einem Prozessor kern versteht.
- Hab sogar "Kerne" durch das korrektere "Cluster" ersetzt. Jetzt fällt mir nicht mehr viel auf was man noch abändern müsste um meine Verbesserung zu akzeptieren. Vamp898 21:45, 15. Nov. 2011 (CET)
- Wie oben schon geschrieben ist die Version mit den Clustern akzeptabel und wird von mir auch nicht zurückgesetzt, nur besser als die alte Version ist die Neue nicht. Die Alte Version war auch nicht falsch und sogar besser, weil sie auf übliche Bezeichnungen wie etwa die Bezeichnung "Prozessorkern" einging und danach erläuterte, wodurch der neue Ansatz von AMD von den üblichen alten Kernen und Kernen mit SMT unterscheiden, nämlich durch das einbringen von CMT in die Prozessorkerne. Dadurch sollte dem Leser ein Verständnis für die Unterschiede vermittelt werden, sofern der Leser bereit ist weiter als nur bis zum ersten Komma zu lesen. In der neuen Version sind diese Unterschiede implizit enthalten, werden jedoch nicht explizit dem Leser dargelegt, was meiner Meinung nach die schlechtere Variante ist. Zudem wird in der neuen Version von 80 Prozent gesprochen, wo nicht genau klar ist auf was sie sich beziehen, weil es unterschiedliche "echte Kerne" gibt, womit zumindest in diesem Punkt noch Nachbesserungsbedarf der neuen Version besteht. Außerdem gibt es auch keine Definition von "echten Kernen", womit ein Vergleich mit einem undefinierten Objekt entsteht. --Juri S. 11:01, 16. Nov. 2011 (CET)
- Die 80% sind eine Rechnung von AMD. AMD schrieb das wenn der Bulldozer ein ganz normaler 8 Kerner wäre und nicht dieses Core-Multithreading hätte wäre er um 20% schneller. Dadurch das er aber kein gewöhnlicher 8-Kerner sonden dieses Modul-System mit Integer Clustern verwendet wo z.b. immer nur eine FloatPoint einheit vorhanden ist, erreicht er nur 80% der Leistung (im vergleich zu sich selber wenn er ein normaler 8 Kerner wäre). Ich werd mich nochmal hinsetzen und versuchen den "Technisches" Teil umzuschreiben und auch die 80% besser zu erklären und am besten gleich mit Quellenangabe zur Aussage von AMD. Vamp898 11:42, 16. Nov. 2011 (CET)
- Wenn es einen normalen Bulldozer als Acht-Kerner gäbe, wäre es kein Bulldozer, weil Core-Multithreading das Hauptdesignmerkmal der Bulldozerarchitektur ist. Wie also eine Architektur ohne ihr Hauptarchitekturmerkmal performt kann keiner wirklich beurteilen. Die Aussage von AMD ist insofern auch gar nicht nachprüfbar. Da kann AMD auch auch sagen, dass es 90 Prozent wären. Das sind keine neutralen Vergleiche, die man hier im Artikel einpflegen sollte. Solche Vergleiche mit einer Gabel auf dem Wasser gezeichnet, sind vielleicht etwas, womit man die Presse vor erscheinen einer Prozessorarchitektur füttern kann, aber sie taugen nichts um irgend eine Handfeste Aussagekraft zu liefern. --Juri S. 12:02, 16. Nov. 2011 (CET)
- Die 80% sind eine Rechnung von AMD. AMD schrieb das wenn der Bulldozer ein ganz normaler 8 Kerner wäre und nicht dieses Core-Multithreading hätte wäre er um 20% schneller. Dadurch das er aber kein gewöhnlicher 8-Kerner sonden dieses Modul-System mit Integer Clustern verwendet wo z.b. immer nur eine FloatPoint einheit vorhanden ist, erreicht er nur 80% der Leistung (im vergleich zu sich selber wenn er ein normaler 8 Kerner wäre). Ich werd mich nochmal hinsetzen und versuchen den "Technisches" Teil umzuschreiben und auch die 80% besser zu erklären und am besten gleich mit Quellenangabe zur Aussage von AMD. Vamp898 11:42, 16. Nov. 2011 (CET)
Also ich hab jetzt mal den undefinierten Vergleich raus genommen. Hab auch wieder "Core-Multithreading" als Begriff eingebracht, weil damit ja SMT verglichen wird und der Begriff direkt von AMD eingeführt wurde. Der Eiertanz um die Module verhindert aber weiterhin eine kompakte und eindeutige beschreiben, wie sie vorher da war. Ich meine, es müsste sogar dir einleuchten, das wenn AMD von "Core-Multithreading" spricht, also von "Kern-Multithreading", dass man dann das Modul damit auch als Kern sieht. Das wir also dennoch hier so ein Eiertanz um die Kerne machen müssen, nur weil das Marketing meint, die Kerne mit Kern-Multithreading als Module zu bezeichnen, ist irgendwie unprofessionell. --Juri S. 11:42, 16. Nov. 2011 (CET)
Linux?!?
BearbeitenDer Bulldozer bringt, nach aktuellen Benchmarks, mit Optomierung (-march=bdver1 -O2 oder durch verwendung von Open64) teilweise bis zu 70% mehr Leistung unter Linux.
Der Bulldozer erhält einen schlechten ruf weil er unter Windows 7 gerade mal knapp einem i5 2500k die Stirn bieten kann, unter Linux schafft er, mit Optimierung, aber locker einen i7 990X.
Das ist ein Geschwindigkeitsunterschied von Welten.
Diesen unterschied hab ich mit insgesamt 7 Quellenangaben in den Artikel eingepflegt, wieso wurde das verworfen? Vamp898 20:03, 15. Nov. 2011 (CET)
- Schon mal daran gedacht, dass man auch Software für den Core i7-990X ebenfalls optimieren kann? Ein Vergleich von zwei Prozessoren mit Software, die für einen Prozessor angepasst und cherry-picked ist, hat nichts mit fairem Benchmarketing zu tun. Faires Benchmarking wäre es, wenn man ein bestehendes Linux-System nimmt und mit bestehender Software Benchmarkt. Oder aber man optimiert die Software für einen Prozessor und für den anderen Prozessor und lässt sie dann ein mit dieser Software ein Problem lösen. Damit wird ermittelt, welcher Prozessor nach Optimierung ein spezielles Problem schneller löst. Dieses Ergebnis hat aber dann nur eine Aussagekraft bezüglich angepasster Software und nicht mehr. Wenn man also irgendwelche Benchmarks postet, sollte man auch so viel Weitsicht haben, deren Aussagekraft zu beschränken und unfaire Benchmarks, die nur auf einen Prozessor extra angepasst worden sind, sind schlicht und ergreifend keine Benchmarks, sondern Täuschung. --Juri S. 21:38, 15. Nov. 2011 (CET)
- -march=native wählt beim Core i7 990X die beste Optimierung für den i7 990X genauso wie es beim Bulldozer die beste Optimierung für den Bulldozer wählt. Der sinn von OpenSource Benchmarks ist das man die Funktionsweise exakt nachvollziehen kann und zu hause selber Benchmarken. Ich verwende beruflich einen i7 990X mit Gentoo der mit -march=native vollständig optimiert ist. Und der läuft langsamer wie mein Bulldozer bei knapp der hälfte alle Benchmarks die ich durchlaufen lass. Teilweise ist der unterschied sehr erheblich. Aber niemand interessiert sich für Benchmarks einer Privat Person weswegen man lediglich auf Quellen wie Phoronix zurückgreifen kann. Ausserdem wurde u.a. optimiert. Vor allem bei dem Benchmark wo der FX-8150 gegen denn 990X antritt wurde auf keiner von beiden optimiert. Beides generic. Es geht hier also nicht darum ein falsches bild zu zeigen, es geht nur darum zu zeigen das der Bulldozer unter Linux mithalten kann, und wie viel man mit Optimierung unter Linux aus ihm rausholen kann. Bei keinem Benchmark wurde ein optimierte Bulldozer mit einem nicht-optimierten 990X verglichen (zum. bei keinem wo ich als Quelle angegeben hab. Der FX-8150 hat das ganz ohne geschafft). Vamp898 21:43, 15. Nov. 2011 (CET)
- Ich würde mich freuen, wenn du das auch mit Quellen im Artikel belegen kannst. Bisher waren deine Quellen recht dünn und damit die Aussagen recht begrenzt, aber immerhin wissen jetzt die Leute, dass man da noch was optimieren kann. Falls es zu wenig Quellen gibt, die das belegen, was du aber angeblich siehst, könntest du ja die Testseiten mal ein wenig Anregen, so was mal zu testen. Aber bitte mit repräsentativer Benchmarksauswahl also kein Cherry Picking und fairem Vergleich, das heißt unter gleichen Bedingungen. Juri S. 10:31, 17. Nov. 2011 (CET)
- -march=native wählt beim Core i7 990X die beste Optimierung für den i7 990X genauso wie es beim Bulldozer die beste Optimierung für den Bulldozer wählt. Der sinn von OpenSource Benchmarks ist das man die Funktionsweise exakt nachvollziehen kann und zu hause selber Benchmarken. Ich verwende beruflich einen i7 990X mit Gentoo der mit -march=native vollständig optimiert ist. Und der läuft langsamer wie mein Bulldozer bei knapp der hälfte alle Benchmarks die ich durchlaufen lass. Teilweise ist der unterschied sehr erheblich. Aber niemand interessiert sich für Benchmarks einer Privat Person weswegen man lediglich auf Quellen wie Phoronix zurückgreifen kann. Ausserdem wurde u.a. optimiert. Vor allem bei dem Benchmark wo der FX-8150 gegen denn 990X antritt wurde auf keiner von beiden optimiert. Beides generic. Es geht hier also nicht darum ein falsches bild zu zeigen, es geht nur darum zu zeigen das der Bulldozer unter Linux mithalten kann, und wie viel man mit Optimierung unter Linux aus ihm rausholen kann. Bei keinem Benchmark wurde ein optimierte Bulldozer mit einem nicht-optimierten 990X verglichen (zum. bei keinem wo ich als Quelle angegeben hab. Der FX-8150 hat das ganz ohne geschafft). Vamp898 21:43, 15. Nov. 2011 (CET)
Auch wenn ich ein bisschen weit ausgeholt hab sollte zum. Erwähnung finden das der Bulldozer auf einem optimierten Linux System, im vergleich zu Windows 7, weit über 50% mehr leistung bietet und deshalb im Linux bereich eine ganz andere Alternative in einer anderen Preisklasse bietet. Vamp898 20:03, 15. Nov. 2011 (CET)
- Schau mal nach, wie teuer angepasste Software ist. ;)
- Ich hab gesagt optimiert, nicht angepasst. Das ist ein riesen unterschied. Ob ich eine Software nicht anfasse und beim kompilieren auf den Prozessor optimiere oder ob ich sie im Source Code anpasse sind Welten von unterschied.
- emerge -av kde-meta und ganz KDE ist für den Bulldozer optimiert und profitiert von dem bis zu 40% Performance gewinn. hmmm so teuer war das jetzt nicht und alles wurde mit -march=bdver1 -O2 & co. auf den Prozessor optimiert. Zauber zauber hexenwerk Vamp898 21:42, 15. Nov. 2011 (CET)
Zudem sind die verwendeten Benchmarks unter Linux OpenSource worduch ein "Schummeln" ausgeschlossen werden kann. Die Windows Benchmarks die hier in dem Artikel erwähnt werden waren ClosedSource Benchmarks wo nirgends auch nur eine Code-Zeile nach verfolgt werden kann. 7 Quellen angaben + OpenSource Benchmarks und trotzdem wurde es nicht eingepflegt. Die nicht nachvollziehbaren Benchmarks unter Windows 7 sind im Artikel drin. Vamp898 20:03, 15. Nov. 2011 (CET)
- LOL, also anpassen der Software ist also kein Schummeln? --Juri S.
- Optimierte Software, nicht angepasste. Ist immernoch ein Unterschied. Zudem scheint es sich hier um ein grundlegendes Missverständnis zu handeln. Wenn auf den FX 8150 optimiert wurde ist er schneller als der i990X. Ohne Optimierung kann er trotzdem mit dem 990X mithalten bzw. dern i5 2500 locker besiegen. Vamp898 21:42, 15. Nov. 2011 (CET)
Hab mir übrigens die Benchmarks noch mal genauer angeschaut. Die erste Quelle: http://www.phoronix.com/scan.php?page=article&item=llvm3_gcc_open64&num=1 Es treten an: Ein alter mobiler Core i7 2630QM mit 2,0 GHz gegen zwei Serverprozessorens aus der Shanghai-Familie (also keine Bulldozer), nämlich die Opterons 2384 an. Noch unfairer hätte mal die Gegner nicht wählen können. Was kommt eigentlich als nächstes? Werden als nächstes Viersockelsysteme gegen Intels mobile Ultra Low Voltage-CPUs gebenchmarkt? Außerdem frage ich mich, was in einem AMD-FX-Artikel Opteron-Benchmarks auf Zweisockelsystemen zu suchen haben. Und was haben diese Benchmarks mit Bulldozer überhaupt zu tun?
zweite Quelle: http://www.phoronix.com/scan.php?page=article&item=amd_bulldozer_compilers&num=1
Es wird ein Bulldozer alleine vermessen. Ein Vergleich mit Intel ist gar nicht gegeben und damit sind auch Konjunktivsätze über das "was wäre wenn" völlig Fehl am Platz.
dritte Quelle: http://www.phoronix.com/scan.php?page=article&item=amd_bdver1_ofast&num=1
Es werden einige Benchmarks mit bdver1-Optimierung durchgeführt. Welche Aussagekraft diese paar Benchmarks mit den Optimierungen für die Gesamtleistung des Prozessors haben, wird nicht erläutert. Es gibt ja schließlich mehr Software als die paar Benchmarks. Haben die Optimierungen vielleicht sogar negative oder eben gar keine Auswirkungen auf andere Anwendungen? Dies wird aus dem Test auch nicht ersichtlich. Es sieht wie Kirschenpflücken aus. Gepflückt wird nur das, was gut aussieht....
Zu dem anderen Benchmark, der lediglich die Multithreadleistung misst, du aber daraus fälschlicherweise Gesamtperformance unter Linux ableitest habe ich mich ja schon mehrfach unter der anderen Überschrift hier in der Diskussion geäußert. Am Ende in der Kategorie Softwareoptimierungen folgt dann noch eine Aussage, die gar keine Quelle hat. Echt toll... --Juri S. 16:27, 16. Nov. 2011 (CET)
Benchmark
BearbeitenHier mal ein Benchmark zu der Performance vom AMD FX 8150 unter optimierten Systemen:
http://ignaz.org/amd/amd/bulldozer.png
als Vergleich dienen hier AMD Phenom II X6 1100T, Intel Core i7 2600 (mit HT), Intel Core i7 860
Als Benchmark diente Hardinfo (OpenSource) und wurde auf den jeweiligen Prozessor, vor dem durchführen, optimiert (-O3, -march=native)
Als Compiler wurde GCC 4.6.2 verwendet und als Distribution Archlinux.
Das Benchmark wurde 5x durchgeführt und das Durchschnittswert als Ergebnis genommen (ca. 1-3% Toleranz steckt in den Werten)
Ich denke das kann man in den Artikel einbauen. Vor allem sieht man hier schön das Intel mit Raytracing liebäugelt was AMD anscheinend nicht tut ;) Vamp898 17:51, 27. Nov. 2011 (CET)
- Man kann auch gut sehen das der Bulldozer, wegen nur 4 FPU Einheiten, bei FPU Benchmarks langsamer als der Phenom II X6 1100T ist (welcher ja 6 hat) Vamp898 17:51, 27. Nov. 2011 (CET)
Das kann man in den Artikel einfügen? Eine Seite als Quelle, die nicht mal ein Impressum hat, geschweige den einen Test vorweisen kann mit dem Namen des Testers, sondern lediglich ein Bild? Und ich dachte ein Impressum wäre in Deutschland Pflicht... ...da muss ich mir nicht mal Gedanken drüber machen, welch synthetische Benchmarks mit welcher Aussagekraft dort in den Diagrammen aufgelistet sind. --Juri S. 18:32, 27. Nov. 2011 (CET)
- Diese WebSeite ist meine Privat Bildergalerie und ich habe nicht auf auf die WebSeite sondern direkt auf ein Bild davon verlinkt, nicht ohne Grund. Wenn du die URL veränderst ist das deine Sache ;) das ist dann nicht mehr was ich verlinkt habe. Das Benchmark wurde ausschließlich im Rahmen dieses Wikipediartikels geschrieben und ich arbeite momentan noch an einem kleinen Text mit den exakten Informationen unter welchen Bedingungen das wie wann wo genau getestet wurde. Desweiteren lassen sich diese Ergebnisse problemlos unter jedem 0815 Linux System reproduzieren weswegen es hier kaum großartige Gründe zur Unglaubwürdigkeit geben sollte. Ich hab nur gedacht ich bekomme das Gestern noch fertig und wollte es anhängen, was leider nicht der Fall war. Aber bis das nicht fertig ist muss es ja natürlich nicht eingefügt werde. Ich schaue das ich das schnellstmöglich fertig mache. Vamp898 12:54, 28. Nov. 2011 (CET)
- Genau das hab ich mir gedacht. Wenn du keine Quelle hast, zeichnest du dir halt selbst eine, nur geht das so nicht. Es können auch nicht alle Nutzer hier deine Ergebnisse reproduzieren, weil ihnen schlicht und ergreifend die Hardware fehlt. Wer hat schon einen Core i7 aus zwei Generationen, einen Phenom II und auch noch einen AMD FX zu hause? Wohl niemand, außer dir natürlich. Also eine Quelle muss schon mehr bieten als das. Und schau dir auch die professionellen Seiten an. Nur synthetische Tests zu machen und darauf etwas abzuleiten bringt nichts. Synthetische Tests sind dazu gut um die Schwächen und Sträkeren der CPUs herauszufinden, nicht um CPUs mit einander zu vergleichen. Ein Vergleich findet mit Benchmarks von realen Anwendungen statt. Siehe auch das Computerbase-Rating, welches hier als Quelle verlinkt wurde. Da werden synthetische Tests aus dem Rating gar raus genommen. Und was machst du? Das genaue Gegengenteil. --Juri S. 15:23, 28. Nov. 2011 (CET)
- "Siehe auch das Computerbase-Rating, welches hier als Quelle verlinkt wurde" Ich denke es würden sich genügend finden lassen die diese Ergebnisse von mir bestätigen würden. Und diese Tests sagen genau das aus was sie aussagen. Nämlich welche Performance welcher Prozessor bei welchem Test hatte. Nicht mehr und nicht weniger. Außerdem besitze ich diese Prozessoren nicht alle, eines ist ein Arbeits PC und der andere wurde zurück gesendet. Und der Phenom ist somit mein alter und war bisher mein einziger Prozessor. Aber wie gesagt, dieses Benchmark ist OpenSource und _jeder_ der einen dieser 4 Prozessoren hat kann seine Ergebnisse mit denen vergleichen. Das heisst man braucht nicht einen der alle hat, sondern es reichen bei weitem 4 aus von denen jeder einen hat. Vamp898 15:40, 28. Nov. 2011 (CET)
- Scroll mal hoch. Ich weiß nicht was für dich am nachfolgenden Satz unverständlich war: "Aber bitte mit repräsentativer Benchmarksauswahl also kein Cherry Picking und fairem Vergleich, das heißt unter gleichen Bedingungen."
- Deine Benchmarks sind weder Repräsentativ, noch wurden die unter gleichen Bedingungen erstellt. Eine Arbeitsmaschine auf der Arbeit kannst du doch nicht einfach mit deinem nagelneu aufgesetzten System zu Hause vergleichen. Also wirklich. Amateur!
- "Siehe auch das Computerbase-Rating, welches hier als Quelle verlinkt wurde" Ich denke es würden sich genügend finden lassen die diese Ergebnisse von mir bestätigen würden. Und diese Tests sagen genau das aus was sie aussagen. Nämlich welche Performance welcher Prozessor bei welchem Test hatte. Nicht mehr und nicht weniger. Außerdem besitze ich diese Prozessoren nicht alle, eines ist ein Arbeits PC und der andere wurde zurück gesendet. Und der Phenom ist somit mein alter und war bisher mein einziger Prozessor. Aber wie gesagt, dieses Benchmark ist OpenSource und _jeder_ der einen dieser 4 Prozessoren hat kann seine Ergebnisse mit denen vergleichen. Das heisst man braucht nicht einen der alle hat, sondern es reichen bei weitem 4 aus von denen jeder einen hat. Vamp898 15:40, 28. Nov. 2011 (CET)
- Aber wie gesagt, das Benchmark sagt aus was es aussagt. Weniger Synthetische Benchmarks gibt es vielleicht, aber ich nenne es nicht Unsynthetisch wenn man ein Betriebssystem nimmt welches keinen Support für den Prozessor hat, ein Benchmark nimmt welches kein Support für den Prozessor hat (somit, selbst wenn es wollte, keine Optimierung für den Prozessor hat), ein Benchmark welches aus einem kommerziellen Hintergrund und zu 100% Closed Source entwickelt wurde. Z.b. könnte das Benchmark jeden wert um 10% erhöhen wenn es ein Intel Prozessor ist. Vielleicht ist es so, vielleicht nicht. Das weiss niemand, wird niemand herausfinden und niemand könnte dies oder das Gegenteil beweisen. Also wäre meine Behauptung dass diese Benchmarks alles andere als Aussagekräftig für irgendwas sind; höchstens dafür dass es traurig ist das es tatsächlich Leute gibt die sowas ernst nehmen und denken das es irgend etwas über Performance aussagen würde. Meine Ergebnisse lassen sich von jedem Menschen der diesen Prozessor besitzt nachvollziehen und zwar ohne das er einen müden Cent bezahlen muss. Jede einzelne Codezeile die das Benchmark ausführt kann nachvollzogen werden und das Benchmark kann auf jeden beliebigen Prozessor optimiert werden (auch Bulldozer) da es OpenSource ist und somit mit aktuellen Compilern die Support für den Bulldozer haben kompiliert werden kann (Open64, GCC & Co.). Vamp898 15:40, 28. Nov. 2011 (CET)
- Es wurde in vielen Launchartikeln das am meisten verbreitete Betriebssystem genommen. Nämlich Windows 7. Weiß nicht, was daran synthetisch sein soll. MacOSX wird gar nicht auf AMDFX-Prozessoren betrieben und ansonsten hat Windows im Allgemeinen im Vergleich zu Linux über 90 Prozent Anteil, so weit ich mich an die letzte Statistik erinnere. Vermeintlich optimiertes Windows 8, dass noch mal 3 Prozente raus holen soll, gibt es (noch) nicht, wurde im Artikel aber auch schon erwähnt. Zudem stehen Windows 8 Viele aufgrund der neuen Oberfläche kritisch gegenüber. Betriebssysteme, die oft mit den Opteron-Prozessoren verwendet werden, interessieren hier auch nicht, da es hier nur um die AMD FX-Prozessoren geht. Wenn also reale Anwendungen auf einem Betriebsystem getestet wurden, welches so weit verbreitet ist, wie es Windows nun mal ist, dann weiß ich nicht, wer du bist, der sich hier hinstellt und meint, dass das angeblich keine Aussagekraft hätte, obwohl diese Anwendungen von Anwendern auf dem besagten Betriebssystem genutzt werden. Und nein, nicht alles was theoretisch geht, geht auch praktisch. Nur weil jeder in den Code rein schauen kann, bedeutet das nicht, dass auch jeder mit dem Code etwas anfangen kann. Der AMD FX-Prozessor wird nun mal zum größten Teil mit Windows-Betriebsystem verwendet und daher sind die betreffenden Benchmarks auch ernst zu nehmen, völlig unabhängig davon ob du da in den Code rein schauen kannst oder nicht, den das reinschauen, ändert an der Performance nichts. Der AMD FX-Prozessor wurde übrigens auch aus kommerziellen Hintergrund entwickelt und ist ebenfalls 100 Prozent Closed Source. Wenn du sonnst noch etwas an den Benchmarks der vielen Benchmarker auszusetzen hast, kannst du dich gerne direkt an die betreffenden Seiten wenden. Alle mir bekannten, lassen Leser ihre Artikel kommentieren. Dort kannst du dann deine Bedenken vortragen und auch die Gegenargumente anderer Leser auf dich wirken lassen. --Juri S. 21:18, 28. Nov. 2011 (CET)
- Aber wie gesagt, das Benchmark sagt aus was es aussagt. Weniger Synthetische Benchmarks gibt es vielleicht, aber ich nenne es nicht Unsynthetisch wenn man ein Betriebssystem nimmt welches keinen Support für den Prozessor hat, ein Benchmark nimmt welches kein Support für den Prozessor hat (somit, selbst wenn es wollte, keine Optimierung für den Prozessor hat), ein Benchmark welches aus einem kommerziellen Hintergrund und zu 100% Closed Source entwickelt wurde. Z.b. könnte das Benchmark jeden wert um 10% erhöhen wenn es ein Intel Prozessor ist. Vielleicht ist es so, vielleicht nicht. Das weiss niemand, wird niemand herausfinden und niemand könnte dies oder das Gegenteil beweisen. Also wäre meine Behauptung dass diese Benchmarks alles andere als Aussagekräftig für irgendwas sind; höchstens dafür dass es traurig ist das es tatsächlich Leute gibt die sowas ernst nehmen und denken das es irgend etwas über Performance aussagen würde. Meine Ergebnisse lassen sich von jedem Menschen der diesen Prozessor besitzt nachvollziehen und zwar ohne das er einen müden Cent bezahlen muss. Jede einzelne Codezeile die das Benchmark ausführt kann nachvollzogen werden und das Benchmark kann auf jeden beliebigen Prozessor optimiert werden (auch Bulldozer) da es OpenSource ist und somit mit aktuellen Compilern die Support für den Bulldozer haben kompiliert werden kann (Open64, GCC & Co.). Vamp898 15:40, 28. Nov. 2011 (CET)
- "völlig unabhängig davon ob du da in den Code rein schauen kannst oder nicht, den das reinschauen, ändert an der Performance nichts" das heisst der Bulldozer erkennt ob eine Software OpenSource ist und läuft schneller? Anders ist es ja nicht zu erklären das 2 Benchmarks die vermeintlich das identische tun (z.b. 42 Fibonacci Zahl berechnen) komplett unterschiedlich schnell laufen und zwar sehr zu Gunsten eines Prozessor Herstellers. Und das obwohl die 42 Fibonacci zahl ja eigentlich immer gleich berechnet wird (selbst wenn man unterschiedliche Wege zum Ziel nimmt kann das keine so große Geschwindigkeitsunterschiede hervorrufen). Aber anscheinend hat der Bulldozer einfach eine OpenSource Erkennung und läuft dann wesentlich schneller, anders ist das ja nicht zu erklären weil die ClosedSource Benchmarks sind ja 100% richtig und neutral. Kann man doch ganz gut am Source sehen... äh nein. Na gut kann man nicht sehen aber glauben! Genauso wie man an Gott glaubt! Prozessor Geschwindigkeiten haben einfach viel mit dem Glaube an Gott zu tun. Zumindest unter Windows.
- Ich denke dann muss ich einfach akzeptieren das die Geschwindigkeit des Prozessors unter Linux nicht interessiert. Die Leute wollen nicht wissen wie schnell der Prozessor ist, sondern wie schnell ihr Spiel am ende läuft. Warum es das tut ist egal, Hauptsache es läuft schneller. Da bezahlt man auch gerne mehr Geld für weniger Leistung =) Und die Wikipedia stellt ja keinen Anspruch an Richtigkeit sondern wenn die Leute die falschen Ergebnisse unter Windows lieber mögen weil sie Windows nutzen, dann müssen diese natürlich auch in die Wikipedia rein. Wer interessiert sich bei einem Artikel über einen Prozessor schon für die Geschwindigkeit des Prozessors wenn man ein System hat welches ihn benutzen kann (Und nein, Windows 8 kann den Bulldozer nicht richtig verwenden, er konnte schon den Phenom nicht richtig verwenden. Die nutzen halt vllt. einen leicht anderen Scheduler und das wars, optimiert wird da garantiert überhaupt gar nichts weil sonst würde es nicht mehr unter Intel Prozessoren laufen).
- Meine Benchmarks haben lediglich gezeigt welche Performance dieser Prozessor erreichen kann; wenn einer diese nie haben wird weil er ein nicht optimiertes System hat ändert das nichts an der Geschwindigkeit die dieser Prozessor liefern kann. Aber wie oben geschrieben geht ja anscheinend nicht um die Geschwindigkeit des Prozessors sondern darum welche bei Windows 7 (oder dann bald bei 8) im Alltag (was ja merkwürdigerweise oft Spiele sind, anscheinend sind Spiele der Alltag von Windows (zum. laut Benchmarks) was ja schon viel über die Seriosität aussagt ;) Spiele sind ja bekanntlich die Krönung unter den Programmierleistungen :P) ankommt. Somit gebe ich mich geschlagen und muss einfach akzeptieren das Werte keinen interessieren die nicht die Masse betreffen. Btw. misst alleine W3 über 5% Marktanteil ;) ich glaube deine Zahlen sind veraltet denn selbst 2004 war die Zahl schon über 3% Vamp898 08:36, 29. Nov. 2011 (CET)
- Es wurde in dem betreffenden Absatz, auf den du antwortest, nirgendwo gesagt, dass Benchmarks unter Linux komplett uninteressant sein. Es wurde in dem betreffenden Absatz auch nirgendwo Stellung dazu genommen, ob es zwischen Windows und Linux einen Unterschied in der Performance gibt. Warum du beides dem betreffenden Absatz unterstellst und dann eine halbe Seite dazu was schreibst, ist völlig unklar. Im Absatz, auf den du antwortest wurde stattdessen gesagt, dass Benchmarks unter Windows mit realen Programmen, alles andere als "synthetisch" sind und eine sehr große Relevanz haben und es wurde auch gesagt, dass unabhängig davon ob die Programme Closed Source sind und man da nicht nachschauen kann, die betreffenden Programme unabhängig davon eine bestimmte Performance aufweisen und aufgrund des Alltags dennoch Relevanz haben. Aber langsam erkenne ich ein Muster. Du unterstellst den Aussagen immer etwas, was sie gar nicht sagen und führst dann die Gegenargumente gegen die Unterstellung. So hast du ja auch behauptet, dass der Artikel behauptet hätte, die Module wären "normale Kerne", nur umbenannt, obwohl im Artikel ganz klar die Unterschiede herausgearbeitet waren. Was du dir mit solch einer Argumentationsmethodik erhoffst, ist mir persönlich schleierhaft. Genau so schleierhaft ist es mir, warum du schon wieder nur einen halben Satz zitierst um ihn dann Misszuverstehen. Es ist doch nun wirklich nicht so schwer beim Zitieren darauf zu achten vollständige Sätze zu zitieren. Wenn sich ein Nebensatz auf die Relevanz des Benchmarks unter Windows bezieht, du aber den Hauptsatz wegschneidest und den betreffenden Nebensatz stattdessen auf Linux beziehst, dann ist es doch klar, dass die Aussage völlig verzerrt wird und im falschen Kontext auch falsch wird. --Juri S. 20:40, 29. Nov. 2011 (CET)
- Meine Benchmarks haben lediglich gezeigt welche Performance dieser Prozessor erreichen kann; wenn einer diese nie haben wird weil er ein nicht optimiertes System hat ändert das nichts an der Geschwindigkeit die dieser Prozessor liefern kann. Aber wie oben geschrieben geht ja anscheinend nicht um die Geschwindigkeit des Prozessors sondern darum welche bei Windows 7 (oder dann bald bei 8) im Alltag (was ja merkwürdigerweise oft Spiele sind, anscheinend sind Spiele der Alltag von Windows (zum. laut Benchmarks) was ja schon viel über die Seriosität aussagt ;) Spiele sind ja bekanntlich die Krönung unter den Programmierleistungen :P) ankommt. Somit gebe ich mich geschlagen und muss einfach akzeptieren das Werte keinen interessieren die nicht die Masse betreffen. Btw. misst alleine W3 über 5% Marktanteil ;) ich glaube deine Zahlen sind veraltet denn selbst 2004 war die Zahl schon über 3% Vamp898 08:36, 29. Nov. 2011 (CET)
- Zudem sind die Werte die aus meinem Benchmark kommen verdächtig aussagekräftig und geben viel zu viel Aufschluss über die Funktionsweise des Prozessors (z.b. das der Bulldozer bei FPU Benchmarks langsamer ist (weniger FPU einheiten), oder das die Intel bei Raytrace so hoch gewinnen (Intels Optimierung für Raytrace)) als das diese grundlegend falsch sein könnten. Und wie gesagt, die Benchmarks sagen aus was sie aus sagen. Nicht mehr und nicht weniger. Der Bulldozer könnte in allem anderen trotzdem langsamer sein als der Intel. Aber wenn z.b. jemand nur mit Crypto-Hash oder Blowfish arbeitet werden diese Benchmarks schon wieder wichtig sein. Kommt also ganz auf den User an ob die Benchmarks ""aussagekräftig"" sind oder nicht. Vamp898 15:40, 28. Nov. 2011 (CET)
- Wie bereits oben geschrieben, taugen synthetische Benchmarks dazu die stärken und schwächen einer CPU zu analysieren. Jedoch nicht, wenn man die reale Performance auf Anwendungen bewerten will. Für weitere Erklärungen wende dich an ein Hardware-Forum deines Vertrauens.... --Juri S. 21:18, 28. Nov. 2011 (CET)
- Zudem sind die Werte die aus meinem Benchmark kommen verdächtig aussagekräftig und geben viel zu viel Aufschluss über die Funktionsweise des Prozessors (z.b. das der Bulldozer bei FPU Benchmarks langsamer ist (weniger FPU einheiten), oder das die Intel bei Raytrace so hoch gewinnen (Intels Optimierung für Raytrace)) als das diese grundlegend falsch sein könnten. Und wie gesagt, die Benchmarks sagen aus was sie aus sagen. Nicht mehr und nicht weniger. Der Bulldozer könnte in allem anderen trotzdem langsamer sein als der Intel. Aber wenn z.b. jemand nur mit Crypto-Hash oder Blowfish arbeitet werden diese Benchmarks schon wieder wichtig sein. Kommt also ganz auf den User an ob die Benchmarks ""aussagekräftig"" sind oder nicht. Vamp898 15:40, 28. Nov. 2011 (CET)
- Sie sind, selbst wenn die Ergebnisse wirklich garnichts über die Reelle Performance aussagen (was zu bezweifeln ist) wären Sie gleichberechtigt neben den momentan erwähnten Benchmarks da diese nicht reellere Werte liefern. Zudem werde ich zu meinem Benchmark eine riesige Anleitung mit Erklärung & Co. mit liefern was ich ganz genau wo warum und wie getestet habe incl. Sourcecode. Ich bin also der Meinung das mein Benchmark nicht mehr falsch ist als die wo bisher erwähnt wurden. Also sollte man entweder alle Fälle/Situationen beleuchten (vor allem wenn das Ergebnis so unterschiedlich ist) oder alle Benchmarks gänzlich aus Artikeln über eine CPU Entfernen (was meiner Meinung nach die bessere Lösung wäre. Auch wenn es schade um mein Benchmark wäre welches mich viel Arbeit und letztendlich auch Geld gekostet hat). Am Rande erwähnt hab ich noch viel mehr Benchmarks zu bieten. Kompilierzeiten, konvertieren von wav nach flac und von flac nach mp3, und vieles mehr. Die Ergebnisse sehen da nicht viel anders aus als auf meinen Benchmarks. Die kann ich gerne nachliefen ;) Vamp898 15:40, 28. Nov. 2011 (CET)
- "falsche Benchmarks" ist der falsche Ausdruck. Sie sind bloß nicht repräsentativ, überwiegend synthetisch und wurden nicht unter gleichen Bedingungen erstellt. Wenn du gerne Benchmarks durchführst, kannst du dich bei einer Hardware-Seite als Benchmarker bewerben. Die Betreiber werden dann hoffentlich auch so viel Wissen haben, dass sie dir die nötigen Hinweise geben, wie man einen Test gestaltet oder dich ablehnen, wenn sie dieses Wissen bereits voraussetzen. Dann schreibst du noch deinen offiziellen Namen unter die Benchmarks drunter und lässt die Leser Kommentare zu deinen Benchmarks verfassen und wenn du Mist benchmarkst, dann muss ich das hier nicht kommentieren, sondern die betreffenden Leser der Hardware-Seite, auf der du das veröffentlicht hast. Die Welt kann so einfach sein ;) --Juri S. 21:18, 28. Nov. 2011 (CET)
- Sie sind, selbst wenn die Ergebnisse wirklich garnichts über die Reelle Performance aussagen (was zu bezweifeln ist) wären Sie gleichberechtigt neben den momentan erwähnten Benchmarks da diese nicht reellere Werte liefern. Zudem werde ich zu meinem Benchmark eine riesige Anleitung mit Erklärung & Co. mit liefern was ich ganz genau wo warum und wie getestet habe incl. Sourcecode. Ich bin also der Meinung das mein Benchmark nicht mehr falsch ist als die wo bisher erwähnt wurden. Also sollte man entweder alle Fälle/Situationen beleuchten (vor allem wenn das Ergebnis so unterschiedlich ist) oder alle Benchmarks gänzlich aus Artikeln über eine CPU Entfernen (was meiner Meinung nach die bessere Lösung wäre. Auch wenn es schade um mein Benchmark wäre welches mich viel Arbeit und letztendlich auch Geld gekostet hat). Am Rande erwähnt hab ich noch viel mehr Benchmarks zu bieten. Kompilierzeiten, konvertieren von wav nach flac und von flac nach mp3, und vieles mehr. Die Ergebnisse sehen da nicht viel anders aus als auf meinen Benchmarks. Die kann ich gerne nachliefen ;) Vamp898 15:40, 28. Nov. 2011 (CET)
Negative Auswirkungen von -march
BearbeitenDiese Optimierung in GCC kann auch genutzt werden, um das ganze Betriebssystem mit allen Anwendungen zu kompilieren, wodurch die Optimierung in allen Anwendungen angewandt wird, was jedoch in einigen Anwendungen auch gar keine oder sogar negative Auswirkungen auf die Performance haben kann
Ich hab noch nie gehört das -march negative Auswirkung auf die Performance haben kann, wieso auch. Es kann vielleicht sein das die ein oder Anwendung (z.b. der Linux Kernel) da etwas empfindlich reagieren und abstürzen aber selbst der Linux Kernel unterstützt -march=bdver1 einwandfrei.
Also ich hab bisher noch nie in meinem Leben gehört das Optimierung mit -march den gegenteiligen Effeckt haben kann und ich denke wenn das keiner belegt sollte der letzte Teil "was jedoch in einigen Anwendungen auch gar keine oder sogar negative Auswirkungen auf die Performance haben kann" wieder entfernt werden.
FreeBSD
Bearbeiten> "Bei BSD-Systemen wie FreeBSD kann dieser Sprung teilweise noch größer werden – höchstwahrscheinlich einer der Gründe, weshalb in Sonys Playstation 4 eine AMD-CPU in Kombination mit FreeBSD eingesetzt wird. Die Prozessoren der AMD-FX-Serie werden jedoch vorzugsweise für Spieler beworben, was die CPU einiges an Reputation kostete, obwohl ihre Leistung je nach Anwendungsfall die einer Intel-CPU übersteigen kann."
Ist das ein Witz? Der Performanceunterschied fällt bei FreeBSD wesentlich geringer aus, man kann unter FreeBSD, im Ports system, nichtmal ohne Weiteres alle Kerne ausnutzen.
Vergleich: Kompilieren von LibreOffice auf einem AMD Opteron 6386SE
Gentoo: 34 Minuten (Mit 24 Threads)
FreeBSD: 8,5 Stunden (Nicht mehr als 1 Thread möglich)
Der Grund für FreeBSD in der PS4 ist die BSD-Lizenz. Sony kann den Kernel sowie das komplette Betriebssystem anpassen/optimieren/verändern und ihn unter einer eigenen, nicht OpenSource Lizenz, weiter geben. Mit Linux müsste der abgeänderte Kernel am Ende OpenSource sein was dazu führen würde, dass jeder auf seinem normalen PC, theoretisch, PS4 Spiele ausführen könnte.
Mit der Performance hat das überhaupt garnichts zu tun. In unseren Tests (mit dem FX 9590, dem A10-7850K und dem 6386SE sowie 2x4386) war FreeBSD immer langsamer als Linux, egal wie stark optimiert. Von daher würde ich das als wage Behauptung hinstellen. Getestet mit FreeBSD 10.1 217.24.206.18 07:35, 11. Dez. 2014 (CET)
- Danke! Genau das wollte ich auch anmerken. Diese Aussage macht überhaupt keinen Sinn und ist reine Spekulation. --Lorenz9314 (Diskussion) 12:26, 14. Aug. 2024 (CEST)