Diskussion:Shellsort

Letzter Kommentar: vor 13 Tagen von 77.22.10.5 in Abschnitt Kritische Anmerkungen zum Artikel

verständlicher schreiben

Bearbeiten

kann nicht mal jemand, der sich damit auskennt einen verständlichen artikle schreiben?

Stimme Dir voll und ganz zu. Ich studiere Informatik und kann nur sagen, dass der Artikel der Shell-Sort nicht gerecht wird. Fehlende Punkte: Vorsortierung, Aufwand, beste Folge an Spalten, etc. --Mike@experimentelles.org 15:34, 3. Jun 2006 (CEST)

Ich hab da mal noch ein wenig was dazugeschrieben, ich hoffe, dass das ein wenig zum Verständnis beiträgt. -- lg 15:02 6. Sept 2006

Im Java-Beispiel: Das Array "spalten" enthält 23 Elemente, die Array-Indizes gehen also von 0 bis 22. Dementsprechend müsste die for-Schleife for (k=0; k<23; k++); anstatt for (k=0; k<24; k++); lauten. Ich hab's im Artikel korrigiert aber nicht getestet, wäre toll wenn jemand die Korrektur überprüfen könnte.

Das Delphi-Beispiel habe ich gerade getestet, es funktioniert nicht. Auch hier ist es ein Index-Fehler. Das erste Element mit dem Index 0 bleibt unsortiert, dafür wird auf das nicht existente Element n zugegriffen. Ich habe den Quelltext nicht korrigiert.

Der Artikel ist gut, nur nicht sehr hilfreich. Ich habe den C-Code geändert, ist allerdings ohne Vorsortierung. Macht doch einen link zu InsertSort, wenns das gibt...

Das C-Beispiel ist fehlerhaft. Compilerfehler.

Ausserdem wird ein aus zwei Elementen bestehendes Feld überhaupt nicht sortiert, der Abbruch aus der Schleife erfolgt zu früh. --80.156.47.202 12:42, 25. Mai 2009 (CEST)Beantworten

Der Signatur der Methode "sort" fehlt ein Parameter (was das Komma vermuten ließe) oder im Aufruf ist einer zuviel:

sort(int *array,int size, )

Der Aufruf findet dann so statt: sort(x, 0, 29);

Die '29' steht für die länge der Eingabe (auch wenn die Länge der zweite Parameter sein muss, nicht der letzte) aber was soll da die '0'?


Autsch das tut weh!!! Die Funktion "tausche(int *a, int *b)" Im C-Code verwendet einen uralten Trick um 2 REGISTER mit XOR zu tauschen, ohne eine temporäre Variable. Aber bitte doch nicht, wenn beide Werte im Speicher liegen!!! Es sei denn, der Compiler erkennt, dass sich die Zielwerte nicht ändern und lädt sie in Register. Trotztdem ist es schlechter Code, der wahrscheinlich nicht performanter ist und in einem Lexikon nur für Verwirrung sorgt.

Kann es sein, dass im Zahlenbeispiel nicht streng nach einem Algorithmus vorgegangen wird ? Die zweite Matrix, die sich ergibt erscheint mir unlogisch. 2 5 3 4 3 9 3 2 5 4 1 3 ergibt ja als 4er-Matrix 2 5 3 4 | 3 9 3 2 | 5 4 1 3 -> sortiert 2 4 1 2 | 3 5 3 3 | 5 9 3 4 => Folge: 2 4 1 2 3 5 3 3 5 9 3 4 (die nun als 2er-Matrix): 2 4 | 1 2 | 3 5 | 3 3 | 5 9 | 3 4 und somit nicht wie im Beispiel, oder ?

Implementierungen und Komplexität

Bearbeiten

Die Implementierungen und ihre Komplexität sind sehr missverständlich. Die Implementierungen in C und Python nutzen den originalen Ansatz, bei dem der Teiler bei N/2 startet und jeweils halbiert wird. Damit hat der Algorithmus aber eine Komplexität von O(n²). Leider wird diese als mögliche Laufzeit im entsprechenden Kapitel nie erwähnt. Im englischen Wiki wird darauf sehr deutlich hingewiesen, vielleicht lohnt sich mal eine Übersetzung. --80.156.47.201 10:42, 24. Mär. 2009 (CET)Beantworten

Startwert für Distanzfolge

Bearbeiten

Ich hab mir das Sortierverfahren eben zum erstenmal angeguckt und mir fehlte für das Verständnis mit welcher Distanzfolge ich überhaupt beginne. Habe jetzt auf einer anderen Seite gelsesen, dass man immer mit der Größten, welche die Arraylänge nicht überschreitet beginnt. Wäre schön, wenn das auch noch jemand hinzufügen könnte.

Neue Formulierung für Abschnitt "Prinzip"

Bearbeiten

Shellsort kann als Erweiterung von Insertionsort betrachtet werden. Dabei versucht es den Nachteil auszugleichen, dass hier Elemente in der Sequenz oft über weite Strecken verschoben werden müssen, was bei langen Strecken hohe Kosten beim Einfügen verursacht. Shellsort verfolgt den Ansatz, die bestehende Sequenz in eine k-spaltige Matrix zu schreiben (Das k ist hier entsprechend hoch zu wählen). (siehe Beispiel, erster Schritt) Nun wird Insertionsort auf die einzelnen Spalten angewendet. Nach der Sortierung jeder Spalte, wird die Anzahl der Spalten um den Faktor 2 verringert bis am Ende nur noch eine Spalte übrig ist.

Dabei gilt folgendes:

  • Anzahl der Spalten: 2n, ..., 4, 2, 1
  • Verringerung: 2n -> n -> n/2 -> ... -> 4 -> 2 -> 1.

Daraus resultiert eine grobe Sortierung. Dieser Vorgang wird mehrmals wiederholt, wobei jeweils die Breite der Matrix verringert wird, bis die Matrix nur noch aus einer einzigen vollständig sortierten Spalte besteht.

Ein Vorteil dieses Vorgehens liegt darin, dass die Strecke beim Verschieben von Elementen verringert wird und somit Insertionsort nun auch auf langen Listen eingesetzt werden kann.

Shellsort arbeitet in-place, gehört jedoch nicht zu den stabilen Sortieralgorithmen.

a*b sortiert

Bearbeiten

Sorry, ich habe im März fast unreflektiert die Angabe aus dem ursprünglichen Text "Dabei gilt es bei der Wahl einer Folge zu vermeiden, dass sie gemeinsame Teiler haben, da eine a*b-sortierte Folge auch a-sortiert und b-sortiert ist, sodass es dann zu unnützen Sortierschritt käme." fast unverändert übernommen (abgewandelt auf benachbarte Folgenglieder). Bei genauerer Betrachtung meiner gestrigen Überarbeitung ist mir das sehr sauer aufgestossen und ich habe nun unter Prinzip erklärt, warum das gar nicht sein kann. Die Erklärung würde ich drin lassen, ist für das Verständnis sicher hilfreich. Würde das gelten, könnte man einen extrem performanten Sortieralgorithmus unter Ausnützung der Primzahlfakultät schreiben. (nicht signierter Beitrag von Rechenelf (Diskussion | Beiträge) 12:13, 14. Dez. 2011 (CET)) Beantworten

Zeitkomplexität nach Knuth

Bearbeiten

Unter Implementierung Java 5 heißt es:

Für die Schrittweiten (1, 3, 7, 15, 31, … ) wurde nachgewiesen (s. Donald E. Knuth: The Art of Computer Programming), dass die Zeitkomplexität des Algorithmus n1,2 beträgt, was deutlich besser ist,...

Unter Komplexität und Distanzfolgen heißt es:

Mit der Folge 1, 3, 7, 15, 31, 63, ..., 2k - 1 von Hibbard wird eine Komplexität von O(n1,5) erreicht.

Nur eine der beiden Aussagen kann richtig sein. --Rat (Diskussion) 22:08, 11. Feb. 2014 (CET)Beantworten

Knuth: The Art of Computer Programming, Volume 3, 2nd Edition, Seite 91 ist die genaue Stelle. O(n1,5) ist richtig. Die falsche Angabe wurde mit dieser Änderung vor 4 1/2 Jahren eingeführt. --Rat (Diskussion) 22:21, 11. Feb. 2014 (CET)Beantworten

Woher kommt die Folge im Beispiel?

Bearbeiten

"Witzig" finde ich, dass im Artikel zahlreiche Spalten-Folgen aufgeführt werden, im Java-Beispiel wird aber eine Folge verwendet, die nirgendwo beschrieben ist: 1, 4, 13, 41, 111, 271, 815, ... Woher kommt diese Folge und welche Komplexität hat sie? 87.140.195.0 14:27, 13. Jun. 2017 (CEST)Beantworten

Shellsort ist ein Hybrid-Algorithmus

Bearbeiten

Frage: Müsste man bei Shellsort nicht eigentlich von einem Hybrid-Algorithmus sprechen? Der Code von Herrn Shell ist schließlich kein Sortierverfahren, denn sein Code unterteilt das Array in Streifen, legt diese "gedacht" untereinander und lässt die Spalten dann von Insertionsort sortieren. Wir haben es hier also mit einem Algorithmus zu tun, der sich einen anderen Algorithmus einverleibt hat und diesen dann die eigentlichen Sortierungen durchführen lässt. --77.21.186.2 13:04, 20. Aug. 2021 (CEST)Beantworten

Sind variable Distanzfolgen vielleicht besser?

Bearbeiten

Ich hätte da eine kleine Überlegung zum Thema Distanzfolgen anzubieten... Ich denke dass es generell keine gute Idee ist feste Zahlen für die Distanzfolgen zu verwenden. Ich würde hier wie folgt vorgehen: Zuerst verwende ich immer die 8. Außer das Array ist kleiner. 😉 Dann entscheidet eine Berechnung entsprechend der Größe des zu sortierenden Arrays, wie viele weitere Zahlen noch kommen. Bei sehr großen Arrays wird die Anzahl auf maximal 7 weitere Zahlen begrenzt, die sich dann gleichmäßig bis zur vollen Größe des Arrays erhöhen. Bei zu vielen Zahlen kann es ansonsten passieren, dass die Sortierung länger dauert, als wenn man das Array gleich vollständig mit Insertionsort sortiert hätte. Bei Datenstrukturen die dem Best-Case ähneln, ist das aber sowieso immer so. (Martin Oppermann) --77.22.10.5 15:42, 23. Dez. 2024 (CET)Beantworten

Kritische Anmerkungen zum Artikel

Bearbeiten

Insertionsort ist nicht langsam

Bearbeiten

Insertionsort kann nicht direkt als langsam bezeichnet werden, denn es gehört von der Geschwindigkeit her eher zu den mittelmäßig schnellen Sortierverfahren. Deshalb ist es ja auch ein Hauptbestandteil des Sortierverfahrens Timsort. Bitte Bedenken: Insertionsort kann den Best-Case erkennen. --77.22.10.5 21:23, 28. Dez. 2024 (CET)Beantworten

Nachteil: Shellsort kann den Best-Case nicht erkennen

Bearbeiten

Shellsort hat den großen Nachteil, dass es den Best-Case nicht erkennen kann, ein Problem das auch bei Heapsort vorhanden ist. In einem Fall der dem Best-Case ähnelt, würde Insertionsort ein Array selbst dann schneller sortieren, wenn es mehrere unsortierte Elemente im Array gibt. Shellsort spielt hier stur alle Distanzfolgen nacheinander ab, auch wenn es darin nichts mehr zu sortieren gibt. --77.22.10.5 21:29, 28. Dez. 2024 (CET)Beantworten