Die Interpolationssuche, auch Intervallsuche genannt, ist ein von der Binären Suche abgeleitetes Suchverfahren, das auf Strukturen mit wahlfreiem Zugriff wie z. B. Listen und Arrays zum Einsatz kommt. Das Verfahren geht davon aus, dass die Daten aufsteigend sortiert und möglichst gleichverteilt sind.

Während der Algorithmus der Binären Suche stets das mittlere Element des Suchraums überprüft und ihn somit in jedem Schritt halbiert, versucht der Algorithmus der Interpolationssuche einen günstigeren, dem Suchwert nahe liegenden Teilungspunkt zu finden. Dabei adaptiert er die intuitive Vorgehensweise der Suche nach einem Wort in einem Wörterbuch: Die Suche nach Wolf vermutet den Treffer nicht nur in der 2. Hälfte (wie beim Binären Suchen), sondern im hinteren Teil des Wörterbuches, während die Suche nach Boot weit vorne beginnt.

Der Algorithmus

Bearbeiten

In einer Schleife oder durch rekursive Aufrufe bestimmt der Algorithmus im anfänglichen bzw. verbliebenen Suchraum anhand des Suchbegriffes eine Teilungsposition. Die Bestimmung der Teilungsposition erfolgt durch Ausnutzung der Gleichverteilung der Daten und nach Bereinigung des Suchbegriffs um den Basiswert (= kleinster Wert).

 

Ist der Datenwert an dieser Position identisch mit dem Suchbegriff, terminiert der Algorithmus. Ist der Datenwert kleiner, befindet sich der gesuchte Wert aufgrund der Vorsortierung im hinteren Teil der Daten. In diesem Fall wird der Suchraum verkürzt, indem die linke Grenze auf die gefundene Position verschoben und die rechte Grenze beibehalten wird. Ist der Datenwert größer, erfolgt die Verkürzung zum vorderen Teil der Daten durch Verschieben der rechten Grenze auf die gefundene Position und Beibehaltung der linken Grenze.

Sodann folgt der nächste Schleifendurchlauf bzw. rekursive Aufruf.

Beispiel

Bearbeiten

Gegeben ist ein Array  , in dem der Wert   gesucht werden soll.

2 4 7 9 12 21 26 31 37

Die Position   des Teilungselements ergibt sich im allgemeinen Fall aller Schleifendurchläufe durch Anpassung obiger Formel an den jeweils verbliebenen Suchraum

 

mit anschließendem Runden auf den nächsten ganzzahligen Wert.

1. Schleifendurchlauf

Anfangs werden die linke und rechte Grenze auf die Grenzen des Arrays gesetzt, also   und  . Der erste Schleifendurchlauf ergibt (rot = Suchbereich, blau =  , fett = gesucht):

 

2 4 7 9 12 21 26 31 37

Daraufhin wird geschaut, ob das gefundene Element das gesuchte ist. Das ist nicht der Fall. Der Wert   ist kleiner als das gesuchte Element  . Somit muss auf der rechten Seite weiter gesucht werden. Hierzu wird die linke Grenze auf   erhöht und die rechte Grenze beibehalten.

2. Schleifendurchlauf

Der zweite Schleifendurchlauf berechnet:

 

2 4 7 9 12 21 26 31 37

Nun ist  . Das Element wurde gefunden und die Suche endet. Sie hat 2 Schritte benötigt.

Komplexität

Bearbeiten

Eine Untersuchung der Interpolationssuche erweist sich als sehr komplex, als Laufzeit kann jedoch   (n ist die Anzahl der Elemente) im durchschnittlichen Fall angenommen werden. Im ungünstigsten Fall (die interpolierte erwartete Position ist immer am Rand) beträgt die Laufzeit allerdings  .[1] Diese Beeinträchtigung löst die Quadratische Binärsuche.

Beispielimplementierungen

Bearbeiten
type
  TIntArray = array of integer;

function interpolierteSuche(schluessel: integer; var daten: TIntArray): integer;
var
  links, rechts,
  versch, aPos: integer;
begin
  links := 0;
  rechts := high(daten);
  versch := 0;
  aPos := 0;
  while (schluessel >= daten[links]) and (schluessel <= daten[rechts]) do
  begin
    versch := daten[rechts] - daten[links];
    aPos := links + round((rechts - links) * (schluessel - daten[links]) / versch);
    if (schluessel > daten[aPos]) then
      links := aPos + 1
    else if (schluessel < daten[aPos]) then
      rechts := aPos - 1
    else begin
      result := aPos;
      exit;
    end;
  end;
  result := -1;
end;

Siehe auch

Bearbeiten

Literatur

Bearbeiten
  • Robert Sedgewick: Algorithmen in C. Addison-Wesley, Bonn 1992, ISBN 3-89319-376-6, S. 239–241.

Einzelnachweise

Bearbeiten
  1. Thomas Seidl, Marcus Gossler: Algorithmen und Datenstrukturen - Kapitel 4: Suchen. Hrsg.: Ludwig-Maximilians-Universität München - Lehrstuhl für Datenbanksysteme und Datamining. (lmu.de [PDF]).