Flüsse und Schnitte in Netzwerken

gerichteter gewichteter Graph mit ausgezeichneter Quelle und Senke
(Weitergeleitet von Netzflussproblem)

Flüsse und Schnitte in Netzwerken sind Strukturen der Graphentheorie, die vielfältige Anwendungen finden.

Definitionen, wichtige Begriffe und Eigenschaften

Bearbeiten

Netzwerk

Bearbeiten

Ein Netzwerk (engl. network)   besteht aus einem gerichteten Graphen   mit zwei ausgezeichneten Knoten (engl. vertex/vertices), einer Quelle (engl. source)   und einer Senke (engl. target)   aus  , sowie einer Kapazitätsfunktion  , die jeder Kante   eine nichtnegative Kapazität zuweist,  . Hat die Kapazitätsfunktion ausschließlich ganzzahlige Werte, so existiert eine maximale Flussfunktion (siehe folgende Definition), die ebenfalls nur ganzzahlige Werte hat.

Ein Fluss ist eine Funktion  , die jeder Kante   im Netzwerk einen nichtnegativen Flusswert   zuweist. Dabei muss folgende Bedingung erfüllt sein:

Kapazitätskonformität:

Der Flusswert auf einer Kante ist höchstens so groß wie die Kapazität der Kante, das heißt, es gilt:

 .

Ist zusätzlich die folgende Bedingung erfüllt, heißt der Fluss  - -Fluss:

Flusserhalt:

Abgesehen von der Quelle s und der Senke t muss in jeden Knoten genau so viel hineinfließen wie herausfließt, das heißt:

 

Dabei ist

 

die Menge der in   hineinführenden und

 

die Menge der aus   hinausführenden Kanten.

Gilt zudem Flusserhalt auch in   und  , hat man eine Strömung oder Zirkulation. Man kann zeigen, dass Inzidenzvektoren einer Zirkulation entsprechen, wenn sie im Zyklenraum   von   liegen.

Der Exzess   eines Knotens  , oder auch Nettofluss oder Überschuss genannt, ist die Differenz der Summe der Flusswerte der eingehenden Kanten und der Summe der Flusswerte der ausgehenden Kanten.

 

 
Beispiel für einen Schnitt. Die Kapazität des Schnittes ist  

Der Wert eines  - -Flusses   ist der Überschuss im Knoten   oder der Betrag des Überschusses im Knoten  .

In Formeln:

 , wobei   die Quelle des Netzwerkes bezeichnet.

Für alle  - -Flüsse ist der Überschuss bis auf   für alle Knoten Null. Für alle Zirkulationen ist er auch in   Null.

Eine echte Teilmenge   der Knoten in einem Netzwerk, die  , aber nicht   enthält, nennt man einen  - -Schnitt. Oft wird unter einem Schnitt auch die Menge aller Kanten verstanden, die zwischen den Partitionen   und   verlaufen. Die Kapazität eines Schnittes ist die Summe der Kapazitäten der von   nach   verlaufenden Kanten.

Schnitte geben eine obere Schranke für den Wert der  - -Flüsse. Das Max-Flow-Min-Cut-Theorem besagt, dass auch umgekehrt Flusswerte eine Untere Schranke für Schnittkapazitäten sind. Beide Konzepte entsprechen also einander auf eine natürliche Art und Weise.

Ferner entspricht der Fluss im gesamten Netzwerk dem Fluss durch einen beliebigen Schnitt. Zusammen mit der Kapazität des Schnittes gilt daher  . Handelt es sich um einen minimalen Schnitt, entspricht der Fluss der Kapazität des Schnittes.[1]

Residualnetzwerk

Bearbeiten

Das Residualnetzwerk  , oder auch Restnetzwerk, zum Fluss   mit Residualgraphen   und Residualkapazitäten   zeigt die restlichen Kapazitäten des Netzwerks an. Der Residualgraph   hat dieselbe Knotenmenge wie   und besteht aus den von   nicht ausgelasteten Kanten ergänzt um Rückkanten: Für jede Kante   mit   enthält   eine Rückkante  . Die Residualkapazitäten   geben für eine Kante   an, um wie viel der Fluss auf ihr noch erhöht werden kann, und für eine Rückkante  , um wie viel der Fluss auf der zugehörigen Hinkante verringert werden darf. Also:

 , falls  

 

Algorithmische Konstruktion eines Residualnetzwerks

Bearbeiten
Initialisiere  ;  ;
1. Für alle Kanten  
2.    if( )
3.       Füge   in   ein
4.       Setze  
5.    if( )
6.       Füge   in   ein
7.       Setze  
8. gib aus  

Schichtnetzwerk

Bearbeiten

Der Level eines Knotens   ist die Anzahl der Kanten eines kürzesten Weges von   nach   im Residualnetzwerk zum Fluss  . Der  -te Level eines Graphen ist die Menge aller Knoten mit Level   also  . Eine Kante   mit Flusswert   heißt nützlich von   nach  , falls  . Falls gilt  , heißt sie nützlich von   nach  . Eine Kante heißt nützlich aus einer Menge, falls sie nützlich von einem Element der Menge in ein Element außerhalb der Menge ist. Analog erklärt man nützlich in eine Menge. Das Schichtnetzwerk oder Levelnetzwerk   zum Fluss   ist ein Teilgraph von   mit

  1.  
  2.  

Schicht- und Residualnetzwerk können in linearer Laufzeit berechnet werden.

Besondere Wege und Flüsse

Bearbeiten

Ein x-y-Weg oder Pfad   ist eine Folge von Kanten, wobei der Ausgangsknoten jeder Kante der Endknoten ihres Vorgängers ist. Die Länge eines Weges  , auch   ist die Anzahl der Kanten im Weg.

Die Distanz zwischen   und   ist die Länge eines kürzesten Weges, falls einer existiert, und „unendlich“, falls nicht. Ein Weg im Residualnetzwerk heißt augmentierender Weg; die Bezeichnungen verbessernder Weg oder erhöhender Weg sind auch gebräuchlich. Jeder  - -Fluss lässt sich in Flüsse auf  - -Wegen und auf Kreisen zerlegen. Genau dann, wenn in einem Netzwerk zu einem  - -Fluss kein augmentierender Weg existiert, hat der Fluss maximalen Wert. Diesen Sachverhalt nutzen der Algorithmus von Ford und Fulkerson und der Algorithmus von Edmonds und Karp aus.

Ein Fluss   in einem Netzwerk   heißt blockierend, falls in jedem  - -Weg in   eine Kante   blockiert, oder auch saturiert, ist, d. h.  .

Push-Operation
 
-> Voraussetzungen:   hat Exzess,   und  
-> Beschreibung: Schiebe  
              Einheiten Fluss von   nach  
1.  
2.  
3.  
4.  
5.  
Lift-Operation
 
Voraussetzungen:   hat Exzess und es gilt für beliebige  :
                   
Beschreibung: inkrementiere die Höhe von  
1.  

Präflüsse

Bearbeiten

 - -Präflüsse, oder auch Vorflüsse, (engl. preflow) sind eine Verallgemeinerung von  - -Flüssen. Dieser Begriff ist nur bei komplexeren (und wesentlich effizienteren) Flussalgorithmen von Bedeutung.

Ein  - -Präfluss ist eine Funktion   mit Kapazitätskonformität wie oben und folgender Abschwächung des Flusserhalts:

 

Das bedeutet, nur den Knoten   darf mehr Fluss verlassen, als ihn erreicht. Ein  - -Präfluss hat Überschuss in einem Knoten, oder auch Overflow, falls sein Überschuss (wie oben) echt größer als Null ist. Das Residualnetzwerk wird analog zu oben gebildet.

Die Höhenfunktion oder Distanzmarkierung in einem Netzwerk mit  - -Präfluss   ist eine Abbildung   mit  ,   und   für alle Kanten  .

Ferner erklärt man die Operationen Push und Lift algorithmisch, so wie rechts beschrieben. Mit diesen Mitteln kann man Preflow-Push-Algorithmen entwerfen und untersuchen, etwa den Goldberg-Tarjan-Algorithmus (nach Andrew Goldberg und Robert Tarjan). Bei diesen Algorithmen kann man die Datenstrukturen während der Algorithmus läuft nicht als  - -Fluss interpretieren. Die Methode von Goldberg und Tarjan initialisiert einen Präfluss und terminiert, falls gewisse Manipulationen der Struktur einen  - -Fluss liefern. Das ist dort stets nach endlich vielen Schritten der Fall und dieser  - -Fluss ist dann stets maximal.

Algorithmen

Bearbeiten

Der Algorithmus von Ford und Fulkerson sucht nach und nach augmentierende Wege, also Wege im Residualnetzwerk, und erhöht dort entlang. Dieses Verfahren klappt genau dann, wenn dieser Algorithmus terminiert, also in die Situation kommt, dass es tatsächlich keine augmentierenden Wege mehr gibt. Dann kann man nämlich die maximale von   aus im Residualnetz erreichbare Knotenmenge betrachten. Diese definiert einen  - -Schnitt, dessen Kapazität dem Flusswert gleicht.

Um das Terminieren aber zu sichern, kann man ein Argument über die algebraische Struktur der Kapazitätswerte heranziehen. Sind es nichtnegative ganze Zahlen, ist der Wert eines maximalen  - -Flusses eine ganze Zahl. Zudem gibt es wenigstens einen maximalen s-t-Fluss, der kantenweise lediglich ganzzahlige Werte annimmt. Für jeden maximalen s-t-Fluss muss das nicht der Fall sein. Weil jedes Augmentieren entlang eines  - -Weges den Wert des  - -Flusses um einen ganzzahligen Schritt, also um mindestens 1 erhöht, ist die Terminierung nach endlich vielen Schritten in dem Fall gesichert. Eine obere Schranke der Laufzeit des Algorithmus kann dann von den Werten der Kapazitäten abhängen. Die Laufzeit kann dann in Bezug auf Anzahl der Knoten und Kanten beliebig groß sein, je nachdem welche Kapazitäten auf den Kanten gegeben sind. Sind die Kapazitäten nichtnegative rationale Zahlen, terminiert der Ford-Fulkerson-Algorithmus ebenfalls, weil das Netzwerk dann algorithmisch äquivalent zu einem Netzwerk ist, bei dem die Kapazitäten mit dem Hauptnenner multipliziert sind, also nur ganzzahlige Kapazitäten auftreten. Bei reellen, irrationalen Kapazitäten muss der Algorithmus jedoch nicht terminieren und noch nicht einmal gegen einen maximalen  - -Fluss konvergieren.

Der Edmonds-Karp-Algorithmus stellt eine Weiterentwicklung der Methode von Ford und Fulkerson dar: Er funktioniert ganz analog, sucht aber augmentierende Wege, die bezüglich Kantenanzahl minimal sind. Das geht mit einer Breitensuche jeweils in linearer Laufzeit. Der Edmonds-Karp-Algorithmus terminiert auch bei beliebigen reellen Kantenkapazitäten. Darüber hinaus ist seine Laufzeit  , also im Allgemeinen größenordnungsmäßig deutlich besser als der Ford-Fulkerson-Algorithmus.

Der Dinic-Algorithmus basiert auf einer weiteren Beobachtung. Sucht man im Residualnetzwerk nach einem augmentierenden Weg, kann es passieren, dass man in Sackgassen gerät, also zu einem Knoten, von dem aus   gar nicht erreichbar ist. Die Idee ist, das Netzwerk zu schichten, also in Gruppen zusammenzufassen, die dieselbe Entfernung zu   haben, also solche Sackgassen eliminiert sind. In diesem Schichtnetzwerken nutzt man dann ferner aus, dass eine Suche nicht nur einen Weg liefert, sondern immer auch ohne zusätzlichen Aufwand einen Wegbaum. Entlang dieses Baumes kann man dann Fluss schicken und das Netzwerk blockieren. Das geht alles elementar in   mit einer modifizierten Tiefensuche. In der nächsten Iteration hat man dann die Situation, wenigstens eine Schicht mehr zu benötigen, weil die alte Schichtung blockiert ist. Das Argument zur Beschränkung der Schichtzahl auf höchstens   Stück liefert eine Schranke an die Anzahl der sogenannten Phasendurchläufe des Algorithmus, also die Anzahl der Schleifeniterationen. Somit ergibt sich eine Laufzeit von  .

Die folgende Tabelle gibt eine Übersicht der entwickelten Fluss-Algorithmen und ihrer Laufzeiten:

Max-Flow Algorithmen nach Veröffentlichung

Bearbeiten

Formulierungen als lineares Optimierungsproblem

Bearbeiten

Das Problem, den Flusswert   zu maximieren, lässt sich ebenfalls als lineares Optimierungsproblem beschreiben. Wählt man beispielsweise eine Variable   für jede Kante  , welche den Fluss   auf der Kante misst, so ergibt sich das folgende Optimierungsproblem:

 

Eine alternative Formulierung erhält man, wenn man für jeden  - -Pfad   eine Variable   einführt, welche den Fluss auf dem entsprechenden Pfad bezeichnet. Es ergibt sich daraus das folgende Optimierungsproblem:

 

Dabei bezeichnet   die Menge aller Pfade von   nach  .

Die zweite Formulierung erscheint zunächst ungünstig, da die Anzahl der  - -Pfade im Allgemeinen exponentiell mit der Anzahl der Knoten und Kanten wächst. Trotzdem kann diese Formulierung durch Spaltengenerierung effizient, also in Polynomialzeit gelöst werden.

Die beiden Formulierungen haben zusätzlich die Eigenschaft, dass die Matrizen, welche die Nebenbedingungen beschreiben, total unimodular sind. Damit ist jede Optimallösung der beiden Probleme ganzzahlig, sofern die Kapazitäten   ganzzahlig sind.

Es ist zudem lehrreich, sich die dualen Probleme der obigen Formulierungen anzusehen. Für die pfadbasierte Formulierung ist das duale Problem beispielsweise gegeben durch:

 

Das duale Problem ist ebenfalls total unimodular, was impliziert, dass die Optimallösung des dualen Problems ein  -Vektor mit   Einträgen ist. Für jeden zulässigen  -Vektor   entspricht außerdem die Menge   einem  - -Schnitt. Damit entspricht die Optimallösung des dualen Problems einem  - -Schnitt minimaler Kapazität. Hieraus folgt durch den starken Dualitätssatz der linearen Optimierung das Max-Flow-Min-Cut-Theorem.

Verallgemeinerungen

Bearbeiten

Zu dem Problem gibt es einige wesentliche Verallgemeinerungen. Als erstes kann man anstelle von Flüssen zwischen einer Quelle beziehungsweise Senke solche zwischen Gebieten betrachten. Dazu gibt man sich eine gewisse Menge von Versorgern   und eine Menge von Empfängern   vor, sowie einen Graphen und Kapazitäten. Das Problem ist nicht schwerer als Max-Flow und kann entweder durch Vor- und Nachschalten von Zusatzknoten oder durch Übergang zum Quotientengraphen   auf Max-Flow reduziert werden.

Andererseits kann man die Gültigkeit der den Kanten zugewiesenen Kapazitäten auf eine gewisse Umgebung der Kante ausweiten, wobei für ein festgehaltenes   eine  -Umgebung die Menge von Knoten und Kanten ist, die   Elemente von der Kante entfernt liegen. Der Spezialfall   entspricht gerade dem maximalen Flussproblem. Der Fall   entspricht dem maximalen Flussproblem mit Knotenkapazitäten. Das kann auf Max-Flow reduziert werden, indem die Knoten durch ein Gebilde, wie im Bild ersetzt werden. Dabei wird die Kantenzahl nicht konstant verändert, also die Komplexität des Problems erhöht. Es existieren aber Lösungen für Max-Flow, deren Komplexität streng von den Knoten abhängt, deren Zahl sich höchstens um den konstanten Faktor 2 ändert.

Für den Fall   kann man beweisen, dass das Problem NP-vollständig ist und daher vermutlich nicht in polynomieller Zeit lösbar ist (es sei denn  ). Für den Fall   wurde ein polynomieller Algorithmus gefunden.

Anwendung

Bearbeiten

Praktische Anwendungen

Bearbeiten

Diese letzte Verallgemeinerung ist motiviert durch Probleme bei der Verkabelung von VLSI-Chips, wo es aufwändig ist, in eine gewisse Nähe von gelegten Kabeln weitere zu setzen.

Die Flusstheorie hat sich historisch ausgehend von Problemen aus der Anwendung entwickelt. Allgemein ist man von der Situation ausgegangen, ein Fluid, also ein beliebig in Untergegenstände zerlegbaren Gegenstand, auf verschiedenen Wegen durch eine Welt räumlich zu verlagern – etwa elektrische Energie über ein Stromnetzwerk von einer Quelle an einen Bedarfsort, oder Daten durch ein Datennetzwerk von einem Sender zu einem Empfänger. Auch abstrakte Gegenstände wie „einander kennen“ kann man modellieren. Durch maximale Flüsse in einem sozialen Netzwerk kann man dann ein Maß dafür erhalten, wie stark zwei (Mengen von) Personen miteinander vernetzt sind.

 
Bipartiter Graph mit der Knotenmenge A (rot) und B (grün) und der ergänzten Quelle s und Senke t

Theoretische Anwendungen

Bearbeiten

Eine naheliegende und natürliche Anwendung hat die Flusstheorie bei der Transversalentheorie, die sich auf sehr natürliche Art und Weise in die Theorie der Flüsse einbetten lässt. Einen umfassenden Ansatz, das zu tun, hat Ford 1962 in einem Standardwerk formuliert.

Auch viele kombinatorische Probleme auf Graphen, wie bipartite Matchings, lassen sich leicht in ein geeignetes Flussproblem überführen (siehe Bild) und dort schnell lösen. Eine weitere Anwendung ist das effiziente Ermitteln der Knotenzusammenhangszahl, Kantenzusammenhangszahl oder Bogenzusammenhangszahl. Durch das Lemma von Tutte (nach William Thomas Tutte) werden zudem Anwendungen erweiterter Flusstheorie (sogenannten gruppenwertigen Flüssen) und Färbbarkeitsaussagen deutlich. Einige Vermutungen von ihm zur Existenz von k-Flüssen in planaren Graphen hätten starke theoretische Implikationen.

Literatur

Bearbeiten

Einzelnachweise

Bearbeiten
  1. Joost-Pieter Katoen: Datenstrukturen und Algorithmen – Vorlesung 18: Maximaler Fluss. Folien 39–41: „Schnitte in Flussnetzwerken“ und „Max-flow Min-cut Theorem“. 29. Juni 2018, abgerufen am 6. April 2024.