Bairstowverfahren

Verfahren zur Bestimmung von Nullstellen eines Polynoms

Das Bairstow-Verfahren ist ein Iterationsverfahren der numerischen Mathematik und dient der Bestimmung der Nullstellen eines Polynoms. Das Verfahren wurde zuerst 1920 von Leonard Bairstow (1880–1963) im Anhang seines Buches „Applied Aerodynamics“ vorgestellt.[1]

Jedes Polynom mit reellen Koeffizienten kann in ein Produkt aus linearen und quadratischen irreduziblen Faktoren mit ebenfalls reellen Koeffizienten zerlegt werden (Fundamentalsatz der Algebra nach Gauß, 1799). Die linearen Faktoren entsprechen reellen Nullstellen, die quadratischen konjugierten Paaren echt komplexer Nullstellen. Gibt es mehr als eine reelle Nullstelle, so können die linearen Faktoren leicht zu quadratischen kombiniert werden. Um nun das Rechnen mit komplexen Zahlen zu vermeiden, kann man nach quadratischen reellen Faktoren suchen. Das Bairstow-Verfahren ist, neben der reellen Variante des Jenkins-Traub-Verfahrens, eine Möglichkeit, solche quadratischen Faktoren zu approximieren. Die reellen oder komplexen Nullstellen dieses quadratischen Faktors können dann mit der bekannten Formel zum Lösen quadratischer Gleichungen bestimmt werden. Weitere Nullstellen können aus dem verbleibenden Polynom nach Abspalten des quadratischen Faktors gewonnen werden.

Wie bei jedem iterativen Verfahren hängt auch hier der Erfolg und die schnelle Konvergenz von der Wahl eines guten Startpunktes, das heißt eines initialen quadratischen Polynoms, ab, das schon fast ein Faktor des Polynoms sein sollte. Die Güte bestimmt sich dabei aus der Größe des Restes nach Polynomdivision. Im Falle eines zufällig gewählten Startpunktes ergibt sich ein Verhalten, wie es im Newton-Fraktal visualisiert wird. Hat das zu lösende Polynom mehrfache Nullstellen oder dicht beieinanderliegende Cluster von Nullstellen, so kann dieses Verfahren daran scheitern, diese zu finden.

Merkmale des Verfahrens

Bearbeiten

Polynome mit reellen Koeffizienten wie z. B.   können auch komplexe Nullstellen haben. Mit Verfahren wie der Regula falsi und dem Newton-Verfahren, die nur eine Nullstelle finden, ist es nicht möglich, komplexe Nullstellen zu finden, ohne dass auch die Berechnung im Komplexen mit komplexer Arithmetik ausgeführt wird. Das Bairstow-Verfahren nutzt die Eigenschaft von Polynomen mit reellen Koeffizienten, die besagt, dass komplexe Nullstellen immer paarweise konjugiert auftreten. Das Verfahren findet die Nullstellen als Paar und liefert eine quadratische Gleichung mit reellen Koeffizienten, aus der ein reelles oder komplex konjugiertes Nullstellenpaar bestimmt werden kann.

Die Merkmale des Verfahrens in der Zusammenfassung:

  • Bei einem Polynom mit reellen Koeffizienten arbeitet das Bairstow-Verfahren vollständig im Reellen und
  • findet auch eventuell auftretende, paarweise konjugiert komplexe Nullstellen (  und  ).
  • Die Nullstellenberechnung wird auch Programmen zugänglich, die mit komplexer Arithmetik nicht umgehen können
  • Eine Iteration in reeller Arithmetik ist erheblich schneller als eine Iteration in komplexer Arithmetik.

Das Bairstow-Verfahren ist aus dem Newton-Verfahren abgeleitet und konvergiert wie dieses (lokal) mit 2. Ordnung.

Beschreibung des Verfahrens

Bearbeiten

Gegeben sei ein Polynom n-ten Grades, dessen Nullstellen gesucht werden:

 .

Die Koeffizienten des Polynoms sind sämtlich reelle Zahlen. Würde man nun in einer direkten Anwendung des Newton-Verfahrens auf die Gleichung   mit einem reellen Startwert beginnen, so wären alle Glieder der Iterationsfolge wieder reell. Um auch komplexe Nullstellen zu finden, müsste die Rechnung mit komplexen Zahlen durchgeführt werden. Das war bei älteren Programmiersprachen nicht ohne größeren Aufwand möglich.

Jedoch haben Polynome f(x) mit reellen Koeffizienten die Eigenschaft, dass komplexe Nullstellen immer in konjugiert komplexen Paaren auftreten, ist   eine Nullstelle, so auch  . Das quadratische Polynom

 ,

welches die Nullstellen   und   hat, ist auch ein Faktor des Polynoms f(x) und hat ebenfalls nur reelle Koeffizienten. Statt also direkt Nullstellen zu bestimmen, werden zunächst quadratische Faktoren gesucht.

Ist   ein quadratischer Faktor von f(x), so gibt es einen weiteren Faktor b(x) vom Grad n-2, der durch Polynomdivision bestimmt werden kann. Ist a(x) kein Faktor, so ergibt die Polynomdivision einen Rest r(x), der ein lineares oder konstantes Polynom ist. Der Rest bestimmt sich dabei aus der Identität f(x)=a(x)b(x)+r(x). Nach einem Koeffizientenvergleich ergibt sich ein System quadratischer Gleichungen in den Koeffizienten

 

Aus den oberen n-1 Gleichungen lassen sich die Koeffizienten von b(x) aus denen von a(x) und f(x) bestimmen. Aus den letzten zwei Gleichungen ergeben sich die Koeffizienten des Restpolynoms. Das Ziel des Verfahrens ist es, diese durch Anpassen von a(x) möglichst klein zu halten. Aus dem Berechnungsschema ist ersichtlich, dass die Koeffizienten von b(x) und letztlich auch die des Restes r(x) Polynome in den zwei variablen Koeffizienten von a(x) sind. Dieses 2x2-System kann nun mit dem Newtonverfahren angegangen werden.

Die notwendige Bestimmung auch der Ableitungen des Gleichungssystems kann mit algebraischen Mitteln vereinfacht werden.

Mathematische Begründung

Bearbeiten

Es wird eine Faktorisierung   mit einem quadratischen Faktor a(x) und einem verbleibenden Faktor b(x) gesucht. Ist jedoch a(x) nur ein näherungsweiser Faktor, so hinterlässt die Division mit Rest von f(x) durch a(x) mit Ergebnis b(x) einen Rest r(x),

 .

Da a(x) quadratisch ist, ist r(x) linear oder konstant. Es wird nun ein lineares Polynom   gesucht, sodass   eine bessere Näherung für einen Faktor von f(x) ist. Ist das verbesserte Polynom sogar ein exakter Faktor, so gibt es ein Polynom   vom Grad n-3 mit

 

Im Newton-Verfahren werden nur Terme erster Ordnung in den Koordinaten des Änderungsvektors betrachtet, alle höhergradigen Ausdrücke werden vernachlässigt. In erster Ordnung ergibt das unter Kombination beider Gleichungen

 .

Diese Gleichung kann in ein lineares Gleichungssystem für die Koeffizienten von   und   aufgelöst werden. Die Gleichung kann jedoch mit algebraischen Mitteln weiter vereinfacht werden, so dass das schließlich zu lösende lineare System zwei Variable und genauso viele Gleichungen hat.

Da   gilt, ist das Polynom   schon selbst der Vertreter kleinsten Grades in seiner Restklasse modulo a(x). Da   in der Restklasse der Null liegt, muss

 

gelten. Nun kann auch das Polynom b(x) modulo a(x) reduziert werden, nach einer weiteren Division mit Rest ergeben sich ein Quotient q(x) und ein linearer Rest p(x) mit  . Es ergibt sich

  bzw.  .

Als Gleichungssystem ausgeschrieben bedeutet dies

 .

Die Determinante der Systemmatrix ist  . Ist diese von Null verschieden, so ergibt sich die Lösung des Systems und damit die Änderung des quadratischen Faktors g(x) als

 .

Für den nächsten Schritt wird a(x) durch   ersetzt und von vorn begonnen. Man kann abbrechen, wenn die Koeffizienten des Rests r(x) sämtlich eine vorher gesetzte Schranke unterschreiten.

Grundzüge

Bearbeiten

Das Verfahren beruht auf folgenden Schritten:

  1. Aus den Startwerten der Iteration für zwei Nullstellen wird ein quadratisches Polynom konstruiert.
  2. Das Polynom  -ten Grades wird durch dieses quadratische Polynom dividiert
  3. Das bei der Division entstehende Polynom  -ten Grades wird erneut durch das quadratische Polynom dividiert
  4. Bei der Division entstehen Divisionsreste
  5. Aus den Divisionsresten wird ein verbessertes quadratisches Polynom bestimmt
  6. Wenn bei der Polynomdivision kein Rest mehr bleibt, sind die Nullstellen des quadratischen Polynoms auch Nullstellen des Polynoms n-ten Grades.

Iteration

Bearbeiten
 
erhält man ein Polynom  -ten Grades:
 
Die Koeffizienten des zugehörigen Divisionsrests   können mit der folgenden Rekursionsformel zur Bestimmung von   berechnet werden:
 ;
 ;
  und
 ;
  • Erneute Division von b(x) durch a(x) ergibt ein neues Polynom   und dessen Divisionsrest  , wobei eine analoge Rekursionsformel zum Einsatz kommt, es gelten wieder   und  ;
  • Mit den Divisionsresten   verbessert man die Koeffizienten des quadratischen Polynoms a(x):
 
 
  • Die verbesserten Startwerte ergeben sich aus
 
 

Anmerkungen zum Ablauf

Bearbeiten
  • Die Bestimmung von   kann als Lösung des folgenden Gleichungssystems aufgefasst werden:
 
  • Das Verfahren lässt sich numerisch relativ einfach, schnell und speichergünstig umsetzen, wenn man nicht erst   berechnet und speichert, sondern im Schritt j die   sofort dazu verwendet, auch den Koeffizienten   zu berechnen.
  • Als Startwerte für die Iteration kann man beispielsweise aus den führenden drei Koeffizienten das quadratische Polynom   bilden, d. h.   wählen. Wenn Näherungen für zwei Nullstellen   vorliegen, kann man auch alternativ nach den Vietaschen Formeln   wählen.
  • Die Iteration kann abgebrochen werden, wenn   bzw.   in der gewünschten Ergebnisgenauigkeit vorliegen, dann wurden passende Nullstellen gefunden und   ist ein Teiler von  . In diesem Fall bestimmt man alle Koeffizienten von   und dann mit dem neuen Polynom   reduzierten Grades die nächsten Nullstellen zu suchen. Denn wenn man von   die Linearfaktoren zu den Nullstellen abdividiert, erhält man  .

Algorithmus

Bearbeiten

Das Programmbeispiel in Pseudocode beschreibt einen einzelnen Iterationsschritt, bei dem die Koeffizienten a0 und a1 des quadratischen Polynoms durch zwei Korrekturen da0 und da1 verbessert werden. Das Feld (Array) f() enthält das Polynom, wobei in f(n) der Koeffizient von   steht. Die Bezeichnungen der Variablen wurden sonst wie in den Formeln gewählt.

In der Schleife der doppelten Polynomdivision stehen die Programmvariablen b0, b1, b2 im Schritt j für die Koeffizienten   und entsprechend q0, q1, q2 für  . Beim Übergang von Schritt j zu Schritt j−1 müssen die Programmvariablen einen Koeffizientenindex weiter geschoben werden, b2←b1←b0 und q2←q1←q0.

    j=n
    b0 = f(n)
    b1 = 0
    q0 = 0
    q1 = 0

    For j = n - 1 To 0 Step -1
        b2 = b1
        b1 = b0
        b0 = f(j) - a1 * b1 - a0 * b2

        q2 = q1
        q1 = q0
        q0 = b2   - a1 * q1 - a0 * q2
    Next j

    M  =  -a0 * q1 - a1  * q0
    D  =  q0 * q0 - M  * q1
    da1 = (b0 * q1 - b1 * q0) / D
    da0 = (b1 * M  - b0 * q0) / D

    a1  = a1 - da1
    a0  = a0 - da0

Im Ergebnis des Iterationsschritts enthalten die Programmvariablen a0 und a1 verbesserte Werte für die Koeffizienten von  

Beispiel

Bearbeiten

Es sollen die Nullstellen des folgenden Polynoms bestimmt werden:

 .

Die Startwerte der Iteration bestimmt man beispielsweise aus der Empfehlung

 

Die Iteration liefert folgende Werte:

Die Iterationen des Bairstow-Verfahrens
Nr. a1 a0 Schrittweite Nullstellen
0 1,833333333333 −5,500000000000 5,579008780071 −0,916666666667±2,517990821623
1 2,979026068546 −0,039896784438 2,048558558641 −1,489513034273±1,502845921479
2 3,635306053091 1,900693009946 1,799922838287 −1,817653026545±1,184554563945
3 3,064938039761 0,193530875538 1,256481376254 −1,532469019881±1,467968126819
4 3,461834191232 1,385679731101 0,428931413521 −1,730917095616±1,269013105052
5 3,326244386565 0,978742927192 0,022431883898 −1,663122193282±1,336874153612
6 3,333340909351 1,000022701147 0,000023931927 −1,666670454676±1,333329555414
7 3,333333333340 1,000000000020 0,000000000021 −1,666666666670±1,333333333330
8 3,333333333333 1,000000000000 0,000000000000 −1,666666666667±1,333333333333

Nach der 8. Iteration wurden a1 und a0 des Näherungspolynoms im Rahmen der Rechengenauigkeit exakt bestimmt. Die Lösung ergibt sich dann aus dem Polynom

 

Die Lösungen dieser quadratischen Gleichung sind auch Lösungen des Polynoms  :

 

Wenn man nun diese beiden Nullstellen dem Polynom   abdividiert, kann das quadratische Polynom gleich als Startwert für die nächste Iteration verwendet werden.

Visualisierung der Konvergenz des Verfahrens

Bearbeiten

Analog zum Newton-Fraktal, welches die Konvergenz des Newton-Verfahrens gegen verschiedene Nullstellen visualisiert, kann man auch für dieses Verfahren Bilder erzeugt werden, die einen Überblick über die Konvergenz zu den verschiedenen quadratischen Faktoren ermöglichen. In den nebenstehenden Bildern wurde eine Parametrisierung gewählt, die jedem Punkt (u,v) das quadratische Polynom   als Startpunkt des Bairstow-Verfahrens zuordnet. Stellt sich ein solches Polynom als Faktor des gegebenen Polynoms heraus, so ergeben Punkte (u,v) in der oberen Halbebene v>0 das komplex konjugierte Paar   als Lösungsmenge des quadratischen Faktors, in der unteren Halbebene v<0 das reelle Paar  . Hat das Polynom f(x) k komplexe Lösungen und s=n-2k reelle Lösungen, so gibt es k quadratische Faktoren über der x-Achse und s(s-1)/2 darunter, da jede reelle Lösung kombiniert mit jeder anderen einen möglichen Faktor ergibt.

     
     

In den weiß gefärbten Punkten wird ein guter Faktor schon im ersten Iterationsschritt erreicht, die farbigen Punkte liefern Startwerte, deren Iteration zu dementsprechend gefärbten Bassin um einen der Faktoren führt. Der Farbverlauf entspricht der Anzahl der Iterationen bis zu einer guten Näherung, je dunkler, desto mehr Schritte wurden gebraucht. Für schwarze Startwerte findet die Iteration in den ersten 100 Schritten keinen Faktor hinreichender Genauigkeit, bzw. die Iteration divergiert. Dargestellt sind Punkte  .

Im Allgemeinen kann man die Konvergenz dieses Verfahrens nicht garantieren, bzw. sie ist teilweise recht langsam, wie sich an den schwarzen und dunklen Flächen des ersten Bildes zum Polynom   ablesen lässt.

Man kann diese Situation teilweise beheben, indem den ungeraden Grad durch Hinzufügen einer Nullstelle in   gerade macht, also das erweiterte Polynom   betrachtet, welches im zweiten Bild dargestellt ist. Im dritten Bild wurde das oben benutzte Beispielpolynom visualisiert.

Praktisch sinnvoller ist aber, mittels Newton-, Sekanten-Verfahren oder Regula falsi bei Polynomen ungeraden Grades zunächst eine reelle Nullstelle zu bestimmen und dann auf das reduzierte Polynom geraden Grades das Bairstow-Verfahren anzuwenden.

Siehe auch

Bearbeiten

Literatur

Bearbeiten
  • Roland W. Freund, Ronald H. W. Hoppe: Stoer/Bulirsch: Numerische Mathematik 1. 10. Auflage. Springer, Berlin 2007, ISBN 978-3-540-45389-5, Abschnitt 5.8.1.

Einzelnachweise

Bearbeiten
  1. Bairstow, Applied Aerodynamics, Longmans, Green and Co., 1920, Archive