Die BDF-Verfahren (englisch Backward Differentiation Formulas ) sind lineare Mehrschrittverfahren zur numerischen Lösung von Anfangswertproblemen gewöhnlicher Differentialgleichungen :
y
′
(
x
)
=
f
(
x
,
y
(
x
)
)
,
y
(
x
0
)
=
y
0
,
y
:
R
→
R
n
{\displaystyle y'(x)=f(x,y(x)),\quad y(x_{0})=y_{0},\quad y\colon \mathbb {R} \to \mathbb {R} ^{n}}
.
Dabei wird für
y
(
x
)
{\displaystyle y(x)}
eine Näherungslösung an den Zwischenstellen
x
i
{\displaystyle x_{i}}
berechnet:
y
i
≈
y
(
x
i
)
i
=
1
,
…
,
m
{\displaystyle y_{i}\approx y(x_{i})\quad i=1,\dotsc ,m}
.
Die Verfahren wurden 1952 von Charles Francis Curtiss und Joseph Oakland Hirschfelder eingeführt und sind seit dem Erscheinen der Arbeiten von C. William Gear 1971 als Löser für steife Anfangswertprobleme weit verbreitet.
Im Gegensatz zu Adams-Moulton-Verfahren wird bei BDF-Verfahren nicht die rechte Seite durch ein Interpolationspolynom approximiert, stattdessen konstruiert man ein Polynom
q
k
{\displaystyle q_{k}}
mit (maximalem) Grad
k
{\displaystyle k}
, welches die letzten
k
{\displaystyle k}
Approximationen
y
n
,
…
,
y
n
+
k
−
1
{\displaystyle y_{n},\dotsc ,y_{n+k-1}}
an die Lösung sowie den unbekannten Wert
y
n
+
k
{\displaystyle y_{n+k}}
interpoliert:
q
k
(
x
i
)
=
y
i
,
für
i
=
n
,
…
,
n
+
k
{\displaystyle q_{k}(x_{i})=y_{i},\quad {\text{für }}i=n,\dots ,n+k}
.
Zusätzlich fordert man, dass das Interpolationspolynom
q
k
{\displaystyle q_{k}}
die gegebene Differentialgleichung im Punkt
x
n
+
k
{\displaystyle x_{n+k}}
löst, also dass gilt
q
k
′
(
x
n
+
k
)
=
f
(
x
n
+
k
,
y
n
+
k
)
{\displaystyle q_{k}'(x_{n+k})=f(x_{n+k},y_{n+k})}
,
und erhält so ein nichtlineares Gleichungssystem für die Bestimmung des implizit gegebenen Wertes
y
n
+
k
{\displaystyle y_{n+k}}
.
Eine Möglichkeit für die Darstellung des Interpolationspolynoms
q
k
{\displaystyle q_{k}}
ist die Lagrange-Darstellung . Dabei sind die Lagrange-Basispolynome mit den
k
+
1
{\displaystyle k+1}
Stützstellen
x
n
,
…
,
x
n
+
k
{\displaystyle x_{n},\dots ,x_{n+k}}
definiert durch
l
j
(
x
n
+
i
)
=
δ
j
i
=
{
1
falls
j
=
i
,
0
falls
j
≠
i
.
{\displaystyle l_{j}(x_{n+i})=\delta _{ji}={\begin{cases}1&{\text{falls }}j=i,\\0&{\text{falls }}j\neq i.\end{cases}}}
wobei
δ
j
i
{\displaystyle \delta _{ji}}
das Kronecker-Delta ist. Damit folgt wegen
q
k
(
x
n
+
i
)
=
∑
j
=
0
k
l
j
(
x
n
+
i
)
y
n
+
j
=
y
n
+
i
{\displaystyle q_{k}(x_{n+i})=\sum _{j=0}^{k}l_{j}(x_{n+i})y_{n+j}=y_{n+i}}
direkt die Darstellung
q
k
(
x
)
=
∑
j
=
0
k
l
j
(
x
)
y
n
+
j
{\displaystyle q_{k}(x)=\sum _{j=0}^{k}l_{j}(x)y_{n+j}}
.
Mit der Forderung
q
k
′
(
x
n
+
k
)
=
f
(
x
n
+
k
,
y
n
+
k
)
{\displaystyle q_{k}'(x_{n+k})=f(x_{n+k},y_{n+k})}
erhält man nun die lineare Rekursionsformel für die BDF-Verfahren:
∑
j
=
0
k
α
j
y
n
+
j
=
f
(
x
n
+
k
,
y
n
+
k
)
{\displaystyle \sum _{j=0}^{k}\alpha _{j}y_{n+j}=f(x_{n+k},y_{n+k})}
,
wobei die Koeffizienten
α
j
{\displaystyle \alpha _{j}}
gegeben sind durch
α
j
=
l
j
′
(
x
n
+
k
)
,
j
=
0
,
…
,
k
{\displaystyle \alpha _{j}=l_{j}'(x_{n+k}),\quad j=0,\dots ,k}
.
Alternativ betrachten wir die Lagrange-Basispolynome definiert durch
L
j
(
−
s
)
=
δ
j
s
=
{
1
falls
j
=
s
,
0
falls
j
≠
s
.
{\displaystyle L_{j}(-s)=\delta _{js}={\begin{cases}1&{\text{falls }}j=s,\\0&{\text{falls }}j\neq s.\end{cases}}}
Damit folgt die Darstellung
q
k
(
x
n
+
k
+
s
h
)
=
∑
j
=
0
k
L
k
−
j
(
s
)
y
n
+
j
{\displaystyle q_{k}(x_{n+k}+sh)=\sum _{j=0}^{k}L_{k-j}(s)y_{n+j}}
.
Dabei ist
h
=
x
i
+
1
−
x
i
{\displaystyle h=x_{i+1}-x_{i}}
der Abstand der Stützstellen und die konstante Schrittweite des Verfahrens. Mit der Forderung
q
k
′
(
x
n
+
k
)
=
f
(
x
n
+
k
,
y
n
+
k
)
{\displaystyle q_{k}'(x_{n+k})=f(x_{n+k},y_{n+k})}
, wobei hier
q
k
′
(
x
)
=
d
d
x
q
k
(
x
)
=
d
d
(
s
h
)
q
k
(
x
n
+
k
+
s
h
)
=
1
h
d
d
s
q
k
(
x
n
+
k
+
s
h
)
{\displaystyle q_{k}'(x)={\frac {d}{dx}}q_{k}(x)={\frac {d}{d(sh)}}q_{k}(x_{n+k}+sh)={\frac {1}{h}}{\frac {d}{ds}}q_{k}(x_{n+k}+sh)}
gilt, erhält man nun für die Berechnung der Koeffizienten
α
j
{\displaystyle \alpha _{j}}
α
j
=
L
k
−
j
′
(
0
)
,
j
=
0
,
…
,
k
{\displaystyle \alpha _{j}=L_{k-j}'(0),\quad j=0,\dots ,k}
und damit die Rekursionsformel
∑
j
=
0
k
L
k
−
j
′
(
0
)
y
n
+
j
=
h
f
(
x
n
+
k
,
y
n
+
k
)
{\displaystyle \sum _{j=0}^{k}L_{k-j}'(0)y_{n+j}=hf(x_{n+k},y_{n+k})}
Die Newton-Darstellung des Interpolationspolynoms
q
k
{\displaystyle q_{k}}
verwendet Rückwärtsdifferenzen, welche rekursiv definiert sind durch
∇
0
y
i
=
y
i
,
∇
j
+
1
y
i
=
∇
j
y
i
−
∇
j
y
i
−
1
.
{\displaystyle \nabla ^{0}y_{i}=y_{i},\quad \nabla ^{j+1}y_{i}=\nabla ^{j}y_{i}-\nabla ^{j}y_{i-1}.}
Damit lässt sich
q
k
{\displaystyle q_{k}}
schreiben als
q
k
(
x
n
+
k
+
s
h
)
=
∑
j
=
0
k
(
−
1
)
j
(
−
s
j
)
∇
j
y
n
+
k
{\displaystyle q_{k}\left(x_{n+k}+sh\right)=\sum _{j=0}^{k}(-1)^{j}{\binom {-s}{j}}\nabla ^{j}y_{n+k}}
.
Diese Formel führt wegen
d
d
s
(
−
1
)
j
(
−
s
j
)
|
s
=
0
=
1
j
{\displaystyle \left.{\frac {d}{ds}}(-1)^{j}{\binom {-s}{j}}\right|_{s=0}={\frac {1}{j}}}
für
j
=
1
,
…
,
k
{\displaystyle j=1,\dots ,k}
auf die Darstellung
∑
j
=
1
k
1
j
∇
j
y
n
+
k
=
h
f
(
x
n
+
k
,
y
n
+
k
)
{\displaystyle \sum \limits _{j=1}^{k}{\frac {1}{j}}\nabla ^{j}y_{n+k}=hf(x_{n+k},y_{n+k})}
der BDF-Verfahren.
Alle oben betrachteten Darstellungen der Berechnungsformeln sind äquivalent, da sie nur verschiedene Arten der Darstellung des eindeutigen Interpolationspolynoms
q
k
{\displaystyle q_{k}}
verwendet haben. Für
k
≤
6
{\displaystyle k\leq 6}
lauten die impliziten Berechnungsformeln der BDF(k)-Verfahren:
BDF(1) – implizites Euler-Verfahren:
y
n
+
1
−
y
n
=
h
f
(
x
n
+
1
,
y
n
+
1
)
{\displaystyle y_{n+1}-y_{n}=hf(x_{n+1},y_{n+1})}
3
y
n
+
2
−
4
y
n
+
1
+
y
n
=
2
h
f
(
x
n
+
2
,
y
n
+
2
)
{\displaystyle 3y_{n+2}-4y_{n+1}+y_{n}=2hf(x_{n+2},y_{n+2})}
11
y
n
+
3
−
18
y
n
+
2
+
9
y
n
+
1
−
2
y
n
=
6
h
f
(
x
n
+
3
,
y
n
+
3
)
{\displaystyle 11y_{n+3}-18y_{n+2}+9y_{n+1}-2y_{n}=6hf(x_{n+3},y_{n+3})}
25
y
n
+
4
−
48
y
n
+
3
+
36
y
n
+
2
−
16
y
n
+
1
+
3
y
n
=
12
h
f
(
x
n
+
4
,
y
n
+
4
)
{\displaystyle 25y_{n+4}-48y_{n+3}+36y_{n+2}-16y_{n+1}+3y_{n}=12hf(x_{n+4},y_{n+4})}
137
y
n
+
5
−
300
y
n
+
4
+
300
y
n
+
3
−
200
y
n
+
2
+
75
y
n
+
1
−
12
y
n
=
60
h
f
(
x
n
+
5
,
y
n
+
5
)
{\displaystyle 137y_{n+5}-300y_{n+4}+300y_{n+3}-200y_{n+2}+75y_{n+1}-12y_{n}=60hf(x_{n+5},y_{n+5})}
147
y
n
+
6
−
360
y
n
+
5
+
450
y
n
+
4
−
400
y
n
+
3
+
225
y
n
+
2
−
72
y
n
+
1
+
10
y
n
=
60
h
f
(
x
n
+
6
,
y
n
+
6
)
{\displaystyle 147y_{n+6}-360y_{n+5}+450y_{n+4}-400y_{n+3}+225y_{n+2}-72y_{n+1}+10y_{n}=60hf(x_{n+6},y_{n+6})}
Die BDF-Verfahren sind alle implizit, da der unbekannte Wert
y
n
+
k
{\displaystyle y_{n+k}}
in die Gleichung eingeht. BDF(k) besitzt genau die Konsistenzordnung k . Das Verfahren BDF(1) ist das implizite Euler-Verfahren . Dieses und BDF(2) sind A-stabil , die Verfahren höherer Ordnung A(
α
{\displaystyle \alpha }
)-stabil, wobei der Öffnungswinkel
α
{\displaystyle \alpha }
sich mit höherer Ordnung verkleinert. Insbesondere BDF(2) ist aufgrund seiner optimalen Eigenschaften bezüglich der zweiten Dahlquist-Barriere bei der Berechnung steifer Differentialgleichungen sehr beliebt.
Für k<6 sind die Verfahren stabil und konsistent und damit auch konvergent. Der größte Anreiz der BDF-Verfahren sind ihre großen Stabilitätsgebiete, weshalb sie sich für den Einsatz bei der Lösung von steifen Anfangswertproblemen eignen.
Für k>6 sind die Verfahren instabil.
Stabilitätsgebiete der BDF-Verfahren
BDF1
BDF2
BDF3
BDF4
BDF5
BDF6
E. Hairer, Syvert P. Nørsett, Gerhard Wanner: Solving Ordinary Differential Equations I, Nonstiff Problems , Springer Verlag, ISBN 3-540-56670-8
E. Hairer, G. Wanner: Solving Ordinary Differential Equations II, Stiff problems , Springer Verlag, ISBN 3-540-60452-9
H.R. Schwarz, N. Köckler: Numerische Mathematik , Teubner (2004)
Curtiss, Hirschfelder Integration of stiff equations , Proc. Nat. Acad. Sci. U.S.A., Band 38, 1952, 235–243.