, 17 min read

Stabilitätsfunktionale und Semistabilitätsfunktionale

Original post is here eklausmeier.goip.de/blog/2024/06-18-stabilitaetsfunktionale-und-semistabilitaetsfunktionale.


1. Semistabilitätsfunktionale in Matrixdarstellung

Mit Ausnahme der Booleschen Algebra wird keine Theorie in der Mathematik universeller benutzt als die lineare Algeba. Es gibt kaum eine Theorie, die elementarer ist, trotz der Tatsache, daß Generationen von Professoren und Lehrbuchautoren die Einfachheit dieser Theorie durch höchst unangebrachte Berechnungen mit Matrizen verdunkelt haben.

Jean Alexandre Dieudonné (1960)

Man kann beweisen, man vgl. z.B. das Buch Albrecht (1979), oder den Aufsatz von Skeel (1976), daß die Norm |Pδ| Stabilitätsfunktional ist für Verfahren der allgemeinen Form

zn+1=Szn+hφn,ziRs,undSRs×s.

Man hat also Fehlerabschätzungen der Art

c1PδZzc2Pδ.

P ist eine Block-Toeplitz Matrix, siehe weiter unten. Hierbei ist Z=(Z1,,Zn) der entsprechende Vektor der exakten Lösungen und z=(z1,,zn), die durch obige Verfahrensvorschrift gewonnene Näherung hierfür.

Diese doppelseitige Abschätzung ist insoweit von besonderer Bedeutung, da sie sofort verständlich macht, daß die berechnete Näherung sich nicht beliebig weit von der exakten Lösung entfernen kann, wenn man die Größe δ “klein” hält. Wichtig ist natürlich, daß die linke Konstante c1 nicht verschwinden darf, also c10 und daß die rechte Konsrtante c2 nicht zu “groß” ist, also c2<. Ferner ist zu berücksichtigen, daß beide Konstanten c1 und c2 nicht selber von der Größe δ abhängen.

Die obige Verfahrensvorschrift zn+1=Szn+hφ ist recht allgemein. Hier genügt vollkommen die Verfahrensvorschrift

i=0κAizn+i=hi=0κBiFn+i,n=0,1,,

mit den Matrizen Ai,BiRs×s und entsprechenden Vektoren zn+i,Fn+iRs.

Es ist sofort offensichtlich, daß die obige Verfahrensvorschrift in der Vorschrift zn+1=Szn+hφn natürlich enthalten ist. Selbstverständlich hängt die Steuerungsfunktion auch von der Zeit tn ab, möglicherweise auch noch von weiteren Größen. Alle diese einfliessenden Parameter seien in der Schreibweise unterdrückt.

Das allgemeinene Stabilitätsfunktional ψ, für welches gilt

c1ψ(δn)Ynync2ψ(δn),

muß nicht notwendig eine Norm sein.

Es müssen also nicht die Bedingungen der Definitheit und die der Homogenität und die Dreiecksungleichung erfüllt sein. Das Funktional ψ hängt natürlich von zahlreichen Größen ab, ist also eine Funktion mehrerer Veränderlicher. Diese ganzen Abhängigkeiten werden aber in der weiteren Schreibweise nicht gesondert alle aufgeführt. Unter Berücksichtigung der Argumente hätte man zu schreiben

ψ=ψ(n,h,Ai,δ),

dabei hängen die Matrizen Ai von den Koeffizienten αij des Verfahrens ab und der Vektor δ hängt ab von der Matrix S und den Matrizen Bi.

Bei der folgenden diskreten Fassung der Kontrollgleichung

zn+1=Azn+un

wird nun das Stabilitätsverhalten weiter betrachtet. Es ist hierbei zn der Vorzustand, zn+1 der Folgezustand und un die Steuerungsgröße. Von Interesse sei jetzt lediglich der innere Zustand, nicht jedoch der Ausgang des obigen Systems. Häufig ist der Ausgang von der Form xn=Bzn.

Man erhält jetzt nacheinander

z1=Az0+u0,z2=Az1+u1=A2z0+Au0+u1,z3=Az2+u2=A3z0+A2u0+Au1+u2,zk=Azk1+uk1=Akz0+Ak1u0++Auk2+A0uk1.

Schreibt man dies in Matrix-Vektor Schreibweise auf, so erhält man

(z1z2z3zk)=(AA0A2A1A00A3A2A1A0AkAk1Ak2Ak3A0)(z0u0u1uk1)=(AA2A3Ak)z0+P(u0u1uk1),

wobei hier die Block-Toeplitz-Dreiecksmatrix P auftaucht, mit

P=(A0A1A00A2A1A0Ak1Ak2Ak3A0).

Otto Toeplitz (1881--1940).

Wichtig ist zu vermerken, daß diese Block-Dreicksmatrix P von der Iterationsstufe k abhängt, insbesondere wird die Matrix dimensionsmässig größer, mit größer werdendem k; es ist PRks×ks.

Man erkennt, wie die alten Steuerungen u0,u1,,uk1 nachwirken, nämlich in Matrixpotenzen

Ak,Ak1,,A,A0.

Die Überlegungen gelten sinngemäß, wenn man die Matrix A selber abhängig vom Index n hält. Dies heißt also, daß sich die Systemzustandsüberführung jedesmal ändern kann. Man hat also die Kontrollgleichung

zn+1=Anzn+un.

Hier erhält man dann ganz genauso wie oben, der Reihe nach ausgehend vom Anfangszustand z0:

z1=A0z0+u0,z2=A1A0z0+A1u0+u1,z3=A2A1A0z0+A2A1u0+A2u1+u2,zk=Ak1zk1+uk1=Ak1A0z0+Ak1A1u0++Ak1uk2+uk1.

Wiederum in Matrix-Vektor Schreibweise ergibt dies

(z1z2z3zk)=(A0IA1A0A1I0A2A1A0A2A1A2IAk1A0Ak1A1Ak1A2Ak1A3I)(z0u0u1uk1).

Auch hier erkennt man den Einfuß vergangener Steuerungen u0,u1,,uk1 auf den neuen Zustand zk, nämlich nun als Matrizenprodukt (im Gegensatz zu den Matrixpotenzen) zu

(Ak1A0),(Ak1A1),,(Ak1),I.

Interpretiert man jetzt die Steuerungen ui als Störungen δi des schon oben angegebenen Verfahrens zn+1=Azn+hφ, untersucht man also die veränderte Steuerungsgleichung

z~n+1=Az~n+hφ~n+δn,

so erkennt man, wie sich diese Störungen aufsammeln und “aufaddieren”. Entscheidend ist hier ist also wieder die Block-Toeplitz-Dreiecksmatrix P, mit

P=(A0A1A00A2A1A0Ak1Ak2Ak3A0),

bzw. für den allgemeineren Falle hat die Block-Dreiecksmatrix P die Gestalt, nicht notwendig eine Toeplitz-Matrix,

P=(IA1I0A2A1A2IAk1A1Ak1A2Ak1A3I),

welche beide von der Iterationsstufe k abhängig sind, also wie oben PRks×ks. Die Matrix P ist hier offensichtlich wegen Azn+zn+1=, (n=0,1,) die Inverse der Matrix

P1=(I0AIAI0AI)bzw.P1=(I0A1IA2I0Ak1I)

Die Sammelwirkung der Steuerungen, bzw. der Störungen, hängt nun ab von Pδ, mit

δ=(δ0δk1).

Würde man das lineare und homogene Gleichungsystems Pδ=0 betrachten und nach den δi auflösen, so erhielte man das Ergebnis, daß die δ0,,δk1 gerade die Jordan-Kette der Länge k ist, bzgl. λ0 für das Matrixpolynom L(λ), wenn man von der Feinheit absieht, daß man u.U. die ersten i-Nullvektoren δ0,,δi1 wegstreicht. Bibliographisch: Keldysh, M.V., Jordan, Camille (1838--1921)

Hierbei ist das Matrixpolynom L(λ) gegeben durch

L(λ)=i=0k1Ai(λλ0)i,

man siehe hierzu Gohberg/Lancaster/Rodman (1982). Autoren sind Gohberg, Izrael' TSudikovich, Lancaster, Peter und Rodman, Leiba.

Für den allgemeineren Fall, daß man in jedem Zustand eine neue Matrix An betrachtet, also zn+1=Anzn+un, ergibt sich das Matrixplynom L(λ) zu

L(λ)=i=0k1(j=0iAj)(λλ0)i.

Man sieht sofort, daß für das Spektrum σ(P) stets gilt, daß σ(P)={1} und zwar unabhängig von den Matrizen A0,,Ak.

Insbesondere ist die Block-Dreiecksmatrix P invertierbar und somit ist P, für festes k, eine Norm, da ganz allgemein für jede Vektornorm gilt, daß mit auch für eine beliebige invertierbare Matrix P dann ebenfalls Px eine Norm ist. Dabei geht die Invertierbarkeit für die Definitheit ein und die Linearität wird für die Homogenität und die Dreiecksungleichung benötigt.

Das weitergehende Resultat, daß dann für die zugehörige Matrixnorm A entsprechend PAP1 die zugehörige Matrixnorm zu Px ist, kann man leicht beweisen. Dennoch wird dieses Ergebnis hier nicht weiter verwendet. Somit hat man ohne Mühe die Aussage erhalten, daß das Stabilitätsfunktional ψ(δ)=Pδ tatsächlich eine Norm ist.

Will man nun zu einer Abschätzung für zn+1z~n+1 gelangen und beachtet man, daß man ja eine explizite Darstellung der Lösungen hat, so ergibt sich zunächst für zn+1=Azn+un die Darstellung

Zn+1=(AAn+1)z0+P(u0un)=:Tz0+Pu.

Für das gestörte System z~n+1=Az~n+vn mit den “veränderten” Steuerungen vi erhält man die Darstellung

Z~n+1=(AAn+1)z~0+P(v0vn)=:Tz~0+Pv.

Hier sind wieder die einzelnen Vektoren zi, bzw. die z~i, zu einem größerem Vektor Zn+1, bzw. Z~n+1, zusammengefaßt. Es ist also

Zn+1=(z1zn+1)undZ~n+1=(z~1z~n+1).

Die Differenz der beiden oben angegebenen Darstellungen führt nun direkt auf

Zn+1Z~n+1=T(zz~0)+P(uv)Tz0z~0+Puv.

Da die Matrizen T und P von der Iterationsstufe k abhängen, sind Einschränkungen an die Komponenten dieser beiden Matrizen zu stellen. Es werde jetzt an die Matrixpotenz Ai oder an die Produkte AkAki die Forderung gestellt, daß ihre Normen, für alle i und alle k beschränkt seien. Es solle also gelten, daß

Aiconst,iN0;

oder allgemeiner

AkAkiconst,i<k,k.

Im Lichte der obigen Bauart der oben angegebenen Block-Dreiecksmatrix P, sind diese beiden Forderungen sofort offenkundig sinnvolle Einschränkungen, da die obigen Matrixpotenzen, bzw. Matrixprodukte, die Komponenten der Block-Dreiecksmatrix P ausmachen. Die erste Bedingung führt dann sofort auf die entsprechende Bedingung an die Eigenwerte der Matrix A. Die zweite Bedingung ist diffiziler.

Es zeigt sich nun, daß diese beiden Forderungen genügen, sodaß auch die Normen von P und T trotz größer werdendem k, nicht zu stark wachsen. Man beachte strikt, daß sich die Normen ändern, mit größer werdendem k. Die sonst recht triviale Aussage, daß die Norm einer festen, beliebigen Matrix stets beschränkt ist, gilt hier nicht.

Vielmehr gilt: |P|=O(k), oder in anderer Formulierung, es ist

1kPconst,kN0.

Der Nachweis werde nur für die Maximumnorm || geführt. Exakterweise müßte man natürlich stets Supremumsnorm notieren, dennoch sei diese Feinheit von jetzt ab nicht näher beachtet. Da |Aj|c, jN0 ergibt sich

Pmaxi=0k1j=0k1c=kc=O(k).

Für die 1-Norm 1 ergibt sich dieses Resultat ganz analog. Dies hängt mit der speziellen Gestalt der Matrix P zusammen. Für den allgemeinen Falle verlaufen die Überlegungen ähnlich.

Die Tatsache, daß T=O(k), ist sofort offenkundig für sowohl die Maximumnorm , als auch für die 1-Norm 1.

Betrachtet man jetzt wieder die beiden Verfahren zn+1=Szn+hφn und z~n+1=Sz~n+hφ~n+δn, so erhält man in üblicher vektorieller Schreibweise für die φi, δi und zi sofort

Zn+1Z~n+1=T(z0z~0)+hP(φφ~)Pδ

und dann mit der Standardabschätzung

(*)Zn+1Z~n+1Tz0z~0+|h|Pφφ~+Pδ.

Setzt man jetzt von den Funktionen φn nur deren Beschränktheit voraus, und damit für φ, so erhält man sofort das Ergebnis, daß die beiden Zustände sich nicht beliebig weit voneinander entfernen können, wenn nur k|δ|const und

z0z~0=O(1k).

Diese beiden Bedingungen sind auch tatsächlich häufig gegeben. Die Beschränktheit des mittleren Summanden in der obigen Abschätzung () ist wegen des Vorfaktors von h offensichtlich, da dieser dann das O(k)-Wachstum der Norm |P| auffängt. Die Beschränktheit von der Funktion φ ist z.B. dann gegeben, wenn man weiß, daß diese Funktion Lipschitz-stetig ist. Auf einer kompakten Definitionsmenge — sagen wir [a,b]×K×JR2s+1 — folgt dann sofort die Beschränktheit von φ.

Bei einer genaueren Untersuchungen muß man natürlich die gestörte Gleichung z~n+1=Azn+h~φ~n+δn betrachten, da sich bei einer Störung natürlich auch die Schrittweitenfolge h0,h1, ändert. Das Ausklammern der Schrittweite h, setzt natürlich gleiche Schrittweiten beider Verfahren voraus. Man kann dies in die Funktion φ~ versuchen hinein zu verlagern. Die dann auftretenden Abschätzungen verlangen dann etwas mehr Sorgfalt. Man beachte, daß hier nur Beschränktheit von |Zn+1Z~n+1| folgt, nicht jedoch erhält man mit der Standardabschätzung wie oben, das weitergehende Resultat, daß die Normdifferenz |Zn+1Z~n+1| kleiner wird, wenn man δ normmässig genügend heftig verkleinert.

Man beachte, daß hier nur ein Semistabilitätsfunktional vorliegt mit der obigen Abschätzung (). Das Stabilitätsfunktional ψ(δ)=|Pδ| geht hier additiv ein.

Bei einer Abschätzung, wie sie z.B. bei Skeel (1976), oder in dem Buche von Albrecht (1979), und auch in dem Buche von Hairer/Wanner/Nørsett (1987) beschrieben wird, geht dieses Funktional direkt multiplikativ in die Abschätzung der Form () ein. Man erhält dann natürlich weitergehende Resultate. Allerdings wachsen die Faktoren vor dem Funktional exponentiell mit der Länge des Integrationsintervalles und ebenso exponentiell in der Lipschitzkonstanten. Insbesondere läßt sich auch der Abstand zweier Zustände verkleinern, falls man die Störung hinreichend stark verkleinert.

Bibliographisch: Hairer, Ernst (*1949), Wanner, Gerhard (*1942), Nørsett, Syvert Paul.

2. Bemerkungen zum Spijkerschen Stabilitätsfunktional

Nebenläufig sei auf die völlige Analogie der Lösungen von diskreter und kontinuierlicher Zustandsgleichung hingewiesen.

Das lineare und inhomogene Differentialgleichungs-Anfangswertproblem

x˙=A(t)x+u(t),x(t0)=x0,

hat die eindeutig bestimmte Lösung

x(t)=H(t)x0+t0tH(t)H1(τ)u(τ)dτ,

wobei H=H(t) das (eindeutig bestimmte) Fundamentalsystem der homogenen Gleichung x˙=A(t)x ist, mit H(t0)=I. Die Spezialisierung auf die lineare und inhomogene Anfangswertaufgabe mit konstanten Koeffizienten

x˙=Ax+u,x(t0)=x0,

hat demnach die (eindeutig bestimmte) Lösung, die sogar auf der gesamten reellen Achse existiert, falls die Inhomogenität u(t) ebenso existiert,

x(t)=eA(tt0)x0+t0teA(tτ)u(τ)dτ.

Für die diskrete Gleichung zn+1=Azn+un erhält man nach Vorgabe des Anfangszustandes z0 die eindeutig bestimmte Lösung

zn=Anz0+ν=0n1An1νuν.

Zwischen den beiden Problemen x˙=Ax+Bz und xk+1=Sxk+Rzk kann man durch den Homomorphismus

S=eA,R=(01eAτdτ)B

stets vermitteln.

Eine weitere Analogie hat man wie folgt. Gilt

|y(t0)y~(t0)|ρ,|y~˙(t)f(y(t))|δ(t),|f(y~(t))f(y(t))|(t)|y~(t)y(t)|,

so erhält man die Abschätzung

|y~(t)y(t)|eL(t)(ρ+t0teL(s)δ(s)ds),

mit

L(s)=t0t(τ)dτ.

Der notationellen Einfachheit halber sei angenommen, daß tt0 ist — dies erspart Betragszeichen.

Spezialisiert man auf konstante δ(t) und (t), also δ(t)δ und (t)L, so erhält man die bekannte Abschätzung

|y~(t)y(t)|(ρ+(tt0)δ)eL|tt0|,

welche eine Aussage darüber macht, wie verschiedene Anfangswerte zu ein und derselben Differentialgleichung zum Auseinanderlaufen der dazugehörigen Lösungen führen können. Im ungünstigsten Falle muß man mit exponentiellen Wachstum rechnen; die Ungleichung ist scharf.

Spezialisiert man lediglich (t)L, so ergibt sich

|y~(t)y(t)|(ρ+t0tδ(τ)dτ)eL|tt0|.

Die letzte Abschätzung weist schon formal auf den engen Zusammenhang zum Spijkerschen Stabilitätsfunktional hin. Direkter wird dieser Zusammenhang im Falle der folgenden Überlegungen.

Hat man

y~˙=f(y~)+d2(t),y~(t0)=y0+d1,

mit den beiden Defekten d1,d2(t)R, so erhält man

|y~(t)y(t)|eL|tt0|maxτ[t0,t]|d2+t0τd1(s)ds|.

Man beachte, daß sich die letzte Defektabschätzung nicht durch Spezialisierung aus der obigen allgemeinen Abschätzung herleiten lässt. Dennoch sind die Beweise für beide Aussagen natürlich ähnlich. Ebenso ist gut zwischen d2(t) aus dem Banachraum R und der nicht-negativen skalaren Größe δ(t) zu unterscheiden; Banach, Stefan (1892--1945). Entsprechend sind die Integrale zu verstehen.

Das Spijkersche Stabilitätsfunktional lautet hier

ψSp(δ)=maxn=0N|i=0nδi|,

in Abweichung der Notation von Albrecht (1979), wegen der veränderten Schreibweise der δi. Die zum Stabilitätsfunktional gehörende Matrix P ist natürlich

P=(III0IIIIIII).

Zu den Abschätzungen vergleiche man die Bücher von Schäfke/Schmidt (1973) und Hairer/Wanner/Nørsett (1987). Dort findet man auch Hinweise auf weiterführende Literatur und schwächere Voraussetzungen bei den Behauptungen.

Bibliographisch: Schäfke, Friedrich Wilhelm (1922--2010), Schmidt, Dieter (*1941).