Mittwoch, 16. November 2016

Eine Gute-Nacht-Abschätzung

In einer (ziemlich komplizierten) Arbeit bin ich letztens auf eine kleine, süße Abschätzung getroffen, die man mit einer kleinen, netten Idee (oder aber auch mit einer langweiligen Fallunterscheidung) begründen kann. Es handelt sich um die folgende Kleinigkeit: Für reelle Zahlen $a$ und $b$ gilt:
$$|a| \geq |b| \quad\Longrightarrow \quad a(a-b) \geq 0.$$ Wollen wir sie einmal beweisen!

Möglichkeit 1: Das, was man immer mit Beträgen macht

Es mag verlockend sein, diese Ungleichung zu beweisen, indem man unterscheidet, ob $a$ positiv oder negativ ist, damit man aus der Bedingung $|a| \geq |b|$ die Vorzeichen des Faktors $a-b$ bestimmen kann. Das ist eine ziemlich langweilige Methode, aber sie führt geordnet zum Erfolg. Insbesondere für diejenigen unter uns, die noch keinen "Blick" dafür entwickelt haben, wie man effektiv (und schön!) an eine Aufgabe heran geht, mag das eine gute Präsentation sein.

Also ran ans Werk! Das Produkt $a(a-b)$ ist bekanntlich genau dann nicht-negativ, wenn die beiden Faktoren $a$ und $a-b$ dasselbe Vorzeichen haben. (Merke: $0 = -0$, somit hat $0$ beide Vorzeichen.) Wir unterscheiden daher naheliegend zwei Fälle:

Fall 1: Zuerst nehmen wir an, dass $a\geq 0$ gilt. In diesem Fall müssen wir $a-b\geq 0$ belegen, umgestellt ist demnach $a\geq b$ zu zeigen. Diese Ungleichung erhalten wir jedoch locker-flockig aus der Voraussetzung:
$$ a = |a| \geq |b| \geq b.$$ Dabei mussten wir lediglich (die auch andernorts nützliche) Ungleich $x\leq |x|$ einsetzen, die für jede reelle Zahl $x$ gilt.
Fall 2: Nun nehmen wir an, dass $a<0$ gilt und müssen entsprechend $a-b\leq 0$, das heißt, $a\leq b$ zeigen. Das Vorgehen ähnelt nun dem obigen, aber wir benötigen nun, dass $a = -|a|$ gilt und dass $-|x|$ stets eine untere Schranke für $x$ ist: $$ a = -|a| \leq -|b| \leq b.$$ Damit sind wir fertig, denn in beiden Fällen folgt $a(a-b) \geq 0$.

Möglichkeit 2: Funktionales Denken

Betrachtet man Ungleichungen zwischen reellen Zahlen, so lassen sich diese oft in geeigneter Weise durch Funktionen darstellen, die ein anschauliches Bild der Situation liefern. Hat man dieses Bild im Kopf, braucht man sich nicht die lästige Fallunterscheidung zu merken, die weit weniger fassbar ist.

Bei unserer Ungleichung hilft uns eine quadratische Funktion $q$, und zwar die Funktion
$$q\colon \mathbb R\to \mathbb R,\quad x\mapsto (x-x_1)(x-x_2)$$ mit den beiden (nicht notwendig verschiedenen) Nullstellen $x_1$ und $x_2$. Diese hat als Graph eine nach oben geöffnete Parabel, die – man beachte auch das Monotonieverhalten! – außerhalb des Intervalls $\lfloor x_1,x_2\rceil$ nur positive Werte annimmt. Die Zeichenkette $\lfloor x_1,x_2\rceil$ bezeichnet dabei alle Zahlen zwischen $x_1$ und $x_2$, also
$$\lfloor x_1,x_2\rceil = [\min(x_1,x_2),\max(x_1,x_2)].$$ Möchte man dieses (nun hoffentlich reaktivierte Wissen, dessen man sich auch mit einer kleinen Rechnung vergewissern kann) auf den obigen Term $a(a-b)$ anwenden, so muss man ihn lediglich als Funktionsterm einer Funktion in Abhängigkeit von der Variablen $a$ mit gegebener Konstante $b$ betrachten, also als Funktion
$$q\colon \mathbb R\to \mathbb R,\quad a\mapsto (a-0)(a-b).$$ Nun wissen wir, dass $a(a-b)\geq 0$ gilt, falls $a\in \lfloor 0,b\rceil$. Da diese Bedingung allerdings kaum ästhetisch ist, suchen wir eine andere – und dies ist eben die Bedingung $|a| \geq |b|$. Wieso diese hinreichend (aber nicht notwendig) ist, sieht man am besten anhand der folgenden Graphik, die auch wunderbare als Merkhilfe dient, da man an ihr ohne jede weitere Rechnerei die gewünschte Abschätzung ablesen kann. P ist der Punkt $(|b|,0)$, Q der Punkt $(-|b|,0)$.


Möglichkeit 3: Geschicktes Addieren einer Null

Wer noch immer nicht schlafen kann, der darf sich jetzt mit einem kleinen Trick anfreunden, der ebenfalls häufig die zielführende Idee ist: Man formt den Term $a(a-b)$ so lange um und addiert und subtrahiert Terme, die sich gegenseitig aufheben, bis man die gewünschte Ungleichung durch eine einfache Abschätzung erhält. Diese einfachen Abschätzung sind dabei nichts anderes als die beiden Fakten $x^2 \geq 0$ und $x\geq 0 \Rightarrow cx\geq 0$ (falls $c\geq 0$). Lang gesagt und lang geschrieben: Es gilt offensichtlich
$$a(a-b) = \frac 12 (a^2 + a^2 - 2ab) = \frac 12 (a^2 + (a-b)^2 - b^2) $$ und daher gilt $a(a-b)\geq 0$, falls
$$\frac 12 (a^2 + (a-b)^2 - b^2)  \geq 0$$ und das gilt wiederum – weil wir mit $2$ multiplizieren können und weil $(a-b)^2$ nicht-negativ ist –, falls
$$a^2 - b^2 \geq 0.$$ Diese hinreichende Bedingung ist schließlich äquivalent zu unserer Voraussetzung: bringe $b^2$ nach rechts und ziehe die Wurzel, dann bleibt nur
$$|a| \geq |b|.$$
Verallgemeinerung

Die letzte Möglichkeit scheint nun nicht sehr angenehm zu sein, da hier keine kleinen Schritte zum Erfolg führen (wie das bei der ersten Möglichkeit der Fall war) und da es auch keine einfache, anschauliche Idee gibt (wie bei der zweiten Möglichkeit). Man musste vielmehr schon am Anfang wissen, was man am Ende heraushaben möchte, um den Beweisgang aufschreiben zu können.

Allerdings ist der hier aufgeführte Beweis nur das, was am Ende übrig bleibt! Befasst man sich das erste Mal mit der Beweisfindung, so hat man höchstens die Hoffnung, dass die Grundidee "Umformen und Abschätzen" zum Erfolg führt, und bastelt dann eine ganze Weile an den Argumenten, bis alles so wunderbar passt wie in der finalen Version. Also keine Angst vor scheinbar genialen Beweisen – die meisten von ihnen sind nicht Ausgeburt eines Genies, sondern das Werk von langer Arbeit und viel Erfahrung.

Damit wissen wir zumindest, warum die dritte Möglichkeit nicht per se schwieriger ist als die ersten beiden – und nun erfahren wir noch, was ihr Mehrwert ist: Sie kann ohne Mühe auf mehrere Dimensionen verallgemeinert werden, und zwar gilt für Vektoren $a$ und $b$:
$$|a| \geq |b| \quad\Longrightarrow \quad a(a-b) \geq 0.$$ Dabei bezeichnet $|x|$ die euklidische Norm des Vektors $x$, gegeben durch
$$|x|^2 = \sum_k x_k^2,$$ und das Produkt $xy$ zweier Vektoren $x$ und $y$ ist das euklidische Skalarprodukt
$$xy = \sum_k x_ky_k.$$ (Dabei läuft der Summationsindex $k$ kanonisch über alle Indices, die möglich sind. Ist also $x$ ein Vektor im drei-dimensionalen euklidischen Raum, so läuft $k$ von $1$ bis $3$, und ist $x$ eine Folge, deren euklidische Norm existiert, so läuft $k$ von $1$ bis $\infty$.)

Der Beweis verläuft nun faktisch exakt so wie eben gezeigt, indem wir wie folgt umformen:
$$2a(a-b) = 2\sum_k a_k^2 - a_kb_k = \sum_k a_k^2 + \sum_k (a_k-b_k)^2 - \sum_k b_k^2 \geq |a|^2 - |b|^2.$$ Die Schlussfolgerung ist offensichtlich und ich wünsche eine gute Nacht. :)

(Wer nicht schlafen kann, kann sich ja am Verständnis der Arbeit versuchen, in der ich diese kleine, nette Abschätzung auf Seite 4, ganz oben, gefunden habe. Viel Spaß damit.)