3. Spor o( )značení

Koncepty diferenciálního počtu, který jsme v předchozích kapitolách a v Oživlé geometrii budovali, snad dávají smysl. Pro jejich praktické využití je však třeba nejen aby dávaly smysl, ale aby bylo co nejjednodušší je používat. Potřebujeme tak vyvinout značení, algebru. Proto se vrátíme na chvíli do historie podíváme se, jak značení diferenciálního počtu pojímali dva ,,zakladatelé`` diferenciálního počtu, I. Newton a G. Leibniz.

Oba tito myslitelé se dlouho přeli, kdo z nich teorii vymyslel jako první, nicméně dle dnešního konsensu oba svou teorii vyvinuli samostatně a nezávisle. Protože však každý na teorii pracoval bez vědomí toho druhého, vyvinuli oba své vlastní značení pro stejné matematické koncepty. Značení, které používáme dnes, kombinuje prvky z obou původních.

Byť se oba tvůrci nemohli vystát, dnes můžeme být vděční za to, že vznikly dva do jisté míry nezávislé pohledy na tu samou věc. Matematické značení, které k výpočtům používáme, totiž ovlivňuje to, jak nad problematikou přemýšlíme. Pokud si zvolíme dobré značení, půjde vše hladce a elegantně, pokud naše značení obsahuje nejasnosti, či ho plně nechápeme, daleko se nedostaneme. Správné pochopení zacházení s matematickým značením a soulad tohoto značení s popisovanou realitou, to je esence algebry, kterou se zde zabýváme. A na málo místech to lze vidět tak dobře jako u tzv. řetězového pravidla, které je předmětem této kapitoly.

Složené funkce

Funkce, kterým jsme se věnovali v Oživlé geometrii, popisují vztah mezi dvěmi veličinami. Můžeme např. popsat, kolik prasat může statkář mít v závislosti na tom, jak velké vlastní pole. V běžném světě se však pouze zřídka nacházejí dva isolované jevy, které jsou spolu nějak spojeny. Spíše se pohybujeme v celé síti vzájemných vztahů. Abychom tuto síť mohli lépe popsat, použijeme složené funkce.

Složené funkce popisují vztah, kdy věc $A$ závisí na $B$ a ta závisí na $C$. Např. chceme-li zjistit, jak výdělek automobilky závisí na výši daní, stačí zjistit, jak prodej aut závisí na daních (čím menší daně, tím více lidí si bude chtít koupit auto) a následovně jak zisk společnosti závisí na počtu prodaných aut. Uveďme však ještě jasnější příklad: dejme tomu, že nějaký stát či velká společnost chce stavět nabíjecí stanice na elektromobily. Díky tzv. úsporám z rozsahu však cena za kus je tím menší, čím více se jich rozhodnou vystavět. Otázka je však, kolik budou mít k disposici peněz, protože ekonomika je nestabilní a samozřejmě všechny stanice nebudou platit najednou. Mohou tedy investovat tím více, čím větší je ekonomický růst. Můžeme se tedy ptát, kolik stanic stát vystaví v závislosti na ekonomickém růstu.

Dejme tomu, že počet vystavených elektrostanic $n$ závisí na počtu peněz, které máme k disposici, jako $$n(p) = p^2 \,,$$

kde $p$ je počet dolarů v milionech. Dále si představme, že $p$ v milionech závisí na ekonomickém růstu následovně: $$ p(r) = r^3 \cdot 100 \,,$$

kde $r$ je ekonomický růst v procentech. V tomto případě tedy závislost $n$ na $r$ bude $$n(r) = n(p(r)) = (p(r))^2= (10\, 000) r^6\,. $$

Funkce $n(r)$ je již jednoduchá funkce, poněvadž jsme do původní složené funkce $n(p(r))$ dosadili explicitní vztah $p(r)$. Můžete si říkat, proč vůbec někdy se složenými funkcemi pracujeme, a proč si vždycky prostě funkce nepřevedeme na jednoduchou funkci? Krása však spočívá v tom, že vláda může měnit funkci $p(r)$ podle toho, jak moc chce ekonomický růst přetavit do elektromobilů. Pomocí této metody může pak pozorovat, jak se vše projeví na veličině $n$. Popis pomocí složených funkcí také víc odpovídá realitě v tom, že náš svět je komplexní síť vztahů. Funkce $p(r)$ může vystupovat i v jiných složených funkcích, a tak dává smysl ji ponechat.

Řetězové pravidlo

Pro další analýzu složených funkcí se hodí spočítat jejich derivaci. Můžeme samozřejmě složené funkce vyjádřit explicitně jako jednoduché funkce a ty derivovat, ale to není vždy praktické. Druhý postup je derivovat přímo složenou funkci. Tentokrát vzorec pro výpočet derivace složené funkce rovnou prozradíme a až pak jej budeme interpretovat a vysvětlíme, proč funguje.

Jak jsme psali na začátku kapitoly, představíme zde také dvě nezávislé značení od Newtona a Leibnize, tzv. Newtonovu notaciLeibnizovu notaci. K vyjádření vzorečku začneme Newtonovou notací, ve které lze psát následující vztah: $$ (n(p(r)))' = n'(p(r)) \cdot p'(r) \,.$$

Porozumění vzorce pomocí Leibnizovy notace se může zdát nepřesné, nicméně Leibnizovo značení nese podobnosti s rigorosním matematickým důkazem našeho vztahu. Krom toho v době Leibnize a i nějakou dobu později tak rigorosní důkazy ani neexistovaly a přesto Leibniz nějak vztah pochopil.

S těmi závorkami to vypadá velice zmatečně, že? Slovně bychom tento vzorec přečetli následovně: „Derivace funkce $n$, která je funkcí $p$ závislého na $r$, je rovna derivaci funkce $n$ podle $p$ násobené derivací funkce $p$ podle $r$.” V Newtonově notaci derivaci značíme většinou čárkou. Jelikož není jasné, podle které proměnné derivujeme, je tato notace nejednoznačná. Můžeme to částečně napravit tak, že proměnnou, podle které derivujeme, napíšeme do závorky. Další náprava je, že pokud derivujeme podle času, píšeme nad derivovanou veličinu tečku takto: $\dot v$ (derivace veličiny $v$ podle času). Výsledek je však často stejně nepřehledný.

Vzorec výše vyjadřuje to, že změna složené funkce je součin změn obou funkcí, avšak zdá se, že spadl z nebe a nestojí za ním žádné opodstatnění. K  lepšímu spatření vnitřních souvislostí bychom obyčejně museli vzorec formulovat přesněji a matematicky dokázat proč (a za jakých podmínek) platí. V tomto případě však hlubší porozumění může poskytnout i změna našeho značení: stačí místo Newtonova použít Leibnizovo. Leibnizova notace se liší tím, že v ní můžeme psát: $$ f'(x) = \frac{\mathrm{d} f(x)}{\mathrm{d} x} \leftrightsquigarrow \frac{\Delta y}{\Delta x}\,.$$

V tomto vzorci motivovaném definicí derivace jako limity podílu vidíme jasně smysl derivace. Jak jistě víme, zlomky můžeme rozšiřovat, neboli násobit jedničkou ve vhodném tvaru. Pro derivaci složené funkce tedy píšeme: $$\begin{align*} \frac{\mathrm d n(p(r))}{\mathrm d r} = \frac{\mathrm d n(p(r))}{\mathrm d r} \frac{\mathrm d p}{\mathrm d p }\\ \frac{\mathrm d n(p(r))}{\mathrm d r} = \frac{\mathrm d n(p)}{\mathrm d p} \cdot \frac{\mathrm d p(r)}{\mathrm d r }\,. \end{align*}$$

V přechodu na druhý řádek jsme sugestivně dopsali $\cdot$, zaměnili jsme $\mathrm d p$ a $\mathrm d r$ díky komutativitě násobení a také jsme místy psali a místy nepsali, která veličina je funkce čeho (např. jestli $p$ je funkce $r$ jako $p(r)$ nebo ne). Dostali jsme nakonec vzorec, kterému se říká řetězové pravidlo (chain rule, Kettenregel). Svůj název má proto, že jednotlivé členy jsou spolu spojeny jako články řetězu.

Potom, co jsme ukázali, jak na vzorec pro derivaci složené funkce lze dojít pomocí Leibnizovy notace, je snad již vidět, jak a proč změnu složené funkce lze rozložit na součin dvou funkcí.

Diferenciály

Možná se ptáte, jestli výše uvedená úprava a zacházení s veličinami $\mathrm d p$ byla vskutku opodstatněná. Vskutku, význam infinitesimálních veličin jako např. $\mathrm d p$ jsme nikde, ani v Oživlé geomtrii, nedefinovali, definovaná je pouze derivace $\frac{\mathrm d}{\mathrm d x}$. Proto ani nedává matematicky smysl jmenovatele zlomků prohazovat. Ukazuje se však, že vzorec, který prohazováním obdržíme, platí, a přemýšlení o derivaci jako o zlomku je pohodlné. Pokusme se tedy matematický smysl výrazům jako $\mathrm d x$ dát.

Nejlepší metoda, jak si něco podmanit, je to pojmenovat. Říkejme tedy od teď, že veličiny ve tvaru $\mathrm d x$ jsou diferenciály. Diferenciál můžeme vnímat jako infinitesimální (nekonečně malý) přírůstek této veličiny, třeba $\mathrm d V$ může být infinitesimální přítok objemu. Když se dva diferenciály vydělí, dostaneme, že: $$ \frac{\mathrm{d}y}{\mathrm d x} \equiv y(x)' \,.$$

Dostali jsme stejný znak pro derivaci, proto budeme předpokládat, že jsme dostali derivaci. Jiný důvod pro podepření našeho přesvědčení může být to, že když jsme derivaci v Oživlé geometrii zaváděli, říkali jsme, že je dobré o ní přemýšlet jako o $\frac{\Delta y}{\Delta x}$, tady máme podobný výraz, akorát místo $\Delta$ používáme $\mathrm{d}$.

Pokud diferenciálům věříme, tak nám dodávají dobrou intuici, vidíme např., že $$ \frac{\mathrm d x}{\mathrm d y} = \left( \frac{\mathrm d y}{\mathrm d x} \right)^{-1} \,.$$

Neboli derivace inversní funkce je rovna jedna lomeno derivaci původní funkce. Tento vzoreček vskutku za nějakých podmínek platí. Náš „postup” však nelze považovat za důkaz, ani za náznak důkazu, vzhledem k tomu, jak narychlo jsme diferenciály popsali.

Další identita, kterou diferenciály naznačují je: $$\begin{align*} \frac{\frac{\mathrm{d} y}{\mathrm{d}x} }{\frac{\mathrm{d} z}{\mathrm{d}x}} = \frac{\mathrm{d}y}{\mathrm{d}z} \,. \end{align*}$$

Identita by měla platit, pokud celý zlomek „rozšíříme” $\mathrm{d}x$. Opět to není důkaz, ale můžeme se spolehnout na to, že většinou funguje.

Taky můžeme diferenciály integrovat: $$ \mathrm d x \Rightarrow \int_0^x \mathrm d x = x \,,$$

Neboli přidání znaku integrálu je úprava, jakou bychom mohli provést např. v rovnici.

Postavení diferenciálů v diferenciálním počtu

Je možné teorii diferenciálního počtu vybudovat tak, že již od začátku začneme mluvit o diferenciálech. Jedná se však o příliš zdlouhavý postup a v učebnicích není běžný. Matematicky správná teorie se jednodušeji buduje pomocí konceptů jako limita, které jsme se snažili načrtnout v naší sérii. Popularita diferenciálů spočívá v jejich hojnému užití ve fysice. Vzhledem k tomu, že fysikové bývají dobře seznámeni s problémem, se kterým pracují, ještě před tím, než ho začnou řešit, nemusí se tolik zajímat o matematickou přesnost. Diferenciály tak pro ně jsou intuitivnější pomůcka, a pokud náhodou narazí na špatný výsledek, dokáží ho identifikovat pomocí jiných pravidel.

Oživlá geometri je psána pro všechny zájemce o diferenciální počet, nehledě na to, jestli jsou to fysikové či ne. Proto je volen postup, který alespoň zhruba odpovídá dobrým matematickým zvykům a zároveň dává intuitivní smysl. O diferenciálech mluvíme teprve teď, neboť se jedná o rozšířenou pomůcku, která nicméně v našem pojetí postrádá patřičnou matematickou konsistenci. V dalším budeme uvádět příklady vždy řešení pomocí obojí notace. Leibnizovy notace se tedy držte, pokud máte s diferenciálním počtem již nějakou zkušenost, či o ni máte zájem. Newtonova notace je podle nás konsistentnější a matematicky přesnější metodou řešení problémů.

Chyba odhadu a derivace

Když jsme si představili řetězové pravidlo, můžeme se podívat na místo jeho užití: teorii nejistot (či chyb) měření. Totiž, dejme tomu, že v našem případě se státem, který chce stavět elektrostanice, bychom analýsu chtěli brát trochu vážněji. Pak bychom měli být trochu připraveni na to, že náš odhad nebude stoprocentně přesný. Počet elektrostanic za určité peníze je daný pevně v ceníku společnosti, u které nakupujeme, takže $n(p)$ je fixní funkce. Na druhou stranu není jisté, že ekonomický růst $r$ dokážeme určit přesně. Jestliže jej určíme s chybou, bude nepřesné i $p$, a tedy i naše odhadnuté $n$. Jak se ale nejistota určení $r$ rozšíří do nejistoty $n$?

Odpověď nalezneme v derivaci: derivace totiž značí změnu. Tedy čím větší je derivace, tím rychleji reaguje funkce na změnu vstupního parametru. Změnu, která může být způsobena nejistotou vstupního parametru...

Slovem nejistota značíme odhad maximální chyby této veličiny. Chybu veličiny totiž nikdy neznáme přesně: kdybychom ji znali přesně, šlo by zpětně spočítat hodnotu veličiny.

Pro každou veličinu $r$ tak budeme značit nejistotu této veličiny jako $\Delta r$. Tj. např. u ekonomického růstu $r=5\,\%$ můžeme mít nejistotu např. $\Delta r = 0{,}5\,\%$. Otázkou je, jak lze při nejistotě $\Delta r$ vypočítat nejistotu $\Delta n$, neboť $n$ závisí na $r$.

Odpověď není těžká, nejistotu totiž spočteme jako $|n( p(r+\Delta r)) - n(p(r))|$. Můžeme dále tento výraz odhadnout pomocí derivace následovně: $$\begin{align*} |n( p(r+\Delta r)) - n(p(r))| &\doteq | \left( n( p(r)) + \Delta r \cdot (n( p(r)))' \right) - n(p(r))|\\ |n( p(r+\Delta r)) - n(p(r))| &\doteq | \Delta r \cdot (n( p(r)))'| = | \Delta r |\cdot |(n( p(r)))'| \,. \end{align*}$$

Obecně jsme dostali to, že nejistota nějaké funkce je derivace funkce násobená nejistotou vstupního parametru funkce (argumentu). Pojďme tedy vypočítat, jaká je nejistota $n$ pro $r=1\,\%$ a $\Delta r = 0{,}5\,\%$.

Prvně pro pořádek vidíme, že $n(p(1\,\%)) = 10\,000$. Dále si spočítejme derivaci $n(p(r))$ podle $r$: $$\begin{align*} \frac{\mathrm d n(p(r))}{\mathrm d r} = \frac{\mathrm d n(p)}{\mathrm d p} \cdot \frac{\mathrm d p(r)}{\mathrm d r } = (2p(r))\cdot (3r^2\cdot 100) = (2 \cdot r^3\cdot 100)\cdot (3r^2\cdot 100) = 6r^5 \cdot 10\,000 \,. \end{align*}$$

Pro výpočet jednotlivých derivací jsme použili pravidlo derivace mocninné funkce, které můžeme též naleznout v tabulce derivací v derivačním dodatku. Pro náš konkrétní případ dostáváme nejistotu $\Delta n = 1875 \doteq 2\,000$. To je skoro jedna pětina odhadnutých stanic. Vidíme tedy, že s našimi daty se těžko můžeme připravit na budoucnost, stát by měl situaci prozkoumat lépe.

Výpočty chyby měření se krom výše zmíněného příkladu používají hlavně v jakémkoliv měřícím přístroji, který máme k disposici. Dříve to byla hlavně doména fyziků, kteří si stavěli své experimenty a potřebovali vědět, jak přesné jsou. Dnes jsme však obklopeni různými čidly, která by nedávala smysluplné hodnoty, pokud bychom nevěděli jejich nejistotu. Např. u telefonu, který přijímá signál, je potřeba znát nejistotu, abychom věděli, zda je spojení spolehlivé.

Derivace součinu

Na závěr představíme ještě jedno užitečné pravidlo na zacházení s derivacemi. Již by to chtělo se dostat k nějakým zajímavým aplikacím derivace, nicméně bez patřičné výbavy to nepůjde. Bez dalšího meškání tedy představíme pravidlo popisující derivaci součinu dvou funkcí, $f(x)$ a $g(x)$. Pomocí Newtonovy notace ho zapíšeme následovně: $$\begin{align*} (f(x)g(x)) ' = f'(x) g(x) + f(x) g'(x) \,. \end{align*}$$

Dá se lze vypozorovat symetrie vůči záměně $f(x)$ a $g(x)$, což je jistě žádoucí. Dále si povšimněme, že výsledná derivace závisí na $f'(x)$ i na $g'(x)$, a to sice lineárně. Pro odvození pravidla si budeme muset vzpomenout na definici derivace. Tuto si rozepíšeme za použití častého triku v důkazech matematické analýzy: přičteme a odečteme vhodný člen. Pak stačí vše jen přeuspořádat. Výsledný postup je shrnut zde:

$$\begin{align*} &\frac{\mathrm{d} (f(x) g(x))}{\mathrm{d}x} = \lim_{h\to 0} \frac{ f(x+ h) g(x +h) - f(x) g(x)}{h} \\&= \lim_{h\to 0} \frac{ f(x+ h) g(x +h) - f(x) g(x) + f(x+h)g(x) - f(x+h)g(x)}{h} \\ &= \lim_{h\to 0} \frac{ f(x+ h) g(x +h) - f(x+h)g(x) + f(x+h)g(x) - f(x) g(x) }{h} \\ &= \lim_{h\to 0} f(x+ h)\frac{ g(x +h) - g(x)}{h} + g(x)\frac{f(x+h) - f(x)}{h}\\ &= \frac{\mathrm{d} g(x)}{\mathrm{d}x} g(x) + f(x)\frac{\mathrm{d} g(x)}{\mathrm{d}x} \,. \end{align*}$$

Nedělejte si starosti, pokud vám přijde důkaz moc složitý, či máte problémy jej udržet v hlavě. Znovu připomínáme, že spíše než o důkaz se jedná o úkaz — o rigorosní matematické porozumění se zde nesnažíme a není to ani potřeba.



<< Předchozí kapitola >> Další kapitola