1. Statistika průměrná je

Koncept derivací jsme si v Oživlé geometrii ukázali na několika funkcích, dokonce víme, jak je vypočítat. Výpočtem derivace jsme zjistili, jak velká je míra růstu těchto funkcí. V některých případech však pro nás není důležitá pouze tato míra růstu ale i jiné míry: např. průměr funkce na určitém intervalu. Ukážeme si, jak výpočet průměru v různých situacích lze provést pomocí integrace, tím nám nám diferenciální počet poskytne mocný nástroj na řešení nejrůznějších typů úloh — průměrná výška hladiny moře za den, průměrný plat v závislosti na věku, průměrná spotřeba auta, to vše a mnohem více můžeme spočítat pomocí integrace. Nejvíce se však průměry využijí ve statistice a teorii pravděpodobnosti: k tomu na konci uvedeme krátký příklad, ale kvůli složitosti se hlouběji nepustíme.

Také si zde ukážeme, co je to určitá integrace, což budeme potřebovat později.

Průměrný výkon

Z každodenní zkušenosti víme, že když zapínáme žárovku, trvá nějaký čas, než se rozsvítí. Podobně, když startujeme auto, nebo když zapínáme různé spotřebiče, trvá různě dlouhý čas, než se zapnou a začnou správně fungovat. U každého spotřebiče nastává jiná konkrétní situace, ale všechny se dají znázornit zhruba takto:





Na obrázku vidíme závislost výkonu spotřebiče $P$ na čase $t$. Výkon je definovaný jako energie, kterou spotřebič užije za jednotku času. Vidíme tedy, že v počáteční fási výkon stoupá, pak se ale ustálí na stabilní hodnotě. Pro různé spotřebiče je stoupání výkonu různé, představme si tedy jeden konkrétní spotřebič. Vezměme třeba spotřebič, u kterého je výkon úměrný čtvrté mocnině času. V takovém případě píšeme $$P(t) = a t^4\,,$$

kde $a$ je nějaká konstanta. Ptáme se, jaký průměrný výkon spotřebič dostával, pokud jsme ho zapnuli v čase $t=0$ a do běžného provozu se dostal v čase $t=t_0$.

Čárka nad veličinami obvykle značí průměr. Někdy se též používá značení $\langle P \rangle$ pro průměr $P$, někdy také průměru říkáme střední hotnota.

Veličinu výkonu zavádíme, abychom mohli určit, kolik energie bylo předáno za nějaký čas. Pokud je výkon v čase konstantní, tak předaná energie je rovna $E=P\cdot t$. Pokud je ale výkon v čase proměnný, tak již tento vzorec použít nemůžeme. Místo něj používáme průměrný výkon $\overline{P}$. Máme-li tedy $P=P(t)$ jako funkci času, tak pomocí průměru můžeme vyjádřit celkovou předanou energii přímočaře pomocí vzorce $E = \overline{P} \cdot t$.

Obvykle se průměr využívá k tomu, že někdo chytrý průměr spočítá za nás (např. počítač), či průměr odhadneme, a pak pro výpočet celkové energie použijeme vzorec $E = \overline P \cdot t$. Průměr nám však také dává cennou informaci o průběhu děje, neboť vyjadřuje jedním údajem, jak zhruba rychle se děj odehrává. Často tedy chceme spočítat průměr a ostatní veličiny nás tolik nezajímají. V takovém případě musíme využít vzorce $\overline P = E/t$, který plyne z předchozího vzorce s průměrem.

Průměr se počítá obdobně i u jiných veličin, např. u rychlosti se jedná o celkovou vzdálenost dělenou celkovým časem.

Celková předaná energie však není nic jiného než plocha pod grafem $P(t)$. V případě spotřebiče za neměnného provozu to dává smysl, jedná se totiž o plochu obdélníku, která je rovna $P\cdot t$, což je určitě celková energie. Když se ale $P$ mění v čase, tak musíme použít myšlenek z diferenciálního počtu.

Plochu si rozdělíme na malé obdélníčky, pro které platí $E=P t$ a jejichž součet je přibližně roven součtu plochy pod grafem. Obdélníčky zmenšujeme a zvětšujeme jejich počet, čímž je náš odhad přesnější, až se v limitě dostaneme k ploše pod grafem. Stručně řečeno, plochu pod grafem lze přesně rozdělit na mnoho malých obdélníčků. Tento fakt jsme již detailně diskutovali v kapitole Oživlé geometrie, kde jsme Archimédovou metodou počítali plochu pod parabolou. Dále jsme také zjistili, že plochu pod grafem lze spočítat pomocí integrace, dostáváme tedy vzorec $$ E = \int_0^{t_0} P(t) \, \mathrm d t \,.$$

Průměrný výkon lze tedy spočítat jako $$ \overline P = \frac{\int_0^{t_0} P(t) \mathrm d t }{t_0} \,.$$

Neukázali jsme nicméně, jak integrál $E$ vypočítat bez pracného odvolávání se na nade všechny meze rostoucí počet obdélníků. Podívejme se na to, jak to lze provést pro případ $P(t) = at^4$. Při tomto výpočtu využijeme fundamentální větu diferenciálního počtu, že totiž integrace je opačná operace derivaci. Hledáme tedy primitivní funkci k $at^4$. Po chvilce přemýšlení nás napadne, že jedna taková funkce je $at^5/5$ (nebo se lze podívat do tabulky v kapitole derivační dodatek). Píšeme tedy: $$ E = \int_0^{t_0} P(t) \,\mathrm d t =\int_0^{t_0} at^4\, \mathrm d t= \left[ \frac{at^5}{5} \right]_0^{t_0} \,.$$

Primitivní funkci jsme napsali do hranatých závorek, protože ještě si nejsme jisti, jaká konkrétní primitivní funkce bude figurovat ve výsledku (koneckonců existuje nekonečno primitivních funkcí, které se liší o konstantu). Píšeme tedy: $$ E = \left[ \frac{at^5}{5} \right]_0^{t_0} = (F(t_0)+C) - (F(0)+C) = \frac{at_0^5}{5} - \frac{a\cdot0^5}{5} + C -C =\frac{at_0^5}{5} \,.$$

Zde jsme obecnou primitivní funkci k $P(t)$ označili $F(t)+ C$. Obecně primitivní funkce popisuje oblast pod křivkou $P(t)$ od nějakého bodu až do bodu $t$. Z toho, že se integrační konstanty $C$ odečtou můžeme usoudit, že na volbě začátku počítání obsahu nezáleží (tento princip lze nahlédnout už z nákresu u vysvětlení fundamentální věty diferenciálního počtu).

Pro náš příklad jsme tak konkrétně dostali: $$\overline{P} = \frac{at_0^5}{5} /t_0 = \frac{at_0^4}{5} \,, $$

což je jedna pětina výkonu v běžném provozu. Než se tedy spotřebič dostane do běžného provozu, je jeho výkon průměrně pětinový než normálně.

Vážený průměr aneb pravděpodobnost

Integrály lze také použít k popisu náhodných jevů jako např. hod šestistěnnou kostkou. Při tomto jevu můžeme dostat číslo $X$ jako jedno z celých čísel od jedné do šesti, všechna se stejnou pravděpodobností. Můžeme se však ptát, jaká bude střední hodnota, která na kostce padne. To lze vypočítat jako součet hodnoty a pravděpodobnosti této hodnoty, následovně: $$ \langle X \rangle = \sum_{i=1}^{i=6} p_i X_i = \frac{1}{6} \cdot 1 + \frac{1}{6} \cdot 2 + \frac{1}{6} \cdot 3 + \frac{1}{6} \cdot 4 + \frac{1}{6} \cdot 5 + \frac{1}{6} \cdot 6 = \frac{7}{2} \,.$$

Do střední hodnoty tedy přispěje každý možná výsledek podle toho, jak moc je pravděpodobný. V tomto případě jsou všechny pravděpodobné stejně, a tak vyjde střední hodnota tři a půl.

„Reálná kostka”

O pravděpodobnosti pro naměření jednoho konkrétního čísla bychom mohli říci, že je menší než jakákoliv jiná pravděpodobnost, tedy že jde k nule.

Můžeme tento případ trochu pozměnit, aby byl trochu složitější. Co kdybychom měli „reálnou kostku”, na které může padnout číslo $X$ od jedné do šesti, ale tentokrát nikoliv celé číslo, nýbrž reálné? Takovou kostku bychom asi nesestrojili, nicméně si můžeme představit, že náhodná čísla generuje počítačový program. Jaká bude střední hodnota tentokrát?

Soustřeďme se nejprve na pravděpodobnost, s jakou dostaneme nějaký konkrétní výsledek. Jelikož čísel mezi jedničkou a šestkou je nespočetně, tak pravděpodobnost, že dostaneme nějaké konkrétní číslo, je nulová. Oproti tomu je lepší bavit se o pravděpodobnosti, že číslo, které dostaneme, leží v určitém intervalu. Např. pravděpodobnost, že leží v intervalu $[1,\, 6]$ je $P(1,6)=100\,\%=1$. Pravděpodobnost, že leží v intervalu $[1,\, 7/2]$, je $P(1,\,7/2)=0{,}5$ protože délka intervalu je poloviční. Podobně $P(a,b) = (b-a)/5$, kde $(b-a)$ je délka studovaného intervalu a 5 je délka největšího možného intervalu.

Musíme skončit se značením $p_i$, neboť index $i$ může nabývat jen celočíselné hodnoty. Má tedy pouze spočetný počet povolených hodnot, ale my chceme vyjádřit pravděpodobnost pro nespočetně čísel!

Střední hodnotu reálné kostky zkusme spočítat podobnou sumou $p_i X_i$ jako u normální kostky. Pišme ale nyní $x$ místo $X_i$ jako nějaké možné číslo z intervalu $[1,\,6]$. Dále budeme psát místo $p_i$ symbol $p(x)$ jako pravděpodobnost, že dostaneme $x$. V předchozím případě bylo např. $p(2)=1/6$. V tomto případě můžeme zkusit spočítat tuto pravdpodobnost jako $p(2) = P(2,\,2)$. Ale to je nula! Zdá se tedy, že naměření libovolného čísla je nulová.

Tento bizarní fakt můžeme doplnit fysikální analogií: když měříme na metru délku nějakého předmětu, také zde nemůžeme naměřit jedno určité číslo, např. $l=1{,}302\,420\,022\,\mathrm{cm}$. Vždy měříme nějaký interval hodnot, který representuje nejistotu měření. A nikdy nelze mít měření bez chyb.

Shrňme to tedy tak, že na reálné kostce je pravděpodobnost, že padne libovolné číslo nulová, můžeme ale vyjádřit pravděpodobnost, že padne číslo do nějakého intervalu. Vraťme se k výpočtu střední hodnoty.

V analogii s předchozím výrazem se nám chce psát sumu. To ale nejde, poněvadž sčítáme nespočetný počet $x$ a sumou lze vyjádřit pouze spočetný počet členů. Říkáme tedy, že suma přejde v integrál: $$\sum_i X_i p_i \to \int_a^b x \, \mathrm{d} p(x) \,.$$

Je možné, že čtenářovi bude připadat, že mu na přechodu od sumy k integrálu stále něco uniká. Pro tento případ zde uvádíme citát od Johna von Neumanna: „Jeden se matematiku neučí, musí si na ni prostě zvyknout.” Kdyby se jednalo o snadno pochopitelný koncept, znamenalo by to, že v sobě obsahuje pramálo nových myšlenek.

Místo $p(x)=0$ zde píšeme $\mathrm{d}p(x)$, čímž myslíme pravděpodobnost, že číslo patří do malého intervalu (o šířce $\mathrm{d}x$) okolo $x$. To, že suma může přejít v integrál, jsme pozorovali poprvé v kapitole o Archimédovi a podruhé v této kapitole o několik odstavců výše. Jedná se o běžný myšlenkový skok v matematice a na nejjednodušší úrovni mu lze porozumět pomocí sčítání stále více stále menších a menších obdélníčků. Snad je nyní srozumitelné, proč tento přechod funguje.

Onu pravděpodobnost, že číslo náleží do nějakého intervalu $\mathrm{d} x$, vyjádříme podle úvah výše jako $\mathrm{d}p(x)=\mathrm{d} x /5$. Píšeme tedy: $$\langle X \rangle = \int_1^6 x \,\mathrm d p(x) = \int_1^6 x \, \frac{\mathrm{d} x}{5} = \frac{1}{5}\int_1^6 x ,\mathrm{d} x $$

Nyní stačí integrál vyčíslit. Opět potřebujeme zjistit primitivní funkci, která tentokrát je $x^2/2$ (zkuste si ji zderivovat). Obdržíme tak: $$\langle X \rangle = \frac{1}{5} \left[ \frac{x^2}{2} \right]_1^6 = \frac{1}{5} \left( \frac{6^2}{2} -\frac{1^2}{2} \right) = \frac{7}{2} \,. $$

To, že máme stejnou střední hodnotu jako pro normální kostku si můžeme představit tak, že za každé číslo, které přibylo napravo od $7/2$ přibylo jedno symetricky nalevo.

Dostali jsme tímto stejnou střední hodnotu jako pro případ s běžnou kostkou, což není až tolik překvapivé. Znamená to tedy, že průměrná hodnota, která na reálné kostce dostaneme, bude $7/2$, ale samotná hodnota $7/2$ zde nejspíš nepadne, protože má nulovou pravděpodobnost, že padne.

Neexistující průměr

Jsou naše výsledky o středních hodnotách k něčemu? U normální kostky nám vyšlo $7/2$, ale tohle číslo nám nikdy nemůže padnout, protože na kostce není. To samé u reálné kostky, tam nemůže padnout kvůli nulové pravděpodobnosti.

Střední hodnotu můžeme brát jako nějakou charakteristiku kostky odlišnou od jiných charakteristik jako např. možných hodnot, které na kostce padnou. Střední hodnota má navíc význam, který jsme prozkoumávali už výše u průměru: když budeme házet kostku třeba stokrát, celkový součet bude zhruba $100\cdot 7/2= 350$.



>> Další kapitola