合成関数の微分公式がなぜか、具体例で検証する

\(y\)を\(t\)の関数、\(t\)を\(x\)の関数とします。このとき合成関数を考えると\(y\)を\(x\)の関数とみなすことができます。

合成関数の微分公式は、

\(\displaystyle \frac{dy}{dx}=\frac{dy}{dt}\frac{dt}{dx}\)

で与えられるのですが、この公式、一見すると分数の公式で約分した関係が成立しているんだぐらいにしか見えません。

公式の使い方もいろいろ学んで使えるようになっても、合成関数(関数の掛け算ではない)からなぜ、分数の掛け算みたいな公式がでてきているのか、そのしくみが見通せない人もいるのではないかと思います。

微分の公式は分数のように書かれますが、

\(\displaystyle \frac{dy}{dx}=\frac{dy\cdot dt}{dt\cdot dx}\)と書かれることはありません。

なぜなら、この式の右辺にでてくる、\(dy\cdot dt\)や\(dt\cdot dx\)がなにを意味しているのかよくわからないからです。

ここでは、微分記号の使い方に慣れる事を目的とし、細かい突っ込みどころは脇において、合成関数の微分公式について説明していきます。

dx,dy,dtなどの意味
それでは合成関数の微分公式について具体例で説明

dx,dy,dtなどの意味

微分の式でよくでてくる、\(dx,dy,dt\)の記号、これがなにを示しているのか教科書を読んでも今一つすっきりしないと思います。

この記号の定義をきちんとしようとすると、かえってわかりにくくなるため、最初はこんなもんだと記号がでてくる式にたくさん触れるところから始め、徐々に理解を深めていく方法がよいです。

そうはいっても、意味深な記号です。

本によっては、\(dx\)の説明を省き、\(\frac{dy}{dx}\)の塊で説明することもあります。

それも一つの方法です。

ここでは、私流の考え方で\(dx\)について誤解を恐れずズバリ書いていきます。

\(dx\)は、変数\(x\)に関する微分です。

ズバリ言ってる割には、「教科書にかかれていることとそうかわらないじゃん！」と思うかもしれません。

それに、「微分」というのがわからないのに、「『微分』その一言で片づけるのなら、意味ないよ」と思いますよね。

まあ、そうなんですが、\(d\)の後ろについている文字に意味があるという事なのです。

\(dx\)は\(x\)に関する微分、\(dy\)は\(y\)に関する微分、つまりある変数に関する微分を\(dx\)のように表しているということです。

\(dt\)と書かれた場合は、いうまでもなく変数\(t\)に関する微分です。

微分の意味

「微分」という用語はいろいろな意味で使われています。

きちんと定義することが難しいので、ここで書かれている「微分」とは、「微小な増分」と考えて読み進んでください。

「増分」と書きましたが、増えるだけでなく、減る場合の意味も含んでいるので、「変化分」ととらえた方がより正確かもしれません。

どの用語を使ったとしても正確性はそうかわらないので、増分と書いていきますが、無限小とはニュアンスが異なります。

小さな数(無限小)というより、小さな変化なのです。

変化するということは、変化する前の状態があります。どのように変化(増加)するのかを主体に考えているため、\(dx\)と\(dy\)を区別して考える必要があるのです。

\(x\)の微小な変化を\(dx\)で表し、\(y\)の微小な変化を\(dy\)で表しています。

わざわざ変数を\(d\)の後ろに付けているのはそのためです。

dxとΔxの違い

\(dx\)の説明とあわせて、\(Δx\)という記号もよく使われます。

\(dx\)と\(Δx\)って、同じ意味じゃん？

なんでΔにしてあとで\(d\)に置き換える必要があるのか？

最初から、\(dx\)を使って書けばいいのに。

そういう疑問も多いと思います。

まあ、ズバリ、\(d\)も\(Δ\)も同じ意味で使われています。

しかし、そこを分けて書く必要があるのです。

なぜなら、\(dx\)というのがうまく定義できないから。

\(Δx\)もxの微分ですが、\(dx\)と違って\(Δx\)は実数です。

\(dx\)は実数ではないのですが、\(Δx\)はある実数(ただし0は除く)を表しています。

具体的にどんな実数を表しているとはかかれていませんが、よくわからなければ、

\(Δx\)は実数の0.001ぐらいに思っておけばよいです。

私はそうしています。普通の関数を扱っているのであれば、0.001で十分微小です。

実数にすることでなにがうれしいのかというと、演算ができるということです。

\(dx\)では演算(つまり掛けたり足したりする事\)ができないのですが、\(Δx\)にすると演算ができるようになります。

とりあえず、実数の範囲で計算できるところまで計算しておいて、最後の最後に極限を考えるというのが、いろいろな公式を証明する手法なのです。

極限を考えたときに、\(Δx\)は\(dx\)に生まれ変わります。

いつも最後に生まれ変わるパターンなので、最初から\(Δx\)の事を\(dx\)と書いていても意味は通じるはずですが、dxに関しては演算ができないため、それを正当化するために\(Δx\)を使います。

dy/dxの意味

\(\displaystyle \frac{dy}{dx}\)は、xの関数yをxで微分した関数(これを導関数という)を指しているのですが、原点に立ち返ってこの記号の意味を考えると、

\(\displaystyle \lim_{Δx→0}\frac{Δy}{Δx}\)が\(\displaystyle \frac{dy}{dx}\)です。

ここで、暗黙に、\(y\)は\(x\)の関数と考えており、\(Δy\)は\(Δx\)の関数になっていることに注意してください。

\(x\)の値がきまると、\(y\)の値がきまるように、\(Δx\)の値が決まると\(Δy\)の値が決まります。

\(Δx\)は0を除いて考えていますから、\(\frac{Δy}{Δx}\)を考える事ができ、その極限を考えることができます。

変数\(x\)が変数と考えている一方、\(Δx\)を変数と考えているときには、\(x\)はある値を指しているので、すこし混乱があるかもしれませんが、よく意味を考えるとこの記号の使い方で混乱は解消されます。

ある\(x\)が\(x+Δx\)に変化したときに、\(y\)は\(y+Δy\)に変化すると考えると、

\(Δy\)は\(Δx\)の関数と考えることができます。

それでは合成関数の微分公式について具体例で説明

具体例の方が、式のしくみがよくわかるため、あえて具体例で合成関数の微分公式を検証してみます。

具体例でのしくみがわかれば、一般の証明も難しくありません。

\(y=t^2-t\)
\(t=x^3+1\)

という例で考えます。

まず、合成関数は、\(y=t^2+t=(x^3+1)^2-(x^3+1)\)となります。

\(y=x^6+x^3\)となりますから、最初に答えを調べておくと

\(\displaystyle \frac{dy}{dx}=6x^5+3x^2\)

となるはずです。

また、
\(\displaystyle \frac{dy}{dt}=2t-1\)
\(\displaystyle \frac{dt}{dx}=3x^2\)
であることも計算しておきましょう。

\(\displaystyle \frac{dy}{dx}=\frac{dy}{dt}\frac{dt}{dx}\)

が成立していますね。公式どおりの結果になっています。

それでは、公式をつかわずに、それぞれ計算してみます。

まず、\(Δx\)を変数\(x\)の増分とします。

\(Δt,Δy\)を与えられた関係式から求めると、

\(Δt=t(x+Δx)-t(x)\\=((x+Δx)^3+1)-(x^3+1)\\=3x^2Δx+3xΔx^2\\=(3x^2+3xΔx+Δx^2)Δx\)

\(Δy=y(t+Δt)-y(t)\\=((t+Δt)^2-(t+Δt))-(t^2-t)\\=(2t-1+Δt)Δt\)

実は、関数が多項式の場合上記のように、\(Δx\)や\(Δt\)で括れます(ここがミソですね)。

実は厄介なことにΔt=0の場合もありえますが、それは特別な場合ですのでここではΔt≠0として計算していきます(Δtでの割り算を使います)。

すると、

\(\displaystyle \frac{Δt}{Δx}=3x^2+3xΔx+Δx^2\)

\(\displaystyle \frac{Δy}{Δt}=(2t-1)Δt\)

が得られます。そして、

\(\displaystyle \frac{Δy}{Δx}=\frac{Δy}{Δt}\frac{Δt}{Δx}=(2t-1)\frac{Δt}{Δx}\)

ここまで極限操作は行っていません。

実数の計算をしているだけです。

ここで、Δx→0 の時に、Δt→0であれば、

上記の式は、

\(\displaystyle \frac{dt}{dx}=3x^2\)

\(\displaystyle \frac{dy}{dt}=2t-1\)

\(\displaystyle \frac{dy}{dx}=t\frac{dt}{dx}\)

を得る事ができます。

Δx→0 の時に、Δt→0であるのは、\(t\)が\(x\)で微分可能であることから得られる条件です。

ですから\(2t-1\)の部分を、\(\displaystyle \frac{dy}{dt}\)で置き換えると、

\(\displaystyle \frac{dy}{dx}=\frac{dy}{dt}\frac{dt}{dx}\)

となっていることが分かります。

他の関数を使っていろいろと計算すると、合成関数の微分のしくみがわかってきます。

\(Δt=0\)の場合も考えるとさらに理解が深まります。

それは、まず具体例で計算して公式を実感してから考えても遅くないと思います。