全微分

偏微分の起源を簡単に紹介。

[
前の記事へ]  [解析力学の目次へ]  [次の記事へ]


 偏微分については力学のページで簡単な紹介をしただけだった。その時の説明は要するに、偏微分というのは、多変数関数の一つの変数だけに注目して行う微分であり、残りの変数についてはあたかも定数であるかのように考えてあとは普通の微分と同じように計算してやれば良いというものだった。

 偏微分は電磁気学のページでも使われてきたが、それくらいの理解で今までのところ問題はなかったと思う。

 ところがこれから先はそうも言っていられない。今後の式変形に備えて、もう少しだけ詳しく説明しておいた方がいいだろう。

 なぜわざわざ普通の微分と違う記号を使って表されているのか、それは普通の微分と何が違って、どう使い分けたら良いのか、そもそもなぜそのような中途半端に思える計算法が許されて、物理法則を記述するために使えているのか、そういうことが気になっている人もいるだろう。そのようなことも明らかにしたい。

 物理とはあまり関係のない、数学の話、いや、数学と言うほどでもない単純な論理の話である。それほど難しい話ではないから安心してほしい。


偏微分はどこから出てくるか

 多変数の関数\( f(x,y,t) \)について考える。変数\( x \)\( y \)\( t \)がそれぞれ勝手に微小量\( \Delta x \)\( \Delta y \)\( \Delta t \)だけ変化すると、それに合わせて関数\( f \)の値も変化するだろう。その変化量\( \Delta f \)は次のように表せる。
\[ \begin{align*} \Delta f \ =\ f( x + \Delta x,\ y + \Delta y,\ t + \Delta t )\ -\ f(x,y,t) \end{align*} \]
 この式は次のように変形してやることができる。
\[ \begin{align*} =\ &f( x + \Delta x,\ y + \Delta y,\ t + \Delta t ) \\ &- f( x,\ y + \Delta y,\ t + \Delta t ) + f( x,\ y + \Delta y,\ t + \Delta t ) \\ &- f( x,\ y,\ t + \Delta t ) + f( x,\ y,\ t + \Delta t ) \\ &\ \ - f(x,y,t) \end{align*} \]
 2 行目と 3 行目を勝手に付け加えただけであり、これらは前後のプラスマイナスで打ち消しあって 0 になっている。この式の改行位置を少し変えてやろう。
\[ \begin{align*} =\ \ &f( x + \Delta x,\ y + \Delta y,\ t + \Delta t ) - f( x,\ y + \Delta y,\ t + \Delta t ) \\ +\ &f( x,\ y + \Delta y,\ t + \Delta t ) - f( x,\ y,\ t + \Delta t ) \\ +\ &f( x,\ y,\ t + \Delta t ) - f(x,y,t) \end{align*} \]
 1 行目は\( x \)だけを変化させた時の\( f \)の変化を表しており、2 行目は\( y \)だけを変化させているし、3 行目は\( t \)だけを変化させている形になっている。これを次のように変形させてみよう。
\[ \begin{align*} = \ \ &\frac{ f( x + \Delta x,\ y + \Delta y,\ t + \Delta t ) - f( x,\ y + \Delta y,\ t + \Delta t ) }{\Delta x} \Delta x \\ +\ &\frac{ f( x,\ y + \Delta y,\ t + \Delta t ) - f( x,\ y,\ t + \Delta t ) }{\Delta y} \Delta y \\ +\ &\frac{ f( x,\ y,\ t + \Delta t ) - f(x,y,t) }{\Delta t} \Delta t \end{align*} \]
 この式の分数の部分は、1 変数関数の普通の微分の定義式を思い出させる。微小変化が無限小であるような極限を考えれば、ほとんど同じ形である。ここまで微小変化を\( \Delta x \)などと書いてきたが、それを意識して記号を改めよう。
\[ \begin{align*} \diff f\ =\ &\lim_{\diff x, \diff y, \diff t \rightarrow 0} \frac{ f( x + \diff x,\ y + \diff y,\ t + \diff t ) - f( x,\ y + \diff y,\ t + \diff t ) }{\diff x} \diff x \\ +\ &\lim_{\diff x, \diff y, \diff t \rightarrow 0} \frac{ f( x,\ y + \diff y,\ t + \diff t ) - f( x,\ y,\ t + \diff t ) }{\diff y} \diff y \tag{1} \\ +\ &\lim_{\diff x, \diff y, \diff t \rightarrow 0} \frac{ f( x,\ y,\ t + \diff t ) - f(x,y,t) }{\diff t} \diff t \end{align*} \]
 なぜ無限小を考える必要があるのだろうか。一つの理由は、微小変化が無限小に近づく極限で、この分数部分が一定の値に落ち着く場合に限って、その値のことを微分だとして定義しているからである。

 もう一つの理由は、多変数関数の場合、\( x \)に変化のない状態で\( y \)が変化するのと、\( x \)が変化した後の状態で\( y \)が変化するのとでは結果がわずかに違ってしまうかも知れない。しかし無限小ならば、そのような差は無視しても良い程度であろうと考えられるからだ。

 例えば、上の式の中に、

\[ \begin{align*} \lim_{\diff x, \diff y, \diff t \rightarrow 0} \frac{ f( x + \diff x,\ y + \diff y,\ t + \diff t ) - f( x,\ y + \diff y,\ t + \diff t ) }{\diff x} \end{align*} \]
という部分があるが、これは
\[ \begin{align*} \lim_{\diff x, \diff y, \diff t \rightarrow 0} \frac{ f( x + \diff x,\ y,\ t ) - f( x,\ y,\ t) }{\diff x} \end{align*} \]
と同じ値だと考えても良いだろうというわけだ。

 この形式を見て分かるように、これは他の変数を変化させないで行う微分だと考えればいい。すなわち、これが「偏微分」の理論的な出どころである。このような、\( \lim \)記号や分数を使って毎回書くのは面倒なので、これを\( \pdif{f}{x} \)などと書き表すことにしたのである。この偏微分の記号を使えば、先ほどの (1) 式は次のように簡単に表すことができる。

\[ \begin{align*} \diff f\ =\ \pdif{f}{x} \diff x\ +\ \pdif{f}{y} \diff y\ +\ \pdif{f}{t} \diff t \tag{2} \end{align*} \]
 多変数関数\( f \)の無限小変化を (2) 式のように表せるとき、この形式を「全微分」あるいは「完全微分」と呼ぶ。

 「表せるとき」と言うからには「表せないとき」もあるわけだ。関数\( f \)がその場所で不連続だったりして、\( x \)を変化させてから\( y \)を変化させるのと、\( y \)を変化させてから\( x \)を変化させるのとで結果が異なる場合などである。

 物理ではそういうケースは時々しか出て来ないので、それほど心配しなくてもいいと思う。上の議論はそういう事態を全く考慮しないで行ったのだった。


偏微分と常微分の違い

 次に、なぜ偏微分と普通の微分を区別する必要があるのかを説明しておこう。

 ここで、実は先ほどの変数\( x \)\( y \)\( t \)の関数だったとしよう。

\[ \begin{align*} f\big( x(t),\ y(t),\ t \big) \end{align*} \]
 今や、\( f \)は実質、\( t \)のみの関数だと言える状況だ。すると\( t \)が変化することで、関数\( f \)\( t \)からの直接的影響を受けるし、同時に\( x \)\( y \)も変化するのでそこからの影響も受けて変化することになる。この\( t \)の変化に対する\( f \)の変化率を求めたければ、先ほどの (2) 式の両辺を\( \diff t \)で割ってやればいい。
\[ \begin{align*} \dif{f}{t} \ =\ \pdif{f}{x} \dif{x}{t}\ +\ \pdif{f}{y} \dif{y}{t}\ +\ \pdif{f}{t} \end{align*} \]
 \( t \)\( \diff t \)だけ変化するときに関数\( f \)\( \diff f \)だけ変化する。つまり左辺は普通の微分だが、それを計算するためには右辺を実行しなくてはならず、その中に\( \pdif{f}{t} \)という偏微分が含まれている。このように、普通の微分と偏微分とは全くの別物だと言えるのである。それで、普通の微分のことを偏微分と区別するために「常微分」と呼ぶことがある。

 しかし 1 変数の関数の場合には常微分と偏微分には何の違いもない。