ラグランジュの未定乗数法の簡単な意味とイメージ

なぜこれで解けるのか?

 

ラグランジュの未定乗数法は、ある関数の最大・最小値を束縛条件のもとで求める際に用いられる手法です。ここでは、なぜこの方法で解が求まるのかを厳密ではありませんが図形的なイメージで解説します。前提としてベクトルの知識が少し必要となりますが、詳しくは言及しませんので、なくても大丈夫かも?

例として2変数関数の場合を挙げます。関数\(f(x,y)\)について、\(g(x,y)=0\)という条件のもとでの最大値を考えます。ラグランジュの未定乗数法によればこの解は、

$$L(x,y,λ)=f(x,y)-λg(x,y)$$

という新たな関数についての連立式

$$\frac{ \partial L }{ \partial x } = \frac{ \partial L }{ \partial y } = \frac{ \partial L }{ \partial λ } = 0$$

を解くことによって求まるというのです。この式を初めて見たときはそのワケが全く分かりませんでした。

まずは、上記の式の \( \frac{ \partial L }{ \partial λ } = 0 \) の部分を考えると、

$$\frac{ \partial L }{ \partial λ } = -g(x,y)=0$$

であるので、結局単に \(g(x,y)=0\) のことを言っているだけだとわかります。

問題はこちら、 \(\frac{ \partial L }{ \partial x } = \frac{ \partial L }{ \partial y } = 0\) ですが、

$$\frac{ \partial L }{ \partial x } = \frac{ \partial f }{ \partial x }-λ\frac{ \partial g }{ \partial x } = 0$$

$$\frac{ \partial L }{ \partial y } = \frac{ \partial f }{ \partial y }-λ\frac{ \partial g }{ \partial y } = 0$$

さらに変形すると、

$$\frac{ \partial f }{ \partial x }=λ\frac{ \partial g }{ \partial x }   ・  \frac{ \partial f }{ \partial y }=λ\frac{ \partial g }{ \partial y } $$

これらをベクトルを用いて表してやると、

$$( \frac{ \partial f }{ \partial x }, \frac{ \partial f }{ \partial y } )=λ( \frac{ \partial g }{ \partial x }, \frac{ \partial g }{ \partial y } ) \Rightarrow \nabla f=λ\nabla g\tag{1}$$

右辺に出てきた記号はナブラといって、ある関数に対して\(x\)で偏微分したものを第一成分に、\(y\)で偏微分したものを第二成分に・・・といった具合で、関数からベクトルを作る操作です。

ここで図形的な説明、xy平面を想像してください。平面上の各点にはその座標に対して、\(f(x,y)\)が存在しますね。この値を「高さ」と考えるならば、同じ値を持つ点は同じ高さの場所、それらを結んでやれば「等高線」のようなものを引くことになります。(上図では代表として3本の曲線を引きましたが、実際にはこのような線は無数に存在します)また、\(g(x,y)=0\)となる点を結べば、1つの曲線が出現します。

すなわち、この問題は「経路\(g(x,y)=0\)上の点で\(f(x,y)\)が最も大きな点はどこですか?」という意味になります。

さて、上図の等高線は円の内側の方が値の大きい点であるという前提で問いの答えを考えてください。答えが等高線と経路が接している点であるということがすぐにわかったでしょうか?

直感的には当たり前かもしれませんが理屈としては、最大となるのが経路と等高線が接している点でない(つまり経路と等高線が交差しているような点である)と仮定します。等高線の両側は片方がその点より高い場所(図では円の内側)と、そこよりも低い場所(円の外側)のどちらかになりますね。

経路が等高線に交差するということは、その両方の側を通過しているということになります。つまり、交差している時点でそこよりも高い点と低い点が経路上に存在してしまいます。これが最大(最小)となる点が接点でなければいけない理由です。

ここまでわかればあと一息、接点となるような点が\((1)\)を満たすことがわかればいいわけですが、これには\(\nabla f\)が曲線\(f=K\)の法線ベクトルであるという前提が必要となります。ここでは説明はしませんので、知らない場合はとりあえずそういうものなんだということで話を進めさせてください。

法線ベクトルは、その点の接線と直交する方向のベクトルです。とすれば、\((1)\)式は\(f(x,y)\)と\(g(x,y)\)の法線ベクトルが平行になっているという意味になります。図の接点から伸びている矢印がそれらを表しており、2つの法線ベクトルが平行になっていることがわかります。つまり、「接線が平行」⇒「法線が平行」ということです。

まとめると、ラグランジュの未定乗数法から導かれる連立式は\(g(x,y)=0\)上の点であること、\(f(x,y)=K\)と\(g(x,y)=0\)が接する点であること、という満たすべき2つの条件を言いかえたモノだということです。そしてこのKこそが最大値(最小値)になるということになります。注意すべきはこれらがあくまで必要条件であるということで、複数の候補が導かれたときはどれが求めたい点なのかを計算する必要があります。

スポンサーリンク
google adsense



google adsense



シェアする

  • このエントリーをはてなブックマークに追加

フォローする

スポンサーリンク
google adsense