2次形式から曲面の曲率まで - 現実と数学の区別が付かない

今日の目的は次の定理を証明することです．

$A, B$ を実対称行列とし，2つの2次形式 \begin{align} \boldsymbol{x}^\mathsf{T} A \boldsymbol{x},~~\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}\end{align} で $\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}$ は正定値であるものを考える．

束縛条件 $\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}=1$ のもとでの $\boldsymbol{x}^\mathsf{T} A \boldsymbol{x}$ の最大値と最小値はそれぞれ $B^{-1}A$ の最大固有値と最小固有値である．

また， $\dfrac{\boldsymbol{x}^\mathsf{T} A \boldsymbol{x}}{\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}}~~(\boldsymbol{x}\neq \boldsymbol{0})$ の最大値と最小値もそれぞれ $B^{-1}A$ の最大固有値と最小固有値である．

この応用として，曲面のガウス曲率・平均曲率の公式を導出します．これら曲率の一応の定義はしますが細かい説明はしないので，定義の意味などはちゃんとした微分幾何の教科書を参考にして下さい．

対称行列と2次形式

第 $i$ 成分だけ $1$ で残りの要素は $0$ であるベクトルを $\boldsymbol{e}_i\in \mathbb{R}^n$ で表す．ベクトル $\boldsymbol{u},~\boldsymbol{v}\in \mathbb{R}^3$ の標準内積を $\boldsymbol{u}\cdot \boldsymbol{v}$ で，外積を $\boldsymbol{u}\times \boldsymbol{v}\in \mathbb{R}^3$ で表す．

対称行列

行列 $M$ の転置を $M^\mathsf{T}$ で表す． $n$ 次正方行列 $A$ が $A=A^\mathsf{T}$ を満たすとき，対称行列と呼ぶ． $n$ 次正方行列 $P$ が $P^\mathsf{T}= P^{-1}$ を満たすとき，直交行列と呼ぶ．実対称行列 $A$ の固有値は全て実数であり， $A$ は直交行列 $P$ で対角化できることが知られている;\begin{align}P^\mathsf{T}AP=\mathrm{diag}(\lambda_1,\dots,\lambda_n)\end{align}

2次形式

$\boldsymbol{x}=(x_1,\dots,x_n)^\mathsf{T}$ を変数を要素とするベクトルとする． $\boldsymbol{x}$ に関する実係数の2次斉次多項式を2次形式と呼ぶ．2次形式はある実対称行列 $A$ により\begin{align} \boldsymbol{x}^\mathsf{T} A \boldsymbol{x}\end{align} と書ける．

$A$ が直交行列 $P$ で $P^\mathsf{T}AP=\mathrm{diag}(\lambda_1,\dots,\lambda_n)$ と対角化されているとき， $A=P~\mathrm{diag}(\lambda_1,\dots,\lambda_n)P^\mathsf{T}$ なので， $\boldsymbol{y}=P^\mathsf{T}\boldsymbol{x} (\Leftrightarrow \boldsymbol{x}=P\boldsymbol{y})$ と変数変換すると\begin{align}\boldsymbol{x}^\mathsf{T} A \boldsymbol{x}=\boldsymbol{y}^\mathsf{T}P^\mathsf{T} A P\boldsymbol{y} =\boldsymbol{y}^\mathsf{T}\mathrm{diag}(\lambda_1,\dots,\lambda_n)\boldsymbol{y}=\sum_{i=1}^n \lambda_i y_i^2 \end{align} となる．

任意の $\boldsymbol{x}\neq \boldsymbol{0}$ に対し $\boldsymbol{x}^\mathsf{T} A \boldsymbol{x}>0$ となるとき，2次形式 $\boldsymbol{x}^\mathsf{T} A \boldsymbol{x}$ は正定値であるという．これは $A$ の固有値 $\lambda_1,\dots,\lambda_n$ が全て正であることと同値である．

2次形式の条件付極値

2つの2次形式 \begin{align} \boldsymbol{x}^\mathsf{T} A \boldsymbol{x},~~\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}\end{align} で $\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}$ は正定値であるものを考える．

束縛条件 $\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}=1$ のもとで $\boldsymbol{x}^\mathsf{T} A \boldsymbol{x}$ の最大値と最小値をラグランジュの未定乗数法を使って求める． $\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}$ は正定値なので $\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}=1$ を満たす $\boldsymbol{x}$ 全体はコンパクト集合で，最大値と最小値が存在することに注意する．

ラグランジュの未定乗数法 - Wikipedia

ラグランジュの未定乗数法
縛条件 $g(\boldsymbol{x})=0$ のもとで $f(\boldsymbol{x})$ の極値を与える $\boldsymbol{x}$ の値は，ある $\lambda$ に対する \begin{align} \mathrm{grad}f(\boldsymbol{x})=\lambda~ \mathrm{grad}g(\boldsymbol{x}),~g(\boldsymbol{x})=0\end{align} の解であるか， $g(\boldsymbol{x})=0$ の特異点，つまり \begin{align}\mathrm{grad}g(\boldsymbol{x})=\boldsymbol{0}, ~g(\boldsymbol{x})=0\end{align} の解であるかのいずれかである．

ここで $\mathrm{grad}f(\boldsymbol{x})=\left(\dfrac{\partial f(\boldsymbol{x})}{\partial x_1},\dots,\dfrac{\partial f(\boldsymbol{x})}{\partial x_n}\right)^\mathsf{T}$ は $f(\boldsymbol{x})$ の勾配である．

$\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}=1$ は非特異なので，束縛条件 $\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}=1$ のもとで $\boldsymbol{x}^\mathsf{T} A \boldsymbol{x}$ の極値を与える $\boldsymbol{x}$ の値は，ある $\lambda$ に対する \begin{align} \mathrm{grad}(\boldsymbol{x}^\mathsf{T} A \boldsymbol{x})=\lambda~ \mathrm{grad}(\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}-1),~\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}=1 \end{align} の解である．

$A$ は対称行列だったので \begin{align}\dfrac{\partial \left(\boldsymbol{x}^\mathsf{T} A\boldsymbol{x}\right)}{\partial x_i}=\boldsymbol{e}^\mathsf{T}_iA\boldsymbol{x}+\boldsymbol{x}^\mathsf{T}A\boldsymbol{e}_i=2\left(\boldsymbol{e}^\mathsf{T}_iA\boldsymbol{x}\right)\end{align} より \begin{align}\mathrm{grad}\left(\boldsymbol{x}^\mathsf{T} A\boldsymbol{x}\right)
=2\left(\boldsymbol{e}^\mathsf{T}_1A\boldsymbol{x},\dots,\boldsymbol{e}^\mathsf{T}_nA\boldsymbol{x}\right)^\mathsf{T}=2A\boldsymbol{x}
\end{align} であり，同様に \begin{align}\mathrm{grad}(\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}-1)=\mathrm{grad}(\boldsymbol{x}^\mathsf{T} B \boldsymbol{x})=2B\boldsymbol{x}
\end{align} となる．よって $\mathrm{grad}(\boldsymbol{x}^\mathsf{T} A \boldsymbol{x})=\lambda~ \mathrm{grad}(\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}-1),~\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}=1$ は \begin{align} &A\boldsymbol{x}=\lambda B\boldsymbol{x}, ~\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}=1\\
\Leftrightarrow~~ & B^{-1}A\boldsymbol{x}=\lambda\boldsymbol{x}, ~\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}=1\end{align} と変形できる．これは $\lambda,~\boldsymbol{x}$ が $B^{-1}A$ の固有値とその固有ベクトルであることを表している．

また，この条件式が成り立っているとき，\begin{align}\boldsymbol{x}^\mathsf{T}A\boldsymbol{x}=\boldsymbol{x}^\mathsf{T}(\lambda B)\boldsymbol{x}=\lambda \boldsymbol{x}^\mathsf{T} B \boldsymbol{x}=\lambda \end{align} となる．

以上より次の定理を得る．

この定理の系として次が成り立つ．

$\dfrac{\boldsymbol{x}^\mathsf{T} A \boldsymbol{x}}{\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}}~~(\boldsymbol{x}\neq \boldsymbol{0})$ の最大値と最小値はそれぞれ $B^{-1}A$ の最大固有値と最小固有値である．

（証明） \begin{align}\left\{\dfrac{\boldsymbol{x}^\mathsf{T} A \boldsymbol{x}}{\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}} ~\middle|~ \boldsymbol{x}\neq \boldsymbol{0}\right\}=\left\{\boldsymbol{x}^\mathsf{T} A \boldsymbol{x} \mid \boldsymbol{x}^\mathsf{T} B \boldsymbol{x}=1\right\}\end{align} が成り立つ．(左辺)⊃(右辺) は自明で，逆の包含は $k=\frac{1}{\sqrt{\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}}}$ とすると $(k\boldsymbol{x})^\mathsf{T} B (k\boldsymbol{x})=1,~\dfrac{(k\boldsymbol{x})^\mathsf{T} A (k\boldsymbol{x})}{(k\boldsymbol{x})^\mathsf{T} B (k\boldsymbol{x})}=\dfrac{k^2\boldsymbol{x}^\mathsf{T} A \boldsymbol{x}}{k^2 \boldsymbol{x}^\mathsf{T} B \boldsymbol{x}}=\dfrac{\boldsymbol{x}^\mathsf{T} A \boldsymbol{x}}{\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}}$ となることから従う．
よって $\dfrac{\boldsymbol{x}^\mathsf{T} A \boldsymbol{x}}{\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}}~~(\boldsymbol{x}\neq \boldsymbol{0})$ の最大値と最小値はそれぞれ，束縛条件 $\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}=1$ のもとでの $\boldsymbol{x}^\mathsf{T} A \boldsymbol{x}$ の最大値と最小値と一致する．（証明終）

曲面のガウス曲率・平均曲率

簡単のため以降出てくる関数は $C^\infty$ 級とする．

曲面

$D$ を $uv$ -平面の領域とし，曲面 \begin{align} \boldsymbol{p}(u,v)=\left(\begin{array}{c} x(u,v)\\y(u,v)\\z(u,v) \end{array}\right),~~(u,v)\in D \end{align} を考える．

曲面の各点で接ベクトル $\boldsymbol{p}_u=\dfrac{\partial \boldsymbol{p}}{\partial u},~\boldsymbol{p}_v= \dfrac{\partial \boldsymbol{p}}{\partial v}$ は1次独立であるとする．このとき，曲面の単位法線ベクトル $\boldsymbol{n}$ はベクトルの外積を用いて\begin{align}\boldsymbol{n}=\dfrac{\boldsymbol{p}_u\times \boldsymbol{p}_v}{\left|\boldsymbol{p}_u\times \boldsymbol{p}_v\right|}\end{align}で与えられる．

曲面上の曲線

$(u_0,v_0)\in D$ を固定し $(x_0,y_0,z_0)=\boldsymbol{p}(u_0,v_0)$ とする．
$\varepsilon>0$ とし， $t=0$ のときに $(u_0,v_0)$ を通る $uv$ -平面上の曲線 \begin{align} c(t)=\left(\begin{array}{c} u(t)\\v(t)\end{array}\right),~~-\varepsilon\le t \le \varepsilon, \end{align} と $\boldsymbol{p}$ を合成すると， $t=0$ のときに $(x_0,y_0,z_0)$ を通る空間曲線 \begin{align} (\boldsymbol{p}\circ c)(t)=\boldsymbol{p}(u(t),v(t))=\left(\begin{array}{c} x(u(t),v(t))\\y(u(t),v(t))\\z(u(t),v(t)) \end{array}\right) ,~~-\varepsilon \le t \le \varepsilon,\end{align} が得られる．これが非特異，すなわち任意の $-\varepsilon \le t \le\varepsilon$ に対し $\dfrac{d (\boldsymbol{p}\circ c)}{dt}(t)\neq 0$ となる $c(t)$ のみを考える．

時間パラメータ・弧長パラメータ

弧長関数 $s(t)$ を\begin{align}s(t)=\int_{0}^t \left|\dfrac{d(\boldsymbol{p}\circ c)(t)}{dt}\right|dt \end{align}で定義し， $\ell_1 =s(-\varepsilon), \ell_2=s(\varepsilon)$ とおく ( $t=0$ のとき $s=0$ となるように積分の始点を $0$ に設定した)．微分が正 $\dfrac{ds(t)}{dt}= \left|\dfrac{d(\boldsymbol{p}\circ c)(t)}{dt}\right|>0$ より弧長関数は狭義単調増加関数になるので，逆関数 $t(s),~\ell_1\le s\le \ell_2,$ を持つ．

$\gamma(s):=(\boldsymbol{p}\circ c \circ t)(s)$ を弧長パラメータ表示と呼び， $(\boldsymbol{p}\circ c)(t)$ を時間パラメータ表示と呼ぶことにする．これらは同一の空間曲線を異なるパラメータ付けで表したものになっている．

少ししつこく説明しておくと，時間パラメータ表示 $(\boldsymbol{p}\circ c)(t)$ に $t=t(s)$ を代入することで弧長パラメータ表示 $\gamma(s)=(\boldsymbol{p}\circ c \circ t)(s)$ が得られ，逆に弧長パラメータ表示 $\gamma(s)$ に $s=s(t)$ を代入することで，時間パラメータ表示 $(\gamma\circ s)(t)=(\boldsymbol{p}\circ c)(t)$ が得られる．

また，定義より $\dfrac{ds}{dt}=\dfrac{ds(t)}{dt}= \left|\dfrac{d(\boldsymbol{p}\circ c)(t)}{dt}\right|$ であり，逆関数の微分の公式により $\dfrac{dt}{ds}=\dfrac{dt(s)}{ds}=\left(\dfrac{ds}{dt}\right)^{-1}= \left|\dfrac{d(\boldsymbol{p}\circ c)(t)}{dt}\right|^{-1}$ である．

法曲率・ガウス曲率・平均曲率の定義

弧長パラメータ表示のときは「速さ」が \begin{align}\left|\dfrac{d\gamma(s)}{ds}\right|=\left|\dfrac{d(\boldsymbol{p}\circ c)(t)}{dt} \cdot \dfrac{dt}{ds}\right|=\left|\dfrac{ds}{dt}\cdot \dfrac{dt}{ds} \right|=1\end{align} で一定である．\begin{align}\dfrac{d\gamma(s)}{ds}\cdot \dfrac{d\gamma(s)}{ds}=\left|\dfrac{d\gamma(s)}{ds}\right|^2=1\end{align} なので両辺 $s$ で微分することで $\dfrac{d\gamma(s)}{ds}\cdot \dfrac{d^2\gamma(s)}{ds^2}+\dfrac{d^2\gamma(s)}{ds^2}\cdot\dfrac{d\gamma(s)}{ds}=0$ より $\dfrac{d\gamma(s)}{ds}\cdot \dfrac{d^2\gamma(s)}{ds^2}=0$ である．つまり $\dfrac{d^2\gamma(s)}{ds^2}$ は $\dfrac{d\gamma(s)}{ds}$ と直交する．

$\dfrac{d^2\gamma(s)}{ds^2}$ の単位法線ベクトル成分 $\dfrac{d^2\gamma(s)}{ds^2}\cdot \boldsymbol{n}$ の $s=0$ での値を空間曲線 $\gamma(s)$ の点 $(x_0,y_0,z_0)$ における法曲率 と呼ぶ．

$t=0$ のときに $(u_0,v_0)$ を通る曲線 $c(t)$ をいろいろ取り換えると，法曲率も様々な値を取る．法曲率の取りうる値の最大値 $\kappa_1$ と最小値 $\kappa_2$ をこの曲面の点 $(x_0,y_0,z_0)$ における主曲率と呼ぶ．また，積 $K:=\kappa_1\kappa_2$ をガウス曲率，平均 $H:=\dfrac{ \kappa_1+\kappa_2}{2}$ を平均曲率と呼ぶ．

第1基本量

$\left(\dfrac{ds(t)}{dt}\right)^2$ を計算する． \begin{align} \left(\dfrac{ds(t)}{dt}\right)^2 =& \left|\dfrac{d(\boldsymbol{p}(u(t),v(t))}{dt}\right|^2 \\=&\left| \boldsymbol{p}_u(u(t),v(t))\dfrac{du(t)}{dt}+\boldsymbol{p}_v(u(t),v(t))\dfrac{dv(t)}{dt}\right|^2 \\=&|\boldsymbol{p}_u(u(t),v(t))|^2 \left(\dfrac{du(t)}{dt}\right)^2 \\&+2\boldsymbol{p}_u(u(t),v(t)) \cdot \boldsymbol{p}_v(u(t),v(t))\dfrac{du(t)}{dt}\dfrac{dv(t)}{dt}\\&+|\boldsymbol{p}_v(u(t),v(t))|^2 \left(\dfrac{dv(t)}{dt}\right)^2 \end{align} ここで $E(u,v)=|\boldsymbol{p}_u|^2,~ F(u,v)=\boldsymbol{p}_u \cdot \boldsymbol{p}_v,~G(u,v)=|\boldsymbol{p}_v|^2$ を第1基本量と呼ぶ．これを用いると $\left(\dfrac{ds(t)}{dt}\right)^2$ は\begin{align} E(u(t),v(t)) \left(\dfrac{du(t)}{dt}\right)^2+2F(u(t),v(t))\dfrac{du(t)}{dt}\dfrac{dv(t)}{dt}+G(u(t),v(t))\left(\dfrac{dv(t)}{dt}\right)^2\end{align}となる．

第2基本量

$\gamma(s)=(\boldsymbol{p}\circ c \circ t)(s)=\boldsymbol{p}(u(t(s)),v(t(s)))$ を用いて法曲率 $\dfrac{d^2\gamma(s)}{ds^2}\cdot \boldsymbol{n}$ を計算する．記号が複雑になるので関数の変数を省略した形で書く． \begin{align}\dfrac{d\gamma(s)}{ds}&=\boldsymbol{p}_u \dfrac{du}{dt}\dfrac{dt}{ds} +\boldsymbol{p}_v \dfrac{dv}{dt}\dfrac{dt}{ds}=\left(\boldsymbol{p}_u \dfrac{du}{dt} +\boldsymbol{p}_v \dfrac{dv}{dt}\right)\dfrac{dt}{ds} \\
\dfrac{d^2\gamma(s)}{ds^2}&=\left(\boldsymbol{p}_{uu} \left(\dfrac{du}{dt}\right)^2 +2\boldsymbol{p}_{uv}\dfrac{du}{dt}\dfrac{dv}{dt}+\boldsymbol{p}_{vv} \left(\dfrac{dv}{dt}\right)^2\right)\left(\dfrac{dt}{ds}\right)^2+\mbox{($\boldsymbol{p}_u$ と $\boldsymbol{p}_v$ の一次結合)} \end{align} となる． $\boldsymbol{p}_u,~\boldsymbol{p}_v$ と $\boldsymbol{n}$ は直交するので法曲率は \begin{align}\dfrac{d^2\gamma(s)}{ds^2}\cdot \boldsymbol{n}=\left(\boldsymbol{p}_{uu}\cdot \boldsymbol{n} \left(\dfrac{du}{dt}\right)^2 +2\boldsymbol{p}_{uv}\cdot \boldsymbol{n}\dfrac{du}{dt}\dfrac{dv}{dt}+\boldsymbol{p}_{vv}\cdot \boldsymbol{n} \left(\dfrac{dv}{dt}\right)^2\right)\left(\dfrac{dt}{ds}\right)^2 \end{align} となる．ここで $L(u,v)=\boldsymbol{p}_{uu}\cdot \boldsymbol{n},~M(u,v)=\boldsymbol{p}_{uv}\cdot \boldsymbol{n},~ N(u,v)=\boldsymbol{p}_{vv}\cdot \boldsymbol{n}$ を第2基本量と呼ぶ．

ガウス曲率・平均曲率の公式

法曲率を第1基本量と第2基本量で表すと \begin{align}&\left(L \left(\dfrac{du}{dt}\right)^2 +2M\dfrac{du}{dt}\dfrac{dv}{dt}+N\left(\dfrac{dv}{dt}\right)^2\right)\left(\dfrac{dt}{ds}\right)^2 \\
&=\dfrac{L \left(\dfrac{du}{dt}\right)^2 +2M\dfrac{du}{dt}\dfrac{dv}{dt}+N\left(\dfrac{dv}{dt}\right)^2}{\left(\dfrac{ds}{dt}\right)^2}\\
&=\dfrac{L \left(\dfrac{du}{dt}\right)^2 +2M\dfrac{du}{dt}\dfrac{dv}{dt}+N\left(\dfrac{dv}{dt}\right)^2}{E \left(\dfrac{du}{dt}\right)^2 +2F\dfrac{du}{dt}\dfrac{dv}{dt}+G\left(\dfrac{dv}{dt}\right)^2}\end{align} となる．この $t=0$ での値が曲面上の点 $(x_0,y_0,z_0)$ における法曲率であった．第1基本量と第2基本量の $t=0$ での値は曲線 $c(t)$ の取り方に依らないので，点 $(x_0,y_0,z_0)$ における法曲率は $\dfrac{dc}{dt}(0)=\left(\dfrac{dv}{dt}(0),\dfrac{du}{dt}(0)\right)^\mathsf{T}$ で決まる．

$\alpha=\dfrac{dv}{dt}(0),~\beta=\dfrac{du}{dt}(0)$ とおく． $(\boldsymbol{p}\circ c)(t)$ が非特異であるという性質は保ったまま曲線 $t=0$ で $(u_0,v_0)$ を通る $c(t)$ をいろいろ取り換えると， $(\alpha,\beta)^\mathsf{T}$ は $\mathbb{R}^2-\{\boldsymbol{0}\}$ のすべての値を取りうる．よって法曲率は分母が正定値である $(\alpha,\beta)^\mathsf{T}$ に関する2次形式の比 \begin{align}\dfrac{L\alpha^2+2 M\alpha \beta+N\beta^2 }{E\alpha^2+2 F\alpha\beta +G\beta^2 }
=\dfrac{(\alpha,\beta)\left(\begin{array}{cc} L & M\\ M& N \end{array}\right) \left(\begin{array}{c} \alpha\\ \beta \end{array}\right)}{(\alpha,\beta)\left(\begin{array}{cc} E & F\\ F& G \end{array}\right) \left(\begin{array}{c} \alpha\\ \beta \end{array}\right)}\end{align} で，上で示した定理により，法曲率の最大値と最小値である主曲率は行列 \begin{align}\left(\begin{array}{cc} E & F\\ F& G \end{array}\right)^{-1}\left(\begin{array}{cc} L & M\\ M& N \end{array}\right)=\dfrac{1}{EG-F^2} \left(\begin{array}{cc} G L - F M & G M - F N \\ EM-FL & EN-FM \end{array}\right) \end{align} の2つの固有値である．さらに，ガウス曲率 $K$ はこの行列の行列式で，平均曲率 $H$ はトレースの $\frac{1}{2}$ 倍となる．よって \begin{align} K=\dfrac{LN-M^2}{EG-F^2},~~H=\dfrac{EN-2FM+GL}{2(EG-F^2)} \end{align} となる．