現実と数学の区別が付かない

数学ネタのブログです

2次形式から曲面の曲率まで

今日の目的は次の定理を証明することです.

A, B を実対称行列とし,2つの2次形式 \begin{align} \boldsymbol{x}^\mathsf{T} A \boldsymbol{x},~~\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}\end{align} で \boldsymbol{x}^\mathsf{T} B \boldsymbol{x} は正定値であるものを考える.

束縛条件  \boldsymbol{x}^\mathsf{T} B \boldsymbol{x}=1 のもとでの \boldsymbol{x}^\mathsf{T} A \boldsymbol{x} の最大値と最小値はそれぞれ B^{-1}A の最大固有値と最小固有値である.

また, \dfrac{\boldsymbol{x}^\mathsf{T} A \boldsymbol{x}}{\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}}~~(\boldsymbol{x}\neq \boldsymbol{0}) の最大値と最小値もそれぞれ B^{-1}A の最大固有値と最小固有値である.

この応用として,曲面のガウス曲率・平均曲率の公式を導出します.これら曲率の一応の定義はしますが細かい説明はしないので,定義の意味などはちゃんとした微分幾何の教科書を参考にして下さい.

対称行列と2次形式

i 成分だけ 1 で残りの要素は 0 であるベクトルを \boldsymbol{e}_i\in \mathbb{R}^n で表す. ベクトル  \boldsymbol{u},~\boldsymbol{v}\in \mathbb{R}^3 の標準内積 \boldsymbol{u}\cdot \boldsymbol{v} で,外積 \boldsymbol{u}\times \boldsymbol{v}\in \mathbb{R}^3 で表す.

対称行列

行列 M の転置を M^\mathsf{T} で表す.n次正方行列 AA=A^\mathsf{T} を満たすとき,対称行列と呼ぶ.n次正方行列 PP^\mathsf{T}= P^{-1} を満たすとき,直交行列と呼ぶ.実対称行列 A固有値は全て実数であり,A は直交行列 P で対角化できることが知られている;\begin{align}P^\mathsf{T}AP=\mathrm{diag}(\lambda_1,\dots,\lambda_n)\end{align}

2次形式

\boldsymbol{x}=(x_1,\dots,x_n)^\mathsf{T} を変数を要素とするベクトルとする.\boldsymbol{x} に関する実係数の2次斉次多項式2次形式と呼ぶ.2次形式はある実対称行列 A により\begin{align} \boldsymbol{x}^\mathsf{T} A \boldsymbol{x}\end{align} と書ける.

A が直交行列 PP^\mathsf{T}AP=\mathrm{diag}(\lambda_1,\dots,\lambda_n) と対角化されているとき,A=P~\mathrm{diag}(\lambda_1,\dots,\lambda_n)P^\mathsf{T} なので, \boldsymbol{y}=P^\mathsf{T}\boldsymbol{x} (\Leftrightarrow \boldsymbol{x}=P\boldsymbol{y}) と変数変換すると\begin{align}\boldsymbol{x}^\mathsf{T} A \boldsymbol{x}=\boldsymbol{y}^\mathsf{T}P^\mathsf{T} A P\boldsymbol{y} =\boldsymbol{y}^\mathsf{T}\mathrm{diag}(\lambda_1,\dots,\lambda_n)\boldsymbol{y}=\sum_{i=1}^n \lambda_i y_i^2 \end{align} となる.

任意の \boldsymbol{x}\neq \boldsymbol{0} に対し  \boldsymbol{x}^\mathsf{T} A \boldsymbol{x}>0 となるとき,2次形式  \boldsymbol{x}^\mathsf{T} A \boldsymbol{x}正定値であるという.これは A固有値 \lambda_1,\dots,\lambda_n が全て正であることと同値である.

2次形式の条件付極値

2つの2次形式 \begin{align} \boldsymbol{x}^\mathsf{T} A \boldsymbol{x},~~\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}\end{align} で \boldsymbol{x}^\mathsf{T} B \boldsymbol{x} は正定値であるものを考える.

束縛条件  \boldsymbol{x}^\mathsf{T} B \boldsymbol{x}=1 のもとで \boldsymbol{x}^\mathsf{T} A \boldsymbol{x} の最大値と最小値をラグランジュの未定乗数法を使って求める.\boldsymbol{x}^\mathsf{T} B \boldsymbol{x} は正定値なので \boldsymbol{x}^\mathsf{T} B \boldsymbol{x}=1 を満たす  \boldsymbol{x} 全体はコンパクト集合で,最大値と最小値が存在することに注意する.

ラグランジュの未定乗数法 - Wikipedia

ラグランジュの未定乗数法
縛条件  g(\boldsymbol{x})=0 のもとで f(\boldsymbol{x})極値を与える  \boldsymbol{x} の値は,ある \lambda に対する \begin{align} \mathrm{grad}f(\boldsymbol{x})=\lambda~ \mathrm{grad}g(\boldsymbol{x}),~g(\boldsymbol{x})=0\end{align} の解であるか, g(\boldsymbol{x})=0特異点,つまり \begin{align}\mathrm{grad}g(\boldsymbol{x})=\boldsymbol{0}, ~g(\boldsymbol{x})=0\end{align} の解であるかのいずれかである.

ここで \mathrm{grad}f(\boldsymbol{x})=\left(\dfrac{\partial f(\boldsymbol{x})}{\partial x_1},\dots,\dfrac{\partial f(\boldsymbol{x})}{\partial x_n}\right)^\mathsf{T}f(\boldsymbol{x}) の勾配である.

 \boldsymbol{x}^\mathsf{T} B \boldsymbol{x}=1 は非特異なので,束縛条件  \boldsymbol{x}^\mathsf{T} B \boldsymbol{x}=1 のもとで \boldsymbol{x}^\mathsf{T} A \boldsymbol{x}極値を与える  \boldsymbol{x} の値は,ある \lambda に対する \begin{align} \mathrm{grad}(\boldsymbol{x}^\mathsf{T} A \boldsymbol{x})=\lambda~ \mathrm{grad}(\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}-1),~\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}=1 \end{align} の解である.

A は対称行列だったので \begin{align}\dfrac{\partial \left(\boldsymbol{x}^\mathsf{T} A\boldsymbol{x}\right)}{\partial x_i}=\boldsymbol{e}^\mathsf{T}_iA\boldsymbol{x}+\boldsymbol{x}^\mathsf{T}A\boldsymbol{e}_i=2\left(\boldsymbol{e}^\mathsf{T}_iA\boldsymbol{x}\right)\end{align} より \begin{align}\mathrm{grad}\left(\boldsymbol{x}^\mathsf{T} A\boldsymbol{x}\right)
=2\left(\boldsymbol{e}^\mathsf{T}_1A\boldsymbol{x},\dots,\boldsymbol{e}^\mathsf{T}_nA\boldsymbol{x}\right)^\mathsf{T}=2A\boldsymbol{x}
\end{align} であり,同様に \begin{align}\mathrm{grad}(\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}-1)=\mathrm{grad}(\boldsymbol{x}^\mathsf{T} B \boldsymbol{x})=2B\boldsymbol{x}
\end{align} となる.よって \mathrm{grad}(\boldsymbol{x}^\mathsf{T} A \boldsymbol{x})=\lambda~ \mathrm{grad}(\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}-1),~\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}=1 は \begin{align} &A\boldsymbol{x}=\lambda B\boldsymbol{x}, ~\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}=1\\
\Leftrightarrow~~ & B^{-1}A\boldsymbol{x}=\lambda\boldsymbol{x}, ~\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}=1\end{align} と変形できる.これは \lambda,~\boldsymbol{x}B^{-1}A固有値とその固有ベクトルであることを表している.

また,この条件式が成り立っているとき,\begin{align}\boldsymbol{x}^\mathsf{T}A\boldsymbol{x}=\boldsymbol{x}^\mathsf{T}(\lambda B)\boldsymbol{x}=\lambda \boldsymbol{x}^\mathsf{T} B \boldsymbol{x}=\lambda \end{align} となる.

以上より次の定理を得る.

2つの2次形式 \begin{align} \boldsymbol{x}^\mathsf{T} A \boldsymbol{x},~~\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}\end{align} で \boldsymbol{x}^\mathsf{T} B \boldsymbol{x} は正定値であるものを考える.

束縛条件  \boldsymbol{x}^\mathsf{T} B \boldsymbol{x}=1 のもとでの \boldsymbol{x}^\mathsf{T} A \boldsymbol{x} の最大値と最小値はそれぞれ B^{-1}A の最大固有値と最小固有値である.

この定理の系として次が成り立つ.

2つの2次形式 \begin{align} \boldsymbol{x}^\mathsf{T} A \boldsymbol{x},~~\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}\end{align} で \boldsymbol{x}^\mathsf{T} B \boldsymbol{x} は正定値であるものを考える.

 \dfrac{\boldsymbol{x}^\mathsf{T} A \boldsymbol{x}}{\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}}~~(\boldsymbol{x}\neq \boldsymbol{0}) の最大値と最小値はそれぞれ B^{-1}A の最大固有値と最小固有値である.

(証明)実数 k に対し  \dfrac{(k\boldsymbol{x})^\mathsf{T} A (k\boldsymbol{x})}{(k\boldsymbol{x})^\mathsf{T} B (k\boldsymbol{x})}=\dfrac{k^2\boldsymbol{x}^\mathsf{T} A \boldsymbol{x}}{k^2 \boldsymbol{x}^\mathsf{T} B \boldsymbol{x}}=\dfrac{\boldsymbol{x}^\mathsf{T} A \boldsymbol{x}}{\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}} なので, k=\frac{1}{\sqrt{\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}}} とすると  (k\boldsymbol{x})^\mathsf{T} B (k\boldsymbol{x})=1 となる.よって \begin{align}\left\{\dfrac{\boldsymbol{x}^\mathsf{T} A \boldsymbol{x}}{\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}} ~\middle|~ \boldsymbol{x}\neq \boldsymbol{0}\right\}=\left\{\boldsymbol{x}^\mathsf{T} A \boldsymbol{x} \mid \boldsymbol{x}^\mathsf{T} B \boldsymbol{x}=1\right\}\end{align} であるので, \dfrac{\boldsymbol{x}^\mathsf{T} A \boldsymbol{x}}{\boldsymbol{x}^\mathsf{T} B \boldsymbol{x}}~~(\boldsymbol{x}\neq \boldsymbol{0}) の最大値と最小値はそれぞれ,束縛条件  \boldsymbol{x}^\mathsf{T} B \boldsymbol{x}=1 のもとでの \boldsymbol{x}^\mathsf{T} A \boldsymbol{x} の最大値と最小値と一致する.(証明終)

曲面のガウス曲率・平均曲率

簡単のため以降出てくる関数は  C^\infty級とする.

曲面

D uv-平面の領域とし,曲面 \begin{align} \boldsymbol{p}(u,v)=\left(\begin{array}{c} x(u,v)\\y(u,v)\\z(u,v) \end{array}\right),~~(u,v)\in D \end{align} を考える.

曲面の各点で接ベクトル \boldsymbol{p}_u=\dfrac{\partial \boldsymbol{p}}{\partial u},~\boldsymbol{p}_v= \dfrac{\partial \boldsymbol{p}}{\partial v} は1次独立であるとする.このとき,曲面の単位法線ベクトル \boldsymbol{n} は ベクトルの外積を用いて\begin{align}\boldsymbol{n}=\dfrac{\boldsymbol{p}_u\times \boldsymbol{p}_v}{\left|\boldsymbol{p}_u\times \boldsymbol{p}_v\right|}\end{align}で与えられる.

曲面上の曲線

(u_0,v_0)\in D を固定し (x_0,y_0,z_0)=\boldsymbol{p}(u_0,v_0) とする.
\varepsilon>0 とし,t=0 のときに (u_0,v_0) を通る  uv-平面上の曲線 \begin{align} c(t)=\left(\begin{array}{c} u(t)\\v(t)\end{array}\right),~~-\varepsilon\le t \le \varepsilon, \end{align} と  \boldsymbol{p} を合成すると,t=0 のときに (x_0,y_0,z_0) を通る空間曲線 \begin{align} (\boldsymbol{p}\circ c)(t)=\boldsymbol{p}(u(t),v(t))=\left(\begin{array}{c} x(u(t),v(t))\\y(u(t),v(t))\\z(u(t),v(t)) \end{array}\right) ,~~-\varepsilon \le t \le \varepsilon,\end{align} が得られる.これが非特異,すなわち任意の  -\varepsilon \le t \le\varepsilon に対し \dfrac{d (\boldsymbol{p}\circ c)}{dt}(t)\neq 0 となる c(t) のみを考える.

時間パラメータ・弧長パラメータ

弧長関数 s(t) を\begin{align}s(t)=\int_{0}^t \left|\dfrac{d(\boldsymbol{p}\circ c)(t)}{dt}\right|dt \end{align}で定義し, \ell_1 =s(-\varepsilon), \ell_2=s(\varepsilon) とおく ( t=0 のとき  s=0 となるように積分の始点を 0 に設定した).微分が正 \dfrac{ds(t)}{dt}= \left|\dfrac{d(\boldsymbol{p}\circ c)(t)}{dt}\right|>0 なので弧長関数は狭義単調増加関数になるので,逆関数  t(s),~\ell_1\le s\le \ell_2, を持つ.

\gamma(s):=(\boldsymbol{p}\circ c \circ t)(s)弧長パラメータ表示と呼び,  (\boldsymbol{p}\circ c)(t)時間パラメータ表示と呼ぶことにする.これらは同一の空間曲線を異なるパラメータ付けで表したものになっている.

少ししつこく説明しておくと,時間パラメータ表示  (\boldsymbol{p}\circ c)(t) t=t(s) を代入することで弧長パラメータ表示 \gamma(s)=(\boldsymbol{p}\circ c \circ t)(s) が得られ,逆に弧長パラメータ表示 \gamma(s) s=s(t) を代入することで,時間パラメータ表示  (\gamma\circ s)(t)=(\boldsymbol{p}\circ c)(t) が得られる.

また,定義より \dfrac{ds}{dt}=\dfrac{ds(t)}{dt}= \left|\dfrac{d(\boldsymbol{p}\circ c)(t)}{dt}\right| であり,逆関数微分の公式により \dfrac{dt}{ds}=\dfrac{dt(s)}{ds}=\left(\dfrac{ds}{dt}\right)^{-1}= \left|\dfrac{d(\boldsymbol{p}\circ c)(t)}{dt}\right|^{-1} である.

法曲率・ガウス曲率・平均曲率の定義

弧長パラメータ表示のときは「速さ」が \begin{align}\left|\dfrac{d\gamma(s)}{ds}\right|=\left|\dfrac{d(\boldsymbol{p}\circ c)(t)}{dt} \cdot \dfrac{dt}{ds}\right|=\left|\dfrac{ds}{dt}\cdot \dfrac{dt}{ds} \right|=1\end{align} で一定である.\begin{align}\dfrac{d\gamma(s)}{ds}\cdot \dfrac{d\gamma(s)}{ds}=\left|\dfrac{d\gamma(s)}{ds}\right|^2=1\end{align} なので両辺  s微分することで \dfrac{d\gamma(s)}{ds}\cdot \dfrac{d^2\gamma(s)}{ds^2}+\dfrac{d^2\gamma(s)}{ds^2}\cdot\dfrac{d\gamma(s)}{ds}=0 より  \dfrac{d\gamma(s)}{ds}\cdot \dfrac{d^2\gamma(s)}{ds^2}=0 である.つまり  \dfrac{d^2\gamma(s)}{ds^2} \dfrac{d\gamma(s)}{ds} と直交する.

 \dfrac{d^2\gamma(s)}{ds^2} の単位法線ベクトル成分 \dfrac{d^2\gamma(s)}{ds^2}\cdot \boldsymbol{n} s=0 での値を空間曲線  \gamma(s) の点 (x_0,y_0,z_0) における法曲率 と呼ぶ.

t=0 のときに (u_0,v_0) を通る曲線  c(t) をいろいろ取り換えると,法曲率も様々な値を取る.法曲率の取りうる値の最大値  \kappa_1 と最小値 \kappa_2 をこの曲面の点  (x_0,y_0,z_0) における主曲率と呼ぶ.また,積  K:=\kappa_1\kappa_2ガウス曲率,平均 H:=\dfrac{ \kappa_1+\kappa_2}{2}平均曲率と呼ぶ.

第1基本量

 \left(\dfrac{ds(t)}{dt}\right)^2 を計算する. \begin{align} \left(\dfrac{ds(t)}{dt}\right)^2 =& \left|\dfrac{d(\boldsymbol{p}(u(t),v(t))}{dt}\right|^2 \\=&\left| \boldsymbol{p}_u(u(t),v(t))\dfrac{du(t)}{dt}+\boldsymbol{p}_v(u(t),v(t))\dfrac{dv(t)}{dt}\right|^2 \\=&|\boldsymbol{p}_u(u(t),v(t))|^2 \left(\dfrac{du(t)}{dt}\right)^2 \\&+2\boldsymbol{p}_u(u(t),v(t)) \cdot \boldsymbol{p}_v(u(t),v(t))\dfrac{du(t)}{dt}\dfrac{dv(t)}{dt}\\&+|\boldsymbol{p}_v(u(t),v(t))|^2 \left(\dfrac{dv(t)}{dt}\right)^2 \end{align} ここで  E(u,v)=|\boldsymbol{p}_u|^2,~ F(u,v)=\boldsymbol{p}_u \cdot \boldsymbol{p}_v,~G(u,v)=|\boldsymbol{p}_v|^2第1基本量と呼ぶ.これを用いると \left(\dfrac{ds(t)}{dt}\right)^2 は\begin{align} E(u(t),v(t)) \left(\dfrac{du(t)}{dt}\right)^2+2F(u(t),v(t))\dfrac{du(t)}{dt}\dfrac{dv(t)}{dt}+G(u(t),v(t))\left(\dfrac{dv(t)}{dt}\right)^2\end{align}となる.

第2基本量

 \gamma(s)=(\boldsymbol{p}\circ c \circ t)(s)=\boldsymbol{p}(u(t(s)),v(t(s))) を用いて法曲率 \dfrac{d^2\gamma(s)}{ds^2}\cdot \boldsymbol{n} を計算する.記号が複雑になるので関数の変数を省略した形で書く. \begin{align}\dfrac{d\gamma(s)}{ds}&=\boldsymbol{p}_u \dfrac{du}{dt}\dfrac{dt}{ds} +\boldsymbol{p}_v \dfrac{dv}{dt}\dfrac{dt}{ds}=\left(\boldsymbol{p}_u \dfrac{du}{dt} +\boldsymbol{p}_v \dfrac{dv}{dt}\right)\dfrac{dt}{ds} \\
\dfrac{d^2\gamma(s)}{ds^2}&=\left(\boldsymbol{p}_{uu} \left(\dfrac{du}{dt}\right)^2 +2\boldsymbol{p}_{uv}\dfrac{du}{dt}\dfrac{dv}{dt}+\boldsymbol{p}_{vv} \left(\dfrac{dv}{dt}\right)^2\right)\left(\dfrac{dt}{ds}\right)^2+\mbox{($\boldsymbol{p}_u$ と $\boldsymbol{p}_v$ の一次結合)} \end{align} となる. \boldsymbol{p}_u,~\boldsymbol{p}_v \boldsymbol{n} は直交するので法曲率は \begin{align}\dfrac{d^2\gamma(s)}{ds^2}\cdot \boldsymbol{n}=\left(\boldsymbol{p}_{uu}\cdot \boldsymbol{n} \left(\dfrac{du}{dt}\right)^2 +2\boldsymbol{p}_{uv}\cdot \boldsymbol{n}\dfrac{du}{dt}\dfrac{dv}{dt}+\boldsymbol{p}_{vv}\cdot \boldsymbol{n} \left(\dfrac{dv}{dt}\right)^2\right)\left(\dfrac{dt}{ds}\right)^2 \end{align} となる.ここで  L(u,v)=\boldsymbol{p}_{uu}\cdot  \boldsymbol{n},~M(u,v)=\boldsymbol{p}_{uv}\cdot  \boldsymbol{n},~ N(u,v)=\boldsymbol{p}_{vv}\cdot  \boldsymbol{n}第2基本量と呼ぶ.

ガウス曲率・平均曲率の公式

法曲率を第1基本量と第2基本量で表すと \begin{align}&\left(L \left(\dfrac{du}{dt}\right)^2 +2M\dfrac{du}{dt}\dfrac{dv}{dt}+N\left(\dfrac{dv}{dt}\right)^2\right)\left(\dfrac{dt}{ds}\right)^2 \\
&=\dfrac{L \left(\dfrac{du}{dt}\right)^2 +2M\dfrac{du}{dt}\dfrac{dv}{dt}+N\left(\dfrac{dv}{dt}\right)^2}{\left(\dfrac{ds}{dt}\right)^2}\\
&=\dfrac{L \left(\dfrac{du}{dt}\right)^2 +2M\dfrac{du}{dt}\dfrac{dv}{dt}+N\left(\dfrac{dv}{dt}\right)^2}{E \left(\dfrac{du}{dt}\right)^2 +2F\dfrac{du}{dt}\dfrac{dv}{dt}+G\left(\dfrac{dv}{dt}\right)^2}\end{align} となる.この t=0 での値が曲面上の点  (x_0,y_0,z_0) における法曲率であった.第1基本量と第2基本量の t=0 での値は曲線  c(t) の取り方に依らないので,点  (x_0,y_0,z_0) における法曲率は  \dfrac{dc}{dt}(0)=\left(\dfrac{dv}{dt}(0),\dfrac{du}{dt}(0)\right)^\mathsf{T} で決まる.

 \alpha=\dfrac{dv}{dt}(0),~\beta=\dfrac{du}{dt}(0) とおく. (\boldsymbol{p}\circ c)(t) が非特異であるという性質は保ったまま曲線  t=0(u_0,v_0) を通る  c(t) をいろいろ取り換えると, (\alpha,\beta)^\mathsf{T}\mathbb{R}^2-\{\boldsymbol{0}\} のすべての値を取りうる.よって法曲率は分母が正定値である  (\alpha,\beta)^\mathsf{T} に関する2次形式の比 \begin{align}\dfrac{L\alpha^2+2 M\alpha \beta+N\beta^2 }{E\alpha^2+2 F\alpha\beta +G\beta^2 }
=\dfrac{(\alpha,\beta)\left(\begin{array}{cc} L & M\\ M& N \end{array}\right) \left(\begin{array}{c} \alpha\\ \beta \end{array}\right)}{(\alpha,\beta)\left(\begin{array}{cc} E & F\\ F& G \end{array}\right) \left(\begin{array}{c} \alpha\\ \beta \end{array}\right)}\end{align} で,上で示した定理により,法曲率の最大値と最小値である主曲率は行列 \begin{align}\left(\begin{array}{cc} E & F\\ F& G \end{array}\right)^{-1}\left(\begin{array}{cc} L & M\\ M& N \end{array}\right)=\dfrac{1}{EG-F^2} \left(\begin{array}{cc} G L - F M & G M - F N \\ EM-FL & EN-FM \end{array}\right) \end{align} の2つの固有値である.さらに,ガウス曲率 K はこの行列の行列式で,平均曲率 H はトレースの \frac{1}{2} 倍となる.よって \begin{align} K=\dfrac{LN-M^2}{EG-F^2},~~H=\dfrac{EN-2FM+GL}{2(EG-F^2)} \end{align} となる.

正則列の Extended Rees Algebra

最近ネタがないのでネットで見かけた問題をひとつ.

「正則列で生成されるイデアルの extended Rees algebra の定義イデアルは自明な関係式で生成されることを簡単に示せないか」という疑問を先日 twitter で見かけました.これは一見当たり前のような気がするけれども,よく考えたら 正則列で生成されるイデアル  \mathfrak{a}\subset R に対して \mathfrak{a}^n/\mathfrak{a}^{n+1} が自由 R/\mathfrak{a}-加群になることが系として出るわけで,そんなに自明でもなさそう.そんなわけで証明を考えてみました.

定理の証明

可換環  Aイデアル  \mathfrak{a}=\langle a_1,\dots,a_n\rangle \subset A に対し,\begin{align}A[t^{-1},t\mathfrak{a}]=A[t^{-1},ta_1,\dots,ta_n] \subset A[t,t^{-1}]\end{align} を \mathfrak{a}extended Rees algebra と呼ぶ.ここで  tA 上の変数.

 \mathbf{a}=(a_1,\dots,a_n)\in A^n,  \mathbf{b}=(b_1,\dots,b_n)\in A^n に対し,\mathbf{a}\cdot\mathbf{b}内積\begin{align}\mathbf{a}\cdot\mathbf{b}=a_1b_1+\cdots +a_nb_n\end{align} とする.また,\mathbf{f}\in A^n に対し \begin{align} \mathrm{Syz}_A(\mathbf{f})=\{\mathbf{a} \in A^n \mid \mathbf{a}\cdot\mathbf{f}=0\}\subset A^n\end{align}を  \mathbf{f} syzygy加群と呼ぶ.
\mathbf{e}_i \in A^ni 番目の成分だけ 1 で,残りの成分は 0 であるベクトルとする.

可換環 R の正則列 a_1,\dots,a_n で生成されるイデアル\mathfrak{a} とする. R 上の多項式環 R[u,x]=R[u,x_1,\dots, x_n] からのR-代数の全射\begin{align} \varphi:&R[u,x]\to R[t^{-1},t\mathfrak{a}],\\& u \mapsto t^{-1}, x_i \mapsto ta_i\end{align} の核  \mathrm{Ker}\varphi a_1-ux_1,\dots, a_n-ux_n で生成される.

(証明)
自然な全射  R[u,x] \to R[u,x]/\langle u\rangle\cong R[x] により  R[x] R[u,x]-代数とみなす.この全射による  f\in R[u,x] の像を \overline{f} で表し, \mathbf{f}=(f_1,\dots,f_n) \in R[u,x] に対し, \overline{\mathbf{f}}=(\overline{f}_1,\dots,\overline{f}_n) とする.

 \mathbf{a}=(a_1,\dots,a_n),   \xi =(a_1-ux_1,\dots, a_n-ux_n) とおく. \mathbf{a}=\overline{ \xi } なので,自然な  R[u,x]-加群の準同型 \begin{align}\Psi: \mathrm{Syz}_{R[u,x]}( \xi ) &\to \mathrm{Syz}_{R[x]}(\mathbf{a}) \\ \mathbf{f} &\mapsto \overline{\mathbf{f}} \end{align}が得られる. a_1,\dots,a_n R[x]-正則列でもあるので,\mathrm{Syz}_{R[x]}(\mathbf{a}) は自明な関係式  a_i \mathbf{e}_j -a_j \mathbf{e}_i,~1\le i < j\le n, で生成されるが,これは \begin{align} (a_i-ux_i)\mathbf{e}_j -(a_j-ux_j) \mathbf{e}_i \in \mathrm{Syz}_{R[u,x]}( \xi ) \end{align} の像になっている.よって \Psi全射である.

 I=\langle  \xi \rangle=\langle a_1-ux_1,\dots, a_n-ux_n \rangle\subset R[u,x],~K=\mathrm{Ker}\varphi\subset R[u,x] とおく.I=K が示すべきことである.

\varphi(u)=t^{-1} R[u,x]/K\cong R[t^{-1},t\mathfrak{a}] \subset R[t,t^{-1}] の正則元なので  K:u=K が成り立つ.

次に I:u=I を示す.p\in I:u を取る.pu\in I=\langle \xi\rangle より,ある  \mathbf{f}=(f_1,\dots, f_n) \in R[u,x]^n により
\begin{align} pu=\mathbf{f}\cdot \xi \end{align}と書ける.\overline{\mathbf{f}}\cdot \mathbf{a} =\overline{\mathbf{f}\cdot  \xi }= \overline{pu}=0 なので  \overline{\mathbf{f}}\in \mathrm{Syz}_{R[x]}(\mathbf{a}) である.\Psi全射だったので,ある  \mathbf{g} \in  \mathrm{Syz}_{R[u,x]}( \xi ) が存在し  \overline{\mathbf{g}}= \overline{\mathbf{f}} となる. \mathbf{g}\cdot  \xi =0 より\begin{align} pu=\mathbf{f}\cdot \xi =(\mathbf{f}-\mathbf{g})\cdot \xi \end{align} である.\overline{\mathbf{f}-\mathbf{g}}=\overline{\mathbf{f}}-\overline{\mathbf{g}}=\overline{\mathbf{f}}-\overline{\mathbf{f}}=0 なので,ある  \mathbf{h}\in R[u,x]^n が存在して \mathbf{f}-\mathbf{g}=u\mathbf{h} となる.よって  pu=u\mathbf{h}\cdot  \xi だが,u R[u,x]の正則元なので,両辺 u で割って p=\mathbf{h}\cdot  \xi  \in I を得る.以上より I:u=I である.

 S=R[u,x] とおく.I:u=I,~ K:u=K なので,\begin{align} I=IS[u^{-1}] \cap S, ~K=KS[u^{-1}] \cap S\end{align} が成り立つ.一方で \begin{align} S[u^{-1}]/KS[u^{-1}]\cong (S/K)[u^{-1}]\cong R[t^{-1},t\mathfrak{a}][t]=R[t,t^{-1}] \end{align} より, KS[u^{-1}]=KR[u^{-1},u,x]R-代数の全射\begin{align} &R[u,u^{-1}][x_1,\dots,x_n]\to R[t,t^{-1}],\\& u \mapsto t^{-1},~~ u^{-1} \mapsto t,~~ x_i \mapsto ta_i\end{align}の核である.よって KS[u^{-1}]x_1-u^{-1}a_1,\dots, x_n- u^{-1}a_n で生成される.また, I の定義より  IS[u^{-1}]x_1-u^{-1}a_1,\dots, x_n- u^{-1}a_nで生成されることが分かる.よって  KS[u^{-1}]=I S[u^{-1}] が成り立つ.

以上より\begin{align} I=IS[u^{-1}] \cap S=KS[u^{-1}] \cap S=K \end{align} である.
(証明終)

この定理の系として,次の定理を示すことができる.

可換環 R の正則列 a_1,\dots,a_n で生成されるイデアル \mathfrak{a} の associated graded ring G:=\bigoplus_{n=0}^\infty \mathfrak{a}^n/\mathfrak{a}^{n+1} は,R/\mathfrak{a} 上の n 変数多項式環と同型となる.
特に,任意の  n に対して  \mathfrak{a}^n/\mathfrak{a}^{n+1} は自由 R/\mathfrak{a}-加群となる.

(証明)\begin{align}G&\cong R[t^{-1},t\mathfrak{a}]/t^{-1}R[t^{-1},t\mathfrak{a}] \cong R[u,x_1,\dots, x_n]/\langle a_1-ux_1,\dots, a_n-ux_n, u\rangle\\&=R[u,x_1,\dots, x_n]/\langle a_1,\dots, a_n, u\rangle\cong (R/\mathfrak{a})[x_1,\dots, x_n]\end{align}(証明終)

隣接行列の一般化とトロピカル演算の正体

最近話題になったこの記事。
qiita.com

この記事は主に次の事実を扱ったものです。

有向グラフの辺の重みを並べた行列のトロピカルな m 乗の第 (i, j)-成分は,i 番目の頂点から j 番目の頂点への道のうち,最小の重みを持つものの重みに等しいという話です。

ここで,トロピカル演算は次のように定義されるものです。

トロピカル加法  a\oplus b := \min\{a,b\}
トロピカル乗法  a\otimes b :=a+b
トロピカル加法の単位元  \infty \oplus a =a \oplus \infty=a, \infty \otimes a =a \otimes \infty=\infty

この話を聞いて,似た話を知っていると思った人もいたのではないでしょうか。それは次の定理です。

有向グラフの隣接行列の m 乗の第 (i, j)-成分は,i 番目の頂点から j 番目の頂点への道の数に等しい。

辺の重みを並べた行列は,隣接行列に見た目がよく似ています。

この2つの似た事実は成り立つ理由もよく似ていますが,隣接行列をうまく一般化するとこの2つの事実を同時に示すことができるというのが今日のお話です。この話を通して,トロピカル演算の正体が見えてきます。

2つの類似した現象

以降では自己ループや多重辺も許容する有向グラフ G=(V,E) を考えます。ただし, V=\{1,\dots,n\} を頂点集合,E を辺集合とします。また,辺 e\in E に対し, e の始点を s(e),終点を  t(e) で表すことにします*1

有向グラフの隣接行列

さて,有向グラフ G=(V,E) に対して
\begin{align}
a_{ij}&=\#\{e\in E \mid s(e)=i, t(e)=j\}\\
&=\mbox{頂点$i$ から 頂点$j$ への辺の本数}
\end{align}で定まる n\times n 行列  A=(a_{ij})_{i,j\in V}G隣接行列と呼びます。

隣接行列 AmA^m の第 (i, j)-成分は

\displaystyle
\sum_{k_1,k_2,\dots,k_{m-1} \in V} a_{i k_1} a_{k_1k_2} a_{k_2k_3} \dots a_{k_{m-1} j}

です。a_{k\ell} は頂点 k から頂点 \ell への辺の本数なので,\sum の中身は

\displaystyle
i\rightarrow k_1 \rightarrow k_2 \rightarrow \dots \rightarrow k_{m-1} \rightarrow j

というルートを通る道の本数を表しています。よって,その合計は i から j への長さ m の道の数に等しいことが分かります。

有向グラフの重み行列

さらに,辺の重みを与える関数 w:E\to \mathbb{Z}_{\ge 0} が定まっている場合を考えましょう。つまり,各辺 e\in E に重み w(e)\in \mathbb{Z}_{\ge 0} が定まっています。

応用上では重みは,辺の長さや,通過にかかる時間・コスト,容量などを表すものとして定められることが多いです。

辺に重みがつけられた有向グラフ G=(V,E) に対して,
\begin{align}
w_{ij}&=\min\{w(e)\mid e\in E,s(e)=i, t(e)=j \}\\
&=\mbox{頂点$i$ から 頂点$j$ への辺の重みの最小値}
\end{align}で定まる n\times n 行列  W=(w_{ij})_{i,j\in V}G重み行列と呼びます。ただし,i から j への辺がないときは  w_{ij}=\infty と定めます。これは重みが辺の通過にかかる時間を表しているとき,「辺がない」ことを「時間が無限にかかる」と表現していると解釈すれば,この定義に納得できると思います。

重み行列 W のトロピカルな mW^{\otimes m} の第 (i, j)-成分は

\displaystyle
\bigoplus_{k_1,k_2,\dots,k_{m-1} \in V} a_{ik_1}\otimes w_{k_1k_2}\otimes w_{k_2k_3}\otimes \dots \otimes w_{k_{m-1}k_m} \otimes w_{k_m j}\hspace{20mm}
\displaystyle= \min\{ w_{ik_1}+ w_{k_1k_2}+ w_{k_2k_3}+\dots+ w_{k_{m-1}j} \mid k_1,k_2,\dots,k_{m-1} \in V \}

です。w_{k\ell} は頂点 k から頂点 \ell への辺の重みの最小値なので,\min の中身は

\displaystyle
i\rightarrow k_1 \rightarrow k_2 \rightarrow \dots \rightarrow k_{m-1} \rightarrow j

というルートを通る道の重みの最小値を表しています。よってその最小値は i から j への長さ m の道の重みの最小値に等しいことが分かります。

具体例

具体例で見てみましょう。


f:id:egory_cat:20190713093829p:plain:w300

この有向グラフの隣接行列A と重み行列 W
\begin{align}
A=\left(
\begin{array}{ccccc}
0 & 1 & 0 & 0 & 0\\
0 & 0 & 1 & 0 & 1\\
1 & 0 & 0 & 0 & 0\\
0 & 1 & 0 & 0 & 0\\
0 & 0 & 1 & 1 & 0
\end{array}
\right),~~~
W=\left(
\begin{array}{ccccc}
\infty & 3 & \infty & \infty & \infty\\
\infty & \infty & 2& \infty & 7\\
6 & \infty & \infty & \infty & \infty \\
\infty &10 & \infty & \infty & \infty \\
\infty & \infty & 5 & 1 & \infty
\end{array}
\right)
\end{align}となります。この 6 乗をそれぞれ計算してみましょう。ただし W の方はトロピカルな 6 乗です。

\begin{align}
A^6=\left(
\begin{array}{ccccc}
2 & 0 & 3 & 2 & 1\\
3 & 4 & 1 & 1 & 0\\
0 & 1 & 2 & 0 & 2\\
2 & 0 & 3 & 2 & 1\\
1 & 3 & 2 & 0 & 2
\end{array}
\right),~~~
W^{\otimes 6}=\left(
\begin{array}{ccccc}
{22} & \infty & {26} & {22} & {31}\\
{29} & {22} & {33} & {29} & \infty\\
\infty & {30} & {22} & \infty & {27}\\
{29} & \infty & {33} & {29} & {38}\\
{32} & {25} & {24} & \infty & {29}
\end{array}
\right)
\end{align}
 A^6 の第 (1, 4)-成分は 2 なので,頂点 1 から頂点 4 への長さ 6 の道はちょうど 2本あることが分かります。

また, W^{\otimes 6} の第 (1, 4)-成分は 22 なので,頂点 1 から頂点 4 への長さ 6 の道の最小の重みは 22 であることが分かります。

実際,頂点 1 から頂点 4 への長さ 6 の道は\begin{align}
&1\rightarrow2\rightarrow3\rightarrow1\rightarrow2\rightarrow5\rightarrow4\\
&1\rightarrow2\rightarrow5\rightarrow4\rightarrow2\rightarrow5\rightarrow4
\end{align}の2本だけで,重みはそれぞれ \begin{align} 3+2+6+3+7+1&=22\\3+7+1+10+7+1&=29\end{align} になっており,最小値は確かに 22 です。

隣接行列の一般化

さて,AW 両方の情報を含むような新たな行列を定義しましょう。

G=(V,E)V=\{1,\dots,n\} を頂点集合,E を辺集合とする自己ループや多重辺も許容する有向グラフで,重み関数 w:E\to \mathbb{Z}_{\ge 0} が定まっていたことを思い出しましょう。また,e\in Es(e) から  t(e) への辺です 。

x を変数とし,\begin{align}
a_{ij}(x)=\sum_{e\in E, s(e)=i,t(e)=j} x^{w(e)}
\end{align}で定まる n\times n 行列  A(x)=(a_{ij}(x))_{i,j\in V}G多項式隣接行列と呼ぶことにします。

多項式隣接行列 A(x)mA(x)^m の第 (i, j)-成分は

\displaystyle
\sum_{k_1,k_2,\dots,k_{m-1} \in V} a_{i k_1}(x) a_{k_1k_2}(x) a_{k_2k_3}(x) \dots a_{k_{m-1} j}(x)

です。この展開を考えると,A(x)^m の第 (i, j)-成分の x^d の係数は, i から j への長さ m の道で,重みが d であるものの本数であることが分かります。

具体例

先ほどの例で見てみましょう。


f:id:egory_cat:20190713093829p:plain:w300

この有向グラフの多項式隣接行列は

A(x)=\left(
\begin{array}{ccccc}
0 & x^3 & 0 & 0 & 0\\
0 & 0 & x^2 & 0 & x^7\\ 
x^6 & 0 & 0 & 0 & 0\\ 
0 & x^{10} & 0 & 0 & 0\\ 
0 & 0 & x^5 & x & 0
\end{array}
\right)

となります。この 6乗を計算してみましょう。

A(x)^6=\left(
\begin{array}{ccccc}
x^{29}+x^{22} & 0 & x^{33}+2x^{26} & x^{29}+x^{22} & x^{31}\\
x^{36}+2x^{29} & x^{36}+2x^{29}+x^{22} & x^{33} & x^{29} & 0\\
0 & x^{30} & x^{29}+x^{22} & 0 & x^{34}+x^{27}\\
x^{36}+x^{29} & 0 & x^{40}+2x^{33} & x^{36}+x^{29} & x^{38}\\
x^{32} & 2x^{32}+x^{25} & x^{31}+x^{24} & 0 & x^{36}+x^{29}
\end{array}
\right)

 A(x)^6 の第 (1, 4)-成分は x^{29}+x^{22} なので,頂点 1 から頂点 4 への長さ 6 の道は,重みが 29 のものと  22 のものが 1本ずつあることが分かります。

また,第 (2, 2)-成分は  x^{36}+2x^{29}+x^{22} なので,頂点 2 から頂点 2 への長さ 6 の道は,重みが 36 のものと  22 のものが1本ずつ,重みが 29 のものが2本あることが分かります。

実際,\begin{align}
&2\rightarrow5\rightarrow4\rightarrow2\rightarrow5\rightarrow4\rightarrow2\\
&2\rightarrow3\rightarrow1\rightarrow2\rightarrow3\rightarrow1\rightarrow2\\
&2\rightarrow5\rightarrow4\rightarrow2\rightarrow3\rightarrow1\rightarrow2\\
&2\rightarrow3\rightarrow1\rightarrow2\rightarrow5\rightarrow4\rightarrow2
\end{align}の4本で,重みがそれぞれ 36,22,29,29 となっています。

隣接行列・重み行列との関係

定義より, A(x)x=1 を代入したものは隣接行列 A に一致しています。よって,A^m A(x)^mx=1 を代入することで得られます。

また,W^{\otimes m} の第 (i, j)-成分は i から j への長さ m の道の重みの最小値でしたが,これは  A(x)^m の第 (i, j)-成分の最低次数に一致します (ただし,0 の最低次数は \infty と約束します)。

こうしてみると,トロピカル演算の正体が見えてきます。つまりトロピカル演算とは,多項式の最低次数だけを抜き出して計算しているものなのです。

トロピカル演算の正体

多項式 \displaystyle f(x) = \sum_n c_nx^n に対し,\begin{align}\mathrm{ord}(f)&:=\min \{n \mid c_n\neq 0\}\\ \mathrm{ord}(0)&:=\infty \end{align} と定義し,f(x)オーダーと呼びます。

\mathrm{ord}(0)=\infty とする理由を説明します。いま,次数の小さい部分に注目していますが,これは  |x| が十分に小さい範囲を考えていることに対応しています。物理学で,  |x| が十分に小さいときに  \sin x=x-\frac{x^3}{3!}+\frac{x^5}{5!}-\cdotsx で近似したりしますよね。 |x| が十分に小さいときは \displaystyle \lim_{n\to \infty} x^n=0 なので,\mathrm{ord}(0)=\infty と約束するのが都合がよいのです。

2つの多項式 \displaystyle f(x), g(x) に対し, \begin{align}
\mathrm{ord}(fg)&=\mathrm{ord}(f)+\mathrm{ord}(g)\\
\mathrm{ord}(f+g)&\ge \min\{\mathrm{ord}(f),~\mathrm{ord}(g)\}\\
\end{align}が成り立ちます。2番目の不等式で等号が成り立たないのは,最低次数の部分がちょうどキャンセルして0になる場合です。

よってそれ以外の場合,例えば fg の係数が全て非負の場合は \begin{align}
\mathrm{ord}(fg)&=\mathrm{ord}(f)+\mathrm{ord}(g)\\
\mathrm{ord}(f+g)&= \min\{\mathrm{ord}(f),~\mathrm{ord}(g)\}\\
\end{align}となります。オーダー関数 \mathrm{ord} によって,加法が \min に,乗法が + に変換されていることが見て取れます。さらに加法単位元 0 については \mathrm{ord}(0)=\infty で,\mathrm{ord}(f\times 0)=\infty です。これはまさにトロピカル演算

トロピカル加法  a\oplus b := \min\{a,b\}
トロピカル乗法  a\otimes b :=a+b
トロピカル加法の単位元  \infty \oplus a =a \oplus \infty=a, \infty \otimes a =a \otimes \infty=\infty

を表しています。

より詳しくトロピカル代数・トロピカル幾何を知りたい方は次のサイトからいろいろたどってみてください。
http://pantodon.shinshu-u.ac.jp/topology/literature/tropical_mathematics.html

*1:つまり E は単なる有限集合で,2つの関数 s:E\to V,~t:E\to V が定まっているということです。E の要素 e\in E のことを s(e) から t(e) への辺と呼ぶことにします。自己ループや多重辺も許容するというのは,s(e)=t(e) となる辺 e があってもいいし,異なる辺  e_1\neq e_2s(e_1)=s(e_2), t(e_1)=t(e_2) となるものがあってもいいといことです