現実と数学の区別が付かない

数学ネタのブログです

ニュートン法の2次収束性とヘンゼルの補題

可換環論でのニュートン法が「2次収束」することの証明をちゃんと書いておく.

可換環 S の可逆元全体を  S^\times で表す.可換環とそのイデアル  I\subset R に対し x\in R の剰余環 R/I での像を x+I と書く.

x\in R に対し x+I\in (R/I)^\times ならば  x+I^n\in (R/I^n)^\times

証明. (x+I)^{-1}=y+I とすると,a:=xy-1\in I である.

z=y(1-a+a^2+\cdots +a^{n-1}) とおくと,\begin{align}(x+I^n)(z+I^n)&=xy(1-a+a^2+\cdots a^{n-1})\\
&=(1+a)(1-a+a^2+\cdots +(-a)^{n-1})\\
&=1+ (-1)^{n-1}a^n\in 1+I^n\end{align}より z+I^n x+I^n の逆元となる.証明終

表記を簡単にするために R/J の可逆元 x+J の逆元 (x+J)^{-1}\cfrac{1}{x}+J と書くことにする.これは \cfrac{1}{x}R で考えてその像を取っているのではないことに注意(xR で可逆とは限らない).次の定理に現れる  \cfrac{1}{f'(a)}+I^{2n} もこの意味での逆元である.

定理
 I\subset R可換環とそのイデアルn を正整数, f(x)\in R[x] とする.a\in R が \begin{align}f(a)\in I^n,~f'(a)+I\in (R/I)^\times\end{align}を満たすとき,\begin{align}b\in a -\cfrac{f(a)}{f'(a)}+I^{2n}\end{align}となる  b を取ると a+I^n=b+I^n であり,\begin{align}f(b)\in I^{2n},~f'(b)+I\in (R/I)^\times\end{align}が成り立つ.

証明. a+I^n=b+I^nb の取り方より自明.

f(x)=f(a)+f'(a)(x-a)+(x-a)^2 g(x) となる g(x) が存在する.b\in a -\cfrac{f(a)}{f'(a)}+I^{2n} より \begin{gather}
f(a)+f'(a)(b-a)\in f'(a) I^{2n}\subset I^{2n},\\
b-a\in -\cfrac{f(a)}{f'(a)} +I^{2n} \subset I^n
\end{gather}であるので,f(b)=f(a)+f'(a)(b-a)+(b-a)^2g(b)\in I^{2n} が成り立つ.

また,b-a\in I^n \subset I より  f'(a)-f'(b) \in I であるので\begin{align}f'(b)+I=f'(a)+I\in (R/I)^\times\end{align}である.証明終

この定理はニュートン法の1ステップで, f(x)R/I^n における単根 a+I^n R/I^{2n} における根 b+I^{2n} に持ち上がるということを言っている.I^nI^{2n} に改善されており,ニュートン法は「2次収束」である.

系(ニュートン法
 I\subset R可換環とそのイデアル f(x)\in R[x] とする.a\in R が \begin{align}f(a)\in I,~f'(a)+I\in (R/I)^\times\end{align}を満たすとき, x_n \in R を次で定める
\begin{align}
x_0&= a, \\
x_{n+1}&\in x_n -\cfrac{f(x_n)}{f'(x_n)} + I^{2^{n+1}}.
\end{align}このとき,x_n+I^{2^n} \in R/I^{2^n} は一意に定まっており,\begin{align}
f(x_n) \in I^{2^n},~x_{n+1}-x_n \in I^{2^n}
\end{align}が成り立つ.

特に \displaystyle b=\lim_{n\to \infty}x_n が収束するとき, f(b)=0,~b-a\in I を満たす.

系(ヘンゼルの補題
R, I, f(x),a は上の系と同様とする.RI 進位相で完備のとき,\begin{align}f(b)=0,~b-a\in I\end{align}を満たす b\in R が存在する.

周期関数の1周期積分の区分求積法

高橋-森理論など,複素解析を用いて数値積分誤差を行う話があります.今回は比較的わかりやすい例として,周期関数の1周期積分の区分求積法は区間の分割数を増やすにしたがって非常に早く(指数オーダーで)収束することを紹介します.

周期関数の1周期積分

d>0, \varepsilon >0 とし,領域 D=\{z \mid  -(d+\varepsilon)<\mathrm{Im}~z< d+\varepsilon\}\subset \mathbb{C} で正則な f(z) が実数 \alpha を周期に持つ,つまり\begin{align}
\forall z\in D, f(z+\alpha)=f(z) \end{align}が成り立っているとする.例えば,何らかの式 \varphi に対する f(z)=\varphi(e^{iz}) は周期 2\pi を持つ (\varphi が「よい」ものなら正則にもなる).実軸上での周期1つ分の積分 \begin{align} I:=\int_0^\alpha f(x) dx \end{align}を f(z)1周期積分と呼ぶことにする.積分区間 [0,\alpha] でなくても,長さ \alpha区間ならばどこを取っても同じである. t=\alpha x と変数変換すると,\begin{align}
\displaystyle I=\int_0^\alpha f(x) dx=\alpha^{-1} \int_0^1 f(\alpha t) dt
\end{align}となり,周期1の周期関数 f(\alpha z) の1周期積分の計算に帰着できる.表記を簡単にするために f(\alpha z) を改めて f(z) とおいて,周期が \alpha=1 であるとする.

このとき,1周期積分  I=\displaystyle\int_0^1 f(x) dx は区分求積法\begin{gather}
I=\lim_{N\to \infty} I_N\\
I_N:=\frac{1}{N}\sum_{k=0}^{N-1} f\left(\frac{k}{N}\right)
\end{gather}で求まりるが,この極限は指数オーダーで収束することを証明する.

証明

g(z)=\cfrac{1}{e^{2\pi i Nz}-1} f(z) とおく.g(z) も周期 1 を持つことに注意しておく.

g(z)特異点は高々一位の極 z=\cfrac{k}{N}, k\in\mathbb{Z}, であり,留数は\begin{align}
\mathrm{Res}\left(g,\cfrac{k}{N}\right)=\lim_{z\to \frac{k}{N}} g(z)\left(z-\frac{k}{N}\right)=\left.\cfrac{f(z) }{(e^{2\pi i Nz}-1)'}\right|_{z=\frac{k}{N}}=\frac{1}{2\pi i N} f\left(\cfrac{k}{N}\right)
\end{align}である (z=\frac{k}{N}f(z) の零点で,g(z) の除去可能特異点となる場合は留数が 0).

h=1/N とし,下図のように経路 C_1,C_2,C_3,C_4 を取り,反時計回りの閉じた経路 C=-C_1-C_3+C_2+C_4 を考えると,C で囲まれる領域に含まれる g(z)特異点z=\cfrac{k}{N},~0\le k\le N-1, なので,留数定理より \begin{align}
\int_C g(z) dz=2\pi i \sum_{k=0}^{N-1} \mathrm{Res}\left(g,\cfrac{k}{N}\right)=2\pi i \sum_{k=0}^{N-1}\frac{1}{2\pi i N} f\left(\cfrac{k}{N}\right)=I_N\end{align}が成り立つ.
f:id:egory_cat:20220310093642p:plain:w500
周期性 g(z+1)=g(z) より \displaystyle \int_{C_3} g(z) dz=\int_{C_4} g(z) dz が成り立つので,\begin{align}
I_N=\int_C g(z) dz&=-\int_{C_1} g(z) dz - \int_{C_3} g(z) dz + \int_{C_2} g(z) dz + \int_{C_4} g(z) dz\\
&=- \int_{C_1} g(z) dz + \int_{C_2} g(z) dz
\end{align}となる.また,下図のように反時計回りの閉路 C' をとる.
f:id:egory_cat:20220310120335p:plain:w500
f(z)D で正則なのでコーシーの積分定理より \displaystyle \int_{C'}f(z)dz=0 である.また,周期性 f(z)=f(z+1) より,やはり虚軸に平行な部分の経路の積分がキャンセルして 0 となり,\begin{align}
0=\int_{C'}f(z)dz =\int_{-h/2}^{1-h/2} f(x) dx -\int_{C_1} f(z)dz
\end{align} が成り立つ.よって\begin{align}
I=\int_0^1 f(x) dx =\int_{-h/2}^{1-h/2} f(x) dx =\int_{C_1} f(z) dz
\end{align}となる.以上より,II_N の差を \begin{align}
I-I_N&=\int_{C_1} f(z)+g(z) dz - \int_{C_2} g(z) dz\\
&= \int_{C_1} \left( 1+\cfrac{1}{e^{2\pi i Nz}-1}\right) f(z) dz - \int_{C_2}\cfrac{1}{e^{2\pi i Nz}-1} f(z) dz\\
&=\int_{C_1} \cfrac{e^{2\pi i Nz}}{e^{2\pi i Nz}-1} f(z) dz - \int_{C_2}\cfrac{1}{e^{2\pi i Nz}-1} f(z) dz
\end{align}と複素積分で表すことができる.

以下 N N>\cfrac{\log 2}{2\pi d} を満たすように大きく取る.このとき  e^{-2\pi dN} <\cfrac{1}{2} が成り立つ.
C_1:z(t)= id+t ~,-h/2\le t\le 1-h/2 より,C_1 上では \begin{align}
\left|\cfrac{e^{2\pi i N( id+t)}}{e^{2\pi i N (id+t)}-1} \right| \le \cfrac{|e^{2\pi i N( id+t)}|}{1-|e^{2\pi i N( id+t)}|} = \cfrac{e^{-2\pi dN}}{1-e^{-2\pi dN}}<2e^{-2\pi dN}
\end{align}C_2:z(t)=-id+t, ~,-h/2\le t\le 1-h/2 より,C_2 上では \begin{align}
\left|\cfrac{1}{e^{2\pi i N (-id+t)}-1} \right| \le\cfrac{1}{|e^{2\pi i N(-id+t)}|-1}=\cfrac{1}{e^{2\pi d N}-1} = \cfrac{e^{-2\pi dN}}{1-e^{-2\pi dN}}<2e^{-2\pi dN}
\end{align}よって \displaystyle M:=\max_{\mathrm{Im}(z)=\pm d} |f(z)| とおくと,\begin{align}
\left|I-I_N\right| &\le \int_{C_1} \left |\cfrac{e^{2\pi i Nz}}{e^{2\pi i Nz}-1}\right| |f(z)| |dz| + \int_{C_2} \left |\cfrac{1}{e^{2\pi i Nz}-1} \right| |f(z)| |dz| \\
&<2e^{-2\pi dN}\cdot M \cdot \mathrm{length}(C_1) + 2e^{-2\pi dN}\cdot M\cdot\mathrm{length}(C_2)\\&=4Me^{-2\pi dN}
\end{align}となり,極限 I=\lim_{N\to \infty} I_N は指数オーダーで収束する.

無限集合版の鳩の巣原理

n+1 羽以上の鳩を n 個の巣箱に入れると,少なくとも1つの巣箱に2羽以上の鳩が入るというのが鳩の巣原理と呼ばれるものです.ほとんど当たり前と思えるものですが,これを使った面白い証明がいろいろと知られています.鳩の巣原理を使える形に問題を言い換える技法の巧妙さと,そこから鳩の巣原理一発で証明が終了してしまう気持ちよさを味わうことができます.
manabitimes.jp
この鳩の巣原理を無限集合の場合にも「集合 X, Y に対し,X の濃度が Y の濃度より小さいとき,Y から X への単射は存在しない」という形に一般化できますが,もう少し強く次のことが言えます.

集合 X, Y に対し,Y が無限集合で (X は有限集合でも無限集合でもいい) X の濃度が Y の濃度より小さいとき,任意の写像 f:Y\to X に対し,ある x\in X が存在して f^{-1}(x) の濃度は Y の濃度と等しい.

X が有限集合で Y が無限集合の場合には「無限集合を有限個に分割すると,いずれかは無限集合である」という形でお馴染みなもので,例えば「有界な実数列は収束部分列を持つ」というボルツァーノワイエルシュトラスの定理や,ディリクレのディオファントス近似定理の証明に使われます.
ja.wikipedia.org
ja.wikipedia.org


今回は X, Y が共に無限集合の場合に無限集合版の鳩の巣原理が使える問題を2つ紹介します.使うのは「濃度の大きい集合から小さい集合への単射は存在しない」という形のものです.

問題1.V\subset \mathbb{R}^2 を高々可算な部分集合とする.このとき,任意の p\not\in V に対し,p を通る放物線のグラフ \begin{align} y=c_2x^2+c_1x+c_0,~~c_2\neq 0, \end{align}で,V とは交わらないものが存在することを示せ.

問題2.A=\mathbb{C}[X,Y]/(Y^2-X^3-1) とする.次の3条件をすべて満たす B を求めよ.

問題1の解答

p=(a,b) とおき,実数  0\neq c\in \mathbb{R} に対し,h_c:= c(x-a)^2+(y-b) とする.曲線 h_c=0p を通る放物線のグラフである.

任意の 0\neq c\in \mathbb{R} に対し, h_c=0 がある V の点を通ると仮定する.その点を  q_c \in V と書くことにする.\mathbb{R}\backslash\{0\} は連続無限で V は高々可算なので,ある 0 でない実数 c_1 \neq c_2 に対し  q_{c_1}=q_{c_2} となる.q_{c_1}=(a',b') とおくと,\begin{align}
\left\{\begin{array}{c} c_1(a'-a)^2+(b'-b)=0 \\ c_2(a'-a)^2+(b'-b)=0\end{array}\right.
\end{align}となる.辺々引くと (c_1-c_2)(a'-a)^2=0 より a'=a であり,よって b=b' も成り立つ.これは p=q_{c_1}\in V を意味するが,p\not\in V に矛盾する.

よって,ある 0\neq c\in \mathbb{R} に対し,放物線のグラフ h_c=0V と交わらない.

問題2の解答

K\mathbb{C} の拡大体で,\mathbb{C} より濃度の大きい代数閉体とする( 例えば \mathbb{C}(t_\lambda \mid \lambda \subset \mathbb{R}) の代数閉包とすればよい).\begin{align}C=A\otimes_{\mathbb{C}}K=K[X,Y]/(Y^2-X^3-1)\end{align}とおき,C の積閉集合 S を \begin{align}S=\{f(x,y)\in C\mid \forall (a,b) \in V_{\mathbb{C}}(Y^2-X^3-1), f(a,b)\neq 0\}\end{align}と定義し,B=S^{-1}C とおく.ただし x,y はそれぞれ X,Y の剰余環における像であり,体 k に対し V_{k}(Y^2-X^3-1):=\{(a,b)\in k^2 \mid b^2-a^3-1=0\} である.

A,~C は非特異アフィン代数曲線の座標環なのでデデキント整域であり,BC の局所化なのでデデキント整域である.

ヒルベルトの零点定理より\begin{gather}
\mathrm{Spec}~A=\{(0)\}\cup \{\langle x-a,x-b\rangle_A \mid (a,b) \in V_{\mathbb{C}}(Y^2-X^3-1)\}\\
\mathrm{Spec}~C=\{(0)\}\cup \{\langle x-a,x-b\rangle_C \mid (a,b) \in V_{K}(Y^2-X^3-1)\}
\end{gather}である.ただし,可換環 Rf,g\in R に対し,\langle f,g\rangle_Rf,g が生成するイデアル fR+gR を表す.

B の素イデアル(0) または,S と交わらない C の素イデアルB に拡大したものだが, \langle x-a,x-b\rangle_C \in \mathrm{Spec}~C, ~ a,b\in K, S と交わらない必要十分条件(a,b) \in V_{\mathbb{C}}(Y^2-X^3-1) であるので,\begin{gather}
\mathrm{Spec}~B=\{(0)\}\cup \{\langle x-a,x-b\rangle_B \mid (a,b) \in V_{\mathbb{C}}(Y^2-X^3-1)\}
\end{gather}である.\mathrm{Spec} ~B が連続無限濃度を持つことも注意しておく.

 \langle x-a,x-b\rangle_B\in \mathrm{Spec}~B に対し \begin{align} \langle x-a,x-b\rangle_B \cap A= \langle x-a,x-b\rangle_A \in \mathrm{Spec}~A\end{align}なので,自然な写像 \mathrm{Spec} ~B\to \mathrm{Spec} ~A全単射であることが分かる.

あとは B が単項イデアル整域であることを示せば A\subset B が求める具体例であることが分かる.

\mathfrak{p}\in \mathrm{Spec} ~B に対し,離散付値環 B_{\mathfrak{p}} の標準的な離散付値 (B_{\mathfrak{p}} の極大イデアルの生成元での値が 1 となるもの) を v_{\mathfrak{p}} と書く.Bデデキント整域なので,任意の g\in B に対し,v_{\mathfrak{p}}(g)\neq 0 となる \mathfrak{p} は有限個しか存在せず,さらに \begin{align}gB=\prod_{(0)\neq \mathfrak{p}\in \mathrm{Spec} ~B} \mathfrak{p}^{v_{\mathfrak{p}}(g)}\end{align}が成り立つことが知られている.

\mathfrak{p}=\langle x-a, y-b\rangle_B \in \mathrm{Spec} ~B とする.

 x-a, y-b\in \mathfrak{p}B_{\mathfrak{p}} なので v_{\mathfrak{p}}(x-a)\ge 1,~v_{\mathfrak{p}}(y-b)\ge 1 だが,いずれか一方は \mathfrak{p}B_{\mathfrak{p}} の生成元なので (中山の補題により,局所ネター環のイデアルの生成系からは極小生成系が選べる),少なくとも v_{\mathfrak{p}}(x-a)=1v_{\mathfrak{p}}(y-b)=1 のいずれか一方は成り立つ.どちらの場合も同様なので v_{\mathfrak{p}}(y-b)=1 とする.c\in K に対し,\begin{align}h_c:=c(x-a)^2+(y-b)\in B\end{align}とおく.v_{\mathfrak{p}}(x-a)\ge 1 より v_{\mathfrak{p}}((x-a)^2)\ge 2 であり,v_{\mathfrak{p}}(h_c)=1 となる.

ここで,任意の c\in K に対し,h_c を含む \mathfrak{p} とは異なる  \mathrm{Spec} ~B の元が存在すると仮定する.その素イデアル\mathfrak{q}_c と書く.\mathrm{Spec} ~B は連続無限濃度で K の濃度はそれよりも大きいので,ある c_1\neq c_2 に対し \mathfrak{q}_{c_1}=\mathfrak{q}_{c_2} となる. \mathfrak{q}_{c_1}=\langle x-a', y-b'\rangle_B とおくと,h_{c_1},h_{c_2}\in \langle x-a', y-b'\rangle_B より,\begin{align}
\left\{\begin{array}{c} c_1(a'-a)^2+(b'-b)=0 \\ c_2(a'-a)^2+(b'-b)=0\end{array}\right.
\end{align}が成り立つ.よって (a,b)=(a',b') であり,\mathfrak{p}=\mathfrak{q}_{c_1} となるが,これは矛盾.

よって,ある c\in K に対し,h_c を含む B の素イデアル\mathfrak{p} のみとなる.
この c に対し \begin{align} h_c B=\prod_{(0)\neq \mathfrak{q}\in \mathrm{Spec} ~B} \mathfrak{q}^{v_{\mathfrak{q}}(h_c)}=\mathfrak{p}\end{align}となり,\mathfrak{p} は単項イデアルである.よって B は単項イデアル整域である.