現実と数学の区別が付かない

数学ネタのブログです

隣接行列の一般化とトロピカル演算の正体

最近話題になったこの記事。
qiita.com

この記事は主に次の事実を扱ったものです。

有向グラフの辺の重みを並べた行列のトロピカルな m 乗の第 (i, j)-成分は,i 番目の頂点から j 番目の頂点への道のうち,最小の重みを持つものの重みに等しいという話です。

ここで,トロピカル演算は次のように定義されるものです。

トロピカル加法  a\oplus b := \min\{a,b\}
トロピカル乗法  a\otimes b :=a+b
トロピカル加法の単位元  \infty \oplus a =a \oplus \infty=a, \infty \otimes a =a \otimes \infty=\infty

この話を聞いて,似た話を知っていると思った人もいたのではないでしょうか。それは次の定理です。

有向グラフの隣接行列の m 乗の第 (i, j)-成分は,i 番目の頂点から j 番目の頂点への道の数に等しい。

辺の重みを並べた行列は,隣接行列に見た目がよく似ています。

この2つの似た事実は成り立つ理由もよく似ていますが,隣接行列をうまく一般化するとこの2つの事実を同時に示すことができるというのが今日のお話です。この話を通して,トロピカル演算の正体が見えてきます。

2つの類似した現象

以降では自己ループや多重辺も許容する有向グラフ G=(V,E) を考えます。ただし, V=\{1,\dots,n\} を頂点集合,E を辺集合とします。また,辺 e\in E に対し, e の始点を s(e),終点を  t(e) で表すことにします*1

有向グラフの隣接行列

さて,有向グラフ G=(V,E) に対して
\begin{align}
a_{ij}&=\#\{e\in E \mid s(e)=i, t(e)=j\}\\
&=\mbox{頂点$i$ から 頂点$j$ への辺の本数}
\end{align}で定まる n\times n 行列  A=(a_{ij})_{i,j\in V}G隣接行列と呼びます。

隣接行列 AmA^m の第 (i, j)-成分は

\displaystyle
\sum_{k_1,k_2,\dots,k_{m-1} \in V} a_{i k_1} a_{k_1k_2} a_{k_2k_3} \dots a_{k_{m-1} j}

です。a_{k\ell} は頂点 k から頂点 \ell への辺の本数なので,\sum の中身は

\displaystyle
i\rightarrow k_1 \rightarrow k_2 \rightarrow \dots \rightarrow k_{m-1} \rightarrow j

というルートを通る道の本数を表しています。よって,その合計は i から j への長さ m の道の数に等しいことが分かります。

有向グラフの重み行列

さらに,辺の重みを与える関数 w:E\to \mathbb{Z}_{\ge 0} が定まっている場合を考えましょう。つまり,各辺 e\in E に重み w(e)\in \mathbb{Z}_{\ge 0} が定まっています。

応用上では重みは,辺の長さや,通過にかかる時間・コスト,容量などを表すものとして定められることが多いです。

辺に重みがつけられた有向グラフ G=(V,E) に対して,
\begin{align}
w_{ij}&=\min\{w(e)\mid e\in E,s(e)=i, t(e)=j \}\\
&=\mbox{頂点$i$ から 頂点$j$ への辺の重みの最小値}
\end{align}で定まる n\times n 行列  W=(w_{ij})_{i,j\in V}G重み行列と呼びます。ただし,i から j への辺がないときは  w_{ij}=\infty と定めます。これは重みが辺の通過にかかる時間を表しているとき,「辺がない」ことを「時間が無限にかかる」と表現していると解釈すれば,この定義に納得できると思います。

重み行列 W のトロピカルな mW^{\otimes m} の第 (i, j)-成分は

\displaystyle
\bigoplus_{k_1,k_2,\dots,k_{m-1} \in V} a_{ik_1}\otimes w_{k_1k_2}\otimes w_{k_2k_3}\otimes \dots \otimes w_{k_{m-1}k_m} \otimes w_{k_m j}\hspace{20mm}
\displaystyle= \min\{ w_{ik_1}+ w_{k_1k_2}+ w_{k_2k_3}+\dots+ w_{k_{m-1}j} \mid k_1,k_2,\dots,k_{m-1} \in V \}

です。w_{k\ell} は頂点 k から頂点 \ell への辺の重みの最小値なので,\min の中身は

\displaystyle
i\rightarrow k_1 \rightarrow k_2 \rightarrow \dots \rightarrow k_{m-1} \rightarrow j

というルートを通る道の重みの最小値を表しています。よってその最小値は i から j への長さ m の道の重みの最小値に等しいことが分かります。

具体例

具体例で見てみましょう。


f:id:egory_cat:20190713093829p:plain:w300

この有向グラフの隣接行列A と重み行列 W
\begin{align}
A=\left(
\begin{array}{ccccc}
0 & 1 & 0 & 0 & 0\\
0 & 0 & 1 & 0 & 1\\
1 & 0 & 0 & 0 & 0\\
0 & 1 & 0 & 0 & 0\\
0 & 0 & 1 & 1 & 0
\end{array}
\right),~~~
W=\left(
\begin{array}{ccccc}
\infty & 3 & \infty & \infty & \infty\\
\infty & \infty & 2& \infty & 7\\
6 & \infty & \infty & \infty & \infty \\
\infty &10 & \infty & \infty & \infty \\
\infty & \infty & 5 & 1 & \infty
\end{array}
\right)
\end{align}となります。この 6 乗をそれぞれ計算してみましょう。ただし W の方はトロピカルな 6 乗です。

\begin{align}
A^6=\left(
\begin{array}{ccccc}
2 & 0 & 3 & 2 & 1\\
3 & 4 & 1 & 1 & 0\\
0 & 1 & 2 & 0 & 2\\
2 & 0 & 3 & 2 & 1\\
1 & 3 & 2 & 0 & 2
\end{array}
\right),~~~
W^{\otimes 6}=\left(
\begin{array}{ccccc}
{22} & \infty & {26} & {22} & {31}\\
{29} & {22} & {33} & {29} & \infty\\
\infty & {30} & {22} & \infty & {27}\\
{29} & \infty & {33} & {29} & {38}\\
{32} & {25} & {24} & \infty & {29}
\end{array}
\right)
\end{align}
 A^6 の第 (1, 4)-成分は 2 なので,頂点 1 から頂点 4 への長さ 6 の道はちょうど 2本あることが分かります。

また, W^{\otimes 6} の第 (1, 4)-成分は 22 なので,頂点 1 から頂点 4 への長さ 6 の道の最小の重みは 22 であることが分かります。

実際,頂点 1 から頂点 4 への長さ 6 の道は\begin{align}
&1\rightarrow2\rightarrow3\rightarrow1\rightarrow2\rightarrow5\rightarrow4\\
&1\rightarrow2\rightarrow5\rightarrow4\rightarrow2\rightarrow5\rightarrow4
\end{align}の2本だけで,重みはそれぞれ \begin{align} 3+2+6+3+7+1&=22\\3+7+1+10+7+1&=29\end{align} になっており,最小値は確かに 22 です。

隣接行列の一般化

さて,AW 両方の情報を含むような新たな行列を定義しましょう。

G=(V,E)V=\{1,\dots,n\} を頂点集合,E を辺集合とする自己ループや多重辺も許容する有向グラフで,重み関数 w:E\to \mathbb{Z}_{\ge 0} が定まっていたことを思い出しましょう。また,e\in Es(e) から  t(e) への辺です 。

x を変数とし,\begin{align}
a_{ij}(x)=\sum_{e\in E, s(e)=i,t(e)=j} x^{w(e)}
\end{align}で定まる n\times n 行列  A(x)=(a_{ij}(x))_{i,j\in V}G多項式隣接行列と呼ぶことにします。

多項式隣接行列 A(x)mA(x)^m の第 (i, j)-成分は

\displaystyle
\sum_{k_1,k_2,\dots,k_{m-1} \in V} a_{i k_1}(x) a_{k_1k_2}(x) a_{k_2k_3}(x) \dots a_{k_{m-1} j}(x)

です。この展開を考えると,A(x)^m の第 (i, j)-成分の x^d の係数は, i から j への長さ m の道で,重みが d であるものの本数であることが分かります。

具体例

先ほどの例で見てみましょう。


f:id:egory_cat:20190713093829p:plain:w300

この有向グラフの多項式隣接行列は

A(x)=\left(
\begin{array}{ccccc}
0 & x^3 & 0 & 0 & 0\\
0 & 0 & x^2 & 0 & x^7\\ 
x^6 & 0 & 0 & 0 & 0\\ 
0 & x^{10} & 0 & 0 & 0\\ 
0 & 0 & x^5 & x & 0
\end{array}
\right)

となります。この 6乗を計算してみましょう。

A(x)^6=\left(
\begin{array}{ccccc}
x^{29}+x^{22} & 0 & x^{33}+2x^{26} & x^{29}+x^{22} & x^{31}\\
x^{36}+2x^{29} & x^{36}+2x^{29}+x^{22} & x^{33} & x^{29} & 0\\
0 & x^{30} & x^{29}+x^{22} & 0 & x^{34}+x^{27}\\
x^{36}+x^{29} & 0 & x^{40}+2x^{33} & x^{36}+x^{29} & x^{38}\\
x^{32} & 2x^{32}+x^{25} & x^{31}+x^{24} & 0 & x^{36}+x^{29}
\end{array}
\right)

 A(x)^6 の第 (1, 4)-成分は x^{29}+x^{22} なので,頂点 1 から頂点 4 への長さ 6 の道は,重みが 29 のものと  22 のものが 1本ずつあることが分かります。

また,第 (2, 2)-成分は  x^{36}+2x^{29}+x^{22} なので,頂点 2 から頂点 2 への長さ 6 の道は,重みが 36 のものと  22 のものが1本ずつ,重みが 29 のものが2本あることが分かります。

実際,\begin{align}
&2\rightarrow5\rightarrow4\rightarrow2\rightarrow5\rightarrow4\rightarrow2\\
&2\rightarrow3\rightarrow1\rightarrow2\rightarrow3\rightarrow1\rightarrow2\\
&2\rightarrow5\rightarrow4\rightarrow2\rightarrow3\rightarrow1\rightarrow2\\
&2\rightarrow3\rightarrow1\rightarrow2\rightarrow5\rightarrow4\rightarrow2
\end{align}の4本で,重みがそれぞれ 36,22,29,29 となっています。

隣接行列・重み行列との関係

定義より, A(x)x=1 を代入したものは隣接行列 A に一致しています。よって,A^m A(x)^mx=1 を代入することで得られます。

また,W^{\otimes m} の第 (i, j)-成分は i から j への長さ m の道の重みの最小値でしたが,これは  A(x)^m の第 (i, j)-成分の最低次数に一致します (ただし,0 の最低次数は \infty と約束します)。

こうしてみると,トロピカル演算の正体が見えてきます。つまりトロピカル演算とは,多項式の最低次数だけを抜き出して計算しているものなのです。

トロピカル演算の正体

多項式 \displaystyle f(x) = \sum_n c_nx^n に対し,\begin{align}\mathrm{ord}(f)&:=\min \{n \mid c_n\neq 0\}\\ \mathrm{ord}(0)&:=\infty \end{align} と定義し,f(x)オーダーと呼びます。

\mathrm{ord}(0)=\infty とする理由を説明します。いま,次数の小さい部分に注目していますが,これは  |x| が十分に小さい範囲を考えていることに対応しています。物理学で,  |x| が十分に小さいときに  \sin x=x-\frac{x^3}{3!}+\frac{x^5}{5!}-\cdotsx で近似したりしますよね。 |x| が十分に小さいときは \displaystyle \lim_{n\to \infty} x^n=0 なので,\mathrm{ord}(0)=\infty と約束するのが都合がよいのです。

2つの多項式 \displaystyle f(x), g(x) に対し, \begin{align}
\mathrm{ord}(fg)&=\mathrm{ord}(f)+\mathrm{ord}(g)\\
\mathrm{ord}(f+g)&\ge \min\{\mathrm{ord}(f),~\mathrm{ord}(g)\}\\
\end{align}が成り立ちます。2番目の不等式で等号が成り立たないのは,最低次数の部分がちょうどキャンセルして0になる場合です。

よってそれ以外の場合,例えば fg の係数が全て非負の場合は \begin{align}
\mathrm{ord}(fg)&=\mathrm{ord}(f)+\mathrm{ord}(g)\\
\mathrm{ord}(f+g)&= \min\{\mathrm{ord}(f),~\mathrm{ord}(g)\}\\
\end{align}となります。オーダー関数 \mathrm{ord} によって,加法が \min に,乗法が + に変換されていることが見て取れます。さらに加法単位元 0 については \mathrm{ord}(0)=\infty で,\mathrm{ord}(f\times 0)=\infty です。これはまさにトロピカル演算

トロピカル加法  a\oplus b := \min\{a,b\}
トロピカル乗法  a\otimes b :=a+b
トロピカル加法の単位元  \infty \oplus a =a \oplus \infty=a, \infty \otimes a =a \otimes \infty=\infty

を表しています。

より詳しくトロピカル代数・トロピカル幾何を知りたい方は次のサイトからいろいろたどってみてください。
http://pantodon.shinshu-u.ac.jp/topology/literature/tropical_mathematics.html

*1:つまり E は単なる有限集合で,2つの関数 s:E\to V,~t:E\to V が定まっているということです。E の要素 e\in E のことを s(e) から t(e) への辺と呼ぶことにします。自己ループや多重辺も許容するというのは,s(e)=t(e) となる辺 e があってもいいし,異なる辺  e_1\neq e_2s(e_1)=s(e_2), t(e_1)=t(e_2) となるものがあってもいいといことです

光速の追い風参考記録

陸上のサニブラウン選手が全米大学陸上選手権男子100メートル決勝で9秒97の日本記録を出しました。準決勝ではより速い9秒96でしたが,こちらは追い風2.4メートルの参考記録でした。
www.nikkansports.com
短距離走では追い風が記録に有利に働くため,追い風の平均風速が秒速2.0メートルを超えると記録が公認のものにならずに「参考記録」となります。

短距離走は人類最速を競う競技ですが,物理最速のものといえば「光」です。

その光ですら追い風で速くなるというお話を今日はしたいと思います。

空気中の光速

あらゆる物質の運動の速さは真空中の光速 c=299792458~ \mathrm{m}/\mathrm{s}を超えることができません。じゃあ追い風で速くなることはないんじゃないかと思うかもしれませんが,追い風が吹いているということは周りに空気があるということです。空気中の光速は真空中の光速よりも遅くなっています。その速さの差の分だけ,まだ速くなれる余地が残されているのです。伸びしろですね。

光速は物質中では真空中よりも遅くなります。その速度の比 \begin{align}n={(\mbox{真空中の光速})}/{(\mbox{物質中の光速})}> 1\end{align}をその物質の絶対屈折率といいます。

空気の絶対屈折率は1.000292で,水の絶対屈折率は1.3334です(正確には絶対屈折率は波長によって異なります。この絶対屈折率は波長 589.3~\mathrm{nm} の光に対してのものです)。物質中の光速は絶対屈折率を用いて  \cfrac{c}{n} と表されます。

では,追い風が吹いている空気中を進んでいる光速の速さはどうなるでしょうか?それを計算するために必要なのがローレンツ変換です。

ローレンツ変換

慣性系Sに対してx軸方向に速度 v~\mathrm{m}/\mathrm{s} で等速直線運動をする別の慣性系S'を考えましょう。
S系の時空座標を t,x,y とし,S'系 の時空座標を t',x',y' とします。
f:id:egory_cat:20190608104114g:plain
このとき,次の変換法則が成り立ちます。これがローレンツ変換と呼ばれているものです。
\begin{align*}
t'&=\frac{1}{\sqrt{1-\frac{v^2}{c^2}}} \left(t-{\frac{vx}{c^{2}}}\right)\\
x'&=\frac{1}{\sqrt{1-\frac{v^2}{c^2}}} (x-vt)\\
y'&=y
\end{align*}
ローレンツ変換 - Wikipedia
この逆変換を求めると
\begin{align}
t&=\frac{1}{\sqrt{1-\frac{v^2}{c^2}}} \left(t'+{\frac{vx'}{c^2}}\right)\\
x&=\frac{1}{\sqrt{1-\frac{v^2}{c^2}}} (x'+vt')\\
y&=y'
\end{align}
となります。

以下ではx軸上の運動のみを考えます。

S' 系から見て速度  \cfrac{dx'}{dt'} で運動している物体があったとします。この物体の運動をS系から観測したときの速度 \cfrac{dx}{dt}ローレンツ変換を用いて計算してみましょう。ローレンツ変換の逆変換の式を微分すると
\begin{align*}
dt &=\frac{1}{\sqrt{1-\frac{v^2}{c^2}}} \left(d t'+{\frac{vd x'}{c^2}}\right)\\\
dx &=\frac{1}{\sqrt{1-\frac{v^2}{c^2}}} (d x'+vd t')
\end{align*}
なので,
\begin{align*}
\cfrac{dx}{dt} =\cfrac{d x'+vd t'}{d t'+\frac{vd x'}{c^2} }=\cfrac{\frac{d x'}{d t'}+v}{1+\frac{v}{c^2}\frac{d x'}{d t'}}
\end{align*}
となります。

追い風の中の光速

さて,一定の風速  v~\mathrm{m}/\mathrm{s} の追い風が吹いている中で光を観測すると,その速さはどうなるでしょうか?

風が一切吹いていない v=0 のとき,光速は  \cfrac{c}{n} となります。ただし n は空気の絶対屈折率です。

風速が  v>0 の場合を考えます。静止系Sから見て,風速と同じ速度で移動する慣性系S'を考えましょう。風と同じ速度で動いているので,S'系 では風を感じません。よってS'系で光速を観測すると,それは無風状態で観測した光速  \cfrac{c}{n} になります。

S'系に対して速度 \cfrac{d x'}{d t'} = \cfrac{c}{n} で運動するものをS系から観測すると,その速度は先ほどの計算により
\begin{align*}
\cfrac{dx}{dt} &=\cfrac{\frac{c}{n}+v}{1+\frac{v}{c^2}\frac{c}{n}}=\cfrac{c+nv}{v+nc}\cdot c \\
&=\left(1+\cfrac{(n^2-1)v}{v+nc}\right)\cdot \cfrac{c}{n}\\
&=\left(1-\cfrac{(n-1)(c-v)}{v+nc}\right)\cdot c
\end{align*}となります*1

0 < v \leq c1 < n であることから, \cfrac{c}{n}<\cfrac{dx}{dt} \leq c が成り立ちます。この\cfrac{dx}{dt} が,風速  v~\mathrm{m}/\mathrm{s} の追い風が吹いているときに観測される光速です。

追い風が吹いている場合の光速は,無風の場合の光速  \cfrac{c}{n} よりは速いが,真空中の光速  c を超えることが無いことが分かりました。

光速の追い風参考記録

 n=1.000292 としましょう。

分母の  v+nc nc が大きいので, v nc に比べて十分小さいとき,追い風の影響で速くなる分  \cfrac{(n^2-1)v}{v+nc}\cdot \cfrac{c}{n} は \begin{align}\cfrac{(n^2-1)v}{nc}\cdot \cfrac{c}{n} =\cfrac{n^2-1}{n^2}\cdot v=5.83744\times 10^{-4} \times v\end{align}という v の定数倍の式で近似できます。

 ac\approx 3.0\times 10^8 なので,0\le v\le 10^6 程度のときはほぼ 5.8\times 10^{-4} \times v です。

短距離走参考記録となる風速  2.0~\mathrm{m}/\mathrm{s}の追い風が吹いている場合は,光は 1.2\times 10^{-3} [\mathrm{m}/\mathrm{s}] ほど,つまり秒速1.2ミリメートルほど追い風の影響で速くなる計算になります。

*1:結果は同じですが波の位相速度としても計算しておきましょう。\gamma=1/\sqrt{1-\frac{v^2}{c^2}} とおきます。S'系から見て位相速度 \cfrac{c}{n} で進む波 \sin(nkx'-ckt')S系から観測すると,\sin\left(nk\gamma (x-vt)-ck\gamma \left(t-{\frac{vx}{c^{2}}}\right) \right)
=\sin\left(k\gamma \left(n+\frac{v}{c}\right)x-k\gamma\left(nv+c\right)t \right)となり,その位相速度は  \cfrac{nv+c}{n+\frac{v}{c}}=\cfrac{c+nv}{v+nc}\cdot c になります。

ユークリッド幾何の第1公準

この記事は、日曜数学アドベントカレンダーの2日目の記事です。
adventar.org
1日目はtsujimotterさんの「パスカルの三角形にたくさん出てくる数: 3003」でした。3003はパスカルの三角形に何回出てくるのでしょうか?追記された部分も面白いのでまだ読んでいない方はぜひ読んでみてください。
tsujimotter.hatenablog.com


2日目のテーマはユークリッド幾何の第1公準です。

ユークリッドの『原論』といえば平行線の公理とも呼ばれる第5公準をめぐる物語でしょう。

第5公準 1本の線分が2本の線分と交わり, 同じ側の内部に作る角の和が2直角より小さいとき, これら2本の線分を延長すると, 角の和が二直角より小さい側で交わる

この第5公準を言い換えた次のものを平行線の公理と呼ぶことも多いようです。

第5公準の言い換え 与えられた直線外の1点を通り,この直線に平行な直線がただ1本存在する

他にも「三角形の内角の和が2直角(180°)」とも言い換えられることが知られています。

平行線公準 - Wikipedia

この第5公準は他の公準とくらべて文章が長く複雑なので,本当に幾何の基礎たる公準に入れる必要があるのか,多くの人が疑問に思いました。そして,多くの数学者が第5公準を第1公準から第4公準を使って証明できないかと挑戦してきました。そのような試みから始まり,双曲幾何の発見により第5公準の独立性(第1~第4公準から証明も反証もできないこと)が証明されるまでの物語は,2000年を超える壮大なものです。

今日はこの平行線の公理ではなくて,第1公準について色々と考えてみましょう。

第1公準 与えられた2点を結ぶ線分を1本だけ引くことができる

単に2点を定木を使ってピッと結べば線分の出来上がり。第5公準にくらべると「当たり前」で,証明の必要のない事実として受け入れることに抵抗はないでしょう。

いつもみんなの笑いもの,ってことはないですが,個別に扱うにはツマラナイものに思えるかもしれません。ところが考察してみるとなかなかどうして色々と面白い話が出てきます。

ちなみに内容は独自研究みたいなものですので,他所の解説記事とは異なることも書いてあると思います(いろいろ調べてみると第1~第5公準のそれぞれが本当に何を意味しているのか世間の合意が取れていないようにも思えます。しかし「○○かどうかは公準の解釈による」とか言っていたら何も考えられないので,この記事は「ユークリッド原論の記述をそのまま素直に読む」という立場で書いています)。正直,手を出すのがちょっと怖いネタですね。あくまで一説として読んで下さい。何か思うことがあればコメントをくれるとありがたいです。

Contents

ユークリッド原論の5つの公準

実は『原論』は原典が現存しておらず写本しか残っていません。全13巻ある『原論』の第1巻では点・直線・円・直角などの定義から始まり,5つの公準と9つの公理が提示され,平面幾何に関する48個の命題が証明されています。

この記事では,平面幾何に関わる5つの公準を以下の通りとします。

第1公準 与えられた2点を結ぶ線分を1本だけ引くことができる
第2公準 与えられた線分を延長することができる
第3公準 与えられた点と半径で円を描くことができる
第4公準 すべての直角は等しい
第5公準 1本の線分が2本の線分と交わり, 同じ側の内部に作る角の和が2直角より小さいとき, これら2本の線分を延長すると, 角の和が二直角より小さい側で交わる

こっそり修正されている 第1 公準

実はこの第1公準はオリジナルのものとちょっと異なります。Wikipediaから引用すると
ユークリッド原論 - Wikipedia

任意の一点から他の一点に対して直線を引くこと

とあり,「1本だけ」という条件が入っていません(ここでいう「直線」とは,現代でいう「線分」のことです)。この条件は9番目の公理から導かれます。再びWikipediaから引用します。

1. 同じものに等しいものは、互いに等しい
(中略)
9. [2線分は面積を囲まない]
ただし[]で囲まれた公理は公理に含めないことがある。

2線分が面積を囲むとは,例えば次の図のようになることです。
f:id:egory_cat:20181125093429p:plain:w400
つまり2点  P,~Q を結ぶ線分が2本以上ある場合です。

そこで,「与えられた2点を結ぶ線分を1本だけ引くことができる」としたものを新たに第1公準として採用することにします。

公準」と「公理」をそれぞれ見てみると,公準は幾何に関するもの,公理は一般的な等式・不等式に関わるものになっていますが,なぜかこの9番目の公理だけは幾何に関するものになっています。しかも公理に含めたり含めなかったりするとの注釈が入っており,いろいろと謎が残ります。

憶測ですが,後世の人が写本を作る際に必要と思って付け加えようとしたのだけれど,神聖な5つの公準はいじることが出来ずに仕方なく公理の最後にくっつけたのかもしれません。

ユークリッド幾何のスーパースター「平行線の公理」

今回の話の本題ではないですが,第5公準に触れないわけにはいかないでしょう。

第5公準 1本の線分が2本の線分と交わり, 同じ側の内部に作る角の和が2直角より小さいとき, これら2本の線分を延長すると, 角の和が二直角より小さい側で交わる f:id:egory_cat:20181125093449p:plain

この第5公準は「与えられた直線外の1点を通り,この直線に平行な直線がただ1本存在する」「三角形の内角の和が2直角(180°)」とも言い換えられることが知られています。

多くの数学者が第5公準を第1~第4公準を使って証明できないかと挑戦してきました。そして双曲幾何の発見により,第5公準を第1~第4公準から証明できないことが分かることになるのですが,その答えを知った後にこの「第5公準を証明せよ」という問題を見直してみると,この問題は二重の意味で「解くのが不可能な問題」であることが分かります。

という2つの大きな壁が問題解決の前に立ちふさがっていたのです。

これは「幾何学といえばユークリッド幾何」が常識の時代に気付くことは不可能と言ってもいいでしょう。まさに数学者の人生を食いつぶす「悪魔の問題」です。

第5公準の独立性は,問題が解決された今日でも初学者はなかなか簡単に理解できるものではないと思います。それは双曲幾何のモデルをちゃんと理解するのが難しいからです。

そこで,ここでは第1公準の独立性について話をしましょう。第5公準の独立性を理解するときの練習にもなると思います。

球面幾何

ユークリッド幾何とは異なる公準を持つ幾何を非ユークリッド幾何と呼びます。双曲幾何も非ユークリッド幾何のひとつです。

ここではユークリッド幾何のひとつである球面幾何をいうものを紹介します。

図形を球面上で考える幾何学球面幾何といいます。

球面上の点を「点」,球面に沿って2点を結ぶ最短の曲線を「線分」,球面上のある点から一定の距離にある点の集まりを「円」,2つの線分のなすの「角度」は線分の接線のなす角度と解釈します。

すると,「線分」は大円(球の中心を通る平面と球面との交わりでできる円)の一部になり,「」は通常の意味での円と同じ図形になります。
f:id:egory_cat:20181127133940p:plain:w200
「線分」をずっと延長したものが「直線」なので,大円が球面上の「直線」に当たります。なので,球面幾何では直線は特殊な円ということになります(ユークリッド幾何の直線も「半径が無限大の円」と解釈できなくもないですが)。

なぜ大円が球面上の「直線」となるのか,(ごまかした)説明をしてみます。

まず直感的に説明すると,大円は球面に描ける一番曲がりが“緩い”曲線です。つまり,球面上の曲線の中で一番普通の意味での直線っぽいものなので,点同士を最短に結ぶ曲線は大円の一部にります。

まあそんな気もするけどちょっと納得しづらいですかね?それでは“物理的に”説明してみましょう(もちろんごまかしの説明です)。

球面にへばりついて生活している「球面人」を考えてみましょう。球面人にとっては自分が住んでいる球面だけが世界の全てで,実は外の世界があって自分は球面に束縛されているだけである事を感じることが出来ないとします。さて,球面人がツルツルのソリに乗って大円上を一定の速度で滑っているとしましょう。外の世界にいる我々から見ると,球面人のソリは等速円運動をしているわけですから,大きさが一定で球の中心に向う向心力が作用している運動をしているように見えます。この向心力は,ソリを球面上に束縛するための力です。球面人は自分は球面に束縛されていることを感じられないので,この向心力を感じることが出来ません。つまり,球面人は自分には何の力もかかっていないと感じていることになります。物理には慣性の法則「外力が働かなければ,物体は静止または等速直線運動を永遠に続ける」というものがありました。球面人の世界でも慣性の法則が成り立つとすると,大円が「球面人にとっての直線」であるという結論になります。

球面幾何と5つの公準

これから球面幾何で第1公準~第5公準が成り立つか見てみましょう。

このときに注意するのが「書いてある通りに解釈する」ということです。公理系というのは厳密な論理のルールなので,書いてもいない内容を勝手に想像して読み込んでいたら,一体何が前提なのか分からなくなってしまいます。言われたことをそのままの意味にしか取れないカタブツAIロボになった気持ちで球面幾何で第1公準~第5公準が成り立つかをチェックしていきましょう。

球面幾何と第1公準

まずは第1公準からです。

第1公準 与えられた2点を結ぶ線分を1本だけ引くことができる

球面幾何では第1公準は成り立ちません。北極と南極を結ぶ「線分」が1本だけでなく,無数に存在するからです。
f:id:egory_cat:20181129141159p:plain:w200
しかし,「2点を結ぶ線分が存在する」という命題は成り立ちます。成り立っていないのは,2点を結ぶ線分の一意性の部分だけです。こうしてみると,追加された「1本だけ」という条件がいかに大事かが分かります。

球面幾何と第2公準

第2公準について見てみましょう。

第2公準 与えられた線分を延長することができる

球面幾何での「直線」である大円は長さが有限で,ずっと延長していくと元の点に戻ってきてしまい,第2公準が成り立つとしていいか迷うかもしれません。また,球面幾何では線分を延長していくと線分でなくなってしまいます。
f:id:egory_cat:20181130192528p:plain:w200
南極 S から伸びる線分 SP の端点 P を動かして線分を延長していくと,P が北極 N に到達するまでは円弧 SP は球面上の線分ですが,北極 N を通り過ぎると円弧 SP は球面上の線分でなくなってしまいます(逆方向から繋いだ方が最短路)。

しかし,単に「線分を延長する」という操作はできているように見えます。

正直「延長することができる」の言葉の解釈の問題のような気もしますが*1「線分を延長して元の点に戻って来てはいけない」「線分を延長した結果も線分である」とはどこにも書いていないので(カタブツAIロボの精神)この記事では 球面幾何では第2公準は成り立っている と解釈することにします*2

球面幾何と第3公準

第3公準について見てみましょう。

第3公準 与えられた点と半径で円を描くことができる

球面上の円には大きさの上限があります。つまり,あまりにも大きな半径を指定すると,その半径を持つ円を描くことができないので,球面幾何では第3公準は成り立たないと思ってしまうかもしれません。

しかし,この考え方は「半径」の定義を誤解しています。もしくは第3公準が成り立つかは「半径」の定義によると言ってもいいでしょう。ではどの定義を採用するかというと,ユークリッド原論の定義を採用するのが一番フェアでしょう。

ユークリッド原論の円の定義を引用してみましょう。定義の15番目が円の定義で,17番目が直径の定義です。
pisan-dub.jp

円とは周と呼ばれる一つの線の境界で囲まれた平面図形であって、その中にある一つの点から円周上の点に引かれた直線の長さがすべて等しいようなものである。
(中略)
直径とは、円の中心を通り、円周上に両端をもつ直線であり、それによって円は二分される。

ここでいう「直線」とは,現代でいう「線分」のことです。半径は直径の半分のことなので,この定義によれば「半径」の定義は「現代的な意味での実数」ではなくて「線分」であることが分かります。実際に原論の証明の中でも,円を描くときは中心と円が通る点を指定しています。

そもそもユークリッド原論では,長さ・角度・面積を数値で表して比較するということを一切しません 。というより,線分や三角形などの「図形」と長さや面積などの「量」を分けて考えるという思想がそもそも無いようです。

ロマンティック数学ナイトで日曜数学会キグロ氏が原論の魅力を語る - ログミーBiz

球面幾何で第3公準が成り立つかは,球面上のある点とそこから伸びる線分があったとき,その点を中心とし,その線分を半径とする円を描けるかどうか判定すればいいことになります。球面上ではそのような円は描くことができます。第3公準は球面幾何で成り立ちます

球面幾何と第4公準

第4公準について見てみましょう。

第4公準 すべての直角は等しい

球面幾何では第4公準は成り立ちます。直角とは直線をその直線上の点で真っ二つに分けたもののことです。どの直角も↓と同じ形です。
f:id:egory_cat:20181127133946p:plain:w200
疑いの余地なし!ありがとう第4公準

球面幾何と第5公準

最後はスーパースター第5公準です。

球面上の「直線」は大円でしたが,球面上のどんな2つの大円も交わることはすぐに分かります。つまり,球面幾何には「平行線」というものは存在しません。
f:id:egory_cat:20181129141159p:plain:w200
平行線の公理こと第5公準は「与えられた直線外の1点を通り,この直線に平行な直線がただ1本存在する」と言い換えられたので,平行線が存在しない球面幾何では第5公準は成立しない,としてしましそうですが,ここに大きな落とし穴があります。

「第5公準は『与えられた直線外の1点を通り,この直線に平行な直線がただ1本存在する』と言い換えられる」というのには大事な前提が抜けていて,正確に言うと「第1~第4公準が成立するという仮定のもとで,第5公準は『与えられた直線外の1点を通り,この直線に平行な直線がただ1本存在する』と言い換えられる」となります。球面幾何では第1公準が成り立たないので,実はこの言い換えはできません。

オリジナルの第5公準を見てみましょう。

第5公準 1本の線分が2本の線分と交わり, 同じ側の内部に作る角の和が2直角より小さいとき, これら2本の線分を延長すると, 角の和が二直角より小さい側で交わる

第5公準は,ある条件のもとで延長した2本の線分が交わることを主張する命題です。球面幾何では何の条件もなしに,線分を延長する方向に関わらず,どんな2本の線分も延長すると交わるので球面幾何では第5公準は成り立っているのです(命題「PならばQ」はQが真ならばPの真偽に関わらず真です)。

第1公準の独立性

以上より(この記事の解釈では)球面幾何では第1公準だけ成り立たず,第2~第5公準は成り立つことが分かりました。
f:id:egory_cat:20181201010353p:plain:w600

この事から,第1公準は第2~第5公準から独立している(証明も反証もできない)ことが分かります。

第2~第5公準から第1公準が証明できると仮定すると,球面幾何では第2~第5公準が成り立っているので,球面幾何でも第1公準が成り立つことになりますが,実際には球面幾何では第1公準は成り立っていないので矛盾です。よって第2~第5公準から第1公準は証明できません。

また,第2~第5公準から「第1公準の否定」が証明できると仮定すると,ユークリッド幾何では第2~第5公準が成り立っているので,ユークリッド幾何でも「第1公準の否定」が成り立つことになりますが,実際にはユークリッド幾何では第1公準が成り立っているので矛盾です。よって第2~第5公準から「第1公準の否定」は証明できません。

つまり,第1公準は第2~第5公準から独立しています。

第1公準の独立性を教えてくれるのが5つの公準のうち第1公準だけを満たさない球面幾何でした。第5公準の独立性を証明したければ,5つの公準のうち第5公準だけを満たさない「幾何」を見つければいいことになります。それが今日では双曲幾何と呼ばれているものです。

三角形の内角の和

せっかく球面幾何を出したので,三角形の内角の和についても見てみましょう。

ユークリッド幾何では三角形の内角の和は2直角(180°)でした。原論では32番目の命題として証明されています。
f:id:egory_cat:20181129162218p:plain:w400
三角形ABCが与えられたとき,図のようにBCを延長し,ABに平行なCEを引きます。平行線に交わった直線の錯角・同位角がそれぞれ等しいので三角形の内角を1直線上に集めることができ,三角形の内角の和が180°になることが証明されます。

一方で球面幾何では,三角形の内角の和は180°より大きくなります。例えば,どの角も直角であるような三角形が存在します。
f:id:egory_cat:20181129161128p:plain:w400
つまり,先ほどのユークリッド幾何における「三角形の内角の和は2直角(180°)」の証明をそのまま球面幾何も当てはめると。どこかで破綻することになります。どこで破綻しているか分かるでしょうか?

まず気付くのは球面幾何には平行線が存在しないのに,証明では平行線を引いているところですね。なのでこの証明は球面幾何では使えません。

サッケーリ・ルジャンドルの定理

ここからさらに三角形の内角の和の深い話に入りましょう。実は,第1公準~第4公準だけを使って「三角形の内角の和は2直角(180°)以下」であることが証明できます。この定理はサッケーリ・ルジャンドルの定理と呼ばれるものです。双曲幾何も第1公準~第4公準を満たすので,「三角形の内角の和は2直角(180°)以下」は双曲幾何でも成り立つことになります。

球面幾何ではサッケーリ・ルジャンドルの定理は成立しないので,やはりその証明は球面幾何では破綻することになります。その原因は球面幾何では第1公準が成り立たないことです。

逆に言うと,サッケーリ・ルジャンドルの定理には第1公準が本質的な役割を果たしているということになります。このことを見ていきましょう。

サッケーリ・ルジャンドルの定理の証明

サッケーリ・ルジャンドルの定理
第1公準~第4公準だけを使い,三角形の内角の和は2直角以下であることが証明できる。

サッケーリ・ルジャンドルの定理は原論の命題17を使って証明されます。また,命題17は命題16を使って証明されます。まずは命題16・17の証明をします(命題16は命題17の証明に必要な部分だけ証明します)。

命題16 三角形の外角はその隣り合わない内角よりも大きい。
命題17 三角形の内角2つの和は2直角より小さい。

(証明)
f:id:egory_cat:20181129170322p:plain:w400
\triangle ABCが与えられたとき,図のようにBCを延長し(第2公準),AC の中点 E を取り(命題10),BE を結んだ線分(第1公準)を延長してBE=EFとなる点Fを取り(第2公準),線分FCを引く(第1公準)。対頂角は等しいので\angle AEB=\angle CEF命題15)。よって,\triangle ABE\triangle CFE は2辺とそのはさむ角がそれぞれ等しいので合同となり,特に \angle A=\angle ECF命題4)。よって外角  \angle ACD は内角 \angle A より大きい。これで命題16(の半分。隣り合わない内角はもう一個あるから。)は示された。

また,\triangle ABC において  \angle A+\angle ACB は,2直角よりも  \angle FCD だけ小さいので,命題17も示された。
(証明終)

命題16の証明には命題10や命題15を使っていますが,実はユークリッド原論では命題1~命題28は第5公準を一切使わずに証明されています。つまり命題17も第1公準~第4公準だけを使い証明でされていることになります。

命題10や15の証明は下記サイトで読むことができます。
ユークリッド原論 総目次

キグロさんのブログもおすすめです。
stoixeia.hatenablog.com

ちなみに,ここで証明した命題17は第5公準の逆になっています。
f:id:egory_cat:20181129112618p:plain:w400
図で「  \alpha+\beta<180^\circ ならば  \ell_1, \ell_2 が交わる」と主張するのが第5公準です。逆に  \ell_1, \ell_2 が交わるとすると,  \ell_1, \ell_2,\ell が三角形をなすので, 命題17は「  \ell_1, \ell_2 が交わるならば \alpha+\beta<180^\circ 」という第5公準の逆を主張していることになります。

サッケーリ・ルジャンドルの定理を証明しましょう。

サッケーリ・ルジャンドルの定理
第1公準~第4公準だけを使い,三角形の内角の和は2直角以下であることが証明できる。

(証明)
背理法で証明する。内角の和が2直角より \delta>0 だけ大きい\triangle ABC が存在したと仮定する。もし, \angle B\ge \delta のとき,命題16と同様の作図をする。
f:id:egory_cat:20181129172554p:plain:w400
 \triangle FBC は内角の和が  \triangle ABC と等しい(どちらも+++)。また, \angle FBC  \angle BFC は足すと \triangle ABC の内角  \angle B と等しいので,どちらかは  \angle B の半分より小さい。

そこで, \angle FBC  \angle BFC の小さい方を新たな  \angle B として, \triangle FBC を新たな  \triangle ABC とする。

以下同じ操作を繰り返すと, \triangle ABC の内角の和は変わらず,\angle B の大きさは1回ごとに半分以下になっていく。よって有限回の操作で  \triangle ABC の内角の和は2直角より \delta>0 だけ大きく, \angle B<\delta という2つの性質を満たす \triangle ABC に到達する*3。このとき, \angle A+\angle C は2直角より大きくなるが,これは命題17に矛盾する。

よって,背理法により,三角形の内角の和が2直角を超える三角形は存在しないことが証明された。
(証明終)

サッケーリ・ルジャンドルの定理の証明はなぜ球面幾何で破綻するのか

球面幾何では三角形の内角の和が2直角を超えるので,サッケーリ・ルジャンドルの定理の証明をそのまま当てはめようとするとどこかで破綻します。

球面幾何で成り立たないのは第1公準の中でも,2点を結ぶ線分の一意性の部分だけなので,この一意性を使わないと証明がうまくいかない部分があるはずです。

それはどこでしょうか?



実は球面幾何では,命題16の時点で証明が破綻していることが分かります。先ほどのすべての角が直角の三角形を見てみましょう。

f:id:egory_cat:20181127133953p:plain:w250

このとき,外角とその隣り合わない内角はどちらも直角で等しくなってしまっています。命題16は「三角形の外角はその隣り合わない内角よりも大きい」ことを主張していたので,球面幾何では命題16は成り立ちません。

では,このすべての角が直角の三角形に対して,命題16の証明はなぜうまくいかないのでしょうか?

命題16と全く同じ作図をこの三角形にしてみましょう。線分 AC の中点 E を取り,線分  BE を延長して  BE=EF となる地点に点  F を取ります。

f:id:egory_cat:20181129175920p:plain:w300

すると点 F が線分  BC を延長した直線上に来てしまいます。\triangle ABE\triangle CFE が合同で \angle A=\angle ECF というのは正しいのですが,\angle ECF が外角の一部ではなく外角全体になってしまい,外角より真に小さいという事が成り立たなくなってしまっています*4

つまり命題16の証明で点 F を取るときに,

第1公準により2点を結ぶ線分は一意なので,線分 BE を延長しても BC を延長した直線と交わらない

というところに第1公準の2点を結ぶ線分の一意性が効いているのです*5

命題16の証明を読んだときに,おそらくこのことを意識することはなかったと思います。

このように非ユークリッド幾何を考えることで,ユークリッド幾何の証明において各公準がどのような働きをしているか,より深く理解できるようにもなるのです。

おしまい。


明日は grand_antiprism さんの Asgeirsson's Mean Value Theorem の話です。
grandantiprism.hatenablog.com

*1:実際,ネットで調べた範囲でも球面幾何で第2公準が成り立つかは記事によってまちまちで,日本語版Wikipedia楕円幾何学の項では球面幾何は楕円幾何の一部で楕円幾何では第2公準は「成り立たない」と言っているし,英語版WikipediaSpherical geometryでは「成り立つ」と言っています。実射影平面が標準的なモデルになるものが楕円幾何としている記事もあって,球面幾何が楕円幾何の一部かどうかも楕円幾何の定義によるようです。

*2:ただ,第2公準が「線分を延長しても元の点に戻ってこない」「線分を延長したものも線分になる」という内容を含んでいないとすると,気なる問題があることは確かです。それはこれらの命題がユークリッド幾何で成り立つことを保証しているものは何かという問題です。個人的にはこれは第2公準単独の問題にせずに,第1公準と,さらにヒルベルトが著書『幾何学基礎論』で導入した「順序の公理」を含めた議論にした方がいいと思います。長くなるのでこのことは別記事にしたいと思います。いまいち納得のできない方は,とりあえず「球面幾何で第2公準が成り立つという解釈もあるかなぁ」くらいで続きを読んでください。

*3:ここでアルキメデスの原理というものを使っています。ユークリッド原論ではアルキメデスの原理は当たり前のものとして扱われているようです。

*4:一方で BC を延長するところと,BE を延長した線上に点 F を取るところで,第2公準「与えられた線分を延長することができる」はちゃんと球面上でも働いているように見えます。

*5:追記:日曜数学会の数学忘年会のニコ生タイムシフトを見て知ったのですが,このことはキグロさんの記事の追記にある通り,『エウクレイデス全集』 斎藤憲・三浦伸夫/訳・解説 東京大学出版会で指摘されているようです。