現実と数学の区別が付かない

数学ネタのブログです

ラッセルのパラドックス

今日は有名なラッセルのパラドックスが起きるメカニズムを考えてみます。

ラッセルのパラドックスは数学の基礎である集合論に対する重要な問題提起となったものですが,ラッセルのパラドックスが起きるメカニズム自体には集合論は関係ないというお話です。

ラッセルのパラドックス

ラッセルのパラドックスとは「自分自身を含まない集合全体を考えると矛盾が生じる」というものです。

ラッセルのパラドックス (素朴集合論)
自分自身を要素として含まない集合全体の集合  R=\{x \mid x\not\in x\} の存在から矛盾が導かれる。

証明
排中律より,R\in R または R\not\in R だが,R\in R とすると R の定義より R\not\in R となり矛盾,R\not\in R とすると R の定義より R\in R となり矛盾。いずれにしても矛盾することが示された。
証明終

ラッセルのパラドックスから得られる教訓は\{x\mid P(x)\} という形のものを何でもかんでも集合を思うと痛い目を見るぞ!」ということです。集合の扱いを明確に規定しない素朴集合論を数学の基礎とするのは危険だ,ということで,現代では公理的集合論というものが使われています。

公理的集合論でのラッセルのパラドックス

公理的集合論の代表選手であるZFC集合論において,ラッセルのパラドックスはどのような扱いになるのか見てみましょう。

公理的集合論 - Wikipedia

ZFCは1階述語論理の上に構築された公理系です。ZFCでは項の型は1種類しかいないので「○○は集合である」という文を表すための記号はありません。項の型が1種類なので「出てくるものは何でもかんでも集合である」と思ってもいいですが,そもそも集合以外のものがないので,「集合である」という概念自体が必要ありません。

「山田さんは日本人である」という命題が必要なのは世の中にイタリア人もベトナム人もいるからで,もし世の中に日本人しかいない世界ならば,「日本人である」という概念そのものが必要ないのと同じことです。

1階述語論理では個体変項・ 個体定項・述語記号・関数記号といった文字(記号)と,論理記号 \vee, \wedge, \to,  \leftrightarrow, \forall, \exists, \perp を使います。  \perp は「矛盾」を表す記号です。ZFCにおける x\in y は2項述語記号の一種で,普通の記法  p(x,y) に合わせるなら  \in(x,y) と書くべきかもしれませんが,慣習により x\in y と書かれます。 x\not\in y \lnot (x\in y) を省略したものです。

A \leftrightarrow B(A\to B)\wedge (B\to A) を省略したもの,A\to B\lnot A\vee B を省略したものとします。

ZFCにおいて,ラッセルのパラドックスに出てくる「集合  R=\{x \mid x\not\in x\} の存在」を表す論理式は\begin{align}\exists y~\forall x~ (x\in y \leftrightarrow x \not\in x)\end{align}になります。この論理式を仮定すると矛盾が導かれる,というのがZFCにおけるラッセルのパラドックスです。

1階述語論理の推論体系として,自然演繹を採用しましょう。詳しくは次のpdfファイルを見てください。
http://abelard.flet.keio.ac.jp/person/takemura/class/2011/print-folnat.pdf(日本大学 竹村亮准教授の講義資料 pdf file)

推論規則として,いくつかの導入規則・除去規則,そして背理法が定義されています。論理式の集合 \Gamma から,自然演繹で論理式 A が導出されることを  \Gamma~\vdash~A で表します。

\vee除去規則は,いわゆる場合分けによる証明を形式化したものです。特別な場合として  B, C が共に A の場合を考えると  A\vee A \vdash A を得ることができます。

 \exists除去規則で  CA[x:=t] の場合を考えると  \exists x A[x]\vdash A[x:=t] が得られます。これは例えば「ある x が存在して  x^2+3x+1=0 が成り立つ」ことが示されているとき,その存在するという  x t とおき,「 t^2+3t+1=0」とするといった,存在が示されたものに固有の記号を割り当てる操作を形式化したものです。

さて,次がZFCにおけるラッセルのパラドックスです。

ラッセルのパラドックス (ZFC集合論)\begin{align}\exists y~\forall x~ (x\in y \leftrightarrow x \not\in x) ~\vdash~ \perp\end{align}

証明
個体定項の記号として  r が用意されているとする。

  1.  \exists y~\forall x~ (x\in y \leftrightarrow x \not\in x)
  2.  \forall x~ (x\in r \leftrightarrow x \not\in x)   [ \exists除去規則]
  3.  (r\in r \leftrightarrow r \not\in r)   [ \forall除去規則]
  4.  ( (r\in r \rightarrow r \not\in r) )\wedge ( (r\not\in r \rightarrow r \in r) )  [ \leftrightarrow の定義]
  5.  ( (r\not\in r) \vee (r \not\in r) )\wedge ( (r\in r) \vee (r\in r) )  [\rightarrow の定義]
  6.   (r\not\in r) \vee (r \not\in r)  [5 に  \wedge除去規則]
  7.   (r\not\in r)  [6 に \vee除去規則]
  8.   (r\in r) \vee (r \in r)  [5 に  \wedge除去規則]
  9.   (r\in r)  [8 に \vee除去規則]
  10.  (r\in r)\wedge (r\not\in r)  [9, 7 に \wedge導入規則]
  11. \perp   [\lnot除去規則]

証明終

この証明をよく見てみると,ZFCの公理は一切出てきません。1階述語論理の推論規則だけから矛盾を導くことができるのです。述語記号 x\in y集合論の記号として性格付けしているのは ZFC の公理系なので,この証明は集合論とは何の関係もないと言っていいでしょう。

もちろん集合論の公理系と全く無関係という訳でなく「\exists y~\forall x~ (x\in y \leftrightarrow x \not\in x) が導かれてしまうような強すぎる公理は採用したらダメ」ということを教えてくれています。

1階述語論理でのラッセルのパラドックス

ラッセルのパラドックスの証明に集合論の公理は何の関係もありませんでした。 x\in y という集合論の述語記号でなくても,任意の述語記号  p(x,y) に対して同じように矛盾を導くことができます。繰り返しになりますが証明も一応書いておきましょう。

ラッセルのパラドックス (1階述語論理)
 p(x,y) を2項述語記号とする。\begin{align}\exists y~\forall x ~(p(x,y) \leftrightarrow \lnot p(x,x)) ~\vdash~ \perp\end{align}

証明
個体定項の記号として  c が用意されているとする。

  1.  \exists y~\forall x~ (p(x,y) \leftrightarrow\lnot p(x,x) )
  2.  \forall x~ (p(x,c) \leftrightarrow \lnot p(x,x) )   [ \exists除去規則]
  3.  (p(c,c) \leftrightarrow\lnot p(c,c) )   [ \forall除去規則)]
  4.  ( (p(c,c) \rightarrow \lnot p(c,c)) )\wedge ( (\lnot p(c,c) \rightarrow p(c,c) )  [ \leftrightarrow の定義]
  5.  ( \lnot p(c,c) \vee \lnot p(c,c) )\wedge (p(c,c) \vee p(c,c) )  [\rightarrow の定義]
  6.  \lnot p(c,c) \vee \lnot p(c,c)  [5 に  \wedge除去規則]
  7.   \lnot p(c,c)  [6 に \vee除去規則]
  8.  p(c,c) \vee p(c,c)   [5 に  \wedge除去規則]
  9.  p(c,c)  [8 に \vee除去規則]
  10. p(c,c)\wedge \lnot p(c,c)  [9, 7 に \wedge導入規則]
  11. \perp   [\lnot除去規則]

証明終

ZFCはラッセルのパラドックスを回避できているか?

ラッセルのパラドックスなどのパラドックスを回避することが公理的集合論ができる動機の1つだったのは間違いないでしょう。Wikipedia:公理的集合論の中には以下のような記述があります。

公理的集合論 - Wikipedia

パラドックスの回避



ツェルメロが ZF の元となる公理系を1908年に発表した最大の動機は、実数が整列可能だとする彼の証明を弁護することであった。しかし、同時に彼はその当時すでに知られていたパラドックスを回避しなければいけないこともわかっていた。代表的なものとしては、 ラッセルのパラドックス、リシャールのパラドックス、ブラリ=フォルティのパラドックスがある。 これらのパラドックスは、集合を構成する方法に制限を付けている ZFC の中では展開できない。 例えば、ラッセルのパラドックスで用いられる\begin{align}{\displaystyle \{x\mid x\notin x\}}\end{align}という集まりは ZFC の中では構成できないし、 リシャールのパラドックスで用いられる構成は論理式で記述できない。

ZFCではラッセルのパラドックスを回避できていると言っているように読めますが本当でしょうか?問題はZFCの公理系から自然演繹でラッセルのパラドックスを表す \begin{align}\exists y~\forall x~ (x\in y \leftrightarrow x \not\in x)\end{align}という論理式を導出できるかどうかです。

 \exists y~\forall x~ (x\in y \leftrightarrow x \not\in x) から矛盾 \perp が導かれるのですから,もしZFCが無矛盾なら当然この論理式は導出されません。一方でもしZFCが矛盾しているなら,矛盾している公理系からはどんな論理式も導出できるので,この論理式も導出できることになります。つまりZFCがラッセルのパラドックスを回避できているかどうかはZFCの無矛盾かどうかに依ります。しかし,ZFCの無矛盾性は証明されていないので,ZFCがラッセルのパラドックスを回避できていることもまだ証明されていない事になります。

まあ,これはちょっとひねくれた見方ですかね。「ZFC集合論では素朴集合論のような単純な形ではラッセルのパラドックスは起きない。ZFCの無矛盾性は多くの人が信じているので,ZFCがラッセルのパラドックスを回避できていることも多くの人が信じている」といったところでしょうか。

ラッセルのパラドックスの応用

定理を証明したら,何かおもしろい応用がないか考えてみることは大切です。せっかくなのでラッセルのパラドックスの応用も考えてみました。

有限集合 S の要素数|S| で表すことにします。

定理
U を有限集合とし, X\subset 2^U U の部分集合族とする。
このとき,次の条件1, 2 を満たす  A\in X は存在しない。

  1. B\in X かつ |B|=5 ならば, B\not\subset A
  2. B\in X かつ |B|\neq 5 ならば,  |A\cap B|=5

証明
B\in X に対して,
1 の条件は「  |B\cap B|=5 ならば  |A\cap B|\neq 5」 と同値で,
2 の条件は「  |B\cap B|\neq 5 ならば  |A\cap B|= 5 」と同値となる。

 B_1, B_2\in X に対し,命題「  |B_1\cap B_2|\neq 5」 を  P(B_1,B_2) で表すことにすると,条件1, 2を満たす A\in X が存在するという命題は\begin{align}\exists A\in X~(\lnot P(B,B) \Leftrightarrow P(A,B))\end{align}と書くことができる。

定理の主張を背理法で示す。条件1, 2 を満たす  A が存在したと仮定する。

論理式の集合  \Gamma =\{\exists y~\forall x ~(p(x,y) \leftrightarrow \lnot p(x,x))\} を考える。 X を定義域とし,2変数述語記号  p を命題  P と解釈すると,これは  \Gamma のモデルになっている。しかし, \Gamma \vdash \perp だったので,1階述語論理の健全性により  \Gamma はモデルを持たない。これは矛盾。

よって,背理法により条件1, 2 を満たす  A は存在しない。
証明終

もちろんこんな持ってまわった証明をせずに, |A|=5 のとき条件1よりA\not\subset A となり矛盾,|A|\neq 5 のとき条件2より|A|=|A\cap A|=5 となり矛盾,というやり方でも証明できます。素朴集合論でのラッセルのパラドックスの証明と同じやり方です。ラッセルのパラドックスで起きる矛盾は割と素朴なものなので,あまり複雑な例は作れないですね。

Murtyの既約判定法

jurupapaさんのブログで面白そうなシリーズが始まりました。可解な代数方程式を冪根で解く計算を数式処理システムMaxima上で行うというものです。
maxima.hatenablog.jp
ガロワ理論が生まれた経緯を考えると,究極と言ってもいいくらいのテーマだと思います(5次方程式に解の公式が存在しないことや,角の三等分の作図不可能性などの「解けない方程式」とは逆方向である,「解ける方程式」に対する完全な解答といえるでしょう)。このテーマは,退職後は素人数学者さん井汲 景太さん→jurupapaさんという流れで広がってきたようです。何かこういう感じ,いいですよね。

jurupapaさんのブログでは  x^4+2x^3+3x^2+4x+5=0 を例として話をすすめるそうです。ということはこの多項式\mathbb{Q}[x] で既約な多項式なのでしょう。Maxima 等の気の利いた数式処理システムには多項式\mathbb{Q}[x] の範囲での因数分解アルゴリズムが実装されているので,多項式の既約性はコマンド一つで確かめることができます。

本日の問題

今日はこの多項式  x^4+2x^3+3x^2+4x+5 を拝借して,整数係数多項式の既約性を手計算で示す方法の話をしましょう。最終目標は次を手計算で示すことです。

 x^4+2x^3+3x^2+4x+5\in \mathbb{Z}[x] は   \mathbb{Z}[x] の元として既約である。

この多項式は原始的(係数の最大公約数が 1)なので,ガウス補題より   \mathbb{Z}[x] の元としての既約性と   \mathbb{Q}[x] の元としての既約性は同値です。

整数係数多項式の既約判定法としては,Eisenstein の既約判定法が有名だと思いますが,この問題には適用できません。

アイゼンシュタインの既約判定法 - Wikipedia

数式処理システムの内部では整数係数多項式因数分解には,Henselの補題を用いたアルゴリズムが使われているようですが,手計算には向かない方法です。

横山和弘,竹島卓,Euclid 環上の因数分解およびGCDについてー格子算法の 応用(pdf file)

今日紹介するのは Murtyの既約判定法というものです。おもしろさの割にはあまり知られていないように思います。

Murtyの既約判定法

Murtyの既約判定法

 f(x)=a_dx^d+a_{d-1}x^{d-1}+\cdots+a_1x+a_0\in \mathbb{Z}[x] d次の多項式,\begin{align}H=\max_{0\le i \le d-1} |a_i/a_d|\end{align} とする。 n\ge H+2 となる整数 n に対し f(n)素数となるとき,f(x)  \mathbb{Z}[x] の元として既約である。

証明は元論文を見てください。定理の証明はちょうど1ページしかありませんし,英語も平易なので簡単に読めると思います。

M. Ram Murty, Prime Numbers and Irreducible Polynomials (pdf file)

f(n)素数になるというのは随分と特殊な場合に思えるかもしれませんが,ブニャコフスキー予想が正しいとすれば,それほどまれな事ではありません。
egory-cat.hatenablog.com

Murtyの既約判定法を使って f(x)=x^4+2x^3+3x^2+4x+5 が既約であることを示してみましょう。この場合は  H=5 です。 n\ge H+2=7 f(n)素数になる最小の  n 12 で,  f(12)=24677 という5桁の素数になります。 24677素数であることを手計算で確かめるのはちょっと大変ですね。素数表で確かめてみましょう。
www.usamimi.info
 24677素数表に現れているので,確かに素数です。

f:id:egory_cat:20180929210354p:plain

よってMurtyの既約判定法により,既約であることが確かめられました。

Murtyの既約判定法の一般化

素数表は計算機を使って作っているわけで,この方法では純粋に手計算で既約性を証明できたとは言いにくいところがあります。

素数表を使わずに  x^4+2x^3+3x^2+4x+5 の既約性が判定できるように,Murtyの既約判定法を一般化します。

Murtyの既約判定法の一般化

 f(x)=a_dx^d+a_{d-1}x^{d-1}+\cdots+a_1x+a_0\in \mathbb{Z}[x] a_d\neq 0, a_0 \neq 0 である整数係数多項式とする。\begin{align}r=\min\{k\in \mathbb{N} ~:~ |a_d|k^d > |a_{d-1}|k^{d-1}+\cdots+|a_1|k+|a_0|\}\end{align}とおく。n を整数, f(n) の最大の素因子を p とし, f(n)=p\ell とする。 n\ge r+|\ell| が成り立っているならば,f(x)  \mathbb{Q}[x] の元として既約である。

 r を荒く上から  H+1 と評価し,さらに \ell=1 となる場合が普通のMurtyの既約判定法になります。

証明
 \varphi(x)=|a_d|x^d-(|a_{d-1}|x^{d-1}+\cdots+|a_1|x+|a_0|) とおく。 \varphi(0)=-|a_0|<0 かつ  \displaystyle\lim_{x\to \infty} \varphi(x)=\infty なので  \varphi(x) は少なくとも一つの正の実根を持つ。また,デカルトの符号法則により, \varphi(x) の正の実根は高々一つであることが分かる。よって  \varphi(x) はちょうど一つの正の実根を持つ。 r \varphi(r)>0 を満たす正の数なので, r\varphi(x) の唯一の実根よりも大きい。よって,x\ge r となる任意の実数に対し, \varphi(x)>0 となる。この対偶を考えると, \varphi(x)\le 0 となる実数  x x < r を満たすことが分かる。

これにより,rf(x)=0 の任意の複素根の絶対値よりも大きいことが分かる。実際,  f(\alpha)=0 を満たす \alpha \in \mathbb{C} をとると,\begin{align} 0=|f(\alpha)|\ge |a_d|\cdot|\alpha|^d-(|a_{d-1}|\cdot |\alpha|^{d-1}+\cdots+|a_1|\cdot|\alpha|+|a_0|)=g(|\alpha|)\end{align} となるので  |\alpha| < r である。

さて, f(x) が既約であることを背理法で示そう。

f(x)=g(x)h(x) と正の次数を持つ多項式  g(x), h(x)\in \mathbb{Z}[x] の積に因数分解されたと仮定する。 f(n)=g(n)h(n) なので,f(n) の素因子である p g(n), h(n) のいずれかを割り切る。どちらも同様なので  p h(n) を割り切るとする。すると, |g(n)|\le |f(n)|/p = |\ell| が成り立つ。

g(x)\mathbb{C}[x] の範囲で \displaystyle g(x)=c\prod_{i=1}^{d'} (x-\alpha_i)因数分解されたとする (ただし d' g(x) の次数)。 c g(x) の先頭係数なので  |c|\ge 1 であることに注意すると,

\begin{eqnarray*}
\left|\ell \right| &\ge& |g(n)| = |c| \prod_{i=1}^{d'} |n-\alpha_i| \ge \prod_{i=1}^{d'} (n-|\alpha_i|) \\
&>& \prod_{i=1}^{d'} (n-r) \ge\prod_{i=1}^{d'} (r+|\ell|-r) =|\ell|^{d'}\ge |\ell|.
\end{eqnarray*}

 |\ell|>|\ell| が得られたことになり,これは矛盾である。よって f(x) は既約である。

証明終

 x^4+2x^3+3x^2+4x+5 の既約性

さて,この一般化されたMurtyの既約判定法を使って,目標の多項式 \begin{align}x^4+2x^3+3x^2+4x+5\end{align} が既約であることを示しましょう。

 g(x)=x^4-(2x^3+3x^2+4x+5) とすると, g(3)=-17, g(4)=59 なので,定理の  r 4 です。

 n=8 としてみると  f(8)=5349=3\times 1783 となります。  1783素数であることは  1783<43^2=1849 なので, 41 以下の任意の素数で割り切れないこと確かめることで分かります。多少面倒ですが,この程度なら手計算で確認することはできます。よって  p=1783, \ell=3 であることが分かりました。

 n=8, r=4, \ell =3 なので, n\ge r+|\ell| が成り立っています。よって  x^4+2x^3+3x^2+4x+5 \mathbb{Z}[x] の元として既約であることを手計算で確認することができました。

微分方程式の解法で突然出てくる謎の変数変換

今日は変数変換を用いた微分方程式の解法の謎に迫りたいと思います。

この記事は微分方程式の初歩である,変数分離形の微分方程式と1階線形微分方程式の解法を知っている方を対象としています*1

 x を自由変数, y=y(x) を未知関数とします。

まずは微分方程式をいくつか

2つほど微分方程式とその解法の例を見てみましょう。

\begin{align}y'=\cfrac{y}{x}-y^2\end{align}

この微分方程式 w=\cfrac{y}{x} という変数変換で,変数分離形の微分方程式 w'=-xw^2 に変換することができます。これを w について解いて  w=\cfrac{y}{x} を代入すれば元の方程式の一般解が求まります。

\begin{align}(1+x)y''+xy'-y=0\end{align}

これは w=y'+y と変数変換すると,変数分離形の微分方程式 w'=\cfrac{w}{1+x} に変換することができます。この一般解を  w=C_1(1+x)w=y'+y に代入した,1階線形微分方程式  y'+y=C_1(1+x) を解くことで元の方程式の一般解が求まります。

謎の変数変換

微分方程式を勉強しているとよく出てくるのが,この

「変数変換すると解法が分かっている微分方程式に変換できる」

というやり方です。

そう言われて実際に計算してみると確かにそうなることは分かるのですが,なぜそのような変数変換を思い付いたのかは一切教えてもらえずにモヤモヤしてしまいます。「センスだから」と言われるともうそれ以上つっこんで聞くこともできません。

しかし,それでは納得できない,理屈が知りたいという方のために,少しは納得ができそうな説明をしてみようと思います。

同次形の微分方程式を再考する

「変数変換すると解法が分かっている微分方程式に変換できる」という解法で一番初めに出会うのが同次形の微分方程式と言われるものです。

同次形
\begin{align}y'=f\left(\cfrac{y}{x}\right)\end{align}は w=\cfrac{y}{x} と変数変換することで変数分離形の微分方程式に変換できる。

確かに実際にやってみるとそうなっています。最初に見た微分方程式  y'=\cfrac{y}{x}-y^2 は同次形ではありませんが,同じ変数変換で変数分離形の微分方程式に変換できました。

ここで発想を逆転して考えてみましょう。

w=\cfrac{y}{x} と変数変換することで変数分離形に変換できる微分方程式とは,w に関する変数分離形  w'=f(x)g(w) から w=\cfrac{y}{x} という変数変換で得られるものに他なりません。

さて,実際にどのような微分方程式w=\cfrac{y}{x} という変数変換で変数分離形になるのか求めてみましょう。変数分離形  w'=f(x)g(w)w=\cfrac{y}{x} という変数変換を施します。

 y=xw より  w'=\cfrac{y'}{x}-\cfrac{y}{x^2} なので, w'=f(x)g(w)
\begin{eqnarray*}
\cfrac{y'}{x}-\cfrac{y}{x^2} &=& f(x)g\left(\cfrac{y}{x}\right)\\
y' &=& \cfrac{y}{x}+xf(x)g\left(\cfrac{y}{x}\right)
\end{eqnarray*}
となります。ここで  h(x)=xf(x) と置くことで,次の微分方程式の解法を得ます。

同次形の一般化
\begin{align}y'=\cfrac{y}{x}+h(x)\cdot g\left(\cfrac{y}{x}\right)\end{align}は w=\cfrac{y}{x} と変数変換することで変数分離形の微分方程式に変換できる。

これの特別な場合, h(x)=1 g\left(\cfrac{y}{x}\right)=f\left(\cfrac{y}{x}\right)-\cfrac{y}{x} としたものが,古典的な同次形の微分方程式  y'=f\left(\cfrac{y}{x}\right) です。

最初に見た微分方程式は, h(x)=x^2,~g\left(\cfrac{y}{x}\right)=-\left(\cfrac{y}{x}\right)^2 の場合です。

同次形の微分方程式の解法を最大限に一般化することができました。こう計算してみると「やってみるとそうなる」というぼんやりした世界を抜け出し,理屈が分かったような気分になることができます。

変数変換  w=y'+y

さて,2つ目の微分方程式では  w=y'+y という変数変換で変数分離形に変換できました。

もうやることは分かりますね。このやり方で解けるのは,w に関する変数分離形の微分方程式  w'=f(x)g(w) から  w=y'+y という変数変換で得られたものです。

計算してみましょう。 w'=y''+y' なので,  w'=f(x)g(w) は \begin{align}y''+y'=f(x)g(y'+y)\end{align}となります。

これが斉次線型微分方程式になる  g(w)=w の場合を考えると \begin{align} y''+(1-f(x)) y' -f(x) y=0\end{align} となります。

つまり  y'' の係数が 1 になるように両辺を適当な関数で割ってこの形になる2階線形微分方程式 w=y'+y という変数変換で変数分離形に変形できることが分かりました。

 y'' の係数を 1 になるように変形しなくても判定できるように  f(x)=-\cfrac{q(x)}{p(x)} とおいて,両辺を  p(x) 倍してみましょう。すると\begin{align}
p(x) y''+\{p(x)+q(x)\}y'+q(x)y=0
\end{align}なります。これで次の微分方程式の解法が得られました。

\begin{align}p(x) y''+\{p(x)+q(x)\}y'+q(x)y=0\end{align} の形の2階線形微分方程式 w=y'+y と変数変換することで  w に関する変数分離形に変換できる。

その一般解  w=f(x) に対して1階線形微分方程式  y'+y=f(x) を解くことで元の方程式の一般解を求めることができる。

2つ目の微分方程式  (1+x)y''+xy'-y=0 はまさにこの形をしています。

ここまで見てみると,左辺は \begin{align}p(x)(y''+y')+q(x)(y'+y)=p(x)(y'+y)'+q(x)(y'+y)\end{align} と変形できるので,変数変換  w=y'+y も当たり前のように思えてきます。

オリジナルの解法を作ろう

変数変換の方法なんて無限にあるので,いくらでもオリジナルの微分方程式の解法を作り出すことができます。

 w=y'+xy と変数変換することで  w に関する変数分離形に変換できる微分方程式を求めてみましょう。完全に一般の場合を考えると煩雑になるので,\begin{align}w'=f(x)w\end{align} の形の変数分離形だけ考えることにします。

 w'=f(x)w w=y'+xy と変数変換すると\begin{align}y''+(x-f(x))y'+(1-xf(x))y=0\end{align}ここで  f(x)=-\cfrac{q(x)}{p(x)} とおくと\begin{align}
p(x)y''+(xp(x)+q(x))y'+(p(x)+xq(x))y=0
\end{align}ここで係数を見やすくするために  P(x)=p(x),  Q(x)=xp(x)+q(x) とおくと p(x)+xq(x)=(1-x^2) P(X)+xQ(x) なので\begin{align}
P(x)y''+Q(x)y'+\{(1-x^2)P(x)+xQ(x)\}y=0
\end{align}となります。次の微分方程式の解法が得られました。

\begin{align}
P(x)y''+Q(x)y'+\{(1-x^2)P(x)+xQ(x)\}y=0
\end{align}の形の2階線形微分方程式 w=y'+xy と変数変換することで  w に関する変数分離形に変換できる。

その一般解  w=f(x) に対して1階線形微分方程式  y'+xy=f(x) を解くことで元の方程式の一般解を求めることができる。

この解法で解ける問題を作ってみましょう。 P(x)=1+x^2, Q(x)=1+x^3 とすると,次の微分方程式になります。

\begin{align}(1+x^2)y''+(1+x^3)y'+(1+x)y=0\end{align}

いい感じに一見どう解いたらいいか分からないものができました。せっかくなので実際に解いてみましょう。

w=y'+xy と変数変換すると  w'=\cfrac{x-1}{x^2+1}w となり,これを解くと  w=C_1\sqrt{x^2+1} ~e^{-\tan^{-1}x} ( C_1 は定数) となります(ただし\tan^{-1}x \tan x逆関数)。

これを  y'+xy=w に代入した1階線形微分方程式を解くと\begin{align}
y=C_1 e^{-\frac{1}{2}x^2} \int \sqrt{x^2+1} ~\exp\left({\frac{1}{2}x^2-\tan^{-1}x}\right)dx\end{align}なります。

\sqrt{x^2+1} ~\exp\left({\frac{1}{2}x^2-\tan^{-1}x}\right) の原始関数の一つを F(x) とおくと,これは \begin{align} y=C_1e^{-\frac{1}{2}x^2}F(x)+C_1C_2e^{-\frac{1}{2}x^2}\end{align}となるので,y=e^{-\frac{1}{2}x^2}F(x),~y=e^{-\frac{1}{2}x^2} が基本解になります。

おわりに

実際に微分方程式を解くときに,どのような変数変換をすればよいか見抜く方法はよく分かりません。結局,センスの問題かもしれません。

とりあえず,「変数変換すると解法が分かっている微分方程式に変換できる」という方法に出会ったら,どのような形の微分方程式なら同じ解法で解けるかを計算してみるといいでしょう。それをまとめて教科書に載っていないようなオリジナルの公式集を作っておけば,役に立つこともあると思います。経験を積んでいくうちにセンスも上がるかもしれません。

いつか微分方程式を華麗に変数変換で解き,何でそんな変数変換を思い付くんだとざわめく群衆に「センスだよ」とドヤ顔をかますその日まで。

俺たちの戦いはこれからだ!(完)

*1: 変数分離形  y'=f(x)g(y) の一般解は \begin{align}\displaystyle \int\cfrac{dy}{g(y)}=\int f(x)dx\end{align} を計算したもの.1階線形微分方程式  y'+P(x)y=Q(x) の一般解は  \mu'(x)=P(x) なる \mu(x) を用い \begin{align}\displaystyle y= e^{-\mu(x)}\int Q(x) e^{\mu(x)}dx\end{align} となります。詳しくは標準的な微分方程式の教科書を見てください。