2020-08-09

今度こそアフィンスキームを理解する(2)Zariski位相の解明！

今度こそアフィンスキームを理解する（全五回）ちょっと専門的な記事

皆様、ご無沙汰しております。
ラスクです。

ここ2か月ほど、ブログの更新をおろそかにしてしまい申し訳ありません。

さて今回はシリーズ「今度こそアフィンスキームを理解する」の第二回をやっていきます！
内容としてはZariski位相という位相を導入し前回定義した $\mathrm{Spec}A$ を位相空間にしていきます。

この概念も、最初の頃は小難しく感じられますが、慣れてしまえばどうってことありません！
出来るだけイメージを大事に解説していきますので、どうぞ目を通してみてください！！

ただ、前回の記事の内容が入っているものとして話を進めますので、まだの方は是非こちらからご覧ください！！
(ただし最初に少しだけは復習をいれます）
mathforeveryone.hatenablog.com

それでは、さっそく始めていきましょう！！！

前回の復習
Zariski位相の定義と簡単な意味
Zariski位相の性質
- Zariski位相の開基
- 引き戻しの連続性
まとめ
参考文献

前回の復習

まずは少しだけ前回の復習をしましょう。

任意の可換環 $A$ に対して、その素イデアルの全体を $\mathrm{Spec}A$ 、極大イデアルの全体を $\mathrm{mSpec}A$ と表し、それぞれ $A$ の素スペクトラム、極大スペクトラムと呼びました。

前回はまず、以下の定理が成り立つことを紹介しました。

定理.(Hilbertの零点定理 weak ver.)
$k$ を代数閉体とする。このとき $A=k[t_1,\ldots,t_n]/I$ に対して以下が成り立つ。\begin{align}\mathrm{mSpec}A=\{(t_1-a_1,\ldots,t_n-a_n)\mod{I}\mid(a_1,\ldots,a_n)\in Z(I)\}\end{align}

ただし、イデアル $I$ の代数的集合 $Z(I)$ とは以下のようなものでした；\begin{align}Z(I)=\{(a_1,\ldots,a_n)\in k^n\mid f(a_1,\ldots,a_n)=0\ (\forall f\in I)\}\end{align}

この定理によって代数幾何学の研究対象である多項式の共通零点集合と、極大イデアルの集まりである $\mathrm{mSpec}A$ が結びついたのでした。

そして次に、 $k$ が代数閉でない場合や、 $\mathrm{Spec}A$ の方はどうなるかについて考え、これらの時は素朴な零点集合の全体とは必ずしも1対1に対応するわけではないことを見ました。

今回はこれらのこと念頭に置きつつ、 $\mathrm{Spec}A$ に位相を入れ、その意味や簡単な性質を見ていきます。

Zariski位相の定義と簡単な意味

ではさっそく、定義をしてしまいましょう。

定義１.(Zariski位相)
可換環 $A$ のイデアル $I$ に対して、 $\mathrm{Spec}A$ の部分集合 $V(I)$ を以下で定める；\begin{align}V(I):=\{\mathfrak{p}\in\mathrm{Spec}A\mid I\subset\mathfrak{p}\}\end{align}そして、 $V(I)$ という形の部分集全体を閉集合系とすることで $\mathrm{Spec}A$ に位相を入れる。これを $\mathrm{Spec}A$ のZariski位相という。

はい、これだけです。Zariski位相の定義自体は意外とシンプルなんですね。
まずは、この定義が本当に位相を定めているのか。つまり、 $V(I)$ という形の部分集合族がきちんと閉集合系の公理を満たしているのかを確認しましょう。

命題２.
可換環 $A$ のイデアル $I,J,I_\lambda\ (\lambda\in\Lambda)$ に対して、以下が成り立つ。

(1) $V({(}0))=\mathrm{Spec}A$ , $V(\mathrm{Spec}A)=\emptyset$
(2) $V(I)\cup V(J)=V(I\cap J)$
(3) $\bigcap_{\lambda\in\Lambda}V(I_\lambda)=V(\sum_{\lambda\in\Lambda}I_\lambda)$

特に、 $V(I)$ 全体は閉集合系の公理を満たし、 $\mathrm{Spec}A$ に位相を定める。

証明.
読者への演習だよ^^

このようにして位相がきちんと定まっていることはわかりましたが、この位相がいったい何を考えているのかわからない…という方も多いのではないでしょうか？
実際、私も代数幾何を初めて学んだ頃はそうでした。

しかし！前回の記事の内容を理解している方ならば、もうこの位相がそこまで不思議なものには見えないはずです！

今、可換環 $A$ は体 $k$ 上の多項式環 $k[t_1,\ldots,t_n]$ であるとしましょう。
このときいつもの同一視\begin{align}\begin{array}{ccc}k^n&\longleftrightarrow &\mathrm{Spec}A\\(a_1,\ldots,a_n)&\longleftrightarrow &(t_1-a_1,\ldots,t_n-a_n)\end{array}\end{align}を使います。
すると代数的集合 $Z(I)\subset k^n$ の元に対応する素（極大）イデアルは必ず $I$ を含みます。
つまり上の同一視を使えば次のような包含関係を考えることが出来ます；\begin{align}Z(I)\subset V(I)\end{align}

ただし、この包含関係は一般には等号になりません。
例えば $A=\mathbb{Q}[t]$ 、 $I=(t^3-t^2+t-1)=(t-1)(t^2+1)$ とすると、\begin{align}Z(I)=\{1\}\end{align}ですが、\begin{align}V(I)=\{(t-1),(t^2+1)\}\end{align}となって数が一致しません。
このことは前回の記事で何度も注意しましたが、大事なのでもう一度…
素イデアルや極大イデアルの集合は、素朴な零点集合よりも大きくなります。

このことをきちんと意識したうえで、 $V(I)$ を閉集合として採用しています。
どうでしょう。なんとなく理解できたでしょうか？

おそらく、 $V(I)$ が $Z(I)$ より大きくなってしまっていることを気にしている方も多いでしょう。
私もそうでした。
しかし、この問題は $k-$ 有理点という概念を用いれば解決します*1。
$k-$ 有理点とは極大イデアルのうち、その剰余環が元の体と同型になっているようなものですが、 $V(I)$ の中からそのよう点だけを取り出してくれば、きちんと $Z(I)$ と一対一に対応します。
このあたりの話は、第五回でもう一度詳しく扱います。

とにもかくにも、 $V(I)$ という集合は気持ちの上では、多項式の零点集合を表していて、そのような集合達を $\mathrm{Spec}A$ の閉集合系としているわけです。
「多項式の零点集合の研究」という代数幾何の基礎的な思想ときちんと合致していますね。

いかがでしょうか。Zariski位相とはお友達に慣れそうですか？
まだ「うーん。」という方は次の簡単な例を見て理解を深めて頂ければと思います。

例１.一番簡単であろう $A=k[t]$ の場合を考えましょう。
$A$ はPIDですから、任意のイデアル $I$ はある多項式 $P$ により生成されます；\begin{align}I=(P)\end{align}このとき、 $V({(}P))$ はどのような集合でしょうか？少し考えてみてください。

答えは、
$V({(}P{)})=\{(P_1),\ldots,(P_m)\mid P_i$ は $P$ の素因子 $\}(P\neq 0)$ 、 $V{(}(0))=\mathrm{Spec}A$
です！説明しましょう。

まず、 $\mathfrak{p}\in\mathrm{Spec}A$ を既約多項式 $Q\in A$ を用いて、 $\mathfrak{p}=(Q)$ と表します。
すると、\begin{align}\mathfrak{p}\in V(I)&\iff I\subset\mathfrak{p}\\&\iff Q|P\end{align}であり、最後の条件について、もし $P=0$ であれば、これはどのような(既約)多項式 $Q$ についても成り立ち、 $P\neq 0$ であれば、 $Q$ が $P$ の素因子であることを言っています。よって、上のように $V(I)$ が明示的に与えられます。

逆にある有限個の相異なる既約多項式 $P_1,\ldots,P_m$ が与えられたときに $I=(P_1\cdots P_m)$ と定めれば、今の議論から、\begin{align}V(I)=\{(P_1),\ldots,(P_m)\}\end{align}となります。

すなわち、 $\mathrm{Spec}A$ の閉集合系は $\mathrm{Spec}A$ と、（空集合をふくむ）有限集合全体に一致しているということがわかります。

これは
・ある多項式が与えられらときに、その零点の数というのは有限個であること。
・逆に有限個の点が与えられれば、それをすべて零点に持つような多項式が存在すること。
という二つの事実に（だいたい)対応しています。

一変数の多項式環であれば、このように簡単に閉集合系を書き下せますが。多変数になるともう少し大変になってきますので、今回はこのくらいにしておきましょう。

Zariski位相の性質

ここからは今後使うZariski位相の簡単な性質を二つだけご紹介していきます。

Zariski位相の開基

今まではどちらかというと、閉集合の方に注目してきたのでこの節では逆に開集合に焦点を当ててみましょう。

定義に従えば、可換環 $A$ の素スペクトラム $\mathrm{Spec}A$ の(Zariski)開集合とは、あるイデアル $I\subset A$ を用いて、\begin{align}U=\mathrm{Spec}A\setminus V(I)\end{align}と表されるものの事です。

このとき、もし $I$ が単項イデアル $I=(f),(f\in A)$ ならば\begin{align}U =\{\mathfrak{p}\in\mathrm{Spec}A \mid f\notin \mathfrak{p}\}\end{align}と表されます。
実際、\begin{align}\mathfrak{p}\in U &\iff (f)\nsubseteq \mathfrak{p} \\ &\iff f\notin \mathfrak{p} \\ &\iff \mathfrak{p}\in \{\mathfrak{p}\in\mathrm{Spec}A \mid f\notin \mathfrak{p}\}\end{align}となり、確かに集合が一致します。
この開集合を以下のように定義しておきましょう。

定義３.(基本開集合)
$A$ を可換環とする。このとき、ある元 $f \in A$ を用いて\begin{align}D(f):=\{\mathfrak{p}\in\mathrm{Spec}A \mid f\notin \mathfrak{p}\}\end{align}と表されるような $\mathrm{Spec}A$ の開集合のことを基本開集合と呼ぶ。

基本開集合 $D(f)$ については、それに入るかどうかが、 $f$ を含んでいるか否かで決まるため非常に扱いやすいことが多いです。
そして幸いなことに、次の命題が成り立ちます。

命題４.
可換環 $A$ の素スペクトラム $\mathrm{Spec}A$ に対して、その基本開集合族 $\{D(f) \mid f\in A\}$ は開基をなす。
すなわち、 $\mathrm{Spec}A$ の任意の開集合は基本開集合 $D(f)$ 達の合併で表される。

証明.
$\mathrm{Spec}A$ の開集合 $U$ を任意にとり、それをイデアル $I\subset A$ を用いて $U=\mathrm{Spec}A\setminus V(I)$ と表す。このとき明らかに\begin{align}U=\bigcup_{f\in I}D(f)\end{align}が成り立つ。

この命題によってZariski位相の開集合に関して考える場合は、多くの場合、扱いやすい基本開集合に限って考えることが出来るわけです。
この基本開集合は次回以降、アフィンスキームを定義する際にも基本となるのできちんと押さえておいてください！

引き戻しの連続性

この節では、二つの可換環 $A,B$ のスペクトラム間の射\begin{align}\mathrm{Spec}B\longrightarrow\mathrm{Spec}A\end{align}について考えましょう。射の方向がおかしいのは後の都合のためです。今、 $\mathrm{Spec}A,\mathrm{Spec}B$ はどちらも位相空間ですから、その間の射は（とりあえず）連続写像を考えるのが自然です。

では具体的にどんなものが連続写像になるのでしょうか？

一つ重要なものとして、環準同型の引き戻しがあります。

命題５.
$\varphi:A\rightarrow B$ を可換環の準同型とする。このとき、\begin{align}\begin{array}{cccc}\varphi^*:&\mathrm{Spec}B&\longrightarrow&\mathrm{Spec}A\\ &\mathfrak{p}&\longmapsto&\varphi^{-1}(\mathfrak{p})\end{array}\end{align}は(Zariski位相に関して)連続である。

証明.
命題4より、任意の基本開集合 $D(f),(f\in A)$ の逆像 $(\varphi^*)^{-1}(D(f))$ が $\mathrm{Spec}B$ の開集合であることを示せばよい。\begin{align}\mathfrak{p}\in(\varphi^*)^{-1}(D(f))&\iff\varphi^*(\mathfrak{p})\in D(f)\\ &\iff\varphi^{-1}(\mathfrak{p})\in D(f)\\ &\iff f\notin \varphi^{-1}(\mathfrak{p})\\ &\iff \varphi(f)\notin \mathfrak{p}\\ &\iff \mathfrak{p}\in D(\varphi(f))\end{align}より、 $(\varphi^*)^{-1}(D(f))=D(\varphi(f))$ が成り立つ。よって基本開集合の逆像は基本開集合（特に開集合）となっている。

このように定義に従えば示すことのできる命題の証明は、きちんと遂行できるようにしたいところですね。

このようにして、任意の環準同型はスペクトル間の連続写像を誘導することがわかりました。
このように環準同型が与えられると、そのスペクトラム間に逆向きの射が与えられます。
このことをもっと詳しく調べると、可換環のなす圏と、アフィンスキームのなす圏に反変的な圏同値があることがわかります。このことは第4回にて詳しく扱うので、今は「ふーん、そうなんだ。」くらいに思っておいてください。

では最後にこの先重要となる二つの自然な環準同型と、そこから誘導される連続写像の例を見ていきましょう！！

命題６.
$A$ を可換環とする。
(１) $I$ を $A$ のイデアル、 $\pi:A\rightarrow A/I$ を自然な全射環準同型とする。このとき\begin{align}\pi^*:\mathrm{Spec}(A/I)\longrightarrow\mathrm{Spec}A\end{align}は $\mathrm{Spec}(A/I)$ から $V(I)\subset\mathrm{Spec}A$ への同型を誘導する。

(２) $S$ を $1$ を含むような $A$ の積閉集合とし、 $\varphi:A\rightarrow S^{-1}A$ を $\varphi(a)=\frac{a}{1},(a\in A)$ で定める（これは環準同型）。このとき、\begin{align}\varphi^*:\mathrm{Spec}(S^{-1}A)\longrightarrow\mathrm{Spec}A\end{align}は $\mathrm{Spec}(S^{-1}A)$ から $\{\mathfrak{p}\in\mathrm{Spec}A\mid\mathfrak{p}\cap S=\emptyset\}\subset\mathrm{Spec}A$ への同型を誘導する。

ただし、 $V(I)$ と $\{\mathfrak{p}\in\mathrm{Spec}A\mid\mathfrak{p}\cap S=\emptyset\}$ にはそれぞれ、 $\mathrm{Spec}A$ の制限位相を入れる。

証明.
(１)(２)ともに $\pi^*,\varphi^*$ が連続な全単射を誘導することは容易。
よって、残りは閉写像であることを見ればよい。

(１)について、 $A/I$ のイデアル $J_1$ を任意にとる。\begin{align}\mathfrak{p}\in V(J_1)&\iff J_1\subset\mathfrak{p}\\&\iff \pi^{-1}(J_1)\subset\pi^{-1}(\mathfrak{p})\\ &\iff\pi^*(\mathfrak{p})\in V(\pi^{-1}(J_1)\end{align}が成り立つことから、 $\pi^*(V(J_1))=V(\pi^{-1}(J_1))$ となり、確かに閉写像になっている。

(２)についても同様に、 $S^{-1}A$ のイデアル $J_2$ に対して $\varphi^*(V(J_2))=V(\varphi^{-1}(J_2))$ が成り立ち、閉写像となる。
これで証明できた。

この命題の言っている意味を考えましょう。

(１)については、環 $A$ のスペクトラム $\mathrm{Spec}A$ の閉部分集合 $V(I)$ がそれ自体、可換環 $A/I$ のスペクトラム $\mathrm{Spec}(A/I)$ になっているということです。

今は単に位相空間として同型であることしか言っていませんが、実際には $\mathrm{Spec}A$ に構造層を入れ、スキームとみなした時にも、この同型はスキームとしてのものであることもわかります。
これは「アフィンスキームの閉部分スキームはそれ自体、アフィンスキームであり、その構造はイデアル $I$ により決定される」という重要かつ強力な結果を表しています。

(２)については、具体的な積閉集合をとって考えてみましょう。

代表的な積閉集合の例として、ある一つの元 $f\in A$ の冪全体で定義されるものがあります；\begin{align}S=\{f^n\mid n\ge 0\}\end{align}この積閉集合による局所化は $A_f$ と書かれるのでした。
そして、対応する $\mathrm{Spec}A$ の部分集合 $\{\mathfrak{p}\in\mathrm{Spec}A\mid\mathfrak{p}\cap S=\emptyset\}$ は、\begin{align}\mathfrak{p}\cap S=\emptyset &\iff f^n\notin \mathfrak{p}(\forall n\ge 0)\\&\iff f\notin\mathfrak{p}\\&\iff \mathfrak{p}\in D(f)\end{align}より基本開集合 $D(f)$ と一致します。

したがって、「可換環 $A$ のスペクトラム $\mathrm{Spec}A$ の基本開集合 $D(f)$ はそれ自体、 $A_f$ のスペクトラム $\mathrm{Spec}A_f$ と表せる」という事がわかります。
もちろん、これもスキームとしての同型に拡張されます。

また、今はある元の冪によって定義される積閉集合を見ましたが、もう一つ代表的な積閉集合がありますね。
それはある素イデアル $\mathfrak{p}\in\mathrm{Spec}A$ を取ったときに、その補集合として定義されるもの；\begin{align}S=A\setminus \mathfrak{p}\end{align}です。この場合、局所化 $A_\mathfrak{p}$ は何を表しているのでしょう？
対応する $\mathrm{Spec}A$ の部分集合は\begin{align}\{\mathfrak{q}\in\mathrm{Spec}A\mid\mathfrak{q}\cap S=\emptyset\}=\{\mathfrak{q}\in\mathrm{Spec}A\mid \mathfrak{q}\subset\mathfrak{p}\}\end{align}となります。つまり、 $\mathfrak{p}$ に含まれるようなような素イデアル (=点)だけを表しており、 $\mathfrak{p}$ という一点の周りのみをズームアップしてみているという事になります。

これは先ほどの $D(f)$ よりもさらに考える範囲を小さな範囲に絞っていることになります。
このようなものをアフィンスキームの $\mathfrak{p}$ における茎(ストーク)といいます。
詳しい話は次回以降にやりますが、このように一点の周りをズームアップしているという感覚は大事にしてください！！

さて、これを考えると、「なぜ、 $A_f$ や $A_\mathfrak{p}$ のようなものを局所化と呼ぶのか」がわかるのではないでしょうか？

つまり、元の可換環 $A$ は $\mathrm{Spec}A$ という空間全体を定めているのに対し、その局所化 $A_f,A_\mathfrak{p}$ はそれぞれ基本開集合 $D(f)$ や $\{\mathfrak{q}\in\mathrm{Spec}A\mid \mathfrak{q}\subset\mathfrak{p}\}$ という小さな空間をズームアップして表していることになります。
だから！局所化という名前がついているわけです。
なるほどってかんじですね。

このように考える範囲を絞っていく（局所化していく）ことで、色々な多項式やその零点の振る舞いを調べよう！というのが、まさに層やスキームの一番基本的な考え方になります。
どうでしょう？だんだんイメージがつかめてきたでしょうか？

では最後に今回の内容をまとめておきましょう。

①Zariski位相とは $V(I)$ という集合全体を閉集合族とするもので、それは多項式の零点集合と（ある程度）対応している。
②基本開集合 $D(f)$ 全体はZariski位相の開基をなす。
③環準同型の引き戻しとして定義される $\mathrm{Spec}$ 間の写像は連続である。
④ $V(I)$ や $D(f)$ はそれ自体、元の環の剰余や局所化のスペクトルとしてあらわされる。

まとめ

今回は $\mathrm{Spec}A$ にZariski位相を定義し、その意味や簡単な性質、仕組みについてみていきました。
お分かりいただけたでしょうか？

出来るだけ代数幾何の「幾何的イメージ」を大事にしつつ解説してみたつもりです。（特に局所化のところはいい感じに書けたと思います）
もちろん、これだけで完全理解！とはならないでしょうが、皆様の勉強に少しでも役立てて頂けたら幸いです。

さて、ここまでの内容を一通り理解できれば、「アフィンスキーム」を定義するのはそこまで難しくありません。
ということで、次回は層の一般的な話を少しした後に、いよいよ「アフィンスキーム」に登場していただきます！
ご期待ください！！

では最後までご覧いただきありがとうございました！！

コメントはどんなものでも絶賛受け付け中です！
気に入ってくださった方は「読者になる」ボタンやTwitterフォローもポチッとお願いします！
また、時折youtubeにてライブ配信などしておりますのでそちらのチャンネル登録もお願いいたします！！
www.youtube.com

それではまた次回お会いいたしましょう！

参考文献

Algebraic Geometry and Arithmetic Curves (Oxford Graduate Texts in Mathematics)

作者:Liu, Qing
発売日: 2006/08/24
メディア: ペーパーバック

f:id:rusk_mathematics:20200809180709p:plain

*1:もしくは代数閉体まで拡大し、ガロア群の作用で有理点全体を割ることによって極大イデアル全体と同一視することもできます

2020-05-06

今度こそアフィンスキームを理解する(1)素イデアルが点とは？

ちょっと専門的な記事今度こそアフィンスキームを理解する（全五回）

みなさん、こんにちは！ラスクです。
まだまだ世界中、大変な状況が続いていますね。。負けずに数学頑張っていきましょう！！

さて！本ブログでは今回からとあるシリーズを始めたいと思います！
タイトルは
「今度こそアフィンスキームを理解する！」
です。

代数幾何を勉強すると最初に現れるアフィンスキーム。これはなかなか初学者泣かせの概念です。
そこで本シリーズではそのイメージをつかむことを目標に、全五回に分けて解説をしていきたいと思います！

必要な知識は、可換環論と位相空間の簡単な事柄のみです。
私の経験も踏まえて最大限、わかりやすく説明するので是非ご一読ください！

ここで内容に入る前に一つだけ宣伝を。
先日、このブログとは別にYoutubeチャンネルを開設しました！

www.youtube.com

そして今回の記事のおおざっぱな内容を、そのチャンネルにてすでにお話ししています。
もしよろしければこちらも併せてご覧ください(内容は5分後くらいから始まります）。
また、今後Youtubeの方の活動も少しづつやっていこうと思うので、是非チャンネル登録をお願いいたします！！

では長くなりましたが始めていきましょう。

代数幾何学とは何か
素スペクトルと極大スペクトル
極大スペクトル
素スペクトル
- 簡単な例再び
- 素イデアルと既約性
まとめ
参考文献

代数幾何学とは何か

まず、アフィンスキームとは何かをお話しする前に、そもそも代数幾何学とは何だったかを簡単に確認しましょう。

代数幾何学とは一言でいえば
「多項式の零点集合として定まる図形を研究する学問」
です。
これは何も難しいことを言っているわけではありません。

例えば非常に簡単な例として、中学生で習うような一次関数\begin{align}y=x\end{align}も多項式で表される零点集合の一つです。
より正確に言えば、次の形の $\mathbb{R}^2$ （あくまで例ですので、体は $\mathbb{R}$ で考えましょう。)の部分集合のことを指しています;\begin{align}\{(x,y)\in\mathbb{R}^2\ |\ y-x=0\}\end{align}
そして、これをグラフとして座標平面上に書けば皆さんご存じの通りの図形が定まります。

f:id:rusk_mathematics:20200506101130p:plain — $y-x=0$

もちろんこの $y-x$ というのは、多項式であれば何でもよく、 $y-x^2$ や $y^2-x^3-ax-b$ 、あるいはもっと変数を増やして $x^2+y^2+z^2-1$ などでもよいです。
ただしあくまで多項式ですから、超越的な関数である $\sin{x}$ や $e^x$ などは(普通は)考えません。

とにかく、このような零点集合としての図形を研究するのが代数幾何学ですから、扱う対象としては非常になじみ深いものであると言えます。

しかし、研究すると言っても何をするのでしょうか？
これについては私も専門外なので一概には言えませんが、大きな目標の一つとしては上で挙げたような図形たちを
「同型の差を除いて分類する」
ということがあります。

この同型をきちんと定義するのは、それこそスキームや多様体の定義を理解する必要があるのでここではしませんが、おおざっぱに言って同様の構造を持っているものを同じ図形とみなすという事です。
このような「分類問題」は途方もない問題でにわかに解けるものではありませんが、それを考える手がかりとして例えば「種数」であったり「コホモロジー」があるわけです。

最後に、これらはどのように研究されているのでしょうか。
一つには、古典的な座標幾何の考えを用いて多項式の零点を定義し、それをもとに議論を進めていくという方法があります。実際、古典的な代数幾何ではこのような方法をとっており、いろいろな結果を導けています。

しかし、あるときグロタンディークという数学者がこの枠組みを大きく抽象化し、イデアルをもとにして代数幾何を進めていく方法を確立しました。このような中で現れるのがスキームやアフィンスキームなのです。
この方法は非常に革新的で、現代の数学においてもはやなくてはならない基礎的な理論になっています。

しかし、この抽象化のさせ方があまりにダイナミックであるため初学者には、これが本当に多項式の零点の研究になっているのか、というのがわからなくなってしまうことがしばしば起こります。

今回のシリーズはそのような疑問を少しでも解消するためのものです。
キーワードは、『数学ガール』の結城先生のお言葉である
「例示は理解の試金石」
です！
できるだけ簡単な例から始めることで、スキームというもののイメージを確固たるものにしていきましょう。

ということで、次の節からは第一回の内容である「素(極大)スペクトルの点とは何か？」について話していきます。

素スペクトルと極大スペクトル

以下、 $A$ と書いたら単位的な可換環を表すことにします。

定義1.
$A$ の素イデアル全体のなす集合を素スペクトルと呼び、 $\mathrm{Spec}A$ と表す。また、 $A$ の極大イデアルの全体のなす集合を極大スペクトルと呼び、 $\mathrm{mSpec}A$ と表す。

この二つが今回の主役です。

注意として、極大イデアルは素イデアルでもあったので以下の包含関係が任意の可換環 $A$ で成り立ちます。\begin{align}\mathrm{mSpec}A\subset\mathrm{Spec}A\end{align}
スキーム論では、主にこの二つの集合を元にして空間を定義し幾何を展開します。つまり任意の可換環に対して、その素イデアル(または極大イデアル)を点とみなすという事です。

はい。。。ここなんですよね。

おそらく代数幾何を学ぼうと思った人の多くが、
「イデアルが点ってどうゆうことやねん！！」
という感想を抱くことでしょう。

それまで可換環論を少ししかやってきていない人からすれば「イデアルというのはなんか倍数の一般化であって、素イデアルっていうのは素数の一般化なんだな。」くらいのイメージしかできていないことも致し方のないことかもしれません。
なので、上のようにイデアルが空間をなします！！とか言われても「？」となってしまうわけです。

そしてそれに追い打ちをかけるように、Zariski位相や構造層という謎の概念がどばーっと出てきて完全に頭の中は「？？？」です。
実際、私もスキームに触れた当初は上のような状態に陥り挫折をしました。
でも今回はまさにそのような悩みを解決する機会です。

第一回である今回は、この素(極大)スペクトルという空間の点が一体何を表しているのかをじっくり探っていきます。

ここで、初めから難しいものを考えて混乱しないために、今回は扱う可換環 $A$ は、体 $k$ 上の多項式環\begin{align}A=k[t_1,\ldots,t_n]\end{align}またはそれをイデアル $I$ で割った剰余環\begin{align}A=k[t_1,\ldots,t_n]/I\end{align}(つまりアフィン代数多様体 *1 )に限ろうとおもいます*2。
このような形の $A$ を有限生成 $k$ -代数と呼びます。

それではまず比較的イメージのしやすい極大スペクトルの方から見ていきましょう。

極大スペクトル

一番簡単な例

例1. $A=\mathbb{C}[t]$
まずはもっとも簡単な対象として複素数係数の一変数多項式環を考えます。このときの $\mathrm{mSpec}\mathbb{C}[t]$ はどのように書けるでしょうか？少し考えてみてください。

答えは以下の通りです。

命題2.\begin{align}\mathrm{mSpec}\mathbb{C}[t]=\{(t-a)\mid a\in\mathbb{C}\}\tag{1}\end{align}

証明.まず、右辺に現れる形のイデアルが極大であるのは\begin{align}\mathbb{C}[t]/(t-a)\simeq\mathbb{C};t\mapsto a\end{align}で剰余環が体になることから良い。
逆向きの包含関係について、 $A=\mathbb{C}[t]$ は単項イデアル整域であるから全てのイデアルというのはある（モニックな)一つの多項式 $f$ によって生成される。
しかし、今 $\mathbb{C}$ というのは代数閉体なので $f$ が2次以上の多項式であるとそれは一次式の積に分解する。つまり $f$ が生成するイデアルは素イデアルにはなりえず、特に極大イデアルにもなりえない。
$f$ が定数の場合に極大イデアルにならないのは明らかなので、結局極大イデアルは一次式で生成されているものに限る。これで証明できた。

この命題を見ていると、極大イデアルを点とみなすという事が少しわかってくるのではないでしょうか？
なぜなら、今 $\mathrm{mSpec}A$ の各点と $\mathbb{C}$ の各点が以下のような関係で一対一に対応しているからです；\begin{align}\mathbb{C}&\longleftrightarrow\mathrm{mSpec}\mathbb{C}[t]\\ a&\longleftrightarrow(t-a)\end{align}このような対応関係を常に念頭に置くことで複素平面 $\mathbb{C}$ と極大スペクトル $\mathrm{mSpec}A$ を同一視して考えるわけです。

これがアフィンスキームを考える上での一番の基礎です。お分かりいただけたでしょうか？

さて、上の例に納得していただけた人もいろいろな疑問がわくと思います。
そのうち以下では次の3つについて考えます。

①多変数 $\mathbb{C}[t_1,\ldots,t_n]$ ではどうなるか？
②あるイデアル $I$ で割った剰余環 $\mathbb{C}[t_1,\ldots,t_n]/I$ の場合はどうなるか？
③ $\mathbb{C}$ を他の体 $k$ に取り替えたらどうなるか？

どれも非常に基本的な問いで、極大スペクトルを理解するうえでは重要なものです。順番に答えていきましょう。

①②の疑問

①②まず一つ目と二つ目の疑問については以下の大定理を使うといっぺんに答えることが出来ます。

定理3.(Hilbertの零点定理 weak ver.)
$k$ を代数閉体とする。このとき $A=k[t_1,\ldots,t_n]/I$ に対して以下が成り立つ。\begin{align}\mathrm{mSpec}A=\{(t_1&-a_1,\ldots,t_n-a_n)\mod{I}\\ &\mid a_i\in k,f(a_1,\ldots,a_n)=0\ (\forall f\in I)\}\tag{2}\end{align}

何を言っているかわかるでしょうか？少し見やすくするために記号を導入しましょう。

定義4.体 $k$ とその上の多項式環 $k[t_1,\ldots,t_n]$ のイデアル $I$ について、その共通零点の集合 $Z(I)$ を以下で定義する；\begin{align}Z(I)=\{(a_1,\ldots,a_n)\in k^n\mid f(a_1,\ldots,a_n)=0\ (\forall f\in I)\}\end{align}これをイデアル $I$ の代数的集合という。

代数的集合は代数幾何の研究対象である多項式の零点集合そのものです。

イデアルで書いてあるからわかりにくいかもしれませんが、例えば $\mathbb{C}[x,y]$ に対してイデアル $I=(y-x^2,y-x-2)$ と取れば\begin{align}Z(I)=\{(x,y)\in\mathbb{C}^2\mid y=x^2,y=x+2\}=\{(-1,1),(2,4)\}\end{align}となります。

この記号を用いて定理中の(2)式を書けば以下のようになります。\begin{align}\mathrm{mSpec}A=\{(t_1-a_1,\ldots,t_n-a_n)\mod{I}\mid(a_1,\ldots,a_n)\in Z(I)\}\tag{2'}\end{align}つまり、極大スペクトル $\mathrm{mSpec}A$ の点はイデアル $I$ の代数的集合 $Z(I)$ と一対一に対応しているわけです；\begin{align}Z(I)&\longleftrightarrow\mathrm{mSpec}A\\ (a_1,\ldots,a_n)&\longleftrightarrow(t_1-a_1,\ldots,t_n-a_n)\mod{I}\end{align}
どうでしょう？ $\mathrm{mSpec}A$ がきちんと多項式の零点集合を考えているんだ、と思えてきましたか？

このことを環論の言葉で言い換えてみましょう。
一度、 $I$ で割る前の多項式環 $\mathbb{C}[t_1,\ldots,t_n]$ を考え、通常通り $(a_1,\ldots,a_n)\in\mathbb{C}^n$ と $\mathfrak{m}=(t_1-a_1,\ldots,t_n-a_n)\in\mathrm{mSpec}\mathbb{C}[t_1,\ldots,t_n]$ を対応付けます。

すると上で述べたことは以下の同値性を示していることになります；\begin{align}(a_1,\ldots,a_n)\in Z(I)\iff I\subset\mathfrak{m}\end{align}つまり、ある点が考えている多項式の（共通）零点になることを、対応する極大イデアルが $I$ を含むということに翻訳できたことになります！！

こうしてみると零点集合の研究に環論が使えそうな気がしてきますね！

以降、例をみていきますが簡単のため $A$ の極大イデアルも $(t_1-a_1,\ldots,t_n-a_n)\mod{I}$ と書く代わりに、 $(t_1-a_1,\ldots,t_n-a_n)$ と書いてしまう事にします。

例1.(再考)
定理3.を基にして、先ほどの例 $A=\mathbb{C}[t]$ をもう一度考えてみましょう。

今、 $\mathbb{C}$ は代数閉体です。定理の形に合わせるためには、 $I=0$ として考えれば良いですね。
すると、(2′)式を使って\begin{align}\mathrm{mSpec}\mathbb{C}[t]=\{(t-a)\mid a\in Z(0)\}\end{align}を得ます。
しかし、 $Z(0)$ というのはゼロ多項式の零点集合なので $\mathbb{C}$ 全体になります。よって、\begin{align}\mathrm{mSpec}\mathbb{C}[t]=\{(t-a)\mid a\in\mathbb{C}\}\tag{1}\end{align}がきちんと出てきます。これで定理3.は命題2.の一般化になっていることが確かめられました。

例2.ここでは $I$ を変えることにより様々な形の図形を見ていきましょう。
まず一変数の例から。

$A=\mathbb{C}[t]/(t^2-1)$ とすると定理3.から\begin{align}\mathrm{mSpec}A=\{(t-a)\mid a\in Z(t^2-1)\}=\{(t-1),(t+1)\}\end{align}となり、 $\mathrm{mSpec}A$ は2点からなる集合を表しています。

これは環論の言葉に直せば、 $(t^2-1)\subset\mathfrak{m}$ なる極大イデアルは上の2個しかないことを言っています。

次に2変数の例を見ましょう。
$A=\mathbb{C}[x,y]/(xy)$ とします。すると代数的集合 $Z(xy)$ は、\begin{align}Z(xy)=\{(x,y)\in\mathbb{C}^2\mid x=0\ \mathrm{or}\ y=0\}\end{align}となります。つまり極大スペクトルは\begin{align}\mathrm{mSpec}A=\{(x-a,y),(x,y-b)\mid a,b\in\mathbb{C}\}\end{align}と書き表せます。これを図で書けば、下のような $xy$ 軸を表していることがわかるでしょう。

f:id:rusk_mathematics:20200506101225p:plain — $xy$ 軸

注意深い人にために言っておくと、今この図は少し無理して書いています。
なぜなら本来 $\mathbb{C}$ というのは実2次元的な対象なのでそれを2次元分書くと、4次元になってしまい中々図にできません。そこで少し目をつぶって各 $\mathbb{C}$ を直線で表し、私たちが慣れている座標平面の図にして書いています。
図というのは理解を助けてくれるものではありますが、いつも100%の意味を与えてくれるものではないので、ご容赦ください。

他にも $I$ をいろいろ変え、図形を描いたものを以下に載せておきます。皆さんもいろいろな例を考えてみてください。

f:id:rusk_mathematics:20200506101312p:plain — 左から $y=x^2$ 、 $y^2=x^3$ 、 $x^2y+xy^2=x^4+y^4$

左から $y=x^2$ 、 $y^2=x^3$ 、 $x^2y+xy^2=x^4+y^4$

では次に $\mathbb{C}$ を他の体に変えたらどうなるかという③の疑問に答えていきましょう。

③の疑問

定理3.を見ると、上の議論は $\mathbb{C}$ でなくても $k$ が代数閉体であれば全く問題なく成り立つことがわかります。
なのでここでは、代数閉体でないようなものとして代表的な $k=\mathbb{Q}$ を考えましょう。

そして考える環は $A=\mathbb{Q}[t]$ とします。
このとき、 $\mathfrak{m}=(t^2+1)$ というイデアルは $A$ の極大イデアルになっています。
実際、\begin{align}\mathbb{Q}[t]/(t^2+1)\simeq\mathbb{Q}(i);t\mapsto i\tag{3}\end{align}という同型があり、剰余環が体になっています。

ところが、この $\mathfrak{m}$ というイデアルは $(t-a),\ (a\in\mathbb{Q})$ という形にはなっていません*3。
つまり、 $\mathrm{mSpec}\mathbb{Q}[t]$ には $(t-a)$ という形以外の極大イデアルが存在し、ヒルベルトの零点定理が成り立っていないことになります。

もちろん、 $\mathbb{Q}[t]$ でも $(t-a)$ という形のイデアルは極大イデアルになっています。これも次のような同型を考えれば納得できるでしょう；\begin{align}\mathbb{Q}[t]/(t-a)\simeq\mathbb{Q};t\mapsto a\tag{4}\end{align}

よって $A=\mathbb{Q}[t]$ においては以下のような真の包含関係が成り立っています；\begin{align}\{(t-a)\mid a\in\mathbb{Q}\}\subsetneq\mathrm{mSpec}\mathbb{Q}[t]\end{align}
左辺の集合は $\mathbb{Q}$ と一対一に対応していますから、この関係式は（少し乱暴ですが）次のようにかけます；\begin{align}\mathbb{Q}\subsetneq\mathrm{mSpec}\mathbb{Q}[t]\end{align}これは多変数にしても同じです。

このように、代数閉体でない $k$ 上の有限生成代数においては、素朴な点集合よりも極大スペクトルの方が大きくなります。つまり現代の代数幾何では、素朴な点よりも多くのものを点の概念として採用しているという事です。

これがとても大切です。これを知らずに、極大スペクトルの点を自分の知っている素朴な点と無理矢理当てはめようとすることが、混乱の種になります。代数幾何では（ある程度対応はとれていながらも）点の取り方を新しく定義しなおしているという事を覚えておいてください。

せっかくですからもう少し上の状況を観察してみましょう。
$\mathrm{mSpec}\mathbb{Q}[t]$ において $(t-a)$ と書かれるものとそうでないものの違いは何でしょうか？

もちろん形が違うというのはその通りですが、もう少し重要な違いが表れているところがすでに表れています。
それはどこでしょう？少し考えてみてください。

答えは、体の拡大の有無です。

(4)式で見たように $(t-a)$ という極大イデアルで割った剰余環は $t$ に $a$ を代入するという写像によって $\mathbb{Q}$ そのものと同型になります。
しかし、 $(t^2+1)$ という極大イデアルの場合は(3)で見たように、その剰余環は $t$ に $i$ を代入するという写像によって少し拡大された $\mathbb{Q}(i)$ という体と同型になります。

ここが違いです。

つまり $\mathbb{Q}$ というのは今、代数閉体ではないのでその中に解を持たない多項式というのが存在し、結果2次以上の多項式も既約になりうるわけです。
今の場合は $i$ が $\mathbb{Q}$ には入っていないため代入しようとすると、体の方を拡大しなけらばならないという事が起こります。

一般に、 $A/\mathfrak{m}$ を $\mathfrak{m}$ における剰余体といい、剰余体が最初に決めた係数体 $k$ と同型（つまり大きくなっていない）点のことを $\mathrm{mSpec}A$ の $k-$ 有理点といいます。
今の場合は $(t-a)$ は $\mathbb{Q}-$ 有理点であり、 $(t^2+1)$ は $\mathbb{Q}-$ 有理点ではありません。

$k-$ 有理点というのはあくまで、初めに与えられた体の中で多項式の零点を探すので、あまり代数閉体を仮定したくないような数論的な状況では重要になります。

この辺の話はアフィンスキームを定義した後、第五回でもう一度お話ししたいと思いますので楽しみにお待ちください。

とにもかくにもこれで代数閉体でない場合についてもある程度わかったことになります。

ここまでの話をまとめます。

（ $k$ が代数閉体であるとき）Hilbertの零点定理が成り立ち、代数的集合 $Z(I)$ と極大スペクトル $\mathrm{mSpec}k[t_1,\ldots,t_n]/I$ の間には一対一の対応がある。
（ $k$ が代数閉体でないとき）素朴な点集合よりも極大スペクトルの方が大きくなり、その差は剰余体の拡大という形で現れる。
代数幾何で扱っている点集合と素朴な座標幾何の点集合は必ずしも一致しない。

ではこれを踏まえて今度は素スペクトルの方を見ていきましょう。

素スペクトル

簡単な例再び

例3. $A=\mathbb{C}[t]$
こちらについても $A=\mathbb{C}[t]$ という環からはじめていきましょう。

ただし今回考えるのは素スペクトル $\mathrm{Spec}A$ です。
これはどのように書き表せるでしょうか？

答えは次のようになります。

命題4.\begin{align}\mathrm{Spec}\mathbb{C}[t]=\mathrm{mSpec}\mathbb{C}[t]\cup\{(0)\}\end{align}

つまり、極大イデアルでない素イデアルというのは、この場合 $(0)$ しかないという事です*4。

証明.
$\mathbb{C}[t]$ の素イデアルを $\mathfrak{p}=(f)$ 、 $f\in\mathbb{C}[t]$ ：モニック、と表す（ $\mathbb{C}[t]$ はPID）。 $\mathbb{C}$ が代数閉体であることから $\mathrm{deg}f\le 1$ であり、もし $\mathrm{deg}f=1$ ならば命題1.より\begin{align}\mathfrak{p}=(f)\in\mathrm{mSpec}\mathbb{C}[t]\end{align}よって $\mathrm{deg}f=0$ であるが、このとき $\mathfrak{p}=(f)$ が素イデアルになるのは明らかに $f=0$ 、すなわち $\mathfrak{p}=(0)$ の時に限る。

例1.で見たように、 $\mathrm{mSpec}\mathbb{C}[t]$ は $\mathbb{C}$ と一対一に対応しています。
では新たに加わったこの零イデアル $(0)\in\mathrm{Spec}\mathbb{C}[t]$ というのは何に対応しているのでしょうか？

結論から言えば、これは $\mathbb{C}$ 全体、すなわち複素平面全体に対応しています。

混乱している人も慌てないでください。実はこれはもう説明してあります。
$(0)$ というのは素イデアルですが、ここでは単にイデアルとみなしましょう。
すると例1.(再考)のところで考えたように代数的集合 $Z(0)$ は $\mathbb{C}$ 全体ですから、 $(0)$ というのは複素平面全体を表していると考えることが出来るわけです。

環論の言葉に直せば、これは $(0)$ というのが任意の極大イデアル $\mathfrak{m}\in\mathrm{mSpec}\mathbb{C}[t]$ に含まれていることを表しています；\begin{align}(0)\subset\mathfrak{m}\end{align}

そして大事なことは、この $(0)$ のようにいくつかの点をあつめてきたような代数的集合というものも、代数幾何では点とみなしているという事です。

普通に考えたら平面全体を点とはみなさないでしょう。
それでもこれを点とみなして空間を定義することにより、都合の良いことがたくさん起こります。
そのあたりは第四回で少しお話します。

素イデアルと既約性

例4. $A=\mathbb{C}[x,y]$
今度は $A$ として2変数の複素数係数多項式環を考えます。
先程は $\mathrm{mSpec}A$ と $\mathrm{Spec}A$ の差は $(0)$ だけでしたが、今度はもっと多くのものが出てきます。

例えば $(x)$ というイデアルは素イデアルではありますが、極大イデアルにはなりません。
実際、剰余環を考えると\begin{align}\mathbb{C}[x,y]/(x)\simeq\mathbb{C}[y]\end{align}であり、 $\mathbb{C}[y]$ は整域ではありますが体ではありません。

では、この $(x)$ というイデアルはどのような図形に対応しているでしょうか？
もう皆さんわかるはずです。

答えは\begin{align}Z(x)=\{(0,a)\mid a\in\mathbb{C}\}\subset\mathbb{C}^2\end{align}すなわち $y$ 軸です。
図形がすぐに想像できた方は、おそらくきちんとスペクトラムのイメージがきちんとできていると思います。

これも環論の言葉に直せば、 $(x)$ を含むような極大イデアルというのは $(x,y-a)$ という形のもの、またそれに限る、ということです；\begin{align}(x)\subset(x,y-a)\ \ (\forall a\in\mathbb{C})\end{align}

しつこいようですが、この $(x)$ というのも点です。いくつかの点が集まってできた図形も点なのです。

さて、最後に一つだけ重要な事柄を言って終わりにしましょう。
今、素イデアル $\mathfrak{p}\in\mathrm{Spec}A$ は代数的集合 $Z(\mathfrak{p})$ に対応しているという事を見てきました。
しかし、任意の代数的集合が素イデアルに対応するわけではありません。

具体的には例2.の中で見たような $Z(xy)$ という代数的集合については、 $(xy)$ が素イデアルではありません。
では、どのような代数的集合が素イデアルに対応するのでしょう？

それは、代数的集合の中でも既約なもの、ということになります。

まだ、 $\mathrm{Spec}A$ に位相を定めていないのできちんとした定義はできませんが、既約性とはおおざっぱに言ってしまえば、二つ以上の代数的集合に分けることが出来ないものを指します。

例えば $(x)$ は $y$ 軸を表していましたが、これはこれ以上分けられないので既約です。
対して、 $(xy)$ は $xy$ 軸を表していましたが、これは $x$ 軸と $y$ 軸という二つの代数的集合分けられるので既約ではありません；\begin{align}Z(xy)=Z(x)\cup Z(y)\end{align}

よって素スペクトラムというのは代数的集合のうち、既約なものを集めてきたものだという事ができるわけです*5\begin{align}\mathrm{Spec}A\longleftrightarrow\{\text{既約な代数的集合}\}\end{align}

まとめ

ということで今回は、素スペクトルと極大スペクトルの点が表しているものの意味を解説していきました。
いかがでしたでしょうか？

今回、私が最も伝えたいことは
「ある空間における点の定義は必ずしも素朴なものと完全に一致しない」
ということです。

数学を勉強していると、いろいろな空間に出会いますがそのどれもが想像しやすいものとは限りません。
そのようなものと自分の知っている概念を関連付けるのは大切ですが、無理にそれをすり合わせようとすると混乱を生じます。
あくまで新しい空間を定義したわけですから、それはそれとして考えることも重要ではないかと私は思っています。

ではシリーズ「今度こそアフィンスキームを理解する」の第一回はこれで終わりにします。

次回は、Zariski位相を導入し $\mathrm{Spec}A$ を位相空間にしていきます。お楽しみに！！

参考文献

基本的には以下の二つの本を参考にしています。

代数幾何学〈1〉 (Springer‐Verlag GTMシリーズ)

作者:R. ハーツホーン
メディア: 単行本

Algebraic Geometry and Arithmetic Curves (Oxford Graduate Texts in Mathematics)

作者:Liu, Qing
発売日: 2006/08/24
メディア: ペーパーバック

f:id:rusk_mathematics:20200506101936p:plain

*1:多様体の定義には既約性を課す場合もありますが、ここでは単に有限生成性だけを課すことにします。

*2:より一般の可換環（例えば $\mathbb{Z}$ など)については、これらのイメージを持ったうえで同様に考えればよいと個人的には思っています。

*3:もしなっているとすると、 $t^2+1$ が $t-a$ で割り切れることになります。このとき因数定理より $a^2+1=0$ となりますが、これは $a$ が有理数であることに反します。

*4:これは $\mathbb{C}[t]$ が環として一次元であることを主張しています。

*5:少し注意すると、代数的集合の既約性というのは図形の見た目で決まるものではなく、それを定めている多項式（イデアル）で決まります。 $Z(t)$ と $Z(t^2)$ はどちらも $\mathrm{Spec}\mathbb{C}[t]$ において原点を表していますが前者は既約であり、後者は既約ではありません。

2020-04-08

ABC予想解決記念！整数と多項式の密接な関わり

初等的な記事

みなさん、こんにちは！ラスクです。

現在、世界中が大変な状況となっており、日本でも外出自粛が要請されていますね。
なにかと不安の多い毎日ですが、こんなときこそ自宅で数学をしましょう！
1人で黙々と本を読むのもよし、オンラインで誰かとセミナーをやるのもよし。
熱中している間は、陰鬱な気分を忘れることができるかもしれません。

さて、最近数学界において大変嬉しい出来事がありました。
私のブログを読んでくださっている方々なら、もうご存知だと思います。
そう！2020年4月3日、
望月新一教授が「ABC予想」を解決したとされる論文の査読がついに完了した
と京都大学から発表がありました！！

平たく言えば、「ABC予想」が解決した！ということです*1。めでたい！

整数論を専攻する身としては、何か記事を書かねばと思い、考えを巡らしました。
しかし「ABC予想」の凄さやその主張の意味に関しては、すでに多くの方が記事や動画で解説されているので、本記事ではそのようなことはお話ししません。

代わりに「ABC予想」を題材にした「整数と多項式の関係性」についてお話ししようと思います。
この考え方自体は現代の整数論や数論幾何学といった理論の根底にあるものです。
とはいってもあまり難しい話はせず、高校生でもギリギリ読める程度で書きます。
大学で習うような代数学の概念の気持ちを知ることが出来るように書いたので、是非身構えずに気軽に見ていって下さい！

では始めましょう。

そもそもABC予想って？
多項式版ABC
整数論における「整数」と「多項式」
- 二つの世界の豊かさと不思議な類似性
- 現れる大定理・大予想
まとめ
参考文献

そもそもABC予想って？

まずは今回証明されたABC予想とはどのようなものなのかを確認しましょう。

まず用語の定義です。

定義1.
どの二つも互いに素な正の整数の三つ組 $(a,b,c)$ であって、\begin{align}a+b=c\end{align}を満たすようなものをabc-tripleという。

定義2.
整数 $N\neq 0$ に対し、その根基 $\mathrm{rad}(N)$ を $N$ の互いに異なるすべての素因数の積とする。

この二つを用いて、主張を述べます。

ABC予想
任意の実数 $\epsilon>0$ に対し、実数 $K(\epsilon)>0$ で、すべてのabc-triple $(a,b,c)$ に対し\begin{align}c< K(\epsilon)(\mathrm{rad}(abc))^{1+\epsilon}\tag{1}\end{align}となるものが存在する。

先ほども述べた通り、ここではこの主張の詳しい解説は致しません。
ただ、上の主張において $\epsilon=0$ とすることは出来ないことには注意しておきましょう。

この辺りのことはtsujimotterさんが非常にわかりやすい記事を挙げてくださっているので、そちらをご覧ください。
tsujimotter.hatenablog.com

望月新一先生は、この予想を「宇宙際タイヒミュラー理論」という新しい理論を使うことによって解決しました*2。
もちろん本来であれば、この理論の気持ちだけでも伝えたいのですが私にその力はありません。
なので、知りたい方は加藤文元先生の本をご覧ください。

宇宙と宇宙をつなぐ数学 IUT理論の衝撃

作者:加藤文元
発売日: 2019/04/25
メディア: 単行本

とにもかくにも、一応これでABC予想の主張は理解されたことにいたします。以下、区別のため上の主張のことを整数版ABC予想という事にします。

多項式版ABC

ABCに必要なもの

さてここからが本題です。
上で述べた主張を整数ではなく多項式で考えてみましょう。

整数論（というか数学全般）にあまり馴染みのない方は、なんでいきなり多項式？？となるかもしれません。
これはABC予想の主張に必要なものを考えてみればわかるかもしれません。

ABC予想の主張に必要なものとは以下の三つです。

①和と積
②素因数分解
③大きさを評価するもの

順番に説明すると同時に、多項式がこれらを有していることを確認しましょう。

以下、簡単のため多項式はすべて実数を係数に持つようなものとして考え*3、その集合を $\mathbb{R}[x]$ と表します。

①和と積
これに関しては説明不要だと思います。さすがに足し算や掛け算のできない状況では何もできません。
そして多項式も足したり、掛けたりすることは普通にできますからOKです。

②素因数分解
このことが必要な3つのもののうち、一番クリティカルです。
abc-tripleの定義の中で互いに素という条件があったり、根基の定義で整数 $N$ の素因数を考えていることから、素因数分解が必要であることがわかります。
より正確に言えば、どんな要素も素数(と符号)の積に一意的に表される、ということです。

このことは多項式でも成り立ちます。
これをきちんと述べるために多項式における素式というものを定義しておきましょう。

定義3.
定数でなく、最高次の係数が $1$ の多項式が実数上既約であるとき、 $\mathbb{R}[x]$ の素式であるという*4。

例を見てみましょう。
例4.

$x-2$ や $x^2+x+1$ などは、定数でなく、最高次の係数が $1$ である。さらに実数の中でこれ以上因数分解できないので既約である。したがってこれらは素式である。
$2x^2-1$ は最高次の係数が $1$ でないので素式でない。
$x^2–5x+6$ は\begin{align}x^2-5x+6=(x-2)(x-3)\end{align}と因数分解できるので素式でない。

わかりましたでしょうか？定数かどうかや最高次の係数は見た瞬間わかるので、気をつけるべきは既約性ですね。

そしてこの素式を使って $\mathbb{R}[x]$ 上の素因数分解を述べると以下のようになります。

命題5.
任意の多項式 $P\in\mathbb{R}[x]$ は素式 $P_1,\dots,P_m\in\mathbb{R}[x]$ と定数 $a\in\mathbb{R}$ を用いて\begin{align}P=aP_1\ldots P_m\end{align}と一意的に表せる。

これも例で見てみましょう。
例6.
\begin{align}x^2-7x+12&=(x-3)(x-4)\\x^3-8&=(x-2)(x^2+2x+4)\\2x^4-2x^3-4x^2+6x+6&=2(x^2-3x+3)(x^2+2x+1)\end{align}

やってみればなんてことはない、ただの因数分解ですね。
ただ、素式の最高次の係数は $1$ しか許されていないので、頭に係数を付けることを忘れないようにしましょう。

こうして、多項式でも素因数分解ができました。

特に、このことを使って

多項式 $P_1,P_2$ が互いに素である $:\iff P_1,P_2$ が共通の素因数(素式)を持たない

多項式 $P$ の根基 $\mathrm{rad}(P)=$ ( $P$ の互いに異なるすべての素因数の積）

と定義することができます。整数の時と全く同様にするわけです。

③大きさを評価するもの
整数や実数には大きさというものが自然に定まっていました。
$2$ と $5$ はどちらが大きい？と聞かれたら $5$ ！と小学生でも答えられるでしょう。
(1)式の中でも大きさの比較をしているのでこれは必須条件となります。

しかし、多項式の大きさというものは普通は定まっていません。 $x^2+x+4$ と $x-3$ どっちが大きい？と聞かれても困ってしまいますね。
それでも、多項式に大きさを決めることはできます。

今回はその多項式の大きさを次数によって定めましょう。
つまり $x^2+x+4$ と $x-3$ であれば、次数の大きい $x^2+x+4$ の方が大きいと答えるわけです。

何とも雑な評価だ、と思われるかもしれませんが多項式版のABCではこの次数を比較します。

以下、多項式 $P$ の次数を $\deg{P}$ と書くことにします。

以上で、①②③を多項式が有していることがわかりました。
つまり、少なくとも主張を述べるだけであれば多項式においてもABCがつくれるわけです。
この①②③の性質については後でもっと詳しく述べることにして、お待ちかねの多項式版のABC定理を述べましょう。

多項式版ABC定理

整数の時と同様、
どの二つも互いに素な多項式の三つ組 $(A,B,C)$ であって、\begin{align}A+B=C\end{align}を満たすようなものをABC-tripleということにします。

定理の主張は以下の通りです。

定理7.(ABC定理)
$(A,B,C)$ を全てが定数でないABC-tripleとする。このとき\begin{align}\max{\{\deg{A},\deg{B},\deg{C}\}}<\deg{\mathrm{rad}(ABC)}\end{align}が成り立つ。

意味は分かるでしょうか？
つまりABC-tripleが与えられたときそれらの次数は全て、積 $ABC$ の根基の次数よりも真に小さいということを言っています。
この定理の主張を見ると、整数版ABC予想よりもかなりすっきりしている印象を受けますね。一体何がちがうのでしょう？

それはずばり、整数版ABC予想における $\epsilon$ を $0$ にできており、加えて $K(\epsilon)$ を $1$ とできている点です。

これが、決定的な違いであり多項式版のABC定理は整数版のABC予想よりも強いことを要請しています。
にもかかわらず、多項式版のABC定理はかなり初等的に証明することができます。
ただ、この定理を証明することが本記事の目的ではないので、簡単に証明の概略だけ紹介することに致します。
是非、意欲のある方は各自で行間を埋めて頂きたいですが、難しいと感じた方は適宜読み飛ばしてください*5。

証明の概略

以下、多項式 $P\in\mathbb{R}[x]$ の微分を $P'$ と表す。

まず\begin{align}D:=AB'-BA'\end{align}とおく。このとき、 $A+B=C$ とすべてが定数でないことから\begin{align}D=AC'-CA'=CB'-BC'\neq 0\tag{2}\end{align}が従う。

次に、 $D$ の定義から $\deg{D}\le\deg{AB}-1$ がわかり、この両辺に $\deg{C}$ を足すことで $\deg{C}+\deg{D}<\deg{ABC}$ を得る。(2)による $D$ の別表示を使う事により、結局\begin{align}\max\{\deg{A},\deg{B},\deg{C}\}+\deg{D}<\deg{ABC}\tag{3}\end{align}が得られる。

ここで $D$ は $A_1:=\frac{A}{\mathrm{rad}(A)},B_1:=\frac{B}{\mathrm{rad}(B)},C_1:=\frac{C}{\mathrm{rad}(C)}$ 全てで割り切れる（すなわち公倍数である）ことが、 $D$ の定義と(2)式、 $A,B,C$ の素因数分解を考えることでわかる。

今、 $A,B,C$ はどの二つも互いに素であったから $A_1,B_1,C_1$ もそうであり、 $D$ は $A_1B_1C_1$ の倍数である。
すると $D\mathrm{rad}(ABC)$ が $ABC$ の倍数となり、結局\begin{align}\deg{ABC}\le\deg{D}+\deg{\mathrm{rad}(ABC)}\end{align}が従う。これと、(3)式を合わせることで、主張を得る。

整数論における「整数」と「多項式」

二つの世界の豊かさと不思議な類似性

さて、前節では多項式版ABC定理の主張と証明を紹介しました。ご理解いただけたでしょうか？
ここでABCの主張に必要な要素を復習しましょう。それは以下の三つでした。

①和と積
②素因数分解
③大きさを評価するもの

ここで一度③はおいておきます。

今からこれらの条件をもとに、代数学で習う用語をババっと説明していきます。

①のように和と積の構造が定められている集合のことを環といいます。
特に環のうち、積が可換(つまり積の順序を入れかえられる)なものを可換環といいます。
そして、可換環であって $0$ でない元同士を掛けても $0$ にならないようなものを整域といいます。
さらにさらに、整域であって②のように一意的な素因数分解（と呼べるもの）が出来るものを一意分解整域といいます。

色々な用語がいきなり出てきて混乱しているかもしれないので簡単にまとめると、これらは以下のような関係にあります。

環　 $\supset$ 　可換環　 $\supset$ 　整域　 $\supset$ 　一意分解整域

この順番でだんだんと条件がきつくなっていきます。
これらを勉強したことがない人からすれば、①②はさておき、積が可換なんて当たり前だろ！とか $0$ でない元を掛けて $0$ にならないのなんて当然だ！といいたいかもしれません。

しかし、代数を少しでもかじってみるとこれらを満たさないような環というのは山のようにでてきます。
すなわち、一意分解整域は上で述べたような様々な条件をクリアした優秀な人たち（環たち…？）といえます。

そして、今述べたいことは、「整数」という環も「多項式」という環もどちらも一意分解整域であるという事です！
整数については小学校などで習った通りで、多項式についても前節で述べたとおりです。

よって、「整数」も「多項式」も様々な条件をクリアした優秀な対象であり、互いによく似た性質を持つ対象であるといえます。

もちろん、条件の強弱というのは相対的なものでしかないので、これだけで優秀とか、似ていると言ってしまうのはマズイかもしれません*6。

それでも、これら二つの対象の上ではとてつもなく豊かな世界が広がっており、その二つの世界同士が不思議な類似性を持っていることは多くの研究で分かっています。
誤解を恐れずに言えば、この「豊かさ」と「不思議な類似性」に整数論の面白さの一つがあるといえます。

ちなみに、③についてはあまりはっきりとしたことは言えません。
というのも③で書いた"大きさ”というのは非常にアバウトな言い回しです。先ほどもちょっと言ったように「多項式の大きさを次数で測りましょう！」というのはあまりにも雑な気がします。なので③については、とりあえずここではABCの主張に必要な要素なんだ、くらいに思っておいてください。

現れる大定理・大予想

さて、上で述べたことを聞いてどう思ったでしょうか？
「うん。確かに整数と多項式は似ている性質がたくさんあるな…ふむふむ」と思っていただけたら嬉しいですが、中にはいろいろ文句をつけたい人もいるでしょう。それもまた正しい反応だと言えます。

今回の題材であるABCであっても、整数版と多項式版では色々相違点があります。
大きくは前節で述べたような、 $\epsilon>0,K(\epsilon)>0$ （整数版）と $\epsilon=0,K(\epsilon)=1$ (多項式版)の違いがありますが他にもあります。

そもそも方や整数の大きさを比較していて、方や次数を比較しているのは同じABCとしてよいものか。。

だったり。

多項式版の方は（多少端折りましたが）高校範囲で証明できてしまうのに対し、整数版は今回「宇宙際タイヒミュラー理論」という壮大な理論を用いて証明されたもの。

だったり。
これが似ているというのは…うーんという気持ちもわきます。。

またABC以外にも、整数と多項式で類似の主張があります。二つご紹介しましょう。どれも泣く子も黙る大定理（予想）です。

「フェルマーの最終定理」

皆さんご存じの整数版フェルマーの最終定理

\begin{align}X^n+Y^n=Z^n\ (n\ge3)\end{align}を満たすような自然数 $X,Y,Z$ は存在しない。

は証明するのに350年以上かかった超難問です。

しかし、この自然数という部分をそのまま多項式に書き換えたものに関しては（先ほどのABC定理を使って)初等的に示すことが出来ます。

「リーマン予想とヴェイユ予想」

少し難しい例になってしまいますがお許しください。
まず、リーマン予想というのは整数に深く関係している問題でミレニアム問題の一つに設定されています。

そして、ヴェイユ予想というのは（かなり乱暴な言い方をすれば）リーマン予想の多項式類似ということが出来ます。ヴェイユ予想も非常に難解であることには変わりありませんが、ドゥワークやグロタンディーク、ドリーニュといった20世紀の大数学者たちによって解決されています。

しかし、リーマン予想はいまだに難攻不落で未解決問題のままとなっています。

（こう聞くと整数の方が難しくて、多項式のが簡単なんだ！と思いがちですがそうともいいきれません。）

こうして説明していると、そろそろ
「似ていると言ったり、似ていないと言ったり、どっちなんだ！！！」
と怒りの声が聞こえてきそうですね。
ただこれに関して、少なくとも私のレベルでは「どちらともいえない」という他ありません。

似ていることもあれば、全然似てないこともある。
共通の道具が使えることもあれば、使えないこともある。

このような何とも言えない関係を踏まえて、先ほどは「不思議な類似性」という言葉を使いました。

そしてこの「不思議な類似性」を追いかけていくと歴史上の数学者たちが示した驚くべき定理や理論たちに出会うことができ、それは非常に魅力的なことだと思うわけです。

まとめ

という事で今回は「ABC予想」を題材に整数と多項式というテーマでお話しをしました。
いかがでしたでしょうか？

書いていくうちにテンションが上がってきてしまい、最後の方はほぼ個人の感想のようになってしまいましたね(笑)
読み返すのが恥ずかしい限りです。

それでも、この記事が誰かの共感を誘ったり、少しでも勉強のモチベーションアップにつながれば幸いです。

まあとにかく、望月先生の論文の査読が完了したのは本当にめでたい！
みんなで喜び合いましょう！バンザイ(/・ω・)/

では最後までご覧いただきありがとうございました！！

コメントはどんなものでも絶賛受け付け中です！
気に入ってくださった方は「読者になる」ボタンやTwitterフォローもポチッとお願いします！

それではまた次回お会いいたしましょう！

参考文献

ABC定理に関しては次の本を参考にしました。証明も詳しく載っています。

初等整数論 ―数論幾何への誘い― (共立講座数学探検 6)

作者:山崎隆雄
発売日: 2015/05/23
メディア: 単行本

f:id:rusk_mathematics:20200408025056p:plain

*1:あくまで「平たく言うと」です。査読が完了したからと言って完全に数学的に正しいかどうかが保証されたわけではありません。ただ、それを言い出すと中々言い回しが面倒になりますので今回はこのように書いています。ご了承ください。

*2:ただし、宇宙際タイヒミュラー理論の凄さはABC予想が解決できるから、という理由だけではないと思っています。

*3:実際には多項式版ABC定理は標数 $0$ の体上の多項式環で成り立ちます

*4:この定義では、素式と多項式環における素元は別のものです。素元は既約性があれば十分ですが、今回は多項式環における素因数分解が本当に一意になるために、最高次の係数が $1$ という条件を課しました

*5:コメントやtwitterで質問してくださってもかまいません

*6:実際にはもっと強い条件も共有しています

2020-03-20

2次体の単数群の構造。ペル方程式再び！

ちょっと専門的な記事

みなさま、ご無沙汰しております。ラスクです。

年末に挙げた微分加群の記事が非常に好評で、アクセス数なども安定してきました。
ありがとうございます。

さて、今回はペル方程式第二弾！と致しまして、その「代数的整数論への応用」を見たいと思います。
具体的には、「2次体の単数群」の構造をペル方程式によって決定できるという話をします。

今回の話は完全に大学数学の範囲になるため、代数学や代数的整数論の本当に基本的な内容は知っている人向けに書きます。
ただし、出てくる用語についてはその都度確認しながら進めるので、あまり自信のない方でも是非読んでみてください！

また、今回の記事の後半で実際にペル方程式を解くことになります。ペル方程式の解の構造や一般解の求め方については前回扱った記事があるので、まだ読んでいない方はこちらからどうぞ！！

mathforeveryone.hatenablog.com

では、さっそく始めていきましょう！

整数環とその単数群
2次体の単数群
まとめ
参考文献

整数環とその単数群

以下 $K$ を代数体、つまり有理数体 $\mathbb{Q}$ の有限次拡大とします。
次の節以降ではもっぱら $K$ として2次体を考えますが、この節では一般の代数体としておきます。

代数体の整数環

$K$ の整数環の定義を復習しましょう。

定義.
$\mathbb{Q}$ 上代数的な元があるモニック(最高次の係数が1)な有理整数係数多項式の根になるとき代数的整数であるという。
また、 $K$ の元であって代数的整数であるもの全体のなす環を $K$ の整数環といい、 $\mathcal{O}_K$ とあらわす。
$\mathcal{O}_K$ の元を $K$ の整数という。

上の定義において、モニックという条件は非常に大切です。これがないと、 $\mathbb{Q}$ 上代数的な元全てが代数的整数になってしまい、代数的整数という言葉に意味がなくなってしまいます。
また、上の定義では代数的整数全体が環をなすことをしれっと言っていますが、実際にはこれは非自明なことで証明が必要です。ここでは長くなるので省略をしますが、一般的には「行列式の技法」というものを使うと示すことが出来ます。

整数環の概念に不慣れな人のために2次体での例を挙げてみます。慣れている方は読み飛ばしていただいて構いませんが、後半でこれらの例を使うことになるためご注意ください。

例1.
$K=\mathbb{Q}(\sqrt{2})$ とします。このとき体の一般論から\begin{align} K=\mathbb{Q}+\mathbb{Q}\sqrt{2}=\{a+b\sqrt{2}\ |\ a,b\in\mathbb{Q}\} \end{align}と書けます。そしてその整数環は\begin{align} \mathcal{O}_K=\mathbb{Z}+\mathbb{Z}\sqrt{2}=\{a+b\sqrt{2}\ |\ a,b\in\mathbb{Z}\} \end{align}となります。つまり、 $\sqrt{2},1+\sqrt{2}$ などは $K$ の整数ですが、 $\frac{1}{2},1+\frac{1}{3}\sqrt{2}$ などは $K$ の整数ではありません。

例2.
次に $K=\mathbb{Q}(\sqrt{5})$ とします。このときも\begin{align} \mathcal{O}_K=\mathbb{Z}+\mathbb{Z}\sqrt{5}\tag{×}\end{align}となると思いがちですがこれは間違いです！実際、 $\frac{1+\sqrt{5}}{2}$ は右辺の集合には含まれませんが、\begin{align}x^2-x-1\end{align}という多項式の根であることから $K$ の整数になります。
ただしくは、\begin{align}\mathcal{O}_K=\mathbb{Z}+\mathbb{Z}\frac{1+\sqrt{5}}{2}\end{align}となります。初めて見た方は「なんでやねん！」って感じかもしれませんね（笑）

上の例のように2次体については、その整数環をかなり具体的に書き表すことができ、事実として以下のことが成り立ちます。

命題1.
$D$ を平方因子を含まない整数とする。このとき2次体 $\mathbb{Q}(\sqrt{D})$ の整数環 $\mathcal{O}_K$ について以下が成り立つ。
（i） $D\equiv 2,3\mod{4}$ ならば\begin{align}\mathcal{O}_K=\mathbb{Z}+\mathbb{Z}\sqrt{D} \end{align}
（ii） $D\equiv 1\mod{4}$ ならば\begin{align}\mathcal{O}_K=\mathbb{Z}+\mathbb{Z}\frac{1+\sqrt{D}}{2} \end{align}

このとき整数 $D$ は正である必要はなく、したがって虚2次体についても全く同様の表記ができることになります。
例えば、虚2次体 $K=\mathbb{Q}(\sqrt{-1})$ については上の命題の(i)が適用でき、その整数環は\begin{align}\mathcal{O}_K=\mathbb{Z}+\mathbb{Z}\sqrt{-1} \end{align}となります。これはガウス整数環という名前のついた非常に有名なもので、複素平面上の格子点に対応しています。

一般の代数体の整数環がこのような具体的な表記を持つかどうかというのは非常に難しい問題です。しかし本記事では、殆どの話を2次体に絞ってしますので、まだ整数環に慣れないなあ、という人はひとまず上の例で見たような数全体の事だと思っておいて差し支えありません。

整数環の単数群

では次に、整数環の単数について確認します。

一般に可換環 $R$ の元 $r$ が単数（単元）であるとは、その乗法に関する逆元が（ $R$ の中に）存在することを言います。つまり数式で書けば\begin{align}
r\in R\text{が単数}\iff \exists s\in R\ s.t.\ rs=sr=1\end{align}
ということです。単数と単数の積はまた単数であることと、 $1$ が単数であることから $R$ の単数全体からなる集合は乗法に関して群をなします。これを $R^*$ と書いて $R$ の単数群と呼びます。

上の定義をそのまま $\mathcal{O}_K$ に適用すれば、 $\mathcal{O}_K$ の単数群 $\mathcal{O}_K^*$ が得られます。今回はこの $\mathcal{O}_K^*$ の構造を調べていこうというわけです。

さて、これで一通り準備が済んだのでこのまま次節に進んでも良いのですが、もう少しだけ疑問が残りますね。
それは「なぜ単数群の構造を知りたいのか？」ということです。
一般の可換環において単数群というのは重要なものだから、と言ってしまえばそれまでですが、それではあんまりですね…。
ここではイデアルとの関係性からもう一歩踏み込んでお話ししたいと思います。

なぜ単数群を考えるのか。

皆さんご存知の通り有理整数環 $\mathbb{Z}$ 上では一意的な素因数分解が出来ました。
しかし、 $\mathbb{Z}$ を拡張した $\mathcal{O}_K$ ではもはやこれは成り立ちません。

ではどうするのか。その一つの打開策として「イデアル」を考えるという方法が挙げられます。
$\mathcal{O}_K$ では一意的な素因数分解は出来ませんが、一意的な素イデアル分解はできるということが知られています*1。素イデアル分解とは例えばガウス整数環 $\mathbb{Z}[\sqrt{-1}]$ におけるイデアル $(5):=5\mathbb{Z}[\sqrt{-1}$ ]を以下のように分解することを言います。
\begin{align}
(5)=(2+\sqrt{-1})(2-\sqrt{-1})
\end{align}
ここで $(2+\sqrt{-1})$ や $(2-\sqrt{-1})$ はそれぞれ $\mathbb{Z}[\sqrt{-1}]$ の素イデアルになっています。
このとき人によっては、別の分解として
\begin{align}
(5)=(-2-\sqrt{-1})(-2+\sqrt{-1})
\end{align}
や
\begin{align}
(5)=(-1+2\sqrt{-1})(1+2\sqrt{-1})
\end{align}
も考えられるじゃないか！全然一意じゃないじゃん！と思われるかもしれません。
しかし、今はあくまでイデアルとして一意であることを主張しているので上の3つの分解は全て同じことを表しています。
例えば $(2+\sqrt{-1})$ と $(-1+2\sqrt{-1})$ はその生成元が
\begin{align}
{}-1+2\sqrt{-1}=\sqrt{-1}(2+\sqrt{-1})
\end{align}
というように単数( $\sqrt{-1}$ )倍で写り合うのでイデアルとしては全く同じものになっています。

だんだん、なぜ単数が重要なのかわかってきたでしょうか？

もう少し正確に書いて整理しておきましょう。

いままでは $\mathcal{O}_K$ の通常のイデアルのみを考えてきましたが、ここからは一般に $K$ の分数イデアルを考えます。

定義.
代数体 $K$ とその整数環 $\mathcal{O}_K$ について、
$K$ の有限生成部分 $\mathcal{O}_K-$ 加群を分数イデアルという。
このうち、特に $\mathcal{O}_K$ の部分加群になっているものを(整)イデアルという。
$(0)$ でない $K$ の分数イデアル全体を $\mathcal{I}_K$ と表す。

このように定めることによって $(0)$ 以外の任意の分数イデアルはイデアルの積に関する逆元を持ち、 $\mathcal{I}_K$ は群をなします。（単位元は $(1)=\mathcal{O}_K$ ）

さらに、先ほど言ったように $\mathcal{I}_K$ では一意的な素イデアル分解ができます*2。
そこで $K^*$ の元に、その元が（ $\mathcal{O}_K$ 上）生成する単項分数イデアルを対応させ、数の世界からイデアルの世界への写像 $\Phi$ を得ます。
\begin{align}
\Phi:&K^*&\longrightarrow &\mathcal{I}_K \\
&a&\longmapsto&(a):=a\mathcal{O}_K
\end{align}
これは明らかに群準同型になっています。
このようにして素因数分解が出来ない、という弱点を克服しようとしているわけです。

しかしこの際、問題点が二つあります。
一つは先ほど見たように「単数倍の違いが無視されてしまう」ということ。
$2+i$ と $-1+2i$ は数としては当然違うものですが、そのズレは単数なので $\Phi$ によって写すと同じものになってしまいます。
つまり単数群 $\mathcal{O}_K^*$ は $\Phi$ という写像の核になっています。
言うならば、
$\mathcal{O}_K^*$ は数の世界からイデアルの世界に写す際に失われてしまう情報を握っている
わけです。
こう聞けば、単数群の構造を知りたいと言うのもうなずけるのではないでしょうか。

また、もう一つの問題点は「 $\Phi$ が一般には全射とは限らない」と言うことです。
これは今回の主題からは外れてしまうので簡単に済ませますが、一般に $\mathcal{O}_K$ が単項イデアル整域とは限らないので $\Phi$ による像の外側にもイデアルがあるわけです。
これは、数の世界からイデアルの世界に写すときに世界が広がってしまうことを表していて、その広がりの大きさを表すものとしてイデアル類群があります。
こちらも代数的整数論の主役級に大事なものですが今回は紹介にとどめたいと思います。

では次の節から実際に単数群の構造を調べていきましょう。

2次体の単数群

代数体のノルム

まずはじめに整数環の元が単数であることのいい換えをしておきましょう。

代数体 $K/ \mathbb{Q}$ （一般には任意の有限次拡大 $L/K$ ）に対して、ノルム写像というものががあります。\begin{align}
N_{K/\mathbb{Q}}:K\longrightarrow\mathbb{Q}
\end{align}
これは、各元に $a\in K$ をかけるような $\mathbb{Q}$ 線形写像 $f_a:K\rightarrow K$ の（ある基底に関する表現行列の）行列式を $N_{K/\mathbb{Q}}(a)$ とするものでした。\begin{align} N_{K/\mathbb{Q}}(a)=\det{(f_a)}\end{align}
定義から直ちに $N_{K/\mathbb{Q}}(a)\in\mathbb{Q}$ が従います。
このとき $N_{K/\mathbb{Q}}(a)$ は $a$ と共役な元(つまり最小多項式を共有するもの)を全てかけた値に等しくなることが簡単に示せます。すると根と係数の関係から $N_{K/\mathbb{Q}}(a)$ は $a$ の最小多項式の定数項の $\pm 1$ 倍とも等しいことになります。
もし $a\in\mathcal{O}_K$ ならば、その最小多項式は有理整数係数ですから、そのノルム $N_{K/\mathbb{Q}}(a)$ は $\mathbb{Z}$ に入るということがわかりました。これは重要なので再度式で書いておきます。\begin{align}a\in\mathcal{O}_K\Longrightarrow N_{K/\mathbb{Q}}(a)\in\mathbb{Z}\end{align}

もう一つノルムの重要な性質として乗法性というものがあります。

命題2.
$K$ を代数体、 $N_{K/\mathbb{Q}}$ をノルム写像とする。このとき任意の $a,b\in K$ に対して\begin{align} N_{K/\mathbb{Q}}(1)&=1\\
N_{K/\mathbb{Q}}(ab)&= N_{K/\mathbb{Q}}(a)N_{K/\mathbb{Q}}(b)\end{align}が成り立つ。

簡単なので証明しておきましょう。
証明.
まず、 $1\in K$ に対して $f_1$ は恒等写像なのでその行列式は $1$ である。
したがって $N_{K/\mathbb{Q}}(1)=1$ 。
また任意の $a,b\in K$ に対し $f_{ab}$ は $ab$ をかけるような写像であったから、 $f_a$ と $f_b$ の合成に一致する。\begin{align}f_{ab}=f_a\circ f_b\end{align}
すると $K$ の $\mathbb{Q}$ 上の基底を一つ取ったときに、その基底に関する $f_{ab}$ の表現行列は、 $f_a$ の表現行列と $f_b$ の表現行列の積に等しい。
よって行列式の乗法性から\begin{align} N_{K/\mathbb{Q}}(ab)= N_{K/\mathbb{Q}}(a)N_{K/\mathbb{Q}}(b)\end{align}
を得る。

これで、以下の命題の証明をする準備が整いました。

命題3.
$K$ を代数体、 $\mathcal{O}_K$ をその整数環、 $N_{K/\mathbb{Q}}$ をノルム写像とする。このとき次が成り立つ。\begin{align}\mathcal{O}_K^*=\{u\in\mathcal{O}_K\ |\ N_{K/\mathbb{Q}}(u)=\pm 1\}\end{align}

証明.
$u\in\mathcal{O}_K^*$ とすると、そのノルム $N_{K/\mathbb{Q}}(u)$ は $\mathbb{Z}$ の単数であるから、 $\pm 1$ となる。
逆に $u\in\mathcal{O}_K$ が $N_{K/\mathbb{Q}}(u)=\pm 1$ を満たする。
このとき、 $u$ の $\mathbb{Q}$ 上の共役元を $u=u_1,u_2,\dots,u_n$ とすると、ノルムの性質から\begin{align}u(u_2\cdots u_n)=\pm1\end{align}
が成り立つ。よって
右辺が $1$ のときは $u_2\cdots u_n$ が、
右辺が $-1$ のときは $-u_2\cdots u_n$ が
それぞれ $u$ の逆元となる。
ここで $u_2,\dots,u_n$ は $u$ は全て $K$ の整数である。
よって、どちらの場合も $u$ が $\mathcal{O}_K$ の中に逆元を持つことがわかり、 $u\in\mathcal{O}_K^*$ を得る。

以上から、代数体の整数環の単数というのは、整数のうちノルムが $\pm1$ のものと特徴付けることができました。
これを使って2次体の単数群を決定しましょう！！

2次体の単数群

ここまでは一般の代数体を考えてきましたが、以下、 $D$ を平方因子を持たない整数、 $K=\mathbb{Q}(\sqrt{D})$ とします。

そして以下、簡単のため\begin{align}D\equiv 2,3\mod{4}\end{align}とします。 $D\equiv 1\mod{4}$ のケースもほぼ同じ議論ができますが、多少調整が必要になってしまうので、この記事では上のケースのみを扱います。

命題1.から $K$ の整数環 $\mathcal{O}_K$ は\begin{align}\mathcal{O}_K=\mathbb{Z}+\mathbb{Z}\sqrt{D}\end{align}
と書き表せていました。
また、 $z=x+y\sqrt{D}\in K(x,y\in\mathbb{Q})$ の共役元は $z'=x-y\sqrt{D}$ なので、ノルム写像 $N_{K/\mathbb{Q}}$ については\begin{align}N_{K/\mathbb{Q}}(z)=zz'=x^2-Dy^2\end{align}
と簡単に計算できます。

というわけで、これと命題3.を合わせると単数群 $\mathcal{O}_K^*$ は\begin{align}\mathcal{O}_K^*=\{x+y\sqrt{D}\mid x,y\in\mathbb{Z},x^2-Dy^2=\pm 1\} \tag{1}\end{align}
と表すことができました！！
さて、この\begin{align}x^2-Dy^2=\pm 1 \tag{2}\end{align}
という方程式、どこかで見たことありますね。そう！これこそ前回の記事で扱ったペル方程式です！！（まあ、タイトルに書いてあるんだからそれしかないですが笑）
ということで、単数を決定することは、(2)のペル方程式を解くことに他ならない！ということがわかりました。
そしてペル方程式の解き方はもう既にやっているので、これで晴れて2次体の単数群の構造がわかると言うことです！！なかなかかっこいい戦略ですよね！

余談ですが、前回の記事でいきなりペル方程式の右辺を $1$ から $\pm 1$ にしたのは、ノルムが $\pm 1$ であるという単数条件に合わせるためだったわけです。

ここでペル方程式の解き方を簡単におさらいしましょう。忘れてしまった方は前回の記事をご覧ください！

ペル方程式 $x^2-Dy^2=\pm1$ の解法
(Ⅰ) $\sqrt{D}$ の連分数展開を求める。
(Ⅱ)そこから $\sqrt{D}$ の近似分数を求めると、その分子と分母が最小解になっている
(Ⅲ)最小解を $(x_1,y_1)$ とし、整数 $x_n,y_n\ (n\in\mathbb{Z})$ を以下の式で定める。
\begin{align}
x_n+y_n\sqrt{D}=(x_1+y_1\sqrt{D})^n
\end{align}
このとき、ペル方程式の整数解の集合は
\begin{align}
\{\pm(x_n,y_n)\ |\ n\in\mathbb{Z}\}
\end{align}
と一致する

つまりペル方程式の最小解 $(x_1,y_1)$ を使えば $\mathcal{O}_K$ の単数群は\begin{align}\mathcal{O}_K^*=\{\pm(x_1+y_1\sqrt{D})^n \mid n\in\mathbb{Z}\}\end{align}とあらわすことが出来るわけです！
ここまでくるともはや2次体の単数群は、 $\sqrt{D}$ の連分数展開さえすれば決定できると言ってしまえるわけです！

どうでしょう？単数群という中々掴みづらい対象が、かなり簡単なアルゴリズムによって明確に表示できました。これがペル方程式の力なのです！

ということで、次の節では具体的な2次体の単数群を決定していきましょう！

具体的な2次体の単数群

実2次体の場合
例3. $\mathbb{Q}(\sqrt{2})$
まずは $K=\mathbb{Q}(\sqrt{2})$ の整数環 $\mathcal{O}_K=\mathbb{Z}+\mathbb{Z}\sqrt{2}$ の単数群を決定しましょう。

今、 $D=2$ ですから、前節の議論によりペル方程式\begin{align}x^2-2y^2=\pm 1\end{align}を解けばよいことになります。

$\sqrt{2}$ の連分数展開は前回も求めましたが、\begin{align}
\sqrt{2}&=1+\frac{1}{2+\frac{1}{2+\frac{1}{2+\ddots}}}\\&=[1;(2)]
\end{align}
です。すなわちその近似分数は $[1]=\frac{1}{1}$ になり、最小解は $(1,1)$ であることがわかります。
よって $K=\mathbb{Q}(\sqrt{2})$ の単数群は\begin{align}\mathcal{O}_K^*&=\{\pm(1+\sqrt{2})^n \mid n\in\mathbb{Z}\}\\&=\pm(1+\sqrt{2})\end{align}となります！ただし、最後の $(1+\sqrt{2})$ は $1+\sqrt{2}$ が生成する巡回群を表しています。

例4. $\mathbb{Q}(\sqrt{7})$
もうひとつだけ実2次体の例を見ましょう。
$\sqrt{7}$ の連分数展開も前回求めており、結果だけ書けば\begin{align}\sqrt{7}=[2;(1,1,1,4)]\end{align}で、その近似分数は $[2;1,1,1]=\frac{8}{3}$ です。よって、先ほど同様 $K=\mathbb{Q}(\sqrt{7})$ の単数群は\begin{align}\mathcal{O}_K^*=\{\pm(8+3\sqrt{7})^n \mid n\in\mathbb{Z}\}=\pm(8+3\sqrt{7})\end{align}となります！

他にも $D\equiv 2,3\mod{4}$ であるような $D$ に対しては同様に単数群を決定できますので、是非いろいろと手を動かして計算してみてください！

虚2次体の場合
最後に虚2次体の単数群についてお話します。
このときも実2次体の時と同様、具体的な体に対応するペル方程式を解くことで単数群を決定することが出来ます。しかし、虚2次体の場合はもっとストレートに単数群の構造を求めることが出来ますのでそちらをご紹介します。
一つ注意として、このセクション内でのみ $D\equiv 1\mod{4}$ の場合も許すことにします。（ただし $D$ が平方因子を含まないことは仮定します。）

結論としては以下の命題が成り立ちます。

命題4.
$K=\mathbb{Q}(\sqrt{D})$ を虚2次体とする( $D<0$ )。このとき $K$ の整数環の単数群 $\mathcal{O}_K^*$ について以下が成り立つ。
（i） $D=-1$ のとき、 $\mathcal{O}_K^*=\{\pm 1,\pm\sqrt{-1}\}$
（ii） $D=-3$ のとき、 $\mathcal{O}_K^*=\{\pm 1,\pm\frac{1\pm\sqrt{-3}}{2}\}$
（iii）それ以外のとき、 $\mathcal{O}_K^*=\{\pm 1\}$

まずは証明しましょう。

証明.
$u\in\mathcal{O}_K^*$ を任意に一つ取り、 $u=a+b\sqrt{D}$ ( $a,b\in\mathbb{Q}$ )とあらわす。
このとき命題1.から $2a\in\mathbb{Z}$ が成り立つ。
命題3.から\begin{align}
u\in\mathcal{O}_K^*\iff N_{K/\mathbb{Q}}(u)=\pm 1\end{align}
であった。いま $b=0$ とすると、 $u=a\in\mathbb{Q}$ より\begin{align}N_{K/\mathbb{Q}}(u)=\pm 1\iff a^2=\pm 1\iff a=\pm 1\end{align}となる。また、根と係数の関係より $u\in\mathcal{O}_K^*$ は2次方程式\begin{align}X^2-2aX\pm 1=0\end{align}の根になるから、\begin{align}u=\frac{2a\pm\sqrt{(2a)^2\pm4}}{2}\end{align}と表せる。ここで、 $b\neq 0$ とすると、 $u\notin\mathbb{R}$ であるから、\begin{align}(2a)^2\pm4<0\end{align}でなくてはならず、 $2a\in\mathbb{Z}$ と合わせると、これは $4$ の符号がマイナスで、 $2a=0,\pm1$ のときしか成り立たない。
以上から虚2次体の単数の候補は\begin{align}\pm 1,\pm\sqrt{-1},\pm\frac{1\pm\sqrt{-3}}{2}\end{align}しかない。これらが実際に単数であることはすぐに確かめられる。
$D=-1$ のときは $\pm 1,\pm\sqrt{-1}$ を、 $D=-3$ のときは $\pm 1,\pm\frac{1\pm\sqrt{-3}}{2}$ を、
それ以外のときには $\pm 1$ のみをそれぞれ含む。

この命題によって、特に虚2次体の単数群は有限群であることがわかります。実2次体の単数群は無限群ですから*3、ここは大きく様子が異なることが見て取れます。

ここで、前半の素イデアル分解の話を思い出しましょう。整数環の単数群とは、数の世界からイデアルの世界に移す写像 $\Phi$ の核でした。したがって、イデアルの世界において
虚2次体では有限個の"数"が同一視されるのに対し、実2次体では無限個の"数"が同一視される
ということがわかりますね。こういった観点で見ると虚2次体の方が実2次体よりも少し簡単な構造をしているような気がしてきます。

まとめ

とうことで今回は2次体の単数群の決定をしていきました、いかがでしたでしょうか？
ペル方程式のつよつよ具合が少しでも伝わったでしょうか？(笑)

最後に少しだけ発展的な話をします。
実2次体の単数群を決定したとき、その形は（符号） $\times$ （巡回群）という形になっていたのに気づいたでしょうか？
実はこれと同様のことが任意の代数体でも成り立ち、単数群は有限アーベル群といくつかの巡回群の直積で書けることが知られています。これはディリクレの単数定理と呼ばれていて、代数的整数論の基礎となる大定理の片翼になります*4。
このことが先にわかっていれば、前回の記事でなぜペル方程式の解が最小解で生成されているのかというのがわかりますね。
このようにそれぞれの巡回群の生成元となっているものを代数体の基本単数といいます。
ただ、じゃあ一体いくつの巡回群の直積なのか？有限アーベル群って言ってもどれくらいの大きさなのか？という疑問が生じます。それについて詳しく話すことは今回できないので、ご興味があれば最後に紹介する参考文献を見てください！

しかし、単数群という中々とりとめもない対象がここまで綺麗な群構造を持っているというのは何度見ても不思議ですね…(笑)

では最後までご覧いただきありがとうございました！！

コメントはどんなものでも絶賛受け付け中です！
気に入ってくださった方は「読者になる」ボタンやTwitterフォローもポチッとお願いします！

それではまた次回お会いいたしましょう！

参考文献

今回の話の前半部分（代数体の整数環の一般論）については、以下の本を参考にしました。

代数的整数論

作者:J. ノイキルヒ
発売日: 2012/07/17
メディア: 単行本

ただ、標準的な代数的整数論の教科書であれば必ず書いてあるような内容だと思います。

後半部分（2次体）については、以下の本がよいと思います。

素数と2次体の整数論 (数学のかんどころ 15)

作者:青木昇
発売日: 2012/12/21
メディア: 単行本

f:id:rusk_mathematics:20200319154826p:plain

*1:証明は代数的整数論の入門的な教科書をご参照ください。

*2:これは少しだけ非自明なことですが、分数イデアルは整イデアルの商で表せることを使えば、分母分子の素イデアル分解をそれぞれ考えることで導かれます。

*3:ペル方程式の解は無限個あることからわかります

*4:もう一つはイデアル類群の有限性です

2019-12-17

微分加群！～その定義と応用～

ちょっと専門的な記事

皆さん、こんにちは。ラスクです。

この記事は日曜数学 Advent Calendar 2019 - Adventarの17日目の記事です。
adventar.org

昨日は、はるさんの「結婚式→Riesz の表現定理→bra-ket 記法」でした。
haru-negami.hatenablog.com

せっかくのアドカレですので、自分は専門に近い「微分加群」について話したいと思います。
この概念はあまり広くは知られていませんが、知ってみると面白いことがいろいろと出てくるので、今回はその雰囲気だけでも知っていただければと思います。
少々、長めですが予備知識としては「線形代数」と簡単な「可換環論」のみですので、ぜひ最後まで読んでみてください！

では、始めます。

微分加群
twisted polynomialと巡回ベクトル
連立一階微分方程式の高階化
おわりに
参考文献

微分 加群

微分環と微分 加群

まず微分環および微分体の定義をしましょう。

定義
$R$ を可換環とする。 $d:R\rightarrow R$ が以下の条件を満たすとき、 $R$ における微分(または導分）という。
(1) $d$ は加法的、つまりアーベル群の準同型である。
(2)任意の $a,b\in R$ に対して\begin{align}d(ab)=d(a)b+ad(b)\end{align}が成り立つ（ライプニッツ則）。
$R$ とその微分の組 $(R,d)$ を微分環という。
また $R$ が体であるとき、 $(R,d)$ を微分体という。

微分環とはその名の通り、環に微分構造を付加したようなものということですね。
抽象的な数学において微分とは、加法的かつ、何らかの意味のライプニッツ則を満たすような写像のことを指すことが多いですが、ここでもそのように定めています。

この記事では今後 $d$ と書いたら微分環（または体）における微分を表すことにし、単に $R$ を微分環などということにします。

次に、微分環上の微分加群を定義しましょう。

定義
$R$ を微分環、 $M$ を $R-$ 加群とする。このとき $D:M\rightarrow M$ が以下の条件を満たすとき、 $M$ における微分(または導分）という。
(1) $D$ は加法的、つまりアーベル群の準同型である。
(2)任意の $a\in R,m\in M$ に対して\begin{align}D(am)=d(a)m+aD(m)\end{align}が成り立つ（ライプニッツ則）。
$M$ とその微分の組 $(M,D)$ を $R$ 上の微分加群という。

こちらもほぼ同様の定義ですが、（2）の条件はスカラー倍に対してのライプニッツ則を述べていることに注意しましょう。
当然のことですが、 $R$ が体のときは $M$ はベクトル空間となります。この場合、 $(M,D)$ は微分ベクトル空間とでも呼ぶべきかもしれませんが、あまり一般的な名称ではないようなので、気にせず微分加群と呼んでしまうことにします。
(後半では主に微分体上の微分加群を考えます。)

先ほどと同様 $D$ と書いたら微分加群における微分を表すことにし、単に $M$ を $R$ 上の微分加群ということにします。

例
$\mathbb{C}(t)$ (複素係数の有理関数体)は通常の微分 $d=\frac{d}{dt}$ に関して微分体をなす。
そして $\mathbb{C}(t)$ 上の加群 $(\mathbb{C}(t))^3$ はその成分ごとの微分により微分加群をなす。
このようなものは自明な微分加群と言われ、非常に単純な構造を持っています。より一般の微分加群の定め方については次の項目を参照してください。

また、 $\mathbb{C}(t)$ は $d=t\frac{d}{dt}$ などに関しても微分体をなす。

微分の行列表示

ベクトル空間上の線形写像(変換)が与えられたとき、何か一つ基底を固定すれば、その行列表示(表現行列)が定まりました。そうすることで、線型写像を行列の演算として具体的に表すことができたのでした。
微分環上の微分加群についても同じようなことができます。

定義
$R$ を微分環、 $M$ を $R$ 上の微分加群とする。いま $M$ が $R$ 上有限生成かつ自由であるとする*1。
このとき、 $M$ の $R$ 上のある基底 $e_1,\ldots,e_n$ に対して、 $D$ の表現行列 $A=(A_{ij})_{1\le i,j\le n}\in M_n(R)$ を以下の式で定める。\begin{align}D(e_j)=\sum_{i=1}^nA_{ij}e_i\tag{1}\end{align}つまり $A$ は\begin{align}(D(e_1),\ldots,D(e_n))=(e_1,\ldots,e_n)A\end{align}を満たすような行列である。

この定義は、線型写像の表現行列と全く同様なので特に疑問はないかとおもいます。
線型写像の場合、ベクトル空間の元を(基底をとって)列ベクトルと同一視したとき、その行き先は $A$ を左からかけるという操作によって与えられました。

では $D$ のときはどうでしょうか？

$M$ の元 $m$ を基底 $e_1,\ldots,e_n$ を用いて\begin{align}m=c_1e_1+\ldots+c_ne_n\ (c_i\in R)\end{align}と表します。 $D$ の表現行列 $A$ を用いて、 $D(m)$ を計算すると\begin{align}D(m)&=d(c_1)e_1+\ldots+d(c_n)e_n+c_1D(e_1)+c_nD(e_n)\\&=d(c_1)e_1+\ldots+d(c_n)e_n+c_1\sum_{i=1}^nA_{i,1}e_i+\ldots+c_n\sum_{i=1}^nA_{in}e_i\\&=\sum_{i=1}(\sum_{j=1}^nA_{ij}c_j+d(c_i))e_i\end{align}となります。
ここで、一つ目の等号は $D$ の加法性とライプニッツ則、二つ目の等号は(1)式を使っています。
これにより $D(m)$ の $e_1,\ldots,e_n$ による表示ができました。つまり、 $m$ を列ベクトル $(c_1,\ldots,c_n)^T$ と同一視すれば $D(m)$ は
\begin{align}D(m)=A \left(
\begin{array}{c}
c_1 \\
c_2 \\
\vdots \\
c_n
\end{array}
\right)+ d\left(
\begin{array}{c}
c_1 \\
c_2 \\
\vdots \\
c_n
\end{array}
\right)
\end{align}とかけます。(二項目は成分ごとに $d$ を作用させたものを表しています。)
こうしてみるとライプニッツ則の様子がよくわかりますね！

行列がかけられている左側の部分はいうなれば $D$ の線形部分で、そこに右側の $d$ が作用している部分が足されているわけです。

このようにして微分 $D$ から行列表示をえましたが、逆に行列を与えれば、それに応じた $D$ を定めることもできます。
これで $D$ の作用についても行列の言葉で書けることがわかりました。

すると今度は「表現行列を簡単にするように基底を取ることができるか？」という自然な疑問が湧きます。そのような問題に関する事柄を後半でご紹介したいと思います。

ちなみに、線形代数では上の疑問に対する一種の答えとして、「ジョルダン標準形」という理論がありました。実は微分加群に対しても似たようなことが成り立つ状況があるのですが、それを紹介するのは非常に骨が折れますので今回は止めることにします。

双対微分 加群

ここで次の節に行く前にもう一つだけ準備をします。

一般の $R-$ 加群 $M$ に対してはその双対 $M^*$ というものが考えられました。
これは $M$ から $R$ への $R$ 線型写像のなす集合 $Hom_R(M,R)$ に通常の和とスカラー倍が定義された加群です。
そして $M$ が微分加群の時には、その双対 $M^*$ にも微分の構造を入れることができます。

定義
$R$ を微分環、 $M$ を $R$ 上の微分加群とする。このとき以下によって $D^*:M^*\rightarrow M^*$ を定義する；\begin{align}D^*(f)(m)=d(f(m))-f(D(m))\ (f\in M^*=Hom_R(M,R),m\in M)\end{align}すると $D^*$ は $M^*$ 上の微分となり、 $(M^*,D^*)$ は $R$ 上の微分加群をなす。
これを $M$ の双対微分加群と呼ぶ。

上の定義で $D^*$ が本当に $M^*$ 上の微分になってるか（つまり加法的で、ライプニッツ則を満たすか）というのは確認するべきですが、難しくないので省略をいたします。
今後、 $M^*$ には常に上で定めた微分 $D^*$ が入っていることにし、単に $M$ の双対微分加群 $M^*$ などと呼ぶことにします。

次に微分加群の双対を取ることによって、その行列表示がどのように変わるかを見ていきます。

まず $R$ 上の微分加群 $M$ の基底 $e_1,\ldots,e_n$ を一つ固定します。
すると $M^*$ 上にはその双対基底 $e_1^*,\ldots,e_n^*$ が存在するのでした。これは以下の式で定まるような $M^*$ の元です。
\begin{align}e_i^*(e_j)=\begin{cases}
1\ (i=j) \\
0\ (i\neq j)
\end{cases}\end{align}
では、 $e_1,\ldots,e_n$ に関する $D$ の表現行列が $A$ のときに $e_1^*,\ldots,e_n^*$ に関する $D^*$ の表現行列はどうなるでしょうか？少し想像すればわかるかもしませんが、結論としては $-A^T$ となります。

簡単に理由を説明しましょう。 $D^*(e_j^*)=B_{1j}e_1^*+\ldots+B_{nj}e_n^*$ と表されていたとすると、双対基底の定義および、(2)式から
\begin{align}B_{ij}=D^*(e_j^*)(e_i)&=d(e_j^*(e_i))-e_j^*(D(e_i))\\
&=-e_j^*(A_{1i}e_1+\ldots+A_{ni}e_n)\\
&=-A_{ji}\end{align}となります。よって確かに $D^*$ の表現行列 $B$ が $-A^T$ と等しいことがわかりますね。

上の説明がよくわからなかった人は、とにかく「双対をとったら表現行列は転置のマイナスになる」とだけ覚えておいてください。
このことは非常に重要で本記事の最後に使います。

twisted polynomialと巡回ベクトル

ベクトル空間とその上の線形変換

体 $F$ 上のベクトル空間 $V$ とその上の線形変換 $f$ が与えられた時、多項式環 $F[T]$ から $V$ への作用が以下のように定まります。
\begin{align}F[T]\times V&\longrightarrow V\\
(P(T),v)&\mapsto P(f)(v)=P_mf^m(v)+\ldots+P_1f(v)+P_0v\end{align}(ただし $P(T)=P_mT^m+\ldots+P_0$ とする。)

このとき $I=\{P\in F[T]\ |\ P(f)(v)=0(\forall v\in V)\}$ という集合は $F[T]$ のイデアルをなし、 $F[T]$ が単項イデアル整域であることからあるモニックな多項式 $P\in F[T]$ が存在し、 $I=F[T] P$ となります。

このような $P$ を $f$ の最小多項式と言いました。一般に $f$ の最小多項式は $f$ の特性多項式の約数となります。
ここでもし、ある $v\in V$ が存在して、 $v,f(v),\ldots,f^{n-1}(v)$ が $V$ の基底をなすとすると、最小多項式 $P$ は特性多項式に一致し以下の $F$ ベクトル空間の同型があります。
\begin{align}F[T]/F[T] P\simeq V\end{align}

さらに、左辺の $F[T]/F[T] P$ には $F[T]$ による自然な作用(つまり $T$ をかけるもの)を入れることにすると、上の同型は作用も込みで同型になることがわかります。
このようにして抽象的なベクトル空間 $V$ とその上の $f$ を、 $F[T]/F[T] P$ という非常に具体的な形で表すことができました。

このことを微分加群に対しても考えてみましょう。

twisted polynomial

以下、 $F$ を微分体、 $V$ をその上の微分加群としましょう。このとき、 $V$ 上の微分 $D$ に関して、上でやったように $F[T]$ から $V$ への作用を作りたいのですが、このままではうまくいきません。
なぜなら一般に $D$ は線形ではないので、例えば $a\in F,v\in V$ に関して\begin{align}D(av)=d(a)v+aD(v)\neq aD(v)\end{align}となってしまい、 $F[T]$ の演算と作用がマッチしません。そこで $D$ に合わせた、すなわちライプニッツ則に合わせた、新しい多項式環を定義します。

定義
微分体 $F$ 上の1変数多項式の集合 $F[T]$ に通常の和と、\begin{align}Ta=aT+d(a)\ (a\in F)\tag{3}\end{align}によって定まる積を入れた非可換環を $F\{T\}$ と表しtwisted polynomial ring(また、その元をtwisted polynomial)という。

さて、何を言っているかわかりますでしょうか？
ベクトルを定数倍してから微分する際、その結果は”単に定数を外に出して微分したもの”と”係数を微分してベクトルはそのままにしたもの”の和になります。
そのようなライプニッツ則を機械的に多項式の言葉で置き換えると(3)式のようになるので、それを積の定義として採用しているわけです。

試しに少し計算してみると、例えば
\begin{align}T(aT+b)&=(Ta)T+Tb\\&=(aT+d(a))T+(bT+d(b))\\&=aT^2+(d(a)+b)T+d(b)\end{align}となります。
まだよくわからない方は、ぜひご自分で色々計算してみてください！

ここで $F\{T\}$ は一般に非可換になることに注意しましょう*2。
しかし、この $F\{T\}$ でも通常の多項式と同じように割り算アルゴリズムが実行でき、任意の左(右)イデアルが単項生成になります。

そして、このようにして定めた $F\{T\}$ から元々の微分加群 $V$ に作用ができます。
\begin{align}F\{T\}\times V&\longrightarrow V\\
(P(T),v)&\mapsto P(D)(v)=P_mD^m(v)+\ldots+P_1D(v)+P_0v\end{align}(ただし $P(T)=P_mT^m+\ldots+P_0$ とする。)

これで、線形変換のときと同様の作用を考えることができました。

巡回ベクトル

もう一つ重要な概念を定義しましょう。

定義
$F$ 上の微分加群 $V$ の元 $v$ であって、\begin{align}v,D(v),\ldots,D^{n-1}(v)\end{align} $(n=dim(V))$ が $V$ の基底となるようなものを巡回ベクトルという。

これも、線型写像で考えたものの類似ですね。

$V$ に巡回ベクトル $v$ が存在すると仮定すると、
\begin{align}F\{T\}&\longrightarrow V\\f(T)&\mapsto f(D)(v)\end{align}によって定まる写像は全射な準同型になります。その核は $F\{T\}$ の左イデアルになりますが、全ての左イデアルは単項生成だったので、ある $P\in F\{T\}$ を用いて $F\{T\}P$ と書くことができます。したがって準同型定理から同型\begin{align}F\{T\}/F\{T\}P\simeq V\end{align}を得ます。

このようにして微分加群 $V$ も、巡回ベクトルが存在すれば $F\{T\}/F\{T\}P$ と具体的に表すことができました。

今からいうことは少し雑な話になりますが、ここで出てきた $P$ はtwisted polynomialですので常微分方程式と考えることができます。なので逆に、考えたい常微分方程式があったとしたら、 $F\{T\}$ をその方程式で割ることにより、対応する微分加群を得ることができます。*3。
このようにして、常微分方程式という解析的な(？)対象を加群という代数的な対象にうつしてその性質を調べることができるという寸法です。
なかなか、面白いですね！！

さて、上の話は全て巡回ベクトルの存在性を仮定しています。一般の体(あるいは環)上の微分加群に巡回ベクトルが存在するかどうかはケースバイケースですが、実はよく考えている体上であればこれは必ず存在するということが知られています。
そちらをご紹介しましょう。

定理
$F$ を標数が $0$ であるような微分体とする。このとき $F$ 上の任意の微分加群 $V$ は巡回ベクトルをもつ。

この定理の証明も非常に面白いですが、今回は割愛することにいたします。

連立一階微分方程式の高階化

では最後に今までの話の応用をひとつだけご紹介します。

$K$ を標数 $0$ の体とします。 $\mathbb{C}$ や $\mathbb{Q}_p$ などを想像してください。

よく知られているように、 $K(t)$ を係数にもつ*4任意の $n$ 階線形常微分方程式\begin{align}y^{(n)}+p_1(z)y^{(n-1)}+\ldots +p_n(z)y=0\tag{4}\end{align}は、未知関数を増やすことにより一階連立微分方程式に変形することができました。
具体的には、 $y_i=y^{(i)}\ (i=0,\ldots,n)$ と置くと、上の方程式(4)は
\begin{align}\begin{cases} y_i’=y_{i+1}\ (i=0,\ldots,n-1)\\y_n+p_1(z)y_{n-1}+\ldots+p_n(z)y_0=0\end{cases}\end{align}
と同値になり、これを行列を用いて表すと
\begin{align}\frac{d}{dt}\left(\begin{array}{c}y_1\\y_2\\ \vdots\\y_n\end{array}\right)=\left(
\begin{array}{ccccc}
& 1 & & & \\
& &1 & &\\
& && \ddots & \\
& & & &1\\
p_n(z)&p_{n-1}(z)&\ldots&&p_1(z)
\end{array}
\right)
\left(\begin{array}{c}y_1\\y_2\\ \vdots\\y_n\end{array}\right)\end{align}となります。

逆に、任意の $K(t)$ 係数一階連立微分方程式が与えられたとき、それを単独の高階方程式に直すことができます。
このことを微分加群を用いて、説明しましょう。

まず、 $n$ 元一階連立方程式を与えるということは $K(t)$ を要素にもつ行列 $A\in M_n(K(t))$ を与えるということに他なりません。この時、上で説明したことからなんらかの変数変換を施して、行列 $A$ を
\begin{align}\left(
\begin{array}{ccccc}
& 1 & & & \\
& &1 & &\\
& && \ddots & \\
& & & &1\\
*&*&\ldots&&*
\end{array}
\right)\end{align}という形に変形できればこれは(4)の単独高階方程式と同値になります。

今言ったことを微分加群の言葉に直します。

まず $K(t)$ を通常の微分 $d=\frac{d}{dt}$ によって微分体とみなします。

次に、行列 $-A\in M_n(K(t))$ によって定まる $K(t)$ 上の $n$ 次元微分加群を $V$ とします。つまりベクトル空間 $V=(K(t))^n$ に
\begin{align}D\left(
\begin{array}{c}
c_1 \\
c_2 \\
\vdots \\
c_n
\end{array}
\right)=-A \left(
\begin{array}{c}
c_1 \\
c_2 \\
\vdots \\
c_n
\end{array}
\right)+ \left(
\begin{array}{c}
c_1 \\
c_2 \\
\vdots \\
c_n
\end{array}
\right)
\end{align}
で定まるような微分 $D$ を入れます。
すると $D(v)=0$ となることが、考えている方程式の解になることと同値になります。
そして、 $V$ の基底を"良いもの"に取り替えることにより、この $D$ の表現行列を
\begin{align}\left(
\begin{array}{ccccc}
& -1 & & & \\
& &-1 & &\\
& && \ddots & \\
& & & &-1\\
*&*&\ldots&&*
\end{array}
\right)\end{align}という形にしたいわけです*5。

では、どのような基底をとれば良いでしょうか？
勘の良い方ならお気づきだと思いますが、巡回ベクトルを使います。
しかし、ただ単純に $V$ の巡回ベクトルをとっても上の形の表現行列にならないので、少し工夫が必要です。どうすれば良いでしょう。。。

答えは「双対加群に対して巡回ベクトルをとれば良い」ことになります！！

やってみましょう。
まず、 $V$ の双対 $V^*$ を考えます。 $V^*$ も $K(t)$ (標数 $0$ )上の微分加群ですから巡回ベクトル $v$ が存在します。そこで $v,\ldots,D^{*(n-1)}(v)$ に対して $D^*$ の表現行列を考えると、
\begin{align}\left(
\begin{array}{ccccc}
& & & &q_n(z) \\
1& & & &q_{n-1}(z)\\
& 1 && & \\
& & \ddots & &\vdots\\
& & & 1& q_1(z)
\end{array}
\right)\end{align}となります。ここで $q_1(z),\ldots,q_n(z)$ は $D^{*(n)}(v)=q_n(z)v+\ldots+q_1(z)D^{*(n-1)}(v)$ を満たすようなものです。添え字のつけ方がおかしいのは次に転置を取るためです。

そして、 $v,\ldots,D^{*(n-1)}(v)$ の双対基底 $e_1,\ldots,e_n$ を $V$ の基底として採用すれば、「双対をとったら表現行列は転置のマイナスになる」ことから $D$ の表現行列は
\begin{align}\left(\begin{array}{ccccc}
& -1 & & & \\
& &-1 & &\\
& && \ddots & \\
& & & &-1\\
-q_n(z)&-q_{n-1}(z)&\ldots&&-q_1(z)
\end{array}
\right)\end{align}となります。
これで求めたい形の行列を得ることができました！！！

結論をまとめます。

$A$ によって定まる連立一階微分方程式を単独高階微分方程式に直すには
① $-A$ によって定まる微分加群を考える。
②その双対微分加群の巡回ベクトルを持ってくる。
③その双対基底を並べた行列によって、未知関数を変数変換することにより単独の方程式への変形が完了する。

いかがでしたでしょうか？巡回ベクトルの便利さが伝わりましたでしょうか？

おわりに

さて、今回は「微分加群」について基本的な定義とそのちょっとした応用をしていきました。
お楽しみいただけましたでしょうか？

最後に、自分がこの概念を面白いと思う理由を二つ挙げたいと思います。

一つは微分方程式をcordinate freeに考えられるという事。
つまり、数多ある変数変換を全部ひっくるめて $D$ という作用素が定義されているように見えるという事です。
考えてみれば、線形写像を定める際も別に基底を取る必要は必ずしもないわけですから、そのような考えからするとこちらも自然かもしれません。

もう一つは、この「微分加群」をもとにして「微分ガロア理論」や「局所体上の微分方程式論」など豊かな理論が作られることです。この話は今回の記事だけでは一切わからないと思いますが、学ぶきっかけとしていただければ幸いです。

では最後までご覧いただきありがとうございました！！
アドベントカレンダーはまだ続きますので、お楽しみに。

コメントはどんなものでも絶賛受け付け中です！
気に入ってくださった方は「読者になる」ボタンやTwitterフォローもポチッとお願いします！

それではまた次回お会いいたしましょう！

参考文献

基本的には次の本を参考にしました。
www.amazon.co.jp

また、自分のリサーチが足りず書き始めてから気づいたのですが、ラブルさんという方が、今回の記事とかなり近い内容をすでにブログに挙げられていました。申し訳ありません。以下、リンクを張りますのでどうぞこちらもご覧になってください。
tetobourbaki.hatenablog.com

f:id:rusk_mathematics:20191217040221p:plain

*1:つまり、有限個の基底が取れるということです。

*2:例えば上の例を逆にして計算してみてください。

*3:本当は双対をとった方が良いです。最後の節もご参照ください。

*4:係数は一般になんでも良いですが、話を簡単にするため $K(t)$ としています。

*5:最後に右辺に移項して考えるため右上には $-1$ が並んでいることに気をつけましょう。

2019-10-06

ペル方程式の解法！ヘイスティングズの戦いにおける兵数は？

初等的な記事ちょっと専門的な記事

みなさまこんにちは、ラスクです。

9月も終わりを迎え、ようやく暑さも和らいできましたね。
この挨拶の部分も若干ネタ切れ感が出てきてきました。。

そんなことはどうでもいいとして、内容に入りましょう！！
今回は、「ヘイスティングズの戦い」という歴史的事件をもとにした、ある問題を解くことを目標にしつつ、それに関連するペル方程式の話をしていきたいと思います。

ペル方程式自体はそこそこ有名な対象なのでネットを探せば様々な記事がヒットしますが、「ヘイスティングズの戦い」について触れているものは僕の知る限りほとんどありませんでした。
なので今回、詳しく話していこうと思います。

また（特に意図があったわけではないのですが）、今までの記事の内容は私の専門である「整数論」の内容とは少し異なるものが多かったです。
しかし今回話す、ペル方程式は「代数的整数論」において非常に重要な対象として登場します。
なので、そのあたりの話も絶対に書きたい*1、と思っています。
これについては次回以降の記事になりますので、今回の記事が気に入っていただけた方は、是非そちらもアップされ次第読んでみてください！

では前置きはこれくらいにして始めていきましょう！！

ハロルド2世の軍の兵数は？
ペル方程式の解法
問題の答え
まとめ

ハロルド2世の軍の兵数は？

今回考える問題は次のようなものです。

問題
かつてのイングランド王ハロルド2世の軍は古来からの慣わしで、同じ大きさの13個の正方形をなすように編成されていた。
その後ハロルド2世自身が「ヘイスティングズの戦い」の戦場に現れると、兵士たちはその王を頂点に一つの巨大な正方形をなして突撃したという。

では、ハロルド2世の軍は何人だったのだろうか。

意味はお分かりいただけたでしょうか。

私はこの問題を、ノイキルヒの『代数的整数論』（非常に有名な整数論の教科書）で知りました。
この本の演習問題の一つとして上の内容が載っているのですが、普通の数学の問題が並ぶ中、明らかにこれだけ異様なオーラを放っています(笑)
というのも、この本の原文にはもっとメッセージ性の強い語調で上の問題が記されています。
今回、私は皆さんに伝わりやすいように多少文章を簡単にしていますが、なかなか数学の問題に個人の感情をのせることはないと思うので是非興味のある方は調べてみてください。

ちなみにヘイスティングズの戦いとは、ノルマンディー公ギヨーム2世とイングランド王ハロルド2世がイングランド領をめぐって争った会戦のことです。恥ずかしながら、これ以上のことはよく知らないので気になる方はWikipediaの記事をお読みください。

ja.wikipedia.org

少し余談が長くなりましたが、数学の話をしましょう。

上の問題を数式で表していきます。
王が加わってできた巨大な正方形の一辺の人数を $x$ 人、もともとの13個あった正方形の一辺の人数を $y$ 人とする。
このとき
\begin{align}
x^2=13y^2+1
\end{align}
つまり
\begin{align}
x^2-13y^2=1 \tag{1}
\end{align}
が成り立ちます。
したがって上の問題は(1)式を満たすような自然数解 $(x,y)$ を求めよ、と言われていることに他なりません。
実はこの式がペル方程式と呼ばれるものの一種になっています。

定義
$D$ を平方数でない自然数とする。
\begin{align}
x^2-Dy^2=1 \tag{2}
\end{align}
という形の方程式をペル方程式という。

今回目標となっているのは、 $D=13$ のケースですね。

そこで次の章から、このペル方程式の整数解の求め方について詳しく見ていくことにします！

ペル方程式の解法

一般解の構造

一般にペル方程式(2)はどのような $D$ に対しても無数の整数解をもつことが知られています。
そして、それらの解の間には非常に簡明で美しい法則があることも知られています。まずはそちらを紹介しましょう。

ここで、以下の話の都合上(2)式の右辺を $\pm 1$ に変えたものを考えることにし、これもペル方程式と呼んでしまうことにします。つまり次のような方程式を考えるという事です。
\begin{align}
x^2-Dy^2=\pm 1 \tag{3}
\end{align}
なぜ、こんなことをするの？考えてる問題と違うじゃん！という声が聞こえてきそうですが、ちゃんと最後には(2)式に戻りますので、ご安心を。このようにする理由については別の記事でゆっくりお話ししたいと思います。

さて、次に以下の補題を用意します。

補題
$(x,y),(x',y')$ をペル方程式 $x^2-Dy^2=\pm 1$ の正の整数解とする。
このとき、
$x < x'$ かつ $y < y'\ \Longleftrightarrow x < x'$ または $y < y'$
が成り立つ。

この補題において右向きの矢印は当然成り立つので、非自明なのは左向きの矢印です。
証明はそこまで難しくないので、省略しますが、左向きの矢印の言っていることを言葉にすると
「ペアの片方が相手より小さいならば、もう片方も相手より小さい」
となります。
このことから、ペル方程式の最小解というものが以下のように定義できます。

定義
ペル方程式 $x^2-Dy^2=\pm 1$ の正の整数解 $(x,y)$ のうち、
$x$ が最小となるようなものを、その方程式の最小解という。
このとき上の補題により、 $y$ も自動的に最小になる。

一つ注意しておきます。
すべてのペル方程式は $(x,y)=(1,0)$ という自明な解をもちます。しかしこれは、最小解ではありません。
なぜなら、最小解は正の整数解から選んでいたので、 $y$ が $0$ であるこの解は絶対に最小解にはなりえないのです。
うっかりしていると間違えてしまうので、定義はしっかり読むことが大事です。

これで、各ペル方程式に対して、その最小解が定まったので一般解の構造に関する定理を述べましょう。

定理
ペル方程式
\begin{align}
x^2-Dy^2=\pm 1 \tag{3}
\end{align}
の最小解を $(x_1,y_1)$ とする。また、整数 $x_n,y_n\ (n\in\mathbb{Z})$ を以下の式で定める。
\begin{align}
x_n+y_n\sqrt{D}=(x_1+y_1\sqrt{D})^n \tag{4}
\end{align}
このとき、(3)の整数解の集合は
\begin{align}
\{\color{red}{\pm}(x_n,y_n)\ |\ n\in\mathbb{Z}\}
\end{align}
と一致する*2

追記
記事を投稿した時点ではペル方程式の整数解の集合に $\pm$ （上の式で赤字にした部分）をつけるのを忘れてしました。
ペル方程式には $x,y$ の2乗しか現れないので、 $(x,y)$ が解となるなら当然 $(-x,-y)$ も解になります。
自然数解だけを知りたい場合にはいらないので、のちの議論にはさほど影響しません。
大変失礼いたしました。

お分かりいただけたでしょうか？
つまり何が言いたいかというと、ペル方程式の”最小解がわかれば”、
無数にあるすべての解を知ることが出来る
というわけです。なかなかとんでもない定理ですよね！！

「なぜこんな定理が成り立つのか」、また「定理の中で $x_n,y_n$ 達を定めてる式はいったい何者なのか」、非常に気になると思います。
定理の証明自体は初等的にゴリゴリやることもできますが、正直なかなか大変で、意味がよく分からないというのが私の感想です。
なので、私は上の定理の代数的整数論的意味付けをぜひ紹介したいと思っています！
しかし、それを今回の記事でやるのはさすがに厳しく、またペル方程式の解法という趣旨にも反するので、別の記事に回させていただきます。こうご期待ください！！

さて、とにかくペル方程式の一般解が知りたければ、最小解を見つけ出せばいいことがわかりました。
なので、以下ではその見つけ方についてお話ししましょう。
方法のカギとなるのは「連分数展開」です！！

連分数展開

ということで、実数の連分数展開を定義します。

定義
実数 $a$ を整数 $\{a_n\}_{n\ge 0}$ を用いて
\begin{align}
a=a_0+\frac{1}{a_1+\frac{1}{a_2+\frac{1}{a_3+\ddots}}}
\end{align}
の形に表すことを $a$ の(正則)連分数展開という。
このとき $a=[a_0;a_1,a_2,\ldots]$ とあらわす。

はじめに注意しておくと、任意の実数 $a$ に対して整数 $\{a_n\}_{n\ge 0}$ は一意的に定まり、すなわちその連分数展開は一意的に定まります。

初めて見る方はよくわからないかもしれないので、実際に連分数展開の仕方を見ていきましょう。

やり方としては
⓪初めに、その数の整数部分を抜き出す。
そして、あとは
①残った小数部分を(無理矢理)逆数の形にし、その分母を必要なら有理化する
②分母の整数部分を抜き出す
の繰り返しです。

例１
手始めに $\sqrt{2}$ を連分数展開してみます。
まずは、⓪ $\sqrt{2}$ の整数部分を抜き出して $\sqrt{2}=1+(\sqrt{2}-1)$ と表します。
①次に小数部分である $\sqrt{2}-1$ を無理矢理 $\frac{1}{\frac{1}{\sqrt{2}-1}}$ と表し、この分母にある分数を有理化し $\frac{1}{\sqrt{2}-1}=1+\sqrt{2}$ とします。②このとき現れた $\sqrt{2}$ の整数部分を抜きだし、 $1+\sqrt{2}=2+(\sqrt{2}-1)$ とします。
ここまでの操作で、以下の式を得ました。
\begin{align}
\sqrt{2}=1+\frac{1}{2+(\sqrt{2}-1)}
\end{align}
この後、さらに $\sqrt{2}-1$ に対して①をして…という風に続けていけばいいわけですが、これは先にやった操作と同じです。
したがって、以降は全く同じ操作が続くことになり、最終的に以下の展開を得ます。
\begin{align}
\sqrt{2}=1+\frac{1}{2+\frac{1}{2+\frac{1}{2+\ddots}}}
\end{align}
これを $\sqrt{2}=[1;2,2,2,\ldots]$ と書くわけですが、巡回する節は括弧（）でくくって表すことにすれば、
\begin{align}
\sqrt{2}=[1;(2)]
\end{align}
となります。納得できましたでしょうか？

例２
もう少し慣れるためと後の都合のため、 $\sqrt{7}$ についても考えてみましょう。
やることは全く同じです。
⓪①②の順に１ステップ終わらせると次のようになります。
\begin{align}
\sqrt{7}&=2+(\sqrt{7}-2)\\
&=2+\frac{1}{\frac{\sqrt{7}+2}{3}}\\
&=2+\frac{1}{1+\frac{\sqrt{7}-1}{3}}
\end{align}
そして、今度は $\frac{\sqrt{7}-1}{3}$ に注目して同じ計算をして…という事を繰り返していきます。
以下各ステップごとの結果をどんどん書きますが、是非ご自分で計算してみてください。
おそらく一度やれば、身につくはずです。

\begin{align}
\sqrt{7}&=2+\color{red}{(\sqrt{7}-2)}\\
\sqrt{7}-2&=\frac{1}{1+\frac{\sqrt{7}-1}{3}}\\
\frac{\sqrt{7}-1}{3}&=\frac{1}{1+\frac{\sqrt{7}-1}{2}}\\
\frac{\sqrt{7}-1}{2}&=\frac{1}{1+\frac{\sqrt{7}-2}{3}}\\
\frac{\sqrt{7}-2}{3}&=\frac{1}{4+\color{red}{(\sqrt{7}-2)}}\\
\end{align}

はい。ここまで行くと、赤文字で書いた $\sqrt{7}-2$ が巡回しましたので以下同じように展開が続くことがわかります。
したがって、連分数展開が
\begin{align}
\sqrt{7}=[2;(1,1,1,4)]
\end{align}
と求まりました。皆様答えは合いましたでしょうか？

ペル方程式の最小解

では、このことをペル方程式の最小解と関連付けていきます。

今、無理数 $\sqrt{D}$ ( $D$ は平方数でない自然数) に対して、その連分数展開は必ず
\begin{align}
\sqrt{D}=[a_0;(a_1,a_2,\ldots,a_k)]
\end{align}
という形になります。
このとき、 $k$ を $\sqrt{D}$ の連分数展開の周期といいます。
また、有理数
\begin{align}
\frac{P}{Q}=[a_0;a_1,a_2.\ldots,a_{{k}-1}]
\end{align}
を $\sqrt{D}$ の近似分数といいます。ただし、 $\frac{P}{Q}$ は既約であるとします。

近似分数の定義において、周期の最後の項 $a_k$ を除いていることに注意してください。
このような定義の下で次の定理が成り立ちます。

定理
ペル方程式
\begin{align}
x^2-Dy^2=\pm1
\end{align}
に対して、 $\sqrt{D}$ の連分数展開を $[a_0;(a_1,a_2,\ldots,a_k)]$ 、その近似分数を $\frac{P}{Q}$ とする。このとき、
（1）周期 $k$ が奇数ならば、
\begin{align}
(x_1,y_1)=(P,Q)
\end{align}
が $x^2-Dy^2=-1$ の最小解となり、(4)式に $n=2$ を代入して定まる
\begin{align}
(x_2,y_2)=(P^2+D{Q}^2,2PQ)
\end{align}
が $x^2-Dy^2=1$ の最小解となる。
（2）周期 $k$ が偶数ならば、
\begin{align}
(x_1,y_1)=(P,Q)
\end{align}
が $x^2-Dy^2=1$ の最小解となり、
$x^2-Dy^2=-1$ の整数解は存在しない。

つまり、ペル方程式を定めている $D$ の平方根の近似分数を見れば、最小解が求まってしまうという事です。
証明をやると、記事の分量が2倍(3倍？)になってしまうので、今回は事実として認めて頂きたいです。

例を見ましょう。
例３
まず $x^2-2y^2=\pm1$ を考えましょう。
$\sqrt{2}$ の連分数展開は例1でやったように $[1;(2)]$ です。なのでその近似分数は、少しわかりにくいですが
\begin{align}
[1]=1=\frac{1}{1}
\end{align}
です。周期は１なので、整数部分だけ生き残るという事ですね。
今回は周期が奇数なので、定理の(1)から
$x^2-2y^2=-1$ の最小解は $(x_1,y_1)=(1,1)$
$x^2-2y^2=1$ の最小解は $(x_2,y_2)=(3,2)$
となります。一般解が（4）式により求まり、具体的には
$(x_3,y_3)=(7,5),(x_4,y_4)=(17,12)$
などとなります。

例4
もう一つのパターンの例も見ましょう。
$x^2-7y^2=\pm1$ を考えます。 $\sqrt{7}=[2;(1,1,1,4)]$ だったので、その近似分数は
\begin{align}
[2;1,1,1]=2+\frac{1}{1+\frac{1}{1+\frac{1}{1}}}=\frac{8}{3}
\end{align}
となります。今回は周期が偶数のケースなので定理の（2）より
$x^2-7y^2=1$ の最小解は $(x_1,y_1)=(8,3)$
$x^2-7y^2=-1$ の整数解は存在しない、となります。
上と同様にいくつか他の解を求めてみると
$(x_2,y_2)=(127,48),(x_3,y_3)=(2024,765)$
となります。

ということでこれで、どのようなペル方程式でも一定のアルゴリズムに従って一般解を求めることが出来るようになりました。まとめておきましょう。

ペル方程式 $x^2-Dy^2=\pm1$ の解法
(Ⅰ) $\sqrt{D}$ の連分数展開を求める。
(Ⅱ)そこから $\sqrt{D}$ の近似分数を求めると、その分子と分母が最小解になっている
(Ⅲ)最小解に対して(4)式を使う事ですべての解を得ることが出来る。

問題の答え

では、ペル方程式の解法がわかったところで「ヘイスティングズの戦い」の問題を解いていきましょう。
とはいっても、ここまで読んでくださった方であればもう答えを導けるはずです。なので、是非ご自分で答えを出してみて以下に書くことは答え合わせのためにお使いください。

では始めます。
問題の兵数を求めるには、
\begin{align}
x^2-13y^2=1 \tag{1}
\end{align}
を解けばよいのでした。そのために(Ⅰ) $\sqrt{13}$ の連分数展開を求めます。
\begin{align}
\sqrt{13}&=3+\color{red}{(\sqrt{13}-3)}\\
\sqrt{13}-3&=\frac{1}{1+\frac{\sqrt{13}-1}{4}}\\
\frac{\sqrt{13}-1}{4}&=\frac{1}{1+\frac{\sqrt{13}-2}{3}}\\
\frac{\sqrt{13}-2}{3}&=\frac{1}{1+\frac{\sqrt{13}-1}{3}}\\
\frac{\sqrt{13}-1}{3}&=\frac{1}{1+\frac{\sqrt{13}-3}{4}}\\
\frac{\sqrt{13}-3}{4}&=\frac{1}{6+\color{red}{(\sqrt{13}-3)}}
\end{align}
したがって $\sqrt{13}=[3;(1,1,1,1,6)]$ 。(Ⅱ)これから $\sqrt{D}$ の近似分数を求めると
\begin{align}
[3;1,1,1,1]=3+\frac{1}{1+\frac{1}{1+\frac{1}{1+\frac{1}{1}}}}=\frac{18}{5}
\end{align}
今、周期が $5$ で奇数なことから
$x^2-13y^2=-1$ の最小解は $(x_1,y_1)=(18,5)$
$x^2-13y^2=1$ の最小解は $(x_2,y_2)=(649,180)$
となります。数学的には $(x_4,y_4)$ や $(x_6,y_6)$ なども解になりますが兵数を考えていることを思い出すと、現実的な数字ではないので、最小解 $(x_2,y_2)$ のみ考えることにします。

そうすると、答えであるハロルド2世の軍の兵数が $649^2-1=421200$ (人)と求まりました！！
…本当でしょうか、かなり怪しいですね。。。

まあ、1000年近く前の出来事で本当にこのような慣わしがあったのかすら微妙なので、怪しい数字になるのは当たり前といえば当たり前でしょう。それでも、解を求められたのはよかったと思います。皆さんの答えは当たっていましたでしょうか？

まとめ

ということで、今回は「ヘイスティングズの戦い」の問題をもとにペル方程式の解法を紹介していきました。
いかがでしたでしょうか。
ペル方程式というのは、ディオファントス方程式という整数論の原動力ともなっているようなものの一種です。
一般にディオファントス方程式を調べるのは非常に難しく、あの有名な「フェルマーの最終定理」もこのディオファントス方程式に関する定理になります。
そんな方程式の中で、ペル方程式は非常に綺麗な解の構造を持っており、加えてその解もかなり簡単なアルゴリズムで得られることが今回の記事を読んでお分かりいただけたと思います。

しかも、最初の方でいったようにこの方程式は「代数的整数論」(特に2次体の単数群)において非常に重要な役割を果たします。
そのような重要なものが、簡単に計算できるというのはとても不思議でありがたいことだと思うわけです。

このあたりのことについては、また別の記事で…。

では最後までご覧いただきありがとうございました！！

コメントはどんなものでも絶賛受け付け中です！
気に入ってくださった方は「読者になる」ボタンやTwitterフォローもポチッとお願いします！

それではまた次回お会いいたしましょう！

f:id:rusk_mathematics:20191005174420p:plain

*1:というかむしろ、そちらを書きたいがゆえに今回の記事を書いている？

*2:ここで、最小解 $(x_1,y_1)$ が(左辺) $=1$ の解であれば、 $(x_n,y_n)$ は全て(左辺) $=1$ の解になります。対して最小解 $(x_1,y_1)$ が(左辺) $=-1$ の解であれば、 $\pm(x_{2k},y_{2k}),(k\in\mathbb{Z})$ が(左辺) $=1$ の、 $\pm(x_{2k+1},y_{2k+1}),(k\in\mathbb{Z})$ が(左辺) $=-1$ の解全体に一致します。当然、 $(x_2,y_2)$ が(左辺) $=1$ の最小解です。

2019-09-06

離散的な世界に登場！差分系テイラー展開！(2)

初等的な記事ちょっと専門的な記事

皆さんこんにちは、ラスクです。

9月に入りましたが、まだまだ残暑が厳しいですね。

それはさておき、今回は前回から扱っていた「ニュートンの補間法」というものの中身に入っていこうとおもいます。

まず、補間の仕方や公式について述べた後、具体的な関数について適用した例をお見せしようと思います。

前回準備した差分についての基礎知識は仮定いたしますので、まだ読んでいない方は是非ご一読ください。

mathforeveryone.hatenablog.com

ニュートンの補間法

では、始めていきましょう。
(多項式による）補間法とは次のような問題を言うのでした。

与えられた $n+1$ 個の点
\begin{align}
(x_0,y_0),(x_1,y_1),\ldots,(x_n,y_n) \end{align}
(ただし $x_i,y_i\in\mathbb{R}$ かつ $i\neq j$ ならば $x_i\neq x_j$ )
をすべて通るような $n$ 次以下の多項式関数 $y=f(x)$ を求める。

ここで各点を $y=f(x)$ が通ることから
\begin{align}
y_i=f(x_i)\ (i=0,1,\ldots,n)
\end{align}
と書けます。

このとき単純に $f(x)$ を $n$ 次関数の一般形から求めようとすると、計算が大変になることが目に見えています。

そこで！！
$n$ 次関数の一般形を使う代わりに $f(x)$ を以下のような形で書き表します。

\begin{align}
f(x)=a_0+a_1(x-x_0)+a_2(x-x_0)(x-x_1)+\ldots+a_n(x-x_0)(x-x_1)\ldots(x-x_{n-1}) \tag{1}
\end{align}

この式が最も重要なポイントです！
$n+1$ 個の点を通る $n$ 次関数というのは一意に決まっているので、このように形を変えても展開して整理すれば結局同じ関数を求めていることになります。
なので、あとは各点の座標を(1)に代入して係数 $a_i$ を求めていけばよいわけです。
勘の良い方はもうお気づきかもしれませんが、このときに(1)のような形にした意味が見えてきます。

順番にやってみましょう。
まず $x_0$ を代入すると、右辺の2項目以降はすべて消え
\begin{align}
f(x_0)=a_0
\end{align}
となります。 $f(x_0)=y_0$ は与えられている値なのでこれで $a_0$ は求まりました。

次に $x_1$ を代入すると、右辺の第3項以降はすべて消え
\begin{align}
f(x_1)=f(x_0)+a_1(x_1-x_0)\\
a_1=\frac{f(x_1)-f(x_0)}{x_1-x_0}=f[x_0,x_1]
\end{align}
と計算されます。最後にできてきたのは $x_0,x_1$ における $f(x)$ の一階差分商です。

もう一つくらいやっておきましょう。
おそらくこの段階で $a_2$ の予想がついている方も多いと思いますので、是非手を動かして考えてみてください！！

ではやってみます。 $x_2$ を代入すると
\begin{align}
f(x_2)=f(x_0)+f[x_0,x_1](x_2-x_0)+a_2(x_2-x_0)(x_2-x_1)
\end{align}
となります。ここで第2項に出てくる $(x_2-x_0)$ を $(x_2-x_1)+(x_1-x_0)$ と表して右辺を計算すると
\begin{align}
f(x_2)&=f(x_0)+f[x_0,x_1](x_2-x_0)+a_2(x_2-x_0)(x_2-x_1)\\
&=f(x_0)+f[x_0,x_1]\{(x_2-x_1)+(x_1-x_0)\}+a_2(x_2-x_0)(x_2-x_1)\\
&=f(x_0)+f[x_0,x_1](x_2-x_1)+f[x_0,x_1](x_1-x_0)+a_2(x_2-x_0)(x_2-x_1)\\
&=f(x_0)+f[x_0,x_1](x_2-x_1)+(f(x_1)-f(x_0))+a_2(x_2-x_0)(x_2-x_1)\\
&=f(x_1)+f[x_0,x_1](x_2-x_1)+a_2(x_2-x_0)(x_2-x_1)
\end{align}
となります。そしてこの式を $a_2$ について解き、差分商の定義を思い出せば、
\begin{align}
a_2&=\frac{(f(x_2)-f(x_1))-f[x_0,x_1](x_2-x_1)}{(x_2-x_1)(x_2-x_0)}\\
&=\frac{\frac{f(x_2)-f(x_1)}{x_2-x_1}-f[x_0,x_1]}{x_2-x_0}\\
&=\frac{f[x_1,x_2]-f[x_0,x_1]}{x_2-x_0}\\
&=f[x_0,x_1,x_2]
\end{align}
となることがわかります。これで $a_2$ も求めることが出来ました*1。

そしてこのような操作を続けていくとすべての係数 $a_i$ を求めることが出来、その形は
\begin{align}
a_i=f[x_0,x_1,\ldots,x_i]
\end{align}
となります。この証明は割愛しますが基本的には帰納法を使って順番に係数を計算することになります。
とにかく、(1)式の係数を差分商という形で簡単に表すことが出来ました！

ここまででひとまず「ニュートンの補間法」の説明はし終わったことになります。まとめておきましょう。

$n+1$ 個の点
\begin{align}
(x_0,f(x_0)),(x_1,f(x_1)),\ldots,(x_n,f(x_n)) \end{align}
が与えられたとき、それらすべてを通る $n$ 次以下の多項式関数は
\begin{align}
f(x)=&f(x_0)+f[x_0,x_1](x-x_0)+f[x_0,x_1,x_2](x-x_0)(x-x_1)+\ldots\\
&+f[x_0,x_1,\ldots,x_n](x-x_0)(x-x_1)\ldots(x-x_{n-1}) \tag{2}
\end{align}
と表される。

メリットと具体的な計算法

一般的な状況下での解説が済んだところで、この方法によるメリットと具体的な計算例を見てみましょう。

ニュートンの補間法のメリット

この補間法の良い点は少なくとも２つあります。

①補間多項式が計算しやすい
まずは何といってもこれでしょう。最初の時点で補間多項式を(1)のような形でおいたので、各係数を $a_0$ から順番に求めることが出来るようになったわけです。

さらに、結局この $a_i$ たちは $f(x)$ の差分商という形で簡単に書けるという事までわかってしまっています。
ここで差分商の計算は次のような表を描いていけばよいのでした。

\begin{align}
\begin{array}{ccccccccccc}
f[x_0]&f[x_0,x_{1}]&f[x_0,x_{1},x_{2}]&f[x_0,x_{1},x_{2},x_{3}]\\
\\
f[x_0]&{}&{}&{}\\
{}&\frac{f[x_1]-f[x_0]}{x_1-x_0}&{}&{}\\
f[x_1]&{}&\frac{f[x_1,x_2]-f[x_0,x_1]}{x_2-x_0}&\\
{}&\frac{f[x_2]-f[x_1]}{x_2-x_1}&{}&\frac{f[x_1,x_2,x_3]-f[x_0,x_1,x_2]}{x_3-x_0}\\
f[x_2]&{}&\frac{f[x_2,x_3]-f[x_1,x_2]}{x_3-x_1}&\\
{}&\frac{f[x_3]-f[x_2]}{x_3-x_2}&{}&\\
f[x_3]&{}&&{}\\
\end{array}
\end{align}

このとき、 $x_0$ から始まっている差分商たち（つまり表でいう一番上のライン）が各 $a_i$ にあたります。
なので上のような表を描くだけで、補間多項式が求まってしまいます！！！かんたん！！

もう少し後で具体的なデータをとって補間多項式をもとめてみるので、まだよくわからない方もそこで確認してみてください。

②データを後から追加しても再計算の必要がない
そしてニュートンの補間法特有のメリットがこちらになります。
これはいくつかの点から補間多項式を計算した後、もう一つデータを加えて補間多項式を修正したいと思ったときに、最初から計算をし直す必要がないということです。

例えば、3つの点 $(x_0,f(x_0)),(x_1,f(x_1)),(x_2,f(x_2))$ から補間多項式をもとめたとします。このとき自分の手元には次のような表が残っているはずですね？

\begin{align}
\begin{array}{cccccccccc}
f[x_0]&f[x_0,x_{1}]&f[x_0,x_{1},x_{2}]\\
\\
f[x_0]&{}&{}\\
{}&\frac{f[x_1]-f[x_0]}{x_1-x_0}&{}\\
f[x_1]&{}&\frac{f[x_1,x_2]-f[x_1,x_0]}{x_2-x_0}\\
{}&\frac{f[x_2]-f[x_1]}{x_2-x_1}&{}\\
f[x_2]&{}&\\
\end{array}
\end{align}

そして、このとき新たな点として $(x_3,f(x_3))$ を追加したとすると*2今まで作った表はまったくいじる必要がなく、新たに加わった点に関する部分だけを加筆していけばよいのです。
つまり次の表でいう赤く色づけした部分を付け足すだけで、修正された補間多項式を求めることが出来ます。

\begin{align}
\begin{array}{ccccccccccc}
f[x_0]&f[x_0,x_{1}]&f[x_0,x_{1},x_{2}]&f[x_0,x_{1},x_{2},x_{3}]\\
\\
f[x_0]&{}&{}&{}\\
{}&\frac{f[x_1]-f[x_0]}{x_1-x_0}&{}&{}\\
f[x_1]&{}&\frac{f[x_1,x_2]-f[x_0,x_1]}{x_2-x_0}&\\
{}&\frac{f[x_2]-f[x_1]}{x_2-x_1}&{}&\color{red}{\frac{f[x_1,x_2,x_3]-f[x_0,x_1,x_2]}{x_3-x_0}}\\
f[x_2]&{}&\color{red}{\frac{f[x_2,x_3]-f[x_1,x_2]}{x_3-x_1}}&\\
{}&\color{red}{\frac{f[x_3]-f[x_2]}{x_3-x_2}}&{}&\\
\color{red}{f[x_3]}&{}&&{}\\
\end{array}
\end{align}

このことがコンピュータのまだない時代、つまりニュートンやライプニッツの時代には非常に重宝されたわけです。

具体例を一つ

ではそろそろ具体的な例を一つ計算してみましょう。
とはいっても、あまり簡単な値でやっても面白くないので、今回は $y=\sin{x}$ から値を取ってきてその補間多項式を求めてみたいと思います。その際、適当なところで切り捨ててしまうので、桁落ちなどが発生するかもしれませんが、そのあたりの話に疎いため大目にみてください。

例1
では $y=\sin{x}$ から次の4点を得たとします*3。
\begin{align}
&(x_0,y_0)=(-2,\sin{(-2)})=(-2,-0.9092)\\
&(x_1,y_1)=(-1,\sin{(-1)})=(-1,-0.8414)\\
&(x_2,y_2)=(0,\sin{(0)})=(0,0)\\
&(x_3,y_3)=(1,\sin{(1)})=(1,0.8414)
\end{align}
そしてこれらの点から差分商を計算していきます。

\begin{align}
\begin{array}{ccccccccccc}
f[x_0]&f[x_0,x_1]&f[x_0,x_1,x_2]&f[x_0,x_1,x_2,x_3]\\
\\
\ -0.9092&{}&{}&{}\\
{}&\frac{-0.8414-(-0.9092)}{-1-(-2)}=0.0678&{}&{}\\
\ -0.8414&{}&\frac{0.8414-0.0678}{0-(-2)}=0.3868&\\
{}&\frac{0-(-0.8414)}{0-(-1)}=0.8414&{}&\frac{0-0.3868}{1-(-2)}=-0.1289\\
\ 0&{}&\frac{0.8414-0.8414}{1-(-1)}=0&\\
{}&\frac{0.8414-0}{1-0}=0.8414&{}&\\
\ 0.8414&{}&{}&{}\\
\end{array}
\end{align}

そして上の表が完成したので一番上のラインを順番に係数として並べれば、補間多項式が
\begin{align}
y=-0.9092+0.0678(x+2)+0.3868(x+2)(x+1)-0.1289(x+2)(x+1)x \tag{3}
\end{align}
と求まりました！！

このグラフを本当の $y=\sin{x}$ のグラフと同時に書いてみましょう。
じゃん！！

f:id:rusk_mathematics:20190905214731p:plain — （水色： $y=\sin{x}$ 、赤色：補間多項式）

どうでしょう！与えた4点の周りだけ見ればかなり近いですよね。
多項式補間も素朴でありながら結構いい感じに近似してくれるんです。

もちろんこの後から、いろいろな点を追加していけばもっと近似の精度を高めることができます。その際、上の表はどんどん大きくなっていきますが②で述べたように書き直す必要はないので、興味のある方はどんどん計算してみて下さい！！

差分系テイラー展開

さて、「ニュートンの補間法」の説明はほとんど終わったのですが、前回から引っ張っている事柄を一つ説明していません。
そう。タイトルにもある「差分系テイラー展開」というものは一体何なのでしょうか。

人によっては多項式補間を見ただけでテイラー展開の類似だとわかるかもしれませんが、ピンとこない方の方が多いと思います。
しかし、このことは少し特別な場合を見ることでかなり納得できると思います。
その特別な場合とは、与えられた点がすべて等間隔に並んでいるような状況です。

点が等間隔に並んでいる場合

以下、与えられた $n+1$ 個の点
\begin{align}
(x_0,y_0),(x_1,y_1),\ldots,(x_n,y_n) \end{align}
は $x$ 座標に関して(この順番に)等間隔で並んでいるとします。

つまり、ある正の数(間隔) $h$ が存在して
\begin{align}
x_i=x_0+ih\ (i=0,1,\ldots,n) \tag{4}
\end{align}
とあらわされているとします。(もし、以下の説明で分かりにくいところがあればまずは $h=1$ で考えてみてください)

このとき
\begin{align}
f(x)=&f(x_0)+f[x_0,x_1](x-x_0)+f[x_0,x_1,x_2](x-x_0)(x-x_1)+\\
&\ldots+f[x_0,x_1,\ldots,x_n](x-x_0)(x-x_1)\ldots(x-x_{n-1}) \tag{2}
\end{align}
を簡単にすることが出来ます。

まず、各項に現れる
\begin{align}
(x-x_0)(x-x_1)\ldots(x-x_i)
\end{align}
は(4)より
\begin{align}
&(x-x_0)(x-x_1)\ldots(x-x_i)\\
=&(x-x_0)\{(x-x_0)-h\}\{(x-x_0)-2h\}\ldots\{(x-x_0)-ih\}
\end{align}
となります。これは $(x-x_0)$ からスタートして $h$ ずつ小さくしていったものの $i$ 個の積を取ったものです。これを
\begin{align}
(x-x_0)^{\underline{i}_h}
\end{align}
と書き、 $h-$ 下降階乗冪という事にします(私が勝手に用意した記号と名前なのでご注意ください)。
$h=1$ の場合は通常の下降階乗冪に一致します。

そしてもう一つ差分商の方ですが、こちらは $h$ と差分を用いて以下のように表せることが知られています。
\begin{align}
f[x_0,x_1,\ldots,x_i]=\frac{\Delta^i f(x_0)}{i!h^i}
\end{align}
この公式の証明も省力しますので、今回は事実としてみてめていただけるとありがたいです。

以上、二つの書き換えを用いると(2)式は以下のようになります。

\begin{align}
f(x)=&f(x_0)+\frac{\Delta f(x_0)}{1!h}(x-x_0)+\frac{\Delta^2 f(x_0)}{2!h^2}(x-x_0)^{\underline{2}_h}+\ldots+\frac{\Delta^n f(x_0)}{n!h^n}(x-x_0)^{\underline{n}_h} \tag{5}
\end{align}

いかがでしょう！ここまでくるともう（ $x_0$ の周りでの）テイラー展開にしか見えないのではないでしょうか！！

一応補足をしておきます。
分母に $h$ の冪があったり $h-$ 下降階乗冪などという見慣れないものが登場するのは、間隔を $h$ でとっているからです。
$h$ 刻みの離散的な値のみから近似をしようとしているので、微分のときとは違ってどうしても幅が出てきてしまいます*4。
ただこの幅があるというのは、ある意味当然のことで、むしろそこに連続的なものと離散的なものの違いが如実に表れています。
この式でもやはり「微分と差分」、「通常の冪と下降階乗冪」という対比がよくわかります。
いやあ綺麗な式ですね(笑)

最後にもう一つ具体例

では(5)式を使って最後にもう一つだけ具体例を計算して終わりにしましょう。
関数はある程度なんでも良いのですが今回は
\begin{align}
y=e^{-\frac{x^2}{2}}
\end{align}
から値を取ってみましょう！

今、 $h=1$ としてこの関数から等間隔に4つの値をとると、次のようになっていることがわかりました。

\begin{align}
&(x_0,y_0)=(-1,e^{-\frac{1}{2}})=(-1,0.6065)\\
&(x_1,y_1)=(0,e^{0})=(0,1)\\
&(x_2,y_2)=(1,e^{-\frac{1}{2}})=(1,0.6065)\\
&(x_3,y_3)=(2,e^{-2})=(2,0.1353)
\end{align}

今、 $h=1,n=3,x_0=-1$ であることから(5)式はつぎのようになります。

\begin{align}
f(x)=&f(-1)+\frac{\Delta f(-1)}{1!}(x+1)+\frac{\Delta^2 f(-1)}{2!}(x+1)^{\underline{2}}+\frac{\Delta^3 f(-1)}{3!}(x+1)^{\underline{3}}
\end{align}

ここで、 $h=1$ より $h-$ 下降階乗冪は通常の下降階乗冪になっていることに注意します。

あとは、 $f$ の差分を計算するだけですね。
やってみましょう。

\begin{align}
\begin{array}{ccccccccc}
f(x_0)&\Delta f(x_0)&\Delta^2 f(x_0)&\Delta^3 f(x_0)\\
\\
0.6065&{}&{}&{}\\
{}&0.3935&{}&{}\\
1&{}&-0.7870&{}\\
{}&-0.3935&{}&0.7093\\
0.6065&{}&-0.0777&\\
{}&-0.4712&{}&\\
0.1353&{}&&{}\\
\end{array}
\end{align}

差分は引き算するだけなので、差分商より計算が楽ですね（笑）

そしてこの表の一番上のラインの値を順番に代入して行けば補間多項式が

\begin{align}
f(x)&=0.6065+\frac{0.3935}{1!}(x+1)-\frac{0.7870}{2!}(x+1)^{\underline{2}}+\frac{0.7093}{3!}(x+1)^{\underline{3}}\\
&=0.6065+0.3935(x+1)-0.3935(x+1)x+0.1182(x+1)x(x-1)
\end{align}
と求まります。

先ほどど同じように、この関数のグラフと本当の $y=e^{-\frac{x^2}{2}}$ のグラフを比べてみましょう。
じゃん！！