今度こそアフィンスキームを理解する(2)Zariski位相の解明!
皆様、ご無沙汰しております。
ラスクです。
ここ2か月ほど、ブログの更新をおろそかにしてしまい申し訳ありません。
さて今回はシリーズ「今度こそアフィンスキームを理解する」の第二回をやっていきます!
内容としてはZariski位相という位相を導入し前回定義したを位相空間にしていきます。
この概念も、最初の頃は小難しく感じられますが、慣れてしまえばどうってことありません!
出来るだけイメージを大事に解説していきますので、どうぞ目を通してみてください!!
ただ、前回の記事の内容が入っているものとして話を進めますので、まだの方は是非こちらからご覧ください!!
(ただし最初に少しだけは復習をいれます)
mathforeveryone.hatenablog.com
それでは、さっそく始めていきましょう!!!
前回の復習
まずは少しだけ前回の復習をしましょう。
任意の可換環に対して、その素イデアルの全体を、極大イデアルの全体をと表し、それぞれの素スペクトラム、極大スペクトラムと呼びました。
前回はまず、以下の定理が成り立つことを紹介しました。
定理.(Hilbertの零点定理 weak ver.)
を代数閉体とする。このときに対して以下が成り立つ。\begin{align}\mathrm{mSpec}A=\{(t_1-a_1,\ldots,t_n-a_n)\mod{I}\mid(a_1,\ldots,a_n)\in Z(I)\}\end{align}
ただし、イデアルの代数的集合とは以下のようなものでした;\begin{align}Z(I)=\{(a_1,\ldots,a_n)\in k^n\mid f(a_1,\ldots,a_n)=0\ (\forall f\in I)\}\end{align}
この定理によって代数幾何学の研究対象である多項式の共通零点集合と、極大イデアルの集まりであるが結びついたのでした。
そして次に、が代数閉でない場合や、の方はどうなるかについて考え、これらの時は素朴な零点集合の全体とは必ずしも1対1に対応するわけではないことを見ました。
今回はこれらのこと念頭に置きつつ、に位相を入れ、その意味や簡単な性質を見ていきます。
Zariski位相の定義と簡単な意味
ではさっそく、定義をしてしまいましょう。
定義1.(Zariski位相)
可換環のイデアルに対して、の部分集合を以下で定める;\begin{align}V(I):=\{\mathfrak{p}\in\mathrm{Spec}A\mid I\subset\mathfrak{p}\}\end{align}そして、という形の部分集全体を閉集合系とすることでに位相を入れる。これをのZariski位相という。
はい、これだけです。Zariski位相の定義自体は意外とシンプルなんですね。
まずは、この定義が本当に位相を定めているのか。つまり、という形の部分集合族がきちんと閉集合系の公理を満たしているのかを確認しましょう。
証明.
読者への演習だよ^^
このようにして位相がきちんと定まっていることはわかりましたが、この位相がいったい何を考えているのかわからない…という方も多いのではないでしょうか?
実際、私も代数幾何を初めて学んだ頃はそうでした。
しかし!前回の記事の内容を理解している方ならば、もうこの位相がそこまで不思議なものには見えないはずです!
今、可換環は体上の多項式環であるとしましょう。
このときいつもの同一視\begin{align}\begin{array}{ccc}k^n&\longleftrightarrow &\mathrm{Spec}A\\(a_1,\ldots,a_n)&\longleftrightarrow &(t_1-a_1,\ldots,t_n-a_n)\end{array}\end{align}を使います。
すると代数的集合の元に対応する素(極大)イデアルは必ずを含みます。
つまり上の同一視を使えば次のような包含関係を考えることが出来ます;\begin{align}Z(I)\subset V(I)\end{align}
ただし、この包含関係は一般には等号になりません。
例えば、とすると、\begin{align}Z(I)=\{1\}\end{align}ですが、\begin{align}V(I)=\{(t-1),(t^2+1)\}\end{align}となって数が一致しません。
このことは前回の記事で何度も注意しましたが、大事なのでもう一度…
素イデアルや極大イデアルの集合は、素朴な零点集合よりも大きくなります。
このことをきちんと意識したうえで、を閉集合として採用しています。
どうでしょう。なんとなく理解できたでしょうか?
おそらく、がより大きくなってしまっていることを気にしている方も多いでしょう。
私もそうでした。
しかし、この問題は有理点という概念を用いれば解決します*1。
有理点とは極大イデアルのうち、その剰余環が元の体と同型になっているようなものですが、の中からそのよう点だけを取り出してくれば、きちんとと一対一に対応します。
このあたりの話は、第五回でもう一度詳しく扱います。
とにもかくにも、という集合は気持ちの上では、多項式の零点集合を表していて、そのような集合達をの閉集合系としているわけです。
「多項式の零点集合の研究」という代数幾何の基礎的な思想ときちんと合致していますね。
いかがでしょうか。Zariski位相とはお友達に慣れそうですか?
まだ「うーん。」という方は次の簡単な例を見て理解を深めて頂ければと思います。
例1.一番簡単であろうの場合を考えましょう。
はPIDですから、任意のイデアルはある多項式により生成されます;\begin{align}I=(P)\end{align}このとき、はどのような集合でしょうか?少し考えてみてください。
答えは、
はの素因子、
です!説明しましょう。
まず、を既約多項式を用いて、と表します。
すると、\begin{align}\mathfrak{p}\in V(I)&\iff I\subset\mathfrak{p}\\&\iff Q|P\end{align}であり、最後の条件について、もしであれば、これはどのような(既約)多項式についても成り立ち、であれば、がの素因子であることを言っています。よって、上のようにが明示的に与えられます。
逆にある有限個の相異なる既約多項式が与えられたときにと定めれば、今の議論から、\begin{align}V(I)=\{(P_1),\ldots,(P_m)\}\end{align}となります。
すなわち、の閉集合系はと、(空集合をふくむ)有限集合全体に一致しているということがわかります。
これは
・ある多項式が与えられらときに、その零点の数というのは有限個であること。
・逆に有限個の点が与えられれば、それをすべて零点に持つような多項式が存在すること。
という二つの事実に(だいたい)対応しています。
一変数の多項式環であれば、このように簡単に閉集合系を書き下せますが。多変数になるともう少し大変になってきますので、今回はこのくらいにしておきましょう。
Zariski位相の性質
ここからは今後使うZariski位相の簡単な性質を二つだけご紹介していきます。
Zariski位相の開基
今まではどちらかというと、閉集合の方に注目してきたのでこの節では逆に開集合に焦点を当ててみましょう。
定義に従えば、可換環の素スペクトラムの(Zariski)開集合とは、あるイデアルを用いて、\begin{align}U=\mathrm{Spec}A\setminus V(I)\end{align}と表されるものの事です。
このとき、もしが単項イデアルならば\begin{align}U =\{\mathfrak{p}\in\mathrm{Spec}A \mid f\notin \mathfrak{p}\}\end{align}と表されます。
実際、\begin{align}\mathfrak{p}\in U &\iff (f)\nsubseteq \mathfrak{p} \\ &\iff f\notin \mathfrak{p} \\ &\iff \mathfrak{p}\in \{\mathfrak{p}\in\mathrm{Spec}A \mid f\notin \mathfrak{p}\}\end{align}となり、確かに集合が一致します。
この開集合を以下のように定義しておきましょう。
定義3.(基本開集合)
を可換環とする。このとき、ある元を用いて\begin{align}D(f):=\{\mathfrak{p}\in\mathrm{Spec}A \mid f\notin \mathfrak{p}\}\end{align}と表されるようなの開集合のことを基本開集合と呼ぶ。
基本開集合については、それに入るかどうかが、を含んでいるか否かで決まるため非常に扱いやすいことが多いです。
そして幸いなことに、次の命題が成り立ちます。
証明.
の開集合を任意にとり、それをイデアルを用いてと表す。このとき明らかに\begin{align}U=\bigcup_{f\in I}D(f)\end{align}が成り立つ。
この命題によってZariski位相の開集合に関して考える場合は、多くの場合、扱いやすい基本開集合に限って考えることが出来るわけです。
この基本開集合は次回以降、アフィンスキームを定義する際にも基本となるのできちんと押さえておいてください!
引き戻しの連続性
この節では、二つの可換環のスペクトラム間の射\begin{align}\mathrm{Spec}B\longrightarrow\mathrm{Spec}A\end{align}について考えましょう。射の方向がおかしいのは後の都合のためです。今、はどちらも位相空間ですから、その間の射は(とりあえず)連続写像を考えるのが自然です。
では具体的にどんなものが連続写像になるのでしょうか?
一つ重要なものとして、環準同型の引き戻しがあります。
命題5.
を可換環の準同型とする。このとき、\begin{align}\begin{array}{cccc}\varphi^*:&\mathrm{Spec}B&\longrightarrow&\mathrm{Spec}A\\ &\mathfrak{p}&\longmapsto&\varphi^{-1}(\mathfrak{p})\end{array}\end{align}は(Zariski位相に関して)連続である。
証明.
命題4より、任意の基本開集合の逆像がの開集合であることを示せばよい。\begin{align}\mathfrak{p}\in(\varphi^*)^{-1}(D(f))&\iff\varphi^*(\mathfrak{p})\in D(f)\\ &\iff\varphi^{-1}(\mathfrak{p})\in D(f)\\ &\iff f\notin \varphi^{-1}(\mathfrak{p})\\ &\iff \varphi(f)\notin \mathfrak{p}\\ &\iff \mathfrak{p}\in D(\varphi(f))\end{align}より、が成り立つ。よって基本開集合の逆像は基本開集合(特に開集合)となっている。
このように定義に従えば示すことのできる命題の証明は、きちんと遂行できるようにしたいところですね。
このようにして、任意の環準同型はスペクトル間の連続写像を誘導することがわかりました。
このように環準同型が与えられると、そのスペクトラム間に逆向きの射が与えられます。
このことをもっと詳しく調べると、可換環のなす圏と、アフィンスキームのなす圏に反変的な圏同値があることがわかります。このことは第4回にて詳しく扱うので、今は「ふーん、そうなんだ。」くらいに思っておいてください。
では最後にこの先重要となる二つの自然な環準同型と、そこから誘導される連続写像の例を見ていきましょう!!
命題6.
を可換環とする。
(1)をのイデアル、を自然な全射環準同型とする。このとき\begin{align}\pi^*:\mathrm{Spec}(A/I)\longrightarrow\mathrm{Spec}A\end{align}はからへの同型を誘導する。
(2)をを含むようなの積閉集合とし、をで定める(これは環準同型)。このとき、\begin{align}\varphi^*:\mathrm{Spec}(S^{-1}A)\longrightarrow\mathrm{Spec}A\end{align}はからへの同型を誘導する。
ただし、とにはそれぞれ、の制限位相を入れる。
証明.
(1)(2)ともにが連続な全単射を誘導することは容易。
よって、残りは閉写像であることを見ればよい。
(1)について、のイデアルを任意にとる。\begin{align}\mathfrak{p}\in V(J_1)&\iff J_1\subset\mathfrak{p}\\&\iff \pi^{-1}(J_1)\subset\pi^{-1}(\mathfrak{p})\\ &\iff\pi^*(\mathfrak{p})\in V(\pi^{-1}(J_1)\end{align}が成り立つことから、となり、確かに閉写像になっている。
(2)についても同様に、のイデアルに対してが成り立ち、閉写像となる。
これで証明できた。
この命題の言っている意味を考えましょう。
(1)については、環のスペクトラムの閉部分集合がそれ自体、可換環のスペクトラムになっているということです。
今は単に位相空間として同型であることしか言っていませんが、実際にはに構造層を入れ、スキームとみなした時にも、この同型はスキームとしてのものであることもわかります。
これは「アフィンスキームの閉部分スキームはそれ自体、アフィンスキームであり、その構造はイデアルにより決定される」という重要かつ強力な結果を表しています。
(2)については、具体的な積閉集合をとって考えてみましょう。
代表的な積閉集合の例として、ある一つの元の冪全体で定義されるものがあります;\begin{align}S=\{f^n\mid n\ge 0\}\end{align}この積閉集合による局所化はと書かれるのでした。
そして、対応するの部分集合は、\begin{align}\mathfrak{p}\cap S=\emptyset &\iff f^n\notin \mathfrak{p}(\forall n\ge 0)\\&\iff f\notin\mathfrak{p}\\&\iff \mathfrak{p}\in D(f)\end{align}より基本開集合と一致します。
したがって、「可換環のスペクトラムの基本開集合はそれ自体、のスペクトラムと表せる」という事がわかります。
もちろん、これもスキームとしての同型に拡張されます。
また、今はある元の冪によって定義される積閉集合を見ましたが、もう一つ代表的な積閉集合がありますね。
それはある素イデアルを取ったときに、その補集合として定義されるもの;\begin{align}S=A\setminus \mathfrak{p}\end{align}です。この場合、局所化は何を表しているのでしょう?
対応するの部分集合は\begin{align}\{\mathfrak{q}\in\mathrm{Spec}A\mid\mathfrak{q}\cap S=\emptyset\}=\{\mathfrak{q}\in\mathrm{Spec}A\mid \mathfrak{q}\subset\mathfrak{p}\}\end{align}となります。つまり、に含まれるようなような素イデアル (=点)だけを表しており、という一点の周りのみをズームアップしてみているという事になります。
これは先ほどのよりもさらに考える範囲を小さな範囲に絞っていることになります。
このようなものをアフィンスキームのにおける茎(ストーク)といいます。
詳しい話は次回以降にやりますが、このように一点の周りをズームアップしているという感覚は大事にしてください!!
さて、これを考えると、「なぜ、やのようなものを局所化と呼ぶのか」がわかるのではないでしょうか?
つまり、元の可換環はという空間全体を定めているのに対し、その局所化はそれぞれ基本開集合やという小さな空間をズームアップして表していることになります。
だから!局所化という名前がついているわけです。
なるほどってかんじですね。
このように考える範囲を絞っていく(局所化していく)ことで、色々な多項式やその零点の振る舞いを調べよう!というのが、まさに層やスキームの一番基本的な考え方になります。
どうでしょう?だんだんイメージがつかめてきたでしょうか?
では最後に今回の内容をまとめておきましょう。
まとめ
今回はにZariski位相を定義し、その意味や簡単な性質、仕組みについてみていきました。
お分かりいただけたでしょうか?
出来るだけ代数幾何の「幾何的イメージ」を大事にしつつ解説してみたつもりです。(特に局所化のところはいい感じに書けたと思います)
もちろん、これだけで完全理解!とはならないでしょうが、皆様の勉強に少しでも役立てて頂けたら幸いです。
さて、ここまでの内容を一通り理解できれば、「アフィンスキーム」を定義するのはそこまで難しくありません。
ということで、次回は層の一般的な話を少しした後に、いよいよ「アフィンスキーム」に登場していただきます!
ご期待ください!!
では最後までご覧いただきありがとうございました!!
コメントはどんなものでも絶賛受け付け中です!
気に入ってくださった方は「読者になる」ボタンやTwitterフォローもポチッとお願いします!
また、時折youtubeにてライブ配信などしておりますのでそちらのチャンネル登録もお願いいたします!!
www.youtube.com
それではまた次回お会いいたしましょう!
参考文献
Algebraic Geometry and Arithmetic Curves (Oxford Graduate Texts in Mathematics)
- 作者:Liu, Qing
- 発売日: 2006/08/24
- メディア: ペーパーバック
今度こそアフィンスキームを理解する(1)素イデアルが点とは?
みなさん、こんにちは!ラスクです。
まだまだ世界中、大変な状況が続いていますね。。負けずに数学頑張っていきましょう!!
さて!本ブログでは今回からとあるシリーズを始めたいと思います!
タイトルは
「今度こそアフィンスキームを理解する!」
です。
代数幾何を勉強すると最初に現れるアフィンスキーム。これはなかなか初学者泣かせの概念です。
そこで本シリーズではそのイメージをつかむことを目標に、全五回に分けて解説をしていきたいと思います!
必要な知識は、可換環論と位相空間の簡単な事柄のみです。
私の経験も踏まえて最大限、わかりやすく説明するので是非ご一読ください!
ここで内容に入る前に一つだけ宣伝を。
先日、このブログとは別にYoutubeチャンネルを開設しました!
そして今回の記事のおおざっぱな内容を、そのチャンネルにてすでにお話ししています。
もしよろしければこちらも併せてご覧ください(内容は5分後くらいから始まります)。
また、今後Youtubeの方の活動も少しづつやっていこうと思うので、是非チャンネル登録をお願いいたします!!
では長くなりましたが始めていきましょう。
代数幾何学とは何か
まず、アフィンスキームとは何かをお話しする前に、そもそも代数幾何学とは何だったかを簡単に確認しましょう。
代数幾何学とは一言でいえば
「多項式の零点集合として定まる図形を研究する学問」
です。
これは何も難しいことを言っているわけではありません。
例えば非常に簡単な例として、中学生で習うような一次関数\begin{align}y=x\end{align}も多項式で表される零点集合の一つです。
より正確に言えば、次の形の(あくまで例ですので、体はで考えましょう。)の部分集合のことを指しています;\begin{align}\{(x,y)\in\mathbb{R}^2\ |\ y-x=0\}\end{align}
そして、これをグラフとして座標平面上に書けば皆さんご存じの通りの図形が定まります。
もちろんこのというのは、多項式であれば何でもよく、や、あるいはもっと変数を増やしてなどでもよいです。
ただしあくまで多項式ですから、超越的な関数であるやなどは(普通は)考えません。
とにかく、このような零点集合としての図形を研究するのが代数幾何学ですから、扱う対象としては非常になじみ深いものであると言えます。
しかし、研究すると言っても何をするのでしょうか?
これについては私も専門外なので一概には言えませんが、大きな目標の一つとしては上で挙げたような図形たちを
「同型の差を除いて分類する」
ということがあります。
この同型をきちんと定義するのは、それこそスキームや多様体の定義を理解する必要があるのでここではしませんが、おおざっぱに言って同様の構造を持っているものを同じ図形とみなすという事です。
このような「分類問題」は途方もない問題でにわかに解けるものではありませんが、それを考える手がかりとして例えば「種数」であったり「コホモロジー」があるわけです。
最後に、これらはどのように研究されているのでしょうか。
一つには、古典的な座標幾何の考えを用いて多項式の零点を定義し、それをもとに議論を進めていくという方法があります。実際、古典的な代数幾何ではこのような方法をとっており、いろいろな結果を導けています。
しかし、あるときグロタンディークという数学者がこの枠組みを大きく抽象化し、イデアルをもとにして代数幾何を進めていく方法を確立しました。このような中で現れるのがスキームやアフィンスキームなのです。
この方法は非常に革新的で、現代の数学においてもはやなくてはならない基礎的な理論になっています。
しかし、この抽象化のさせ方があまりにダイナミックであるため初学者には、これが本当に多項式の零点の研究になっているのか、というのがわからなくなってしまうことがしばしば起こります。
今回のシリーズはそのような疑問を少しでも解消するためのものです。
キーワードは、『数学ガール』の結城先生のお言葉である
「例示は理解の試金石」
です!
できるだけ簡単な例から始めることで、スキームというもののイメージを確固たるものにしていきましょう。
ということで、次の節からは第一回の内容である「素(極大)スペクトルの点とは何か?」について話していきます。
素スペクトルと極大スペクトル
以下、と書いたら単位的な可換環を表すことにします。
この二つが今回の主役です。注意として、極大イデアルは素イデアルでもあったので以下の包含関係が任意の可換環で成り立ちます。\begin{align}\mathrm{mSpec}A\subset\mathrm{Spec}A\end{align}
スキーム論では、主にこの二つの集合を元にして空間を定義し幾何を展開します。つまり任意の可換環に対して、その素イデアル(または極大イデアル)を点とみなすという事です。
はい。。。ここなんですよね。
おそらく代数幾何を学ぼうと思った人の多くが、
「イデアルが点ってどうゆうことやねん!!」
という感想を抱くことでしょう。
それまで可換環論を少ししかやってきていない人からすれば「イデアルというのはなんか倍数の一般化であって、素イデアルっていうのは素数の一般化なんだな。」くらいのイメージしかできていないことも致し方のないことかもしれません。
なので、上のようにイデアルが空間をなします!!とか言われても「?」となってしまうわけです。
そしてそれに追い打ちをかけるように、Zariski位相や構造層という謎の概念がどばーっと出てきて完全に頭の中は「???」です。
実際、私もスキームに触れた当初は上のような状態に陥り挫折をしました。
でも今回はまさにそのような悩みを解決する機会です。
第一回である今回は、この素(極大)スペクトルという空間の点が一体何を表しているのかをじっくり探っていきます。
ここで、初めから難しいものを考えて混乱しないために、今回は扱う可換環は、体上の多項式環\begin{align}A=k[t_1,\ldots,t_n]\end{align}またはそれをイデアルで割った剰余環\begin{align}A=k[t_1,\ldots,t_n]/I\end{align}(つまりアフィン代数多様体*1 )に限ろうとおもいます*2。
このような形のを有限生成-代数と呼びます。
それではまず比較的イメージのしやすい極大スペクトルの方から見ていきましょう。
極大スペクトル
一番簡単な例
例1.
まずはもっとも簡単な対象として複素数係数の一変数多項式環を考えます。このときのはどのように書けるでしょうか?少し考えてみてください。
答えは以下の通りです。
命題2.\begin{align}\mathrm{mSpec}\mathbb{C}[t]=\{(t-a)\mid a\in\mathbb{C}\}\tag{1}\end{align}
逆向きの包含関係について、は単項イデアル整域であるから全てのイデアルというのはある(モニックな)一つの多項式によって生成される。
しかし、今というのは代数閉体なのでが2次以上の多項式であるとそれは一次式の積に分解する。つまりが生成するイデアルは素イデアルにはなりえず、特に極大イデアルにもなりえない。
が定数の場合に極大イデアルにならないのは明らかなので、結局極大イデアルは一次式で生成されているものに限る。これで証明できた。
この命題を見ていると、極大イデアルを点とみなすという事が少しわかってくるのではないでしょうか?
なぜなら、今の各点との各点が以下のような関係で一対一に対応しているからです;\begin{align}\mathbb{C}&\longleftrightarrow\mathrm{mSpec}\mathbb{C}[t]\\ a&\longleftrightarrow(t-a)\end{align}このような対応関係を常に念頭に置くことで複素平面と極大スペクトルを同一視して考えるわけです。
これがアフィンスキームを考える上での一番の基礎です。お分かりいただけたでしょうか?
さて、上の例に納得していただけた人もいろいろな疑問がわくと思います。
そのうち以下では次の3つについて考えます。
どれも非常に基本的な問いで、極大スペクトルを理解するうえでは重要なものです。順番に答えていきましょう。
①②の疑問
①②まず一つ目と二つ目の疑問については以下の大定理を使うといっぺんに答えることが出来ます。
定理3.(Hilbertの零点定理 weak ver.)
を代数閉体とする。このときに対して以下が成り立つ。\begin{align}\mathrm{mSpec}A=\{(t_1&-a_1,\ldots,t_n-a_n)\mod{I}\\ &\mid a_i\in k,f(a_1,\ldots,a_n)=0\ (\forall f\in I)\}\tag{2}\end{align}
何を言っているかわかるでしょうか?少し見やすくするために記号を導入しましょう。
定義4.体とその上の多項式環のイデアルについて、その共通零点の集合を以下で定義する;\begin{align}Z(I)=\{(a_1,\ldots,a_n)\in k^n\mid f(a_1,\ldots,a_n)=0\ (\forall f\in I)\}\end{align}これをイデアルの代数的集合という。
代数的集合は代数幾何の研究対象である多項式の零点集合そのものです。
イデアルで書いてあるからわかりにくいかもしれませんが、例えばに対してイデアルと取れば\begin{align}Z(I)=\{(x,y)\in\mathbb{C}^2\mid y=x^2,y=x+2\}=\{(-1,1),(2,4)\}\end{align}となります。
この記号を用いて定理中の(2)式を書けば以下のようになります。\begin{align}\mathrm{mSpec}A=\{(t_1-a_1,\ldots,t_n-a_n)\mod{I}\mid(a_1,\ldots,a_n)\in Z(I)\}\tag{2'}\end{align}つまり、極大スペクトルの点はイデアルの代数的集合と一対一に対応しているわけです;\begin{align}Z(I)&\longleftrightarrow\mathrm{mSpec}A\\ (a_1,\ldots,a_n)&\longleftrightarrow(t_1-a_1,\ldots,t_n-a_n)\mod{I}\end{align}
どうでしょう?がきちんと多項式の零点集合を考えているんだ、と思えてきましたか?
このことを環論の言葉で言い換えてみましょう。
一度、で割る前の多項式環を考え、通常通りとを対応付けます。
すると上で述べたことは以下の同値性を示していることになります;\begin{align}(a_1,\ldots,a_n)\in Z(I)\iff I\subset\mathfrak{m}\end{align}つまり、ある点が考えている多項式の(共通)零点になることを、対応する極大イデアルがを含むということに翻訳できたことになります!!
こうしてみると零点集合の研究に環論が使えそうな気がしてきますね!
以降、例をみていきますが簡単のための極大イデアルもと書く代わりに、と書いてしまう事にします。
例1.(再考)
定理3.を基にして、先ほどの例をもう一度考えてみましょう。
今、は代数閉体です。定理の形に合わせるためには、として考えれば良いですね。
すると、(2′)式を使って\begin{align}\mathrm{mSpec}\mathbb{C}[t]=\{(t-a)\mid a\in Z(0)\}\end{align}を得ます。
しかし、というのはゼロ多項式の零点集合なので全体になります。よって、\begin{align}\mathrm{mSpec}\mathbb{C}[t]=\{(t-a)\mid a\in\mathbb{C}\}\tag{1}\end{align}がきちんと出てきます。これで定理3.は命題2.の一般化になっていることが確かめられました。
例2.ここではを変えることにより様々な形の図形を見ていきましょう。
まず一変数の例から。
とすると定理3.から\begin{align}\mathrm{mSpec}A=\{(t-a)\mid a\in Z(t^2-1)\}=\{(t-1),(t+1)\}\end{align}となり、は2点からなる集合を表しています。
これは環論の言葉に直せば、なる極大イデアルは上の2個しかないことを言っています。
次に2変数の例を見ましょう。
とします。すると代数的集合は、\begin{align}Z(xy)=\{(x,y)\in\mathbb{C}^2\mid x=0\ \mathrm{or}\ y=0\}\end{align}となります。つまり極大スペクトルは\begin{align}\mathrm{mSpec}A=\{(x-a,y),(x,y-b)\mid a,b\in\mathbb{C}\}\end{align}と書き表せます。これを図で書けば、下のような軸を表していることがわかるでしょう。
注意深い人にために言っておくと、今この図は少し無理して書いています。
なぜなら本来というのは実2次元的な対象なのでそれを2次元分書くと、4次元になってしまい中々図にできません。そこで少し目をつぶって各を直線で表し、私たちが慣れている座標平面の図にして書いています。
図というのは理解を助けてくれるものではありますが、いつも100%の意味を与えてくれるものではないので、ご容赦ください。
他にもをいろいろ変え、図形を描いたものを以下に載せておきます。皆さんもいろいろな例を考えてみてください。
では次にを他の体に変えたらどうなるかという③の疑問に答えていきましょう。
③の疑問
定理3.を見ると、上の議論はでなくてもが代数閉体であれば全く問題なく成り立つことがわかります。
なのでここでは、代数閉体でないようなものとして代表的なを考えましょう。
そして考える環はとします。
このとき、というイデアルはの極大イデアルになっています。
実際、\begin{align}\mathbb{Q}[t]/(t^2+1)\simeq\mathbb{Q}(i);t\mapsto i\tag{3}\end{align}という同型があり、剰余環が体になっています。
ところが、このというイデアルはという形にはなっていません*3。
つまり、にはという形以外の極大イデアルが存在し、ヒルベルトの零点定理が成り立っていないことになります。
もちろん、でもという形のイデアルは極大イデアルになっています。これも次のような同型を考えれば納得できるでしょう;\begin{align}\mathbb{Q}[t]/(t-a)\simeq\mathbb{Q};t\mapsto a\tag{4}\end{align}
よってにおいては以下のような真の包含関係が成り立っています;\begin{align}\{(t-a)\mid a\in\mathbb{Q}\}\subsetneq\mathrm{mSpec}\mathbb{Q}[t]\end{align}
左辺の集合はと一対一に対応していますから、この関係式は(少し乱暴ですが)次のようにかけます;\begin{align}\mathbb{Q}\subsetneq\mathrm{mSpec}\mathbb{Q}[t]\end{align}これは多変数にしても同じです。
このように、代数閉体でない上の有限生成代数においては、素朴な点集合よりも極大スペクトルの方が大きくなります。つまり現代の代数幾何では、素朴な点よりも多くのものを点の概念として採用しているという事です。
これがとても大切です。これを知らずに、極大スペクトルの点を自分の知っている素朴な点と無理矢理当てはめようとすることが、混乱の種になります。代数幾何では(ある程度対応はとれていながらも)点の取り方を新しく定義しなおしているという事を覚えておいてください。
せっかくですからもう少し上の状況を観察してみましょう。
においてと書かれるものとそうでないものの違いは何でしょうか?
もちろん形が違うというのはその通りですが、もう少し重要な違いが表れているところがすでに表れています。
それはどこでしょう?少し考えてみてください。
答えは、体の拡大の有無です。
(4)式で見たようにという極大イデアルで割った剰余環はにを代入するという写像によってそのものと同型になります。
しかし、という極大イデアルの場合は(3)で見たように、その剰余環はにを代入するという写像によって少し拡大されたという体と同型になります。
ここが違いです。
つまりというのは今、代数閉体ではないのでその中に解を持たない多項式というのが存在し、結果2次以上の多項式も既約になりうるわけです。
今の場合はがには入っていないため代入しようとすると、体の方を拡大しなけらばならないという事が起こります。
一般に、をにおける剰余体といい、剰余体が最初に決めた係数体と同型(つまり大きくなっていない)点のことをの有理点といいます。
今の場合はは有理点であり、は有理点ではありません。
有理点というのはあくまで、初めに与えられた体の中で多項式の零点を探すので、あまり代数閉体を仮定したくないような数論的な状況では重要になります。
この辺の話はアフィンスキームを定義した後、第五回でもう一度お話ししたいと思いますので楽しみにお待ちください。
とにもかくにもこれで代数閉体でない場合についてもある程度わかったことになります。
ここまでの話をまとめます。
ではこれを踏まえて今度は素スペクトルの方を見ていきましょう。
素スペクトル
簡単な例再び
例3.
こちらについてもという環からはじめていきましょう。
ただし今回考えるのは素スペクトルです。
これはどのように書き表せるでしょうか?
答えは次のようになります。
命題4.\begin{align}\mathrm{Spec}\mathbb{C}[t]=\mathrm{mSpec}\mathbb{C}[t]\cup\{(0)\}\end{align}
証明.
の素イデアルを、:モニック、と表す(はPID)。が代数閉体であることからであり、もしならば命題1.より\begin{align}\mathfrak{p}=(f)\in\mathrm{mSpec}\mathbb{C}[t]\end{align}よってであるが、このときが素イデアルになるのは明らかに、すなわちの時に限る。
例1.で見たように、はと一対一に対応しています。
では新たに加わったこの零イデアルというのは何に対応しているのでしょうか?
結論から言えば、これは全体、すなわち複素平面全体に対応しています。
混乱している人も慌てないでください。実はこれはもう説明してあります。
というのは素イデアルですが、ここでは単にイデアルとみなしましょう。
すると例1.(再考)のところで考えたように代数的集合は全体ですから、というのは複素平面全体を表していると考えることが出来るわけです。
環論の言葉に直せば、これはというのが任意の極大イデアルに含まれていることを表しています;\begin{align}(0)\subset\mathfrak{m}\end{align}
そして大事なことは、こののようにいくつかの点をあつめてきたような代数的集合というものも、代数幾何では点とみなしているという事です。
普通に考えたら平面全体を点とはみなさないでしょう。
それでもこれを点とみなして空間を定義することにより、都合の良いことがたくさん起こります。
そのあたりは第四回で少しお話します。
素イデアルと既約性
例4.
今度はとして2変数の複素数係数多項式環を考えます。
先程はとの差はだけでしたが、今度はもっと多くのものが出てきます。
例えばというイデアルは素イデアルではありますが、極大イデアルにはなりません。
実際、剰余環を考えると\begin{align}\mathbb{C}[x,y]/(x)\simeq\mathbb{C}[y]\end{align}であり、は整域ではありますが体ではありません。
では、このというイデアルはどのような図形に対応しているでしょうか?
もう皆さんわかるはずです。
答えは\begin{align}Z(x)=\{(0,a)\mid a\in\mathbb{C}\}\subset\mathbb{C}^2\end{align}すなわち軸です。
図形がすぐに想像できた方は、おそらくきちんとスペクトラムのイメージがきちんとできていると思います。
これも環論の言葉に直せば、を含むような極大イデアルというのはという形のもの、またそれに限る、ということです;\begin{align}(x)\subset(x,y-a)\ \ (\forall a\in\mathbb{C})\end{align}
しつこいようですが、このというのも点です。いくつかの点が集まってできた図形も点なのです。
さて、最後に一つだけ重要な事柄を言って終わりにしましょう。
今、素イデアルは代数的集合に対応しているという事を見てきました。
しかし、任意の代数的集合が素イデアルに対応するわけではありません。
具体的には例2.の中で見たようなという代数的集合については、が素イデアルではありません。
では、どのような代数的集合が素イデアルに対応するのでしょう?
それは、代数的集合の中でも既約なもの、ということになります。
まだ、に位相を定めていないのできちんとした定義はできませんが、既約性とはおおざっぱに言ってしまえば、二つ以上の代数的集合に分けることが出来ないものを指します。
例えばは軸を表していましたが、これはこれ以上分けられないので既約です。
対して、は軸を表していましたが、これは軸と軸という二つの代数的集合分けられるので既約ではありません;\begin{align}Z(xy)=Z(x)\cup Z(y)\end{align}
よって素スペクトラムというのは代数的集合のうち、既約なものを集めてきたものだという事ができるわけです*5\begin{align}\mathrm{Spec}A\longleftrightarrow\{\text{既約な代数的集合}\}\end{align}
まとめ
ということで今回は、素スペクトルと極大スペクトルの点が表しているものの意味を解説していきました。
いかがでしたでしょうか?
今回、私が最も伝えたいことは
「ある空間における点の定義は必ずしも素朴なものと完全に一致しない」
ということです。
数学を勉強していると、いろいろな空間に出会いますがそのどれもが想像しやすいものとは限りません。
そのようなものと自分の知っている概念を関連付けるのは大切ですが、無理にそれをすり合わせようとすると混乱を生じます。
あくまで新しい空間を定義したわけですから、それはそれとして考えることも重要ではないかと私は思っています。
ではシリーズ「今度こそアフィンスキームを理解する」の第一回はこれで終わりにします。
次回は、Zariski位相を導入しを位相空間にしていきます。お楽しみに!!
参考文献
基本的には以下の二つの本を参考にしています。
代数幾何学〈1〉 (Springer‐Verlag GTMシリーズ)
- 作者:R. ハーツホーン
- メディア: 単行本
Algebraic Geometry and Arithmetic Curves (Oxford Graduate Texts in Mathematics)
- 作者:Liu, Qing
- 発売日: 2006/08/24
- メディア: ペーパーバック
*1:多様体の定義には既約性を課す場合もありますが、ここでは単に有限生成性だけを課すことにします。
*2:より一般の可換環(例えばなど)については、これらのイメージを持ったうえで同様に考えればよいと個人的には思っています。
*3:もしなっているとすると、がで割り切れることになります。このとき因数定理よりとなりますが、これはが有理数であることに反します。
*4:これはが環として一次元であることを主張しています。
*5:少し注意すると、代数的集合の既約性というのは図形の見た目で決まるものではなく、それを定めている多項式(イデアル)で決まります。とはどちらもにおいて原点を表していますが前者は既約であり、後者は既約ではありません。
ABC予想解決記念!整数と多項式の密接な関わり
みなさん、こんにちは!ラスクです。
現在、世界中が大変な状況となっており、日本でも外出自粛が要請されていますね。
なにかと不安の多い毎日ですが、こんなときこそ自宅で数学をしましょう!
1人で黙々と本を読むのもよし、オンラインで誰かとセミナーをやるのもよし。
熱中している間は、陰鬱な気分を忘れることができるかもしれません。
さて、最近数学界において大変嬉しい出来事がありました。
私のブログを読んでくださっている方々なら、もうご存知だと思います。
そう!2020年4月3日、
望月新一教授が「ABC予想」を解決したとされる論文の査読がついに完了した
と京都大学から発表がありました!!
平たく言えば、「ABC予想」が解決した!ということです*1。めでたい!
整数論を専攻する身としては、何か記事を書かねばと思い、考えを巡らしました。
しかし「ABC予想」の凄さやその主張の意味に関しては、すでに多くの方が記事や動画で解説されているので、本記事ではそのようなことはお話ししません。
代わりに「ABC予想」を題材にした「整数と多項式の関係性」についてお話ししようと思います。
この考え方自体は現代の整数論や数論幾何学といった理論の根底にあるものです。
とはいってもあまり難しい話はせず、高校生でもギリギリ読める程度で書きます。
大学で習うような代数学の概念の気持ちを知ることが出来るように書いたので、是非身構えずに気軽に見ていって下さい!
では始めましょう。
そもそもABC予想って?
まずは今回証明されたABC予想とはどのようなものなのかを確認しましょう。
まず用語の定義です。
定義1.
どの二つも互いに素な正の整数の三つ組であって、\begin{align}a+b=c\end{align}を満たすようなものをabc-tripleという。
定義2.
整数に対し、その根基をの互いに異なるすべての素因数の積とする。
この二つを用いて、主張を述べます。
ABC予想
任意の実数に対し、実数で、すべてのabc-tripleに対し\begin{align}c< K(\epsilon)(\mathrm{rad}(abc))^{1+\epsilon}\tag{1}\end{align}となるものが存在する。
先ほども述べた通り、ここではこの主張の詳しい解説は致しません。
ただ、上の主張においてとすることは出来ないことには注意しておきましょう。
この辺りのことはtsujimotterさんが非常にわかりやすい記事を挙げてくださっているので、そちらをご覧ください。
tsujimotter.hatenablog.com
望月新一先生は、この予想を「宇宙際タイヒミュラー理論」という新しい理論を使うことによって解決しました*2。
もちろん本来であれば、この理論の気持ちだけでも伝えたいのですが私にその力はありません。
なので、知りたい方は加藤文元先生の本をご覧ください。
- 作者:加藤 文元
- 発売日: 2019/04/25
- メディア: 単行本
とにもかくにも、一応これでABC予想の主張は理解されたことにいたします。以下、区別のため上の主張のことを整数版ABC予想という事にします。
多項式版ABC
ABCに必要なもの
さてここからが本題です。
上で述べた主張を整数ではなく多項式で考えてみましょう。
整数論(というか数学全般)にあまり馴染みのない方は、なんでいきなり多項式??となるかもしれません。
これはABC予想の主張に必要なものを考えてみればわかるかもしれません。
ABC予想の主張に必要なものとは以下の三つです。
順番に説明すると同時に、多項式がこれらを有していることを確認しましょう。
以下、簡単のため多項式はすべて実数を係数に持つようなものとして考え*3、その集合をと表します。
①和と積
これに関しては説明不要だと思います。さすがに足し算や掛け算のできない状況では何もできません。
そして多項式も足したり、掛けたりすることは普通にできますからOKです。
②素因数分解
このことが必要な3つのもののうち、一番クリティカルです。
abc-tripleの定義の中で互いに素という条件があったり、根基の定義で整数の素因数を考えていることから、素因数分解が必要であることがわかります。
より正確に言えば、どんな要素も素数(と符号)の積に一意的に表される、ということです。
このことは多項式でも成り立ちます。
これをきちんと述べるために多項式における素式というものを定義しておきましょう。
例を見てみましょう。
例4.
- やなどは、定数でなく、最高次の係数がである。さらに実数の中でこれ以上因数分解できないので既約である。したがってこれらは素式である。
- は最高次の係数がでないので素式でない。
- は\begin{align}x^2-5x+6=(x-2)(x-3)\end{align}と因数分解できるので素式でない。
わかりましたでしょうか?定数かどうかや最高次の係数は見た瞬間わかるので、気をつけるべきは既約性ですね。
そしてこの素式を使って上の素因数分解を述べると以下のようになります。
命題5.
任意の多項式は素式と定数を用いて\begin{align}P=aP_1\ldots P_m\end{align}と一意的に表せる。
これも例で見てみましょう。
例6.
\begin{align}x^2-7x+12&=(x-3)(x-4)\\x^3-8&=(x-2)(x^2+2x+4)\\2x^4-2x^3-4x^2+6x+6&=2(x^2-3x+3)(x^2+2x+1)\end{align}
やってみればなんてことはない、ただの因数分解ですね。
ただ、素式の最高次の係数はしか許されていないので、頭に係数を付けることを忘れないようにしましょう。
特に、このことを使って
多項式が互いに素であるが共通の素因数(素式)を持たない
多項式の根基(の互いに異なるすべての素因数の積)
と定義することができます。整数の時と全く同様にするわけです。
③大きさを評価するもの
整数や実数には大きさというものが自然に定まっていました。
とはどちらが大きい?と聞かれたら!と小学生でも答えられるでしょう。
(1)式の中でも大きさの比較をしているのでこれは必須条件となります。
しかし、多項式の大きさというものは普通は定まっていません。とどっちが大きい?と聞かれても困ってしまいますね。
それでも、多項式に大きさを決めることはできます。
今回はその多項式の大きさを次数によって定めましょう。
つまりとであれば、次数の大きいの方が大きいと答えるわけです。
何とも雑な評価だ、と思われるかもしれませんが多項式版のABCではこの次数を比較します。
以下、多項式の次数をと書くことにします。
以上で、①②③を多項式が有していることがわかりました。
つまり、少なくとも主張を述べるだけであれば多項式においてもABCがつくれるわけです。
この①②③の性質については後でもっと詳しく述べることにして、お待ちかねの多項式版のABC定理を述べましょう。
多項式版ABC定理
整数の時と同様、
どの二つも互いに素な多項式の三つ組であって、\begin{align}A+B=C\end{align}を満たすようなものをABC-tripleということにします。
定理の主張は以下の通りです。
定理7.(ABC定理)
を全てが定数でないABC-tripleとする。このとき\begin{align}\max{\{\deg{A},\deg{B},\deg{C}\}}<\deg{\mathrm{rad}(ABC)}\end{align}が成り立つ。
意味は分かるでしょうか?
つまりABC-tripleが与えられたときそれらの次数は全て、積の根基の次数よりも真に小さいということを言っています。
この定理の主張を見ると、整数版ABC予想よりもかなりすっきりしている印象を受けますね。一体何がちがうのでしょう?
それはずばり、整数版ABC予想におけるをにできており、加えてをとできている点です。
これが、決定的な違いであり多項式版のABC定理は整数版のABC予想よりも強いことを要請しています。
にもかかわらず、多項式版のABC定理はかなり初等的に証明することができます。
ただ、この定理を証明することが本記事の目的ではないので、簡単に証明の概略だけ紹介することに致します。
是非、意欲のある方は各自で行間を埋めて頂きたいですが、難しいと感じた方は適宜読み飛ばしてください*5。
証明の概略
まず\begin{align}D:=AB'-BA'\end{align}とおく。このとき、とすべてが定数でないことから\begin{align}D=AC'-CA'=CB'-BC'\neq 0\tag{2}\end{align}が従う。
次に、の定義からがわかり、この両辺にを足すことでを得る。(2)によるの別表示を使う事により、結局\begin{align}\max\{\deg{A},\deg{B},\deg{C}\}+\deg{D}<\deg{ABC}\tag{3}\end{align}が得られる。
ここでは全てで割り切れる(すなわち公倍数である)ことが、の定義と(2)式、の素因数分解を考えることでわかる。
今、はどの二つも互いに素であったからもそうであり、はの倍数である。
するとがの倍数となり、結局\begin{align}\deg{ABC}\le\deg{D}+\deg{\mathrm{rad}(ABC)}\end{align}が従う。これと、(3)式を合わせることで、主張を得る。
整数論における「整数」と「多項式」
二つの世界の豊かさと不思議な類似性
さて、前節では多項式版ABC定理の主張と証明を紹介しました。ご理解いただけたでしょうか?
ここでABCの主張に必要な要素を復習しましょう。それは以下の三つでした。
ここで一度③はおいておきます。
今からこれらの条件をもとに、代数学で習う用語をババっと説明していきます。
①のように和と積の構造が定められている集合のことを環といいます。
特に環のうち、積が可換(つまり積の順序を入れかえられる)なものを可換環といいます。
そして、可換環であってでない元同士を掛けてもにならないようなものを整域といいます。
さらにさらに、整域であって②のように一意的な素因数分解(と呼べるもの)が出来るものを一意分解整域といいます。
色々な用語がいきなり出てきて混乱しているかもしれないので簡単にまとめると、これらは以下のような関係にあります。
環 可換環 整域 一意分解整域
この順番でだんだんと条件がきつくなっていきます。
これらを勉強したことがない人からすれば、①②はさておき、積が可換なんて当たり前だろ!とかでない元を掛けてにならないのなんて当然だ!といいたいかもしれません。
しかし、代数を少しでもかじってみるとこれらを満たさないような環というのは山のようにでてきます。
すなわち、一意分解整域は上で述べたような様々な条件をクリアした優秀な人たち(環たち…?)といえます。
そして、今述べたいことは、「整数」という環も「多項式」という環もどちらも一意分解整域であるという事です!
整数については小学校などで習った通りで、多項式についても前節で述べたとおりです。
よって、「整数」も「多項式」も様々な条件をクリアした優秀な対象であり、互いによく似た性質を持つ対象であるといえます。
もちろん、条件の強弱というのは相対的なものでしかないので、これだけで優秀とか、似ていると言ってしまうのはマズイかもしれません*6。
それでも、これら二つの対象の上ではとてつもなく豊かな世界が広がっており、その二つの世界同士が不思議な類似性を持っていることは多くの研究で分かっています。
誤解を恐れずに言えば、この「豊かさ」と「不思議な類似性」に整数論の面白さの一つがあるといえます。
ちなみに、③についてはあまりはっきりとしたことは言えません。
というのも③で書いた"大きさ”というのは非常にアバウトな言い回しです。先ほどもちょっと言ったように「多項式の大きさを次数で測りましょう!」というのはあまりにも雑な気がします。なので③については、とりあえずここではABCの主張に必要な要素なんだ、くらいに思っておいてください。
現れる大定理・大予想
さて、上で述べたことを聞いてどう思ったでしょうか?
「うん。確かに整数と多項式は似ている性質がたくさんあるな…ふむふむ」と思っていただけたら嬉しいですが、中にはいろいろ文句をつけたい人もいるでしょう。それもまた正しい反応だと言えます。
今回の題材であるABCであっても、整数版と多項式版では色々相違点があります。
大きくは前節で述べたような、(整数版)と(多項式版)の違いがありますが他にもあります。
そもそも方や整数の大きさを比較していて、方や次数を比較しているのは同じABCとしてよいものか。。
だったり。
多項式版の方は(多少端折りましたが)高校範囲で証明できてしまうのに対し、整数版は今回「宇宙際タイヒミュラー理論」という壮大な理論を用いて証明されたもの。
だったり。
これが似ているというのは…うーんという気持ちもわきます。。
またABC以外にも、整数と多項式で類似の主張があります。二つご紹介しましょう。どれも泣く子も黙る大定理(予想)です。
皆さんご存じの整数版フェルマーの最終定理
しかし、この自然数という部分をそのまま多項式に書き換えたものに関しては(先ほどのABC定理を使って)初等的に示すことが出来ます。
少し難しい例になってしまいますがお許しください。
まず、リーマン予想というのは整数に深く関係している問題でミレニアム問題の一つに設定されています。
そして、ヴェイユ予想というのは(かなり乱暴な言い方をすれば)リーマン予想の多項式類似ということが出来ます。ヴェイユ予想も非常に難解であることには変わりありませんが、ドゥワークやグロタンディーク、ドリーニュといった20世紀の大数学者たちによって解決されています。
しかし、リーマン予想はいまだに難攻不落で未解決問題のままとなっています。
(こう聞くと整数の方が難しくて、多項式のが簡単なんだ!と思いがちですがそうともいいきれません。)
こうして説明していると、そろそろ
「似ていると言ったり、似ていないと言ったり、どっちなんだ!!!」
と怒りの声が聞こえてきそうですね。
ただこれに関して、少なくとも私のレベルでは「どちらともいえない」という他ありません。
似ていることもあれば、全然似てないこともある。
共通の道具が使えることもあれば、使えないこともある。
このような何とも言えない関係を踏まえて、先ほどは「不思議な類似性」という言葉を使いました。
そしてこの「不思議な類似性」を追いかけていくと歴史上の数学者たちが示した驚くべき定理や理論たちに出会うことができ、それは非常に魅力的なことだと思うわけです。
まとめ
という事で今回は「ABC予想」を題材に整数と多項式というテーマでお話しをしました。
いかがでしたでしょうか?
書いていくうちにテンションが上がってきてしまい、最後の方はほぼ個人の感想のようになってしまいましたね(笑)
読み返すのが恥ずかしい限りです。
それでも、この記事が誰かの共感を誘ったり、少しでも勉強のモチベーションアップにつながれば幸いです。
まあとにかく、望月先生の論文の査読が完了したのは本当にめでたい!
みんなで喜び合いましょう!バンザイ(/・ω・)/
では最後までご覧いただきありがとうございました!!
コメントはどんなものでも絶賛受け付け中です!
気に入ってくださった方は「読者になる」ボタンやTwitterフォローもポチッとお願いします!
それではまた次回お会いいたしましょう!
参考文献
ABC定理に関しては次の本を参考にしました。証明も詳しく載っています。
初等整数論 ―数論幾何への誘い― (共立講座 数学探検 6)
- 作者:山崎 隆雄
- 発売日: 2015/05/23
- メディア: 単行本
*1:あくまで「平たく言うと」です。査読が完了したからと言って完全に数学的に正しいかどうかが保証されたわけではありません。ただ、それを言い出すと中々言い回しが面倒になりますので今回はこのように書いています。ご了承ください。
*2:ただし、宇宙際タイヒミュラー理論の凄さはABC予想が解決できるから、という理由だけではないと思っています。
*3:実際には多項式版ABC定理は標数の体上の多項式環で成り立ちます
*4:この定義では、素式と多項式環における素元は別のものです。素元は既約性があれば十分ですが、今回は多項式環における素因数分解が本当に一意になるために、最高次の係数がという条件を課しました
*5:コメントやtwitterで質問してくださってもかまいません
*6:実際にはもっと強い条件も共有しています
2次体の単数群の構造。ペル方程式再び!
みなさま、ご無沙汰しております。ラスクです。
年末に挙げた微分加群の記事が非常に好評で、アクセス数なども安定してきました。
ありがとうございます。
さて、今回はペル方程式第二弾!と致しまして、その「代数的整数論への応用」を見たいと思います。
具体的には、「2次体の単数群」の構造をペル方程式によって決定できるという話をします。
今回の話は完全に大学数学の範囲になるため、代数学や代数的整数論の本当に基本的な内容は知っている人向けに書きます。
ただし、出てくる用語についてはその都度確認しながら進めるので、あまり自信のない方でも是非読んでみてください!
また、今回の記事の後半で実際にペル方程式を解くことになります。ペル方程式の解の構造や一般解の求め方については前回扱った記事があるので、まだ読んでいない方はこちらからどうぞ!!
mathforeveryone.hatenablog.com
では、さっそく始めていきましょう!
整数環とその単数群
以下を代数体、つまり有理数体の有限次拡大とします。
次の節以降ではもっぱらとして2次体を考えますが、この節では一般の代数体としておきます。
代数体の整数環
の整数環の定義を復習しましょう。
定義.
上代数的な元があるモニック(最高次の係数が1)な有理整数係数多項式の根になるとき代数的整数であるという。
また、の元であって代数的整数であるもの全体のなす環をの整数環といい、とあらわす。
の元をの整数という。
上の定義において、モニックという条件は非常に大切です。これがないと、上代数的な元全てが代数的整数になってしまい、代数的整数という言葉に意味がなくなってしまいます。
また、上の定義では代数的整数全体が環をなすことをしれっと言っていますが、実際にはこれは非自明なことで証明が必要です。ここでは長くなるので省略をしますが、一般的には「行列式の技法」というものを使うと示すことが出来ます。
整数環の概念に不慣れな人のために2次体での例を挙げてみます。慣れている方は読み飛ばしていただいて構いませんが、後半でこれらの例を使うことになるためご注意ください。
例1.
とします。このとき体の一般論から\begin{align} K=\mathbb{Q}+\mathbb{Q}\sqrt{2}=\{a+b\sqrt{2}\ |\ a,b\in\mathbb{Q}\} \end{align}と書けます。そしてその整数環は\begin{align} \mathcal{O}_K=\mathbb{Z}+\mathbb{Z}\sqrt{2}=\{a+b\sqrt{2}\ |\ a,b\in\mathbb{Z}\} \end{align}となります。つまり、などはの整数ですが、などはの整数ではありません。
例2.
次にとします。このときも\begin{align} \mathcal{O}_K=\mathbb{Z}+\mathbb{Z}\sqrt{5}\tag{×}\end{align}となると思いがちですがこれは間違いです!実際、は右辺の集合には含まれませんが、\begin{align}x^2-x-1\end{align}という多項式の根であることからの整数になります。
ただしくは、\begin{align}\mathcal{O}_K=\mathbb{Z}+\mathbb{Z}\frac{1+\sqrt{5}}{2}\end{align}となります。初めて見た方は「なんでやねん!」って感じかもしれませんね(笑)
上の例のように2次体については、その整数環をかなり具体的に書き表すことができ、事実として以下のことが成り立ちます。
命題1.
を平方因子を含まない整数とする。このとき2次体の整数環について以下が成り立つ。
(i)ならば\begin{align}\mathcal{O}_K=\mathbb{Z}+\mathbb{Z}\sqrt{D} \end{align}
(ii)ならば\begin{align}\mathcal{O}_K=\mathbb{Z}+\mathbb{Z}\frac{1+\sqrt{D}}{2} \end{align}
このとき整数は正である必要はなく、したがって虚2次体についても全く同様の表記ができることになります。
例えば、虚2次体については上の命題の(i)が適用でき、その整数環は\begin{align}\mathcal{O}_K=\mathbb{Z}+\mathbb{Z}\sqrt{-1} \end{align}となります。これはガウス整数環という名前のついた非常に有名なもので、複素平面上の格子点に対応しています。
一般の代数体の整数環がこのような具体的な表記を持つかどうかというのは非常に難しい問題です。しかし本記事では、殆どの話を2次体に絞ってしますので、まだ整数環に慣れないなあ、という人はひとまず上の例で見たような数全体の事だと思っておいて差し支えありません。
整数環の単数群
では次に、整数環の単数について確認します。
一般に可換環の元が単数(単元)であるとは、その乗法に関する逆元が(の中に)存在することを言います。つまり数式で書けば\begin{align}
r\in R\text{が単数}\iff \exists s\in R\ s.t.\ rs=sr=1\end{align}
ということです。単数と単数の積はまた単数であることと、が単数であることからの単数全体からなる集合は乗法に関して群をなします。これをと書いての単数群と呼びます。
上の定義をそのままに適用すれば、の単数群が得られます。今回はこのの構造を調べていこうというわけです。
さて、これで一通り準備が済んだのでこのまま次節に進んでも良いのですが、もう少しだけ疑問が残りますね。
それは「なぜ単数群の構造を知りたいのか?」ということです。
一般の可換環において単数群というのは重要なものだから、と言ってしまえばそれまでですが、それではあんまりですね…。
ここではイデアルとの関係性からもう一歩踏み込んでお話ししたいと思います。
なぜ単数群を考えるのか。
皆さんご存知の通り有理整数環上では一意的な素因数分解が出来ました。
しかし、を拡張したではもはやこれは成り立ちません。
ではどうするのか。その一つの打開策として「イデアル」を考えるという方法が挙げられます。
では一意的な素因数分解は出来ませんが、一意的な素イデアル分解はできるということが知られています*1。素イデアル分解とは例えばガウス整数環におけるイデアル]を以下のように分解することを言います。
\begin{align}
(5)=(2+\sqrt{-1})(2-\sqrt{-1})
\end{align}
ここでやはそれぞれの素イデアルになっています。
このとき人によっては、別の分解として
\begin{align}
(5)=(-2-\sqrt{-1})(-2+\sqrt{-1})
\end{align}
や
\begin{align}
(5)=(-1+2\sqrt{-1})(1+2\sqrt{-1})
\end{align}
も考えられるじゃないか!全然一意じゃないじゃん!と思われるかもしれません。
しかし、今はあくまでイデアルとして一意であることを主張しているので上の3つの分解は全て同じことを表しています。
例えばとはその生成元が
\begin{align}
{}-1+2\sqrt{-1}=\sqrt{-1}(2+\sqrt{-1})
\end{align}
というように単数()倍で写り合うのでイデアルとしては全く同じものになっています。
だんだん、なぜ単数が重要なのかわかってきたでしょうか?
もう少し正確に書いて整理しておきましょう。
いままではの通常のイデアルのみを考えてきましたが、ここからは一般にの分数イデアルを考えます。
このように定めることによって以外の任意の分数イデアルはイデアルの積に関する逆元を持ち、は群をなします。(単位元は)
さらに、先ほど言ったようにでは一意的な素イデアル分解ができます*2。
そこでの元に、その元が(上)生成する単項分数イデアルを対応させ、数の世界からイデアルの世界への写像を得ます。
\begin{align}
\Phi:&K^*&\longrightarrow &\mathcal{I}_K \\
&a&\longmapsto&(a):=a\mathcal{O}_K
\end{align}
これは明らかに群準同型になっています。
このようにして素因数分解が出来ない、という弱点を克服しようとしているわけです。
しかしこの際、問題点が二つあります。
一つは先ほど見たように「単数倍の違いが無視されてしまう」ということ。
とは数としては当然違うものですが、そのズレは単数なのでによって写すと同じものになってしまいます。
つまり単数群はという写像の核になっています。
言うならば、
は数の世界からイデアルの世界に写す際に失われてしまう情報を握っている
わけです。
こう聞けば、単数群の構造を知りたいと言うのもうなずけるのではないでしょうか。
また、もう一つの問題点は「が一般には全射とは限らない」と言うことです。
これは今回の主題からは外れてしまうので簡単に済ませますが、一般にが単項イデアル整域とは限らないのでによる像の外側にもイデアルがあるわけです。
これは、数の世界からイデアルの世界に写すときに世界が広がってしまうことを表していて、その広がりの大きさを表すものとしてイデアル類群があります。
こちらも代数的整数論の主役級に大事なものですが今回は紹介にとどめたいと思います。
では次の節から実際に単数群の構造を調べていきましょう。
2次体の単数群
代数体のノルム
まずはじめに整数環の元が単数であることのいい換えをしておきましょう。
代数体(一般には任意の有限次拡大)に対して、ノルム写像というものががあります。\begin{align}
N_{K/\mathbb{Q}}:K\longrightarrow\mathbb{Q}
\end{align}
これは、各元にをかけるような線形写像の(ある基底に関する表現行列の)行列式をとするものでした。\begin{align} N_{K/\mathbb{Q}}(a)=\det{(f_a)}\end{align}
定義から直ちにが従います。
このときはと共役な元(つまり最小多項式を共有するもの)を全てかけた値に等しくなることが簡単に示せます。すると根と係数の関係からはの最小多項式の定数項の倍とも等しいことになります。
もしならば、その最小多項式は有理整数係数ですから、そのノルムはに入るということがわかりました。これは重要なので再度式で書いておきます。\begin{align}a\in\mathcal{O}_K\Longrightarrow N_{K/\mathbb{Q}}(a)\in\mathbb{Z}\end{align}
もう一つノルムの重要な性質として乗法性というものがあります。
命題2.
を代数体、をノルム写像とする。このとき任意のに対して\begin{align} N_{K/\mathbb{Q}}(1)&=1\\
N_{K/\mathbb{Q}}(ab)&= N_{K/\mathbb{Q}}(a)N_{K/\mathbb{Q}}(b)\end{align}が成り立つ。
簡単なので証明しておきましょう。
証明.
まず、に対しては恒等写像なのでその行列式はである。
したがって。
また任意のに対しはをかけるような写像であったから、との合成に一致する。\begin{align}f_{ab}=f_a\circ f_b\end{align}
するとの上の基底を一つ取ったときに、その基底に関するの表現行列は、の表現行列との表現行列の積に等しい。
よって行列式の乗法性から\begin{align} N_{K/\mathbb{Q}}(ab)= N_{K/\mathbb{Q}}(a)N_{K/\mathbb{Q}}(b)\end{align}
を得る。
これで、以下の命題の証明をする準備が整いました。
命題3.
を代数体、をその整数環、をノルム写像とする。このとき次が成り立つ。\begin{align}\mathcal{O}_K^*=\{u\in\mathcal{O}_K\ |\ N_{K/\mathbb{Q}}(u)=\pm 1\}\end{align}
証明.
とすると、そのノルムはの単数であるから、となる。
逆にがを満たする。
このとき、の上の共役元をとすると、ノルムの性質から\begin{align}u(u_2\cdots u_n)=\pm1\end{align}
が成り立つ。よって
右辺がのときはが、
右辺がのときはが
それぞれの逆元となる。
ここではは全ての整数である。
よって、どちらの場合もがの中に逆元を持つことがわかり、を得る。
以上から、代数体の整数環の単数というのは、整数のうちノルムがのものと特徴付けることができました。
これを使って2次体の単数群を決定しましょう!!
2次体の単数群
ここまでは一般の代数体を考えてきましたが、以下、を平方因子を持たない整数、とします。
そして以下、簡単のため\begin{align}D\equiv 2,3\mod{4}\end{align}とします。のケースもほぼ同じ議論ができますが、多少調整が必要になってしまうので、この記事では上のケースのみを扱います。
命題1.からの整数環は\begin{align}\mathcal{O}_K=\mathbb{Z}+\mathbb{Z}\sqrt{D}\end{align}
と書き表せていました。
また、の共役元はなので、ノルム写像については\begin{align}N_{K/\mathbb{Q}}(z)=zz'=x^2-Dy^2\end{align}
と簡単に計算できます。
というわけで、これと命題3.を合わせると単数群は\begin{align}\mathcal{O}_K^*=\{x+y\sqrt{D}\mid x,y\in\mathbb{Z},x^2-Dy^2=\pm 1\} \tag{1}\end{align}
と表すことができました!!
さて、この\begin{align}x^2-Dy^2=\pm 1 \tag{2}\end{align}
という方程式、どこかで見たことありますね。そう!これこそ前回の記事で扱ったペル方程式です!!(まあ、タイトルに書いてあるんだからそれしかないですが笑)
ということで、単数を決定することは、(2)のペル方程式を解くことに他ならない!ということがわかりました。
そしてペル方程式の解き方はもう既にやっているので、これで晴れて2次体の単数群の構造がわかると言うことです!!なかなかかっこいい戦略ですよね!
余談ですが、前回の記事でいきなりペル方程式の右辺をからにしたのは、ノルムがであるという単数条件に合わせるためだったわけです。
ここでペル方程式の解き方を簡単におさらいしましょう。忘れてしまった方は前回の記事をご覧ください!
(Ⅰ)の連分数展開を求める。
(Ⅱ)そこからの近似分数を求めると、その分子と分母が最小解になっている
(Ⅲ)最小解をとし、整数を以下の式で定める。
\begin{align}
x_n+y_n\sqrt{D}=(x_1+y_1\sqrt{D})^n
\end{align}
このとき、ペル方程式の整数解の集合は
\begin{align}
\{\pm(x_n,y_n)\ |\ n\in\mathbb{Z}\}
\end{align}
と一致する
つまりペル方程式の最小解を使えばの単数群は\begin{align}\mathcal{O}_K^*=\{\pm(x_1+y_1\sqrt{D})^n \mid n\in\mathbb{Z}\}\end{align}とあらわすことが出来るわけです!
ここまでくるともはや2次体の単数群は、の連分数展開さえすれば決定できると言ってしまえるわけです!
どうでしょう?単数群という中々掴みづらい対象が、かなり簡単なアルゴリズムによって明確に表示できました。これがペル方程式の力なのです!
ということで、次の節では具体的な2次体の単数群を決定していきましょう!
具体的な2次体の単数群
実2次体の場合
例3.
まずはの整数環の単数群を決定しましょう。
今、ですから、前節の議論によりペル方程式\begin{align}x^2-2y^2=\pm 1\end{align}を解けばよいことになります。
の連分数展開は前回も求めましたが、\begin{align}
\sqrt{2}&=1+\frac{1}{2+\frac{1}{2+\frac{1}{2+\ddots}}}\\&=[1;(2)]
\end{align}
です。すなわちその近似分数はになり、最小解はであることがわかります。
よっての単数群は\begin{align}\mathcal{O}_K^*&=\{\pm(1+\sqrt{2})^n \mid n\in\mathbb{Z}\}\\&=\pm(1+\sqrt{2})\end{align}となります!ただし、最後のはが生成する巡回群を表しています。
例4.
もうひとつだけ実2次体の例を見ましょう。
の連分数展開も前回求めており、結果だけ書けば\begin{align}\sqrt{7}=[2;(1,1,1,4)]\end{align}で、その近似分数はです。よって、先ほど同様の単数群は\begin{align}\mathcal{O}_K^*=\{\pm(8+3\sqrt{7})^n \mid n\in\mathbb{Z}\}=\pm(8+3\sqrt{7})\end{align}となります!
他にもであるようなに対しては同様に単数群を決定できますので、是非いろいろと手を動かして計算してみてください!
虚2次体の場合
最後に虚2次体の単数群についてお話します。
このときも実2次体の時と同様、具体的な体に対応するペル方程式を解くことで単数群を決定することが出来ます。しかし、虚2次体の場合はもっとストレートに単数群の構造を求めることが出来ますのでそちらをご紹介します。
一つ注意として、このセクション内でのみの場合も許すことにします。(ただしが平方因子を含まないことは仮定します。)
結論としては以下の命題が成り立ちます。
命題4.
を虚2次体とする()。このときの整数環の単数群について以下が成り立つ。
(i)のとき、
(ii)のとき、
(iii)それ以外のとき、
まずは証明しましょう。
証明.
を任意に一つ取り、()とあらわす。
このとき命題1.からが成り立つ。
命題3.から\begin{align}
u\in\mathcal{O}_K^*\iff N_{K/\mathbb{Q}}(u)=\pm 1\end{align}
であった。いまとすると、より\begin{align}N_{K/\mathbb{Q}}(u)=\pm 1\iff a^2=\pm 1\iff a=\pm 1\end{align}となる。また、根と係数の関係よりは2次方程式\begin{align}X^2-2aX\pm 1=0\end{align}の根になるから、\begin{align}u=\frac{2a\pm\sqrt{(2a)^2\pm4}}{2}\end{align}と表せる。ここで、とすると、であるから、\begin{align}(2a)^2\pm4<0\end{align}でなくてはならず、と合わせると、これはの符号がマイナスで、のときしか成り立たない。
以上から虚2次体の単数の候補は\begin{align}\pm 1,\pm\sqrt{-1},\pm\frac{1\pm\sqrt{-3}}{2}\end{align}しかない。これらが実際に単数であることはすぐに確かめられる。
のときはを、のときはを、
それ以外のときにはのみをそれぞれ含む。
この命題によって、特に虚2次体の単数群は有限群であることがわかります。実2次体の単数群は無限群ですから*3、ここは大きく様子が異なることが見て取れます。
ここで、前半の素イデアル分解の話を思い出しましょう。整数環の単数群とは、数の世界からイデアルの世界に移す写像の核でした。したがって、イデアルの世界において
虚2次体では有限個の"数"が同一視されるのに対し、実2次体では無限個の"数"が同一視される
ということがわかりますね。こういった観点で見ると虚2次体の方が実2次体よりも少し簡単な構造をしているような気がしてきます。
まとめ
とうことで今回は2次体の単数群の決定をしていきました、いかがでしたでしょうか?
ペル方程式のつよつよ具合が少しでも伝わったでしょうか?(笑)
最後に少しだけ発展的な話をします。
実2次体の単数群を決定したとき、その形は(符号)(巡回群)という形になっていたのに気づいたでしょうか?
実はこれと同様のことが任意の代数体でも成り立ち、単数群は有限アーベル群といくつかの巡回群の直積で書けることが知られています。これはディリクレの単数定理と呼ばれていて、代数的整数論の基礎となる大定理の片翼になります*4。
このことが先にわかっていれば、前回の記事でなぜペル方程式の解が最小解で生成されているのかというのがわかりますね。
このようにそれぞれの巡回群の生成元となっているものを代数体の基本単数といいます。
ただ、じゃあ一体いくつの巡回群の直積なのか?有限アーベル群って言ってもどれくらいの大きさなのか?という疑問が生じます。それについて詳しく話すことは今回できないので、ご興味があれば最後に紹介する参考文献を見てください!
しかし、単数群という中々とりとめもない対象がここまで綺麗な群構造を持っているというのは何度見ても不思議ですね…(笑)
では最後までご覧いただきありがとうございました!!
コメントはどんなものでも絶賛受け付け中です!
気に入ってくださった方は「読者になる」ボタンやTwitterフォローもポチッとお願いします!
それではまた次回お会いいたしましょう!
微分加群!~その定義と応用~
皆さん、こんにちは。ラスクです。
この記事は日曜数学 Advent Calendar 2019 - Adventarの17日目の記事です。
adventar.org
昨日は、はるさんの「結婚式→Riesz の表現定理→bra-ket 記法」でした。
haru-negami.hatenablog.com
せっかくのアドカレですので、自分は専門に近い「微分加群」について話したいと思います。
この概念はあまり広くは知られていませんが、知ってみると面白いことがいろいろと出てくるので、今回はその雰囲気だけでも知っていただければと思います。
少々、長めですが予備知識としては「線形代数」と簡単な「可換環論」のみですので、ぜひ最後まで読んでみてください!
では、始めます。
微分加群
微分環と微分加群
定義
を可換環とする。が以下の条件を満たすとき、における微分(または導分)という。
(1)は加法的、つまりアーベル群の準同型である。
(2)任意のに対して\begin{align}d(ab)=d(a)b+ad(b)\end{align}が成り立つ(ライプニッツ則)。
とその微分の組を微分環という。
またが体であるとき、を微分体という。
微分環とはその名の通り、環に微分構造を付加したようなものということですね。
抽象的な数学において微分とは、加法的かつ、何らかの意味のライプニッツ則を満たすような写像のことを指すことが多いですが、ここでもそのように定めています。
この記事では今後と書いたら微分環(または体)における微分を表すことにし、単にを微分環などということにします。
定義
を微分環、を加群とする。このときが以下の条件を満たすとき、における微分(または導分)という。
(1)は加法的、つまりアーベル群の準同型である。
(2)任意のに対して\begin{align}D(am)=d(a)m+aD(m)\end{align}が成り立つ(ライプニッツ則)。
とその微分の組を上の微分加群という。
こちらもほぼ同様の定義ですが、(2)の条件はスカラー倍に対してのライプニッツ則を述べていることに注意しましょう。
当然のことですが、が体のときははベクトル空間となります。この場合、は微分ベクトル空間とでも呼ぶべきかもしれませんが、あまり一般的な名称ではないようなので、気にせず微分加群と呼んでしまうことにします。
(後半では主に微分体上の微分加群を考えます。)
先ほどと同様と書いたら微分加群における微分を表すことにし、単にを上の微分加群ということにします。
例
(複素係数の有理関数体)は通常の微分に関して微分体をなす。
そして上の加群はその成分ごとの微分により微分加群をなす。
このようなものは自明な微分加群と言われ、非常に単純な構造を持っています。より一般の微分加群の定め方については次の項目を参照してください。
また、はなどに関しても微分体をなす。
微分の行列表示
ベクトル空間上の線形写像(変換)が与えられたとき、何か一つ基底を固定すれば、その行列表示(表現行列)が定まりました。そうすることで、線型写像を行列の演算として具体的に表すことができたのでした。
微分環上の微分加群についても同じようなことができます。
定義
を微分環、を上の微分加群とする。いまが上有限生成かつ自由であるとする*1。
このとき、の上のある基底に対して、の表現行列を以下の式で定める。\begin{align}D(e_j)=\sum_{i=1}^nA_{ij}e_i\tag{1}\end{align}つまりは\begin{align}(D(e_1),\ldots,D(e_n))=(e_1,\ldots,e_n)A\end{align}を満たすような行列である。
この定義は、線型写像の表現行列と全く同様なので特に疑問はないかとおもいます。
線型写像の場合、ベクトル空間の元を(基底をとって)列ベクトルと同一視したとき、その行き先はを左からかけるという操作によって与えられました。
ではのときはどうでしょうか?
の元を基底を用いて\begin{align}m=c_1e_1+\ldots+c_ne_n\ (c_i\in R)\end{align}と表します。の表現行列を用いて、を計算すると\begin{align}D(m)&=d(c_1)e_1+\ldots+d(c_n)e_n+c_1D(e_1)+c_nD(e_n)\\&=d(c_1)e_1+\ldots+d(c_n)e_n+c_1\sum_{i=1}^nA_{i,1}e_i+\ldots+c_n\sum_{i=1}^nA_{in}e_i\\&=\sum_{i=1}(\sum_{j=1}^nA_{ij}c_j+d(c_i))e_i\end{align}となります。
ここで、一つ目の等号はの加法性とライプニッツ則、二つ目の等号は(1)式を使っています。
これによりのによる表示ができました。つまり、を列ベクトルと同一視すればは
\begin{align}D(m)=A \left(
\begin{array}{c}
c_1 \\
c_2 \\
\vdots \\
c_n
\end{array}
\right)+ d\left(
\begin{array}{c}
c_1 \\
c_2 \\
\vdots \\
c_n
\end{array}
\right)
\end{align}とかけます。(二項目は成分ごとにを作用させたものを表しています。)
こうしてみるとライプニッツ則の様子がよくわかりますね!
行列がかけられている左側の部分はいうなればの線形部分で、そこに右側のが作用している部分が足されているわけです。
このようにして微分から行列表示をえましたが、逆に行列を与えれば、それに応じたを定めることもできます。
これでの作用についても行列の言葉で書けることがわかりました。
すると今度は「表現行列を簡単にするように基底を取ることができるか?」という自然な疑問が湧きます。そのような問題に関する事柄を後半でご紹介したいと思います。
ちなみに、線形代数では上の疑問に対する一種の答えとして、「ジョルダン標準形」という理論がありました。実は微分加群に対しても似たようなことが成り立つ状況があるのですが、それを紹介するのは非常に骨が折れますので今回は止めることにします。
双対微分加群
ここで次の節に行く前にもう一つだけ準備をします。
一般の加群に対してはその双対というものが考えられました。
これはからへの線型写像のなす集合に通常の和とスカラー倍が定義された加群です。
そしてが微分加群の時には、その双対にも微分の構造を入れることができます。
定義
を微分環、を上の微分加群とする。このとき以下によってを定義する;\begin{align}D^*(f)(m)=d(f(m))-f(D(m))\ (f\in M^*=Hom_R(M,R),m\in M)\end{align}するとは上の微分となり、は上の微分加群をなす。
これをの双対微分加群と呼ぶ。
上の定義でが本当に上の微分になってるか(つまり加法的で、ライプニッツ則を満たすか)というのは確認するべきですが、難しくないので省略をいたします。
今後、には常に上で定めた微分が入っていることにし、単にの双対微分加群などと呼ぶことにします。
次に微分加群の双対を取ることによって、その行列表示がどのように変わるかを見ていきます。
まず上の微分加群の基底を一つ固定します。
すると上にはその双対基底が存在するのでした。これは以下の式で定まるようなの元です。
\begin{align}e_i^*(e_j)=\begin{cases}
1\ (i=j) \\
0\ (i\neq j)
\end{cases}\end{align}
では、に関するの表現行列がのときにに関するの表現行列はどうなるでしょうか?少し想像すればわかるかもしませんが、結論としてはとなります。
簡単に理由を説明しましょう。と表されていたとすると、双対基底の定義および、(2)式から
\begin{align}B_{ij}=D^*(e_j^*)(e_i)&=d(e_j^*(e_i))-e_j^*(D(e_i))\\
&=-e_j^*(A_{1i}e_1+\ldots+A_{ni}e_n)\\
&=-A_{ji}\end{align}となります。よって確かにの表現行列がと等しいことがわかりますね。
上の説明がよくわからなかった人は、とにかく「双対をとったら表現行列は転置のマイナスになる」とだけ覚えておいてください。
このことは非常に重要で本記事の最後に使います。
twisted polynomialと巡回ベクトル
ベクトル空間とその上の線形変換
体上のベクトル空間とその上の線形変換が与えられた時、多項式環からへの作用が以下のように定まります。
\begin{align}F[T]\times V&\longrightarrow V\\
(P(T),v)&\mapsto P(f)(v)=P_mf^m(v)+\ldots+P_1f(v)+P_0v\end{align}(ただしとする。)
このときという集合はのイデアルをなし、が単項イデアル整域であることからあるモニックな多項式が存在し、となります。
このようなをの最小多項式と言いました。一般にの最小多項式はの特性多項式の約数となります。
ここでもし、あるが存在して、がの基底をなすとすると、最小多項式は特性多項式に一致し以下のベクトル空間の同型があります。
\begin{align}F[T]/F[T] P\simeq V\end{align}
さらに、左辺のにはによる自然な作用(つまりをかけるもの)を入れることにすると、上の同型は作用も込みで同型になることがわかります。
このようにして抽象的なベクトル空間とその上のを、という非常に具体的な形で表すことができました。
twisted polynomial
以下、を微分体、をその上の微分加群としましょう。このとき、上の微分に関して、上でやったようにからへの作用を作りたいのですが、このままではうまくいきません。
なぜなら一般には線形ではないので、例えばに関して\begin{align}D(av)=d(a)v+aD(v)\neq aD(v)\end{align}となってしまい、の演算と作用がマッチしません。そこでに合わせた、すなわちライプニッツ則に合わせた、新しい多項式環を定義します。
定義
微分体上の1変数多項式の集合に通常の和と、\begin{align}Ta=aT+d(a)\ (a\in F)\tag{3}\end{align}によって定まる積を入れた非可換環をと表しtwisted polynomial ring(また、その元をtwisted polynomial)という。
さて、何を言っているかわかりますでしょうか?
ベクトルを定数倍してから微分する際、その結果は”単に定数を外に出して微分したもの”と”係数を微分してベクトルはそのままにしたもの”の和になります。
そのようなライプニッツ則を機械的に多項式の言葉で置き換えると(3)式のようになるので、それを積の定義として採用しているわけです。
試しに少し計算してみると、例えば
\begin{align}T(aT+b)&=(Ta)T+Tb\\&=(aT+d(a))T+(bT+d(b))\\&=aT^2+(d(a)+b)T+d(b)\end{align}となります。
まだよくわからない方は、ぜひご自分で色々計算してみてください!
ここでは一般に非可換になることに注意しましょう*2。
しかし、このでも通常の多項式と同じように割り算アルゴリズムが実行でき、任意の左(右)イデアルが単項生成になります。
そして、このようにして定めたから元々の微分加群に作用ができます。
\begin{align}F\{T\}\times V&\longrightarrow V\\
(P(T),v)&\mapsto P(D)(v)=P_mD^m(v)+\ldots+P_1D(v)+P_0v\end{align}(ただしとする。)
これで、線形変換のときと同様の作用を考えることができました。
巡回ベクトル
もう一つ重要な概念を定義しましょう。
これも、線型写像で考えたものの類似ですね。
に巡回ベクトルが存在すると仮定すると、
\begin{align}F\{T\}&\longrightarrow V\\f(T)&\mapsto f(D)(v)\end{align}によって定まる写像は全射な準同型になります。その核はの左イデアルになりますが、全ての左イデアルは単項生成だったので、あるを用いてと書くことができます。したがって準同型定理から同型\begin{align}F\{T\}/F\{T\}P\simeq V\end{align}を得ます。
このようにして微分加群も、巡回ベクトルが存在すればと具体的に表すことができました。
今からいうことは少し雑な話になりますが、ここで出てきたはtwisted polynomialですので常微分方程式と考えることができます。なので逆に、考えたい常微分方程式があったとしたら、をその方程式で割ることにより、対応する微分加群を得ることができます。*3。
このようにして、常微分方程式という解析的な(?)対象を加群という代数的な対象にうつしてその性質を調べることができるという寸法です。
なかなか、面白いですね!!
さて、上の話は全て巡回ベクトルの存在性を仮定しています。一般の体(あるいは環)上の微分加群に巡回ベクトルが存在するかどうかはケースバイケースですが、実はよく考えている体上であればこれは必ず存在するということが知られています。
そちらをご紹介しましょう。
この定理の証明も非常に面白いですが、今回は割愛することにいたします。
連立一階微分方程式の高階化
では最後に今までの話の応用をひとつだけご紹介します。
を標数の体とします。やなどを想像してください。
よく知られているように、を係数にもつ*4任意の階線形常微分方程式\begin{align}y^{(n)}+p_1(z)y^{(n-1)}+\ldots +p_n(z)y=0\tag{4}\end{align}は、未知関数を増やすことにより一階連立微分方程式に変形することができました。
具体的には、と置くと、上の方程式(4)は
\begin{align}\begin{cases} y_i’=y_{i+1}\ (i=0,\ldots,n-1)\\y_n+p_1(z)y_{n-1}+\ldots+p_n(z)y_0=0\end{cases}\end{align}
と同値になり、これを行列を用いて表すと
\begin{align}\frac{d}{dt}\left(\begin{array}{c}y_1\\y_2\\ \vdots\\y_n\end{array}\right)=\left(
\begin{array}{ccccc}
& 1 & & & \\
& &1 & &\\
& && \ddots & \\
& & & &1\\
p_n(z)&p_{n-1}(z)&\ldots&&p_1(z)
\end{array}
\right)
\left(\begin{array}{c}y_1\\y_2\\ \vdots\\y_n\end{array}\right)\end{align}となります。
逆に、任意の係数一階連立微分方程式が与えられたとき、それを単独の高階方程式に直すことができます。
このことを微分加群を用いて、説明しましょう。
まず、元一階連立方程式を与えるということはを要素にもつ行列を与えるということに他なりません。この時、上で説明したことからなんらかの変数変換を施して、行列を
\begin{align}\left(
\begin{array}{ccccc}
& 1 & & & \\
& &1 & &\\
& && \ddots & \\
& & & &1\\
*&*&\ldots&&*
\end{array}
\right)\end{align}という形に変形できればこれは(4)の単独高階方程式と同値になります。
次に、行列によって定まる上の次元微分加群をとします。つまりベクトル空間に
\begin{align}D\left(
\begin{array}{c}
c_1 \\
c_2 \\
\vdots \\
c_n
\end{array}
\right)=-A \left(
\begin{array}{c}
c_1 \\
c_2 \\
\vdots \\
c_n
\end{array}
\right)+ \left(
\begin{array}{c}
c_1 \\
c_2 \\
\vdots \\
c_n
\end{array}
\right)
\end{align}
で定まるような微分を入れます。
するととなることが、考えている方程式の解になることと同値になります。
そして、の基底を"良いもの"に取り替えることにより、このの表現行列を
\begin{align}\left(
\begin{array}{ccccc}
& -1 & & & \\
& &-1 & &\\
& && \ddots & \\
& & & &-1\\
*&*&\ldots&&*
\end{array}
\right)\end{align}という形にしたいわけです*5。
では、どのような基底をとれば良いでしょうか?
勘の良い方ならお気づきだと思いますが、巡回ベクトルを使います。
しかし、ただ単純にの巡回ベクトルをとっても上の形の表現行列にならないので、少し工夫が必要です。どうすれば良いでしょう。。。
答えは「双対加群に対して巡回ベクトルをとれば良い」ことになります!!
やってみましょう。
まず、の双対を考えます。も(標数)上の微分加群ですから巡回ベクトルが存在します。そこでに対しての表現行列を考えると、
\begin{align}\left(
\begin{array}{ccccc}
& & & &q_n(z) \\
1& & & &q_{n-1}(z)\\
& 1 && & \\
& & \ddots & &\vdots\\
& & & 1& q_1(z)
\end{array}
\right)\end{align}となります。ここではを満たすようなものです。添え字のつけ方がおかしいのは次に転置を取るためです。
そして、の双対基底をの基底として採用すれば、「双対をとったら表現行列は転置のマイナスになる」ことからの表現行列は
\begin{align}\left(\begin{array}{ccccc}
& -1 & & & \\
& &-1 & &\\
& && \ddots & \\
& & & &-1\\
-q_n(z)&-q_{n-1}(z)&\ldots&&-q_1(z)
\end{array}
\right)\end{align}となります。
これで求めたい形の行列を得ることができました!!!
結論をまとめます。
によって定まる連立一階微分方程式を単独高階微分方程式に直すには
①によって定まる微分加群を考える。
②その双対微分加群の巡回ベクトルを持ってくる。
③その双対基底を並べた行列によって、未知関数を変数変換することにより単独の方程式への変形が完了する。
いかがでしたでしょうか?巡回ベクトルの便利さが伝わりましたでしょうか?
おわりに
さて、今回は「微分加群」について基本的な定義とそのちょっとした応用をしていきました。
お楽しみいただけましたでしょうか?
最後に、自分がこの概念を面白いと思う理由を二つ挙げたいと思います。
一つは微分方程式をcordinate freeに考えられるという事。
つまり、数多ある変数変換を全部ひっくるめてという作用素が定義されているように見えるという事です。
考えてみれば、線形写像を定める際も別に基底を取る必要は必ずしもないわけですから、そのような考えからするとこちらも自然かもしれません。
もう一つは、この「微分加群」をもとにして「微分ガロア理論」や「局所体上の微分方程式論」など豊かな理論が作られることです。この話は今回の記事だけでは一切わからないと思いますが、学ぶきっかけとしていただければ幸いです。
では最後までご覧いただきありがとうございました!!
アドベントカレンダーはまだ続きますので、お楽しみに。
コメントはどんなものでも絶賛受け付け中です!
気に入ってくださった方は「読者になる」ボタンやTwitterフォローもポチッとお願いします!
それではまた次回お会いいたしましょう!
参考文献
基本的には次の本を参考にしました。
www.amazon.co.jp
また、自分のリサーチが足りず書き始めてから気づいたのですが、ラブルさんという方が、今回の記事とかなり近い内容をすでにブログに挙げられていました。申し訳ありません。以下、リンクを張りますのでどうぞこちらもご覧になってください。
tetobourbaki.hatenablog.com
ペル方程式の解法!ヘイスティングズの戦いにおける兵数は?
みなさまこんにちは、ラスクです。
9月も終わりを迎え、ようやく暑さも和らいできましたね。
この挨拶の部分も若干ネタ切れ感が出てきてきました。。
そんなことはどうでもいいとして、内容に入りましょう!!
今回は、「ヘイスティングズの戦い」という歴史的事件をもとにした、ある問題を解くことを目標にしつつ、それに関連するペル方程式の話をしていきたいと思います。
ペル方程式自体はそこそこ有名な対象なのでネットを探せば様々な記事がヒットしますが、「ヘイスティングズの戦い」について触れているものは僕の知る限りほとんどありませんでした。
なので今回、詳しく話していこうと思います。
また(特に意図があったわけではないのですが)、今までの記事の内容は私の専門である「整数論」の内容とは少し異なるものが多かったです。
しかし今回話す、ペル方程式は「代数的整数論」において非常に重要な対象として登場します。
なので、そのあたりの話も絶対に書きたい*1、と思っています。
これについては次回以降の記事になりますので、今回の記事が気に入っていただけた方は、是非そちらもアップされ次第読んでみてください!
では前置きはこれくらいにして始めていきましょう!!
ハロルド2世の軍の兵数は?
今回考える問題は次のようなものです。
かつてのイングランド王ハロルド2世の軍は古来からの慣わしで、同じ大きさの13個の正方形をなすように編成されていた。
その後ハロルド2世自身が「ヘイスティングズの戦い」の戦場に現れると、兵士たちはその王を頂点に一つの巨大な正方形をなして突撃したという。
では、ハロルド2世の軍は何人だったのだろうか。
意味はお分かりいただけたでしょうか。
私はこの問題を、ノイキルヒの『代数的整数論』(非常に有名な整数論の教科書)で知りました。
この本の演習問題の一つとして上の内容が載っているのですが、普通の数学の問題が並ぶ中、明らかにこれだけ異様なオーラを放っています(笑)
というのも、この本の原文にはもっとメッセージ性の強い語調で上の問題が記されています。
今回、私は皆さんに伝わりやすいように多少文章を簡単にしていますが、なかなか数学の問題に個人の感情をのせることはないと思うので是非興味のある方は調べてみてください。
ちなみにヘイスティングズの戦いとは、ノルマンディー公ギヨーム2世とイングランド王ハロルド2世がイングランド領をめぐって争った会戦のことです。恥ずかしながら、これ以上のことはよく知らないので気になる方はWikipediaの記事をお読みください。
少し余談が長くなりましたが、数学の話をしましょう。
上の問題を数式で表していきます。
王が加わってできた巨大な正方形の一辺の人数を人、もともとの13個あった正方形の一辺の人数を人とする。
このとき
\begin{align}
x^2=13y^2+1
\end{align}
つまり
\begin{align}
x^2-13y^2=1 \tag{1}
\end{align}
が成り立ちます。
したがって上の問題は(1)式を満たすような自然数解を求めよ、と言われていることに他なりません。
実はこの式がペル方程式と呼ばれるものの一種になっています。
定義
を平方数でない自然数とする。
\begin{align}
x^2-Dy^2=1 \tag{2}
\end{align}
という形の方程式をペル方程式という。
今回目標となっているのは、のケースですね。
そこで次の章から、このペル方程式の整数解の求め方について詳しく見ていくことにします!
ペル方程式の解法
一般解の構造
一般にペル方程式(2)はどのようなに対しても無数の整数解をもつことが知られています。
そして、それらの解の間には非常に簡明で美しい法則があることも知られています。まずはそちらを紹介しましょう。
ここで、以下の話の都合上(2)式の右辺をに変えたものを考えることにし、これもペル方程式と呼んでしまうことにします。つまり次のような方程式を考えるという事です。
\begin{align}
x^2-Dy^2=\pm 1 \tag{3}
\end{align}
なぜ、こんなことをするの?考えてる問題と違うじゃん!という声が聞こえてきそうですが、ちゃんと最後には(2)式に戻りますので、ご安心を。このようにする理由については別の記事でゆっくりお話ししたいと思います。
さて、次に以下の補題を用意します。
補題
をペル方程式の正の整数解とする。
このとき、
かつまたは
が成り立つ。
この補題において右向きの矢印は当然成り立つので、非自明なのは左向きの矢印です。
証明はそこまで難しくないので、省略しますが、左向きの矢印の言っていることを言葉にすると
「ペアの片方が相手より小さいならば、もう片方も相手より小さい」
となります。
このことから、ペル方程式の最小解というものが以下のように定義できます。
定義
ペル方程式の正の整数解のうち、
が最小となるようなものを、その方程式の最小解という。
このとき上の補題により、も自動的に最小になる。
一つ注意しておきます。
すべてのペル方程式はという自明な解をもちます。しかしこれは、最小解ではありません。
なぜなら、最小解は正の整数解から選んでいたので、がであるこの解は絶対に最小解にはなりえないのです。
うっかりしていると間違えてしまうので、定義はしっかり読むことが大事です。
これで、各ペル方程式に対して、その最小解が定まったので一般解の構造に関する定理を述べましょう。
定理
ペル方程式
\begin{align}
x^2-Dy^2=\pm 1 \tag{3}
\end{align}
の最小解をとする。また、整数を以下の式で定める。
\begin{align}
x_n+y_n\sqrt{D}=(x_1+y_1\sqrt{D})^n \tag{4}
\end{align}
このとき、(3)の整数解の集合は
\begin{align}
\{\color{red}{\pm}(x_n,y_n)\ |\ n\in\mathbb{Z}\}
\end{align}
と一致する*2
追記
記事を投稿した時点ではペル方程式の整数解の集合に(上の式で赤字にした部分)をつけるのを忘れてしました。
ペル方程式にはの2乗しか現れないので、が解となるなら当然も解になります。
自然数解だけを知りたい場合にはいらないので、のちの議論にはさほど影響しません。
大変失礼いたしました。
お分かりいただけたでしょうか?
つまり何が言いたいかというと、ペル方程式の”最小解がわかれば”、
無数にあるすべての解を知ることが出来る
というわけです。なかなかとんでもない定理ですよね!!
「なぜこんな定理が成り立つのか」、また「定理の中で達を定めてる式はいったい何者なのか」、非常に気になると思います。
定理の証明自体は初等的にゴリゴリやることもできますが、正直なかなか大変で、意味がよく分からないというのが私の感想です。
なので、私は上の定理の代数的整数論的意味付けをぜひ紹介したいと思っています!
しかし、それを今回の記事でやるのはさすがに厳しく、またペル方程式の解法という趣旨にも反するので、別の記事に回させていただきます。こうご期待ください!!
さて、とにかくペル方程式の一般解が知りたければ、最小解を見つけ出せばいいことがわかりました。
なので、以下ではその見つけ方についてお話ししましょう。
方法のカギとなるのは「連分数展開」です!!
連分数展開
ということで、実数の連分数展開を定義します。
定義
実数を整数を用いて
\begin{align}
a=a_0+\frac{1}{a_1+\frac{1}{a_2+\frac{1}{a_3+\ddots}}}
\end{align}
の形に表すことをの(正則)連分数展開という。
このときとあらわす。
はじめに注意しておくと、任意の実数に対して整数は一意的に定まり、すなわちその連分数展開は一意的に定まります。
初めて見る方はよくわからないかもしれないので、実際に連分数展開の仕方を見ていきましょう。
やり方としては
⓪初めに、その数の整数部分を抜き出す。
そして、あとは
①残った小数部分を(無理矢理)逆数の形にし、その分母を必要なら有理化する
②分母の整数部分を抜き出す
の繰り返しです。
例1
手始めにを連分数展開してみます。
まずは、⓪の整数部分を抜き出してと表します。
①次に小数部分であるを無理矢理と表し、この分母にある分数を有理化しとします。②このとき現れたの整数部分を抜きだし、とします。
ここまでの操作で、以下の式を得ました。
\begin{align}
\sqrt{2}=1+\frac{1}{2+(\sqrt{2}-1)}
\end{align}
この後、さらにに対して①をして…という風に続けていけばいいわけですが、これは先にやった操作と同じです。
したがって、以降は全く同じ操作が続くことになり、最終的に以下の展開を得ます。
\begin{align}
\sqrt{2}=1+\frac{1}{2+\frac{1}{2+\frac{1}{2+\ddots}}}
\end{align}
これをと書くわけですが、巡回する節は括弧()でくくって表すことにすれば、
\begin{align}
\sqrt{2}=[1;(2)]
\end{align}
となります。納得できましたでしょうか?
例2
もう少し慣れるためと後の都合のため、についても考えてみましょう。
やることは全く同じです。
⓪①②の順に1ステップ終わらせると次のようになります。
\begin{align}
\sqrt{7}&=2+(\sqrt{7}-2)\\
&=2+\frac{1}{\frac{\sqrt{7}+2}{3}}\\
&=2+\frac{1}{1+\frac{\sqrt{7}-1}{3}}
\end{align}
そして、今度はに注目して同じ計算をして…という事を繰り返していきます。
以下各ステップごとの結果をどんどん書きますが、是非ご自分で計算してみてください。
おそらく一度やれば、身につくはずです。
\begin{align}
\sqrt{7}&=2+\color{red}{(\sqrt{7}-2)}\\
\sqrt{7}-2&=\frac{1}{1+\frac{\sqrt{7}-1}{3}}\\
\frac{\sqrt{7}-1}{3}&=\frac{1}{1+\frac{\sqrt{7}-1}{2}}\\
\frac{\sqrt{7}-1}{2}&=\frac{1}{1+\frac{\sqrt{7}-2}{3}}\\
\frac{\sqrt{7}-2}{3}&=\frac{1}{4+\color{red}{(\sqrt{7}-2)}}\\
\end{align}
はい。ここまで行くと、赤文字で書いたが巡回しましたので以下同じように展開が続くことがわかります。
したがって、連分数展開が
\begin{align}
\sqrt{7}=[2;(1,1,1,4)]
\end{align}
と求まりました。皆様答えは合いましたでしょうか?
ペル方程式の最小解
では、このことをペル方程式の最小解と関連付けていきます。
今、無理数(は平方数でない自然数) に対して、その連分数展開は必ず
\begin{align}
\sqrt{D}=[a_0;(a_1,a_2,\ldots,a_k)]
\end{align}
という形になります。
このとき、をの連分数展開の周期といいます。
また、有理数
\begin{align}
\frac{P}{Q}=[a_0;a_1,a_2.\ldots,a_{{k}-1}]
\end{align}
をの近似分数といいます。ただし、は既約であるとします。
近似分数の定義において、周期の最後の項を除いていることに注意してください。
このような定義の下で次の定理が成り立ちます。
定理
ペル方程式
\begin{align}
x^2-Dy^2=\pm1
\end{align}
に対して、の連分数展開を、その近似分数をとする。このとき、
(1)周期が奇数ならば、
\begin{align}
(x_1,y_1)=(P,Q)
\end{align}
がの最小解となり、(4)式にを代入して定まる
\begin{align}
(x_2,y_2)=(P^2+D{Q}^2,2PQ)
\end{align}
がの最小解となる。
(2)周期が偶数ならば、
\begin{align}
(x_1,y_1)=(P,Q)
\end{align}
がの最小解となり、
の整数解は存在しない。
つまり、ペル方程式を定めているの平方根の近似分数を見れば、最小解が求まってしまうという事です。
証明をやると、記事の分量が2倍(3倍?)になってしまうので、今回は事実として認めて頂きたいです。
例を見ましょう。
例3
まずを考えましょう。
の連分数展開は例1でやったようにです。なのでその近似分数は、少しわかりにくいですが
\begin{align}
[1]=1=\frac{1}{1}
\end{align}
です。周期は1なので、整数部分だけ生き残るという事ですね。
今回は周期が奇数なので、定理の(1)から
の最小解は
の最小解は
となります。一般解が(4)式により求まり、具体的には
などとなります。
例4
もう一つのパターンの例も見ましょう。
を考えます。だったので、その近似分数は
\begin{align}
[2;1,1,1]=2+\frac{1}{1+\frac{1}{1+\frac{1}{1}}}=\frac{8}{3}
\end{align}
となります。今回は周期が偶数のケースなので定理の(2)より
の最小解は
の整数解は存在しない、となります。
上と同様にいくつか他の解を求めてみると
となります。
ということでこれで、どのようなペル方程式でも一定のアルゴリズムに従って一般解を求めることが出来るようになりました。まとめておきましょう。
(Ⅰ)の連分数展開を求める。
(Ⅱ)そこからの近似分数を求めると、その分子と分母が最小解になっている
(Ⅲ)最小解に対して(4)式を使う事ですべての解を得ることが出来る。
問題の答え
では、ペル方程式の解法がわかったところで「ヘイスティングズの戦い」の問題を解いていきましょう。
とはいっても、ここまで読んでくださった方であればもう答えを導けるはずです。なので、是非ご自分で答えを出してみて以下に書くことは答え合わせのためにお使いください。
では始めます。
問題の兵数を求めるには、
\begin{align}
x^2-13y^2=1 \tag{1}
\end{align}
を解けばよいのでした。そのために(Ⅰ)の連分数展開を求めます。
\begin{align}
\sqrt{13}&=3+\color{red}{(\sqrt{13}-3)}\\
\sqrt{13}-3&=\frac{1}{1+\frac{\sqrt{13}-1}{4}}\\
\frac{\sqrt{13}-1}{4}&=\frac{1}{1+\frac{\sqrt{13}-2}{3}}\\
\frac{\sqrt{13}-2}{3}&=\frac{1}{1+\frac{\sqrt{13}-1}{3}}\\
\frac{\sqrt{13}-1}{3}&=\frac{1}{1+\frac{\sqrt{13}-3}{4}}\\
\frac{\sqrt{13}-3}{4}&=\frac{1}{6+\color{red}{(\sqrt{13}-3)}}
\end{align}
したがって。(Ⅱ)これからの近似分数を求めると
\begin{align}
[3;1,1,1,1]=3+\frac{1}{1+\frac{1}{1+\frac{1}{1+\frac{1}{1}}}}=\frac{18}{5}
\end{align}
今、周期がで奇数なことから
の最小解は
の最小解は
となります。数学的にはやなども解になりますが兵数を考えていることを思い出すと、現実的な数字ではないので、最小解のみ考えることにします。
そうすると、答えであるハロルド2世の軍の兵数が(人)と求まりました!!
…本当でしょうか、かなり怪しいですね。。。
まあ、1000年近く前の出来事で本当にこのような慣わしがあったのかすら微妙なので、怪しい数字になるのは当たり前といえば当たり前でしょう。それでも、解を求められたのはよかったと思います。皆さんの答えは当たっていましたでしょうか?
まとめ
ということで、今回は「ヘイスティングズの戦い」の問題をもとにペル方程式の解法を紹介していきました。
いかがでしたでしょうか。
ペル方程式というのは、ディオファントス方程式という整数論の原動力ともなっているようなものの一種です。
一般にディオファントス方程式を調べるのは非常に難しく、あの有名な「フェルマーの最終定理」もこのディオファントス方程式に関する定理になります。
そんな方程式の中で、ペル方程式は非常に綺麗な解の構造を持っており、加えてその解もかなり簡単なアルゴリズムで得られることが今回の記事を読んでお分かりいただけたと思います。
しかも、最初の方でいったようにこの方程式は「代数的整数論」(特に2次体の単数群)において非常に重要な役割を果たします。
そのような重要なものが、簡単に計算できるというのはとても不思議でありがたいことだと思うわけです。
このあたりのことについては、また別の記事で…。
では最後までご覧いただきありがとうございました!!
コメントはどんなものでも絶賛受け付け中です!
気に入ってくださった方は「読者になる」ボタンやTwitterフォローもポチッとお願いします!
それではまた次回お会いいたしましょう!
離散的な世界に登場!差分系テイラー展開!(2)
皆さんこんにちは、ラスクです。
9月に入りましたが、まだまだ残暑が厳しいですね。
それはさておき、今回は前回から扱っていた「ニュートンの補間法」というものの中身に入っていこうとおもいます。
まず、補間の仕方や公式について述べた後、具体的な関数について適用した例をお見せしようと思います。
前回準備した差分についての基礎知識は仮定いたしますので、まだ読んでいない方は是非ご一読ください。
mathforeveryone.hatenablog.com
ニュートンの補間法
では、始めていきましょう。
(多項式による)補間法とは次のような問題を言うのでした。
与えられた個の点
\begin{align}
(x_0,y_0),(x_1,y_1),\ldots,(x_n,y_n) \end{align}
(ただしかつならば)
をすべて通るような次以下の多項式関数を求める。
ここで各点をが通ることから
\begin{align}
y_i=f(x_i)\ (i=0,1,\ldots,n)
\end{align}
と書けます。
このとき単純にを次関数の一般形から求めようとすると、計算が大変になることが目に見えています。
そこで!!
次関数の一般形を使う代わりにを以下のような形で書き表します。
\begin{align}
f(x)=a_0+a_1(x-x_0)+a_2(x-x_0)(x-x_1)+\ldots+a_n(x-x_0)(x-x_1)\ldots(x-x_{n-1}) \tag{1}
\end{align}
この式が最も重要なポイントです!
個の点を通る次関数というのは一意に決まっているので、このように形を変えても展開して整理すれば結局同じ関数を求めていることになります。
なので、あとは各点の座標を(1)に代入して係数を求めていけばよいわけです。
勘の良い方はもうお気づきかもしれませんが、このときに(1)のような形にした意味が見えてきます。
順番にやってみましょう。
まずを代入すると、右辺の2項目以降はすべて消え
\begin{align}
f(x_0)=a_0
\end{align}
となります。は与えられている値なのでこれでは求まりました。
次にを代入すると、右辺の第3項以降はすべて消え
\begin{align}
f(x_1)=f(x_0)+a_1(x_1-x_0)\\
a_1=\frac{f(x_1)-f(x_0)}{x_1-x_0}=f[x_0,x_1]
\end{align}
と計算されます。最後にできてきたのはにおける の一階差分商です。
もう一つくらいやっておきましょう。
おそらくこの段階での予想がついている方も多いと思いますので、是非手を動かして考えてみてください!!
ではやってみます。を代入すると
\begin{align}
f(x_2)=f(x_0)+f[x_0,x_1](x_2-x_0)+a_2(x_2-x_0)(x_2-x_1)
\end{align}
となります。ここで第2項に出てくるをと表して右辺を計算すると
\begin{align}
f(x_2)&=f(x_0)+f[x_0,x_1](x_2-x_0)+a_2(x_2-x_0)(x_2-x_1)\\
&=f(x_0)+f[x_0,x_1]\{(x_2-x_1)+(x_1-x_0)\}+a_2(x_2-x_0)(x_2-x_1)\\
&=f(x_0)+f[x_0,x_1](x_2-x_1)+f[x_0,x_1](x_1-x_0)+a_2(x_2-x_0)(x_2-x_1)\\
&=f(x_0)+f[x_0,x_1](x_2-x_1)+(f(x_1)-f(x_0))+a_2(x_2-x_0)(x_2-x_1)\\
&=f(x_1)+f[x_0,x_1](x_2-x_1)+a_2(x_2-x_0)(x_2-x_1)
\end{align}
となります。そしてこの式をについて解き、差分商の定義を思い出せば、
\begin{align}
a_2&=\frac{(f(x_2)-f(x_1))-f[x_0,x_1](x_2-x_1)}{(x_2-x_1)(x_2-x_0)}\\
&=\frac{\frac{f(x_2)-f(x_1)}{x_2-x_1}-f[x_0,x_1]}{x_2-x_0}\\
&=\frac{f[x_1,x_2]-f[x_0,x_1]}{x_2-x_0}\\
&=f[x_0,x_1,x_2]
\end{align}
となることがわかります。これでも求めることが出来ました*1。
そしてこのような操作を続けていくとすべての係数を求めることが出来、その形は
\begin{align}
a_i=f[x_0,x_1,\ldots,x_i]
\end{align}
となります。この証明は割愛しますが基本的には帰納法を使って順番に係数を計算することになります。
とにかく、(1)式の係数を差分商という形で簡単に表すことが出来ました!
ここまででひとまず「ニュートンの補間法」の説明はし終わったことになります。まとめておきましょう。
個の点
\begin{align}
(x_0,f(x_0)),(x_1,f(x_1)),\ldots,(x_n,f(x_n)) \end{align}
が与えられたとき、それらすべてを通る次以下の多項式関数は
\begin{align}
f(x)=&f(x_0)+f[x_0,x_1](x-x_0)+f[x_0,x_1,x_2](x-x_0)(x-x_1)+\ldots\\
&+f[x_0,x_1,\ldots,x_n](x-x_0)(x-x_1)\ldots(x-x_{n-1}) \tag{2}
\end{align}
と表される。
メリットと具体的な計算法
一般的な状況下での解説が済んだところで、この方法によるメリットと具体的な計算例を見てみましょう。
ニュートンの補間法のメリット
この補間法の良い点は少なくとも2つあります。
①補間多項式が計算しやすい
まずは何といってもこれでしょう。最初の時点で補間多項式を(1)のような形でおいたので、各係数をから順番に求めることが出来るようになったわけです。
さらに、結局このたちはの差分商という形で簡単に書けるという事までわかってしまっています。
ここで差分商の計算は次のような表を描いていけばよいのでした。
\begin{align}
\begin{array}{ccccccccccc}
f[x_0]&f[x_0,x_{1}]&f[x_0,x_{1},x_{2}]&f[x_0,x_{1},x_{2},x_{3}]\\
\\
f[x_0]&{}&{}&{}\\
{}&\frac{f[x_1]-f[x_0]}{x_1-x_0}&{}&{}\\
f[x_1]&{}&\frac{f[x_1,x_2]-f[x_0,x_1]}{x_2-x_0}&\\
{}&\frac{f[x_2]-f[x_1]}{x_2-x_1}&{}&\frac{f[x_1,x_2,x_3]-f[x_0,x_1,x_2]}{x_3-x_0}\\
f[x_2]&{}&\frac{f[x_2,x_3]-f[x_1,x_2]}{x_3-x_1}&\\
{}&\frac{f[x_3]-f[x_2]}{x_3-x_2}&{}&\\
f[x_3]&{}&&{}\\
\end{array}
\end{align}
このとき、から始まっている差分商たち(つまり表でいう一番上のライン)が各にあたります。
なので上のような表を描くだけで、補間多項式が求まってしまいます!!!かんたん!!
もう少し後で具体的なデータをとって補間多項式をもとめてみるので、まだよくわからない方もそこで確認してみてください。
②データを後から追加しても再計算の必要がない
そしてニュートンの補間法特有のメリットがこちらになります。
これはいくつかの点から補間多項式を計算した後、もう一つデータを加えて補間多項式を修正したいと思ったときに、最初から計算をし直す必要がないということです。
例えば、3つの点から補間多項式をもとめたとします。このとき自分の手元には次のような表が残っているはずですね?
\begin{align}
\begin{array}{cccccccccc}
f[x_0]&f[x_0,x_{1}]&f[x_0,x_{1},x_{2}]\\
\\
f[x_0]&{}&{}\\
{}&\frac{f[x_1]-f[x_0]}{x_1-x_0}&{}\\
f[x_1]&{}&\frac{f[x_1,x_2]-f[x_1,x_0]}{x_2-x_0}\\
{}&\frac{f[x_2]-f[x_1]}{x_2-x_1}&{}\\
f[x_2]&{}&\\
\end{array}
\end{align}
そして、このとき新たな点としてを追加したとすると*2今まで作った表はまったくいじる必要がなく、新たに加わった点に関する部分だけを加筆していけばよいのです。
つまり次の表でいう赤く色づけした部分を付け足すだけで、修正された補間多項式を求めることが出来ます。
\begin{align}
\begin{array}{ccccccccccc}
f[x_0]&f[x_0,x_{1}]&f[x_0,x_{1},x_{2}]&f[x_0,x_{1},x_{2},x_{3}]\\
\\
f[x_0]&{}&{}&{}\\
{}&\frac{f[x_1]-f[x_0]}{x_1-x_0}&{}&{}\\
f[x_1]&{}&\frac{f[x_1,x_2]-f[x_0,x_1]}{x_2-x_0}&\\
{}&\frac{f[x_2]-f[x_1]}{x_2-x_1}&{}&\color{red}{\frac{f[x_1,x_2,x_3]-f[x_0,x_1,x_2]}{x_3-x_0}}\\
f[x_2]&{}&\color{red}{\frac{f[x_2,x_3]-f[x_1,x_2]}{x_3-x_1}}&\\
{}&\color{red}{\frac{f[x_3]-f[x_2]}{x_3-x_2}}&{}&\\
\color{red}{f[x_3]}&{}&&{}\\
\end{array}
\end{align}
具体例を一つ
ではそろそろ具体的な例を一つ計算してみましょう。
とはいっても、あまり簡単な値でやっても面白くないので、今回はから値を取ってきてその補間多項式を求めてみたいと思います。その際、適当なところで切り捨ててしまうので、桁落ちなどが発生するかもしれませんが、そのあたりの話に疎いため大目にみてください。
例1
ではから次の4点を得たとします*3。
\begin{align}
&(x_0,y_0)=(-2,\sin{(-2)})=(-2,-0.9092)\\
&(x_1,y_1)=(-1,\sin{(-1)})=(-1,-0.8414)\\
&(x_2,y_2)=(0,\sin{(0)})=(0,0)\\
&(x_3,y_3)=(1,\sin{(1)})=(1,0.8414)
\end{align}
そしてこれらの点から差分商を計算していきます。
\begin{align}
\begin{array}{ccccccccccc}
f[x_0]&f[x_0,x_1]&f[x_0,x_1,x_2]&f[x_0,x_1,x_2,x_3]\\
\\
\ -0.9092&{}&{}&{}\\
{}&\frac{-0.8414-(-0.9092)}{-1-(-2)}=0.0678&{}&{}\\
\ -0.8414&{}&\frac{0.8414-0.0678}{0-(-2)}=0.3868&\\
{}&\frac{0-(-0.8414)}{0-(-1)}=0.8414&{}&\frac{0-0.3868}{1-(-2)}=-0.1289\\
\ 0&{}&\frac{0.8414-0.8414}{1-(-1)}=0&\\
{}&\frac{0.8414-0}{1-0}=0.8414&{}&\\
\ 0.8414&{}&{}&{}\\
\end{array}
\end{align}
そして上の表が完成したので一番上のラインを順番に係数として並べれば、補間多項式が
\begin{align}
y=-0.9092+0.0678(x+2)+0.3868(x+2)(x+1)-0.1289(x+2)(x+1)x \tag{3}
\end{align}
と求まりました!!
このグラフを本当ののグラフと同時に書いてみましょう。
じゃん!!
どうでしょう!与えた4点の周りだけ見ればかなり近いですよね。
多項式補間も素朴でありながら結構いい感じに近似してくれるんです。
もちろんこの後から、いろいろな点を追加していけばもっと近似の精度を高めることができます。その際、上の表はどんどん大きくなっていきますが②で述べたように書き直す必要はないので、興味のある方はどんどん計算してみて下さい!!
差分系テイラー展開
さて、「ニュートンの補間法」の説明はほとんど終わったのですが、前回から引っ張っている事柄を一つ説明していません。
そう。タイトルにもある「差分系テイラー展開」というものは一体何なのでしょうか。
人によっては多項式補間を見ただけでテイラー展開の類似だとわかるかもしれませんが、ピンとこない方の方が多いと思います。
しかし、このことは少し特別な場合を見ることでかなり納得できると思います。
その特別な場合とは、与えられた点がすべて等間隔に並んでいるような状況です。
点が等間隔に並んでいる場合
以下、与えられた個の点
\begin{align}
(x_0,y_0),(x_1,y_1),\ldots,(x_n,y_n) \end{align}
は座標に関して(この順番に)等間隔で並んでいるとします。
つまり、ある正の数(間隔)が存在して
\begin{align}
x_i=x_0+ih\ (i=0,1,\ldots,n) \tag{4}
\end{align}
とあらわされているとします。(もし、以下の説明で分かりにくいところがあればまずはで考えてみてください)
このとき
\begin{align}
f(x)=&f(x_0)+f[x_0,x_1](x-x_0)+f[x_0,x_1,x_2](x-x_0)(x-x_1)+\\
&\ldots+f[x_0,x_1,\ldots,x_n](x-x_0)(x-x_1)\ldots(x-x_{n-1}) \tag{2}
\end{align}
を簡単にすることが出来ます。
まず、各項に現れる
\begin{align}
(x-x_0)(x-x_1)\ldots(x-x_i)
\end{align}
は(4)より
\begin{align}
&(x-x_0)(x-x_1)\ldots(x-x_i)\\
=&(x-x_0)\{(x-x_0)-h\}\{(x-x_0)-2h\}\ldots\{(x-x_0)-ih\}
\end{align}
となります。これはからスタートしてずつ小さくしていったものの個の積を取ったものです。これを
\begin{align}
(x-x_0)^{\underline{i}_h}
\end{align}
と書き、下降階乗冪という事にします(私が勝手に用意した記号と名前なのでご注意ください)。
の場合は通常の下降階乗冪に一致します。
そしてもう一つ差分商の方ですが、こちらはと差分を用いて以下のように表せることが知られています。
\begin{align}
f[x_0,x_1,\ldots,x_i]=\frac{\Delta^i f(x_0)}{i!h^i}
\end{align}
この公式の証明も省力しますので、今回は事実としてみてめていただけるとありがたいです。
以上、二つの書き換えを用いると(2)式は以下のようになります。
\begin{align}
f(x)=&f(x_0)+\frac{\Delta f(x_0)}{1!h}(x-x_0)+\frac{\Delta^2 f(x_0)}{2!h^2}(x-x_0)^{\underline{2}_h}+\ldots+\frac{\Delta^n f(x_0)}{n!h^n}(x-x_0)^{\underline{n}_h} \tag{5}
\end{align}
いかがでしょう!ここまでくるともう(の周りでの)テイラー展開にしか見えないのではないでしょうか!!
一応補足をしておきます。
分母にの冪があったり下降階乗冪などという見慣れないものが登場するのは、間隔をでとっているからです。
刻みの離散的な値のみから近似をしようとしているので、微分のときとは違ってどうしても幅が出てきてしまいます*4。
ただこの幅があるというのは、ある意味当然のことで、むしろそこに連続的なものと離散的なものの違いが如実に表れています。
この式でもやはり「微分と差分」、「通常の冪と下降階乗冪」という対比がよくわかります。
いやあ綺麗な式ですね(笑)
最後にもう一つ具体例
では(5)式を使って最後にもう一つだけ具体例を計算して終わりにしましょう。
関数はある程度なんでも良いのですが今回は
\begin{align}
y=e^{-\frac{x^2}{2}}
\end{align}
から値を取ってみましょう!
今、としてこの関数から等間隔に4つの値をとると、次のようになっていることがわかりました。
\begin{align}
&(x_0,y_0)=(-1,e^{-\frac{1}{2}})=(-1,0.6065)\\
&(x_1,y_1)=(0,e^{0})=(0,1)\\
&(x_2,y_2)=(1,e^{-\frac{1}{2}})=(1,0.6065)\\
&(x_3,y_3)=(2,e^{-2})=(2,0.1353)
\end{align}
今、であることから(5)式はつぎのようになります。
\begin{align}
f(x)=&f(-1)+\frac{\Delta f(-1)}{1!}(x+1)+\frac{\Delta^2 f(-1)}{2!}(x+1)^{\underline{2}}+\frac{\Delta^3 f(-1)}{3!}(x+1)^{\underline{3}}
\end{align}
ここで、より下降階乗冪は通常の下降階乗冪になっていることに注意します。
あとは、の差分を計算するだけですね。
やってみましょう。
\begin{align}
\begin{array}{ccccccccc}
f(x_0)&\Delta f(x_0)&\Delta^2 f(x_0)&\Delta^3 f(x_0)\\
\\
0.6065&{}&{}&{}\\
{}&0.3935&{}&{}\\
1&{}&-0.7870&{}\\
{}&-0.3935&{}&0.7093\\
0.6065&{}&-0.0777&\\
{}&-0.4712&{}&\\
0.1353&{}&&{}\\
\end{array}
\end{align}
差分は引き算するだけなので、差分商より計算が楽ですね(笑)
そしてこの表の一番上のラインの値を順番に代入して行けば補間多項式が
\begin{align}
f(x)&=0.6065+\frac{0.3935}{1!}(x+1)-\frac{0.7870}{2!}(x+1)^{\underline{2}}+\frac{0.7093}{3!}(x+1)^{\underline{3}}\\
&=0.6065+0.3935(x+1)-0.3935(x+1)x+0.1182(x+1)x(x-1)
\end{align}
と求まります。
先ほどど同じように、この関数のグラフと本当ののグラフを比べてみましょう。
じゃん!!
これもかなり近いことがわかりますね。
これで、(5)式の使い方も分かったことと思います!
なので皆さん是非、色々な関数で実験してみてください!グラフを見たときの感動はなかなかのものですよ!
まとめ
いかがでしたでしょうか。
今回は「差分系テイラー展開」というタイトルで、「ニュートンの補間法」というものをご紹介しました。
途中にも書きましたが、やはり連続的な世界と離散的な世界には一定の対応関係があり、そのようなものを追っていくと、色々と類似することが発見できるというのは非常に面白いことだと思います。
このような異なるもの同士の間にある類似の発見というのは、数学をやっていく中での一つの楽しみになりうるのではないでしょうか?
少なくとも私はそう思っています!!
では最後までご覧いただきありがとうございました!!
コメントはどんなものでも絶賛受け付け中です!
気に入ってくださった方は「読者になる」ボタンやTwitterフォローもポチッとお願いします!
それではまた次回お会いいたしましょう!