2010年3月16日火曜日

意味

情報論と呼ばれるものは、情報を扱いはしない。 ある仮定のもとで情報の量について云々はするが、情報そのものをうまく捉えてはいない。 すべて、表の出る確率がこれこれで裏の確率がこれこれといった確率分布を与えた後で始まる話であり、その表裏がどのような情報であるかについてその先は問えない。 これは公理化された確率論がそもそも確率そのものを扱わず、さまざまな事象に対する確率を与えた後で、その計算方法について示したものであることを引き継いでいる。 このことは、形式論理学が世界との間で論理が意味するものを捨てて、純粋に形式の内に留まることによって成功したのと似ている。 形式と世界とのインターフェースを直視し踏み込もうとすれば、たちまちからみつく茂みに足を取られ居場所を見失ないかねない。でもぼくらが現実にすでにいばらの中にいるかもしれないのに見ないふりをするとすれば、それもあまり居心地のいい話ではない。

情報量と情報との関係も微妙だし、情報の意味が受け手にとって変わってくることもほとんど自明だ。 アラビア文字やモンゴル文字を美しいと思いこそはすれ、ぼくにはほとんどそれ以上にはなりえない。 囲碁のルールは知っていてもぼくには盤面を見てもどちらが優勢かさえわからぬただの白黒の模様だ。 自分自身の X 線写真もぼくにはそれと大差ない。 肺の影とやらがあるかどうは専門の医者に見てもらうしかない。 こうした例は枚挙に暇がないほど挙げることができる。 “Gen.11” はわずか 6 バイトの文字列に過ぎないが、聖書が手元にあれば、創世記 11 章「バベルの塔」の物語を意味しうる。 0, 1 という 1 ビットの区別が何を意味するかは文脈の数、あらゆる yes-no 疑問文の数だけ異なりうる。 ということは結局状況を好きに設定することを認めてしまえば 1 ビットであらゆる情報を意味しうる。 情報は、送り手と受け手が共通に持つもの、言語の知識や暗号の鍵や聖書という本に依存している。 であれば文脈、送り手と受け手とが共通に持つものに相対的に、あるいはそれも含めて情報を定めればよいのだろうか。 しかし共通に持つものをまともに定められそうなのは、はじめからそれを意図したネットワークや通信の規格のようなものだけだろう。 道具が臨機応変に意味するところを変え、捉えがたいのに似て、共通に持つものがどこまで共通なのかは心許ない。

英語で出てくるアルファベットを頻度順に並べると ETAOIN SHRDLU で始まり XZ で終わるとされる。 かつての鋳植機のキーボードの配列。 英語の文章を符号化するとき、アルファベットを 1 バイトずつで表すのではなく、頻度の多い E に頻度の対数に応じた短いビット列を割り当て、Z に長いビット列を割り当てるといった具合にすれば、英語でありさえすればほとんどの場合符号は元のものより短くなる。 イカサマコインが 1 ビット以下であるように、英語の文字ごとの頻度が均一でなく冗長であるからエントロピーはいくらか小さくなるのだ。 しかしこれは最良とは程遠い。 Q の後はほぼ必ず U であったり、S の後はほぼ必ず R でなかったりすることに注目すれば、2 文字目のエントロピーはさらに小さくなる。 3 文字、4 文字と増やしていけばどんどん小さくなっていく。 “When we have shuffled off this mortal ... ,” 英語文化圏の人なら『ハムレット』を読んだことがなくてもこの文に続く次の単語が coil であることはほぼ想像できてしまうのだろう。 ならば「英語文化」に相対的なこの coil の情報量は 1 ビットに満たないはずだ。 この表現自体シェイクスピアが作り出したものだとすると、少なくともその当初はそうではなかったのだろう。 しかしよほど鈍くない限り “mortal coil” という語が辞書に載る前から、それらの単語の微妙なニュアンスを読み取って、その比喩の意味するところは英語文化圏に居さえすれば自然に理解できたはずだ。 一方で、英語を他の文化圏として後から学ばねばならない人間にとっては、「死すべき者たちのコイル」が「人生のしがらみ」といった意味であるとはかなりの情報量がある。

140 バイトで表されるビット列は 21120 個、すなわちおよそ 10337 個ある。 宇宙の水素原子の数が 1080 とすれば、宇宙 10257 個分ほど。 これを標準的な 2 進数値とみればその中には「7 の 5 の 3 乗乗」や「5 の階乗の階乗」も含まれ、ASCII 文字列と見れば、「“AB” の 70 回の繰り返し」も含まれる。 しかしこうした短い記述が与えられるものはごくごくごく一部に過ぎない。 単純な算術を駆使すれば、半分の 70 バイトまでのビット列は 2561 ほどしかないのだから、半分以下に圧縮できるものは高々 2559 分の 1, つまり 10168 分の 1 程しかない。 わずか 140 文字のビット列のほとんどは圧縮できず、ぼくらはそのほとんどを眼にすることさえない。 一方で全世界での Twitter のつぶやきは 2010 年 3 月現在 100 億、1010 ほど、ハードディスク一台に収まる。 あらゆる多様な人々のうずまく多様なコイル、加算的に積み上げられたつぶやきですら、この指数的な数の可能性の前ではほとんど無に等しい。 文字通りあらゆる本を納めたボルヘスの『バベルの図書館』に迷い込み一生さまよっても、一行でも意味のある文章に出会うことは絶望的に小さな可能性しか持ち得ない。 広大な空間から消え去りそうなほど小さな「意味」のある文章をより分けているのは何か。 あらゆる可能性からこの《世界》をより分けているのは。

確率論を世界から切り離すことで公理化したコルモゴロフは、またアルゴリズムによって文字列や数値の持つ文脈に寄らない客観的な本当の複雑さを定めようとした。 文字列や数の複雑さはそれを生成できる形式的な記述、すなわちプログラムの最小の長さとして定められる。 究極の圧縮。 どういうプログラム言語、どういう処理系かという文脈はあるが、それは定数分の違いに抑えられる。 しかしその複雑さを求めることはコンピュータにとっては計算不可能な問題であった。 究極の圧縮プログラムは存在してはならない。 そのようなプログラムを認めてしまうと、ある複雑さ以上でそれ自体が最小の記述を与えることになり矛盾する。 ベリーのパラドクス。 圧縮したい文字列より短いすべてのプログラムの生成結果を順に確かめ、文字列と比較して最小の記述を見つけ出そうとしても、それが停止するとは限らない。 停止問題。

完全なランダムノイズは、記述できるような何らの特徴を持たず、それを送ろうとすれば圧縮できず、最大の情報量を持つ。 しかし何も意味しない。 限界まで圧縮された信号はランダムノイズと区別できず、復元プログラムという鍵がないと決して解読はできない。 ある文脈、ある解読プログラムがそれの意味する長い物語を示すかもしれないが、それは文脈次第であらゆるもの、あらゆる可能性でありうる。 ならば何者でもなく何も意味しない。 文脈なしにはランダムさは何の情報も含まないのでなければならない。 しかし完全にそうだろうか。 一昔前のアナログテレビの「砂嵐」の画面はテレビの中の抵抗器の熱雑音によるほとんど完全なランダムパターンだ。 熱という完全な無知であり続ける領域から来た、圧縮できないと同時に何の情報も含んでいないパターン。 しかし、見ているとぼくらはそこにもうごめく線状のパターンを感じる。 何も情報が読み取れないはずのところにさえ、ぼくらの脳の視覚野はパターンを見つけ出そうともがき身もだえている。 この煩悶の中からこそ意味は始まるのではないだろうか。

「意味」と呼ばれるその共通のものが容易に取り出せるぐらいだったなら、形式的意味処理によって知性を模倣できるとした人工知能を作り出すことも何ということもなかったはずだ。 コンピュータがこの世に誕生した瞬間からあったその目論見は正に失敗の歴史でしかなかった。 1960 年代、ウィノグラードのプログラム SHRDLU は積み木の世界であるからこそ成功したかに見えた。 閉じられた箱庭の限定された意味の世界。 何色の積み木が他のどの積み木の上か下か、必要となる意味はそのようなものでしかない。 開かれた世界の意味をこれとして取り出すことはそれと比べるとずっと困難な話だ。 ランダムな可能性の中から意味あるものをうまくより分けなければ計算量は指数的に増大する。 フレーム問題。 ならば、ぼくらは何をやっているのか。 どうやってより分けているのか、本当により分けているのか。 しかし、ぼくが情報の意味の理解を間違っていないと自信を持つとしたら、むしろそれこそ間違っている。 理解に誤解はつきものだし、そうであるようなものでなければならない。

だが理解を相対化して意味などないというのとも違う。 意味がないと思っては、ぼくらの口はただの一言の言葉も発することはない。 昔タモリがやっていたハナモゲラ語ですら意味の境界で戯れるからこそ面白く感じる。 世界が「砂嵐」で、ものがぼくらにとって何がしかの意味を持つものとして現れてこなければ、ぼくらの眼はほとんど何も眼にすることはない。 それと定めることができなくても意味があるかのようにしかぼくらは振る舞えない。 意味があるかのように苦悶しつつ振る舞うこと、その結果として意味の世界が半ば結晶のようにしっかりと、半ばアメーバのように捉えどころなく析出してくる。