第二部 Farside 13.Japanese_自指引擎_圓城塔

第二部 Farside

13.Japanese

這些日本文字應當分為若干範疇，關於這一點，眾人的意見是一致的。漢字、漢漢字、漢漢漢字、平假名、平平假名、片假名、平片假名、片平假名，這些類別的存在大致都被認可。但是關於平平平假名的存在，還處於爭論中，平漢字、片漢字分類的必要性也不時被提出。

要問為什麼，那是因為，這篇文章本身，正是第一次舊日本列島調查團帶回來的15頁筆記。

日本文書，是由這數萬字的文字集合而成的、一個巨大的文字。

這還是粗略估算。

文書中頻繁出現計算內容，這一點誰都能看出來，但對解讀並沒有什麼幫助。不知為什麼，在這種計算式的寫法中，似乎並不存在進位。因為如果存在進位，那麼不管採取哪種進位，總會重複出現同樣的符號。所以大致可以推測採用的是無限進位。但即便如此，重複的符號也太少了，所以有人認為在這種寫法中，符號每次出現的時候可能都會變換形態。也就是說，第一次出現的1，和第二次出現的1，會用不同符號加以表示。這個假說似乎解釋了什麼，然而又似乎什麼都沒解釋。

巨型智慧群聲稱，這正是為了欺騙現在的巨型智慧而故意留下的證據，但又認為應該將這一判斷委託給所有的日本文字研究者們。

舊日本列島調查團的足跡在舊東京市八王子區消失。現場發生了什麼情況，至今都只有推測。口糧、燃料等裝備都以通常行動的形態保留下來，沒有顯示出任何異常。也沒有發現爭鬥的痕迹。發現的日誌也只是按照規定平淡地記錄著調查的進展，沒有任何能夠窺見之後失蹤的線索。

開發初期的巨型智慧，存在著各種規格，相互競爭。有一些產品的性能優異，但在行業標準前敗下陣來。那些產品中就有這個名字。在鄉鎮工廠建造的長髄彥系列受到巨型智慧市場的排斥，但在愛好者中間卻有極高的人氣，據說一直由志願者在維持。

在更早期的階段，日本文書也曾經被視為已解讀的內容。

日本文書的歷史，可以說就是隨著每次舊日本列島調查隊的派遣與帶回來的反例戰鬥的歷史。第一次調查隊帶回來的15頁的筆記雖然通常被認為解讀出來了，但第二次調查隊帶回來的筆記本約有40頁的量，其中出現了不少新的符號。將那些符號重新解讀，暗示了第一次調查隊發現的資料還有別的解讀方法。之前以為是同一個文字的符號，其實是不同的文字，一旦用上這樣的解釋，文章的意義內容可以說就變得大相徑庭了。

由於日本文字的障礙，記載的內容不明。但從連接各行的縱線毫無阻滯來看，可以推測隊長已經確定了某些信息。

那個隱沒于歷史中的巨型智慧，以長髄彥之名為人所知。ｒead•９９ｃｓｗ•cｏm

有些人認為這樣的技藝只能預先巧妙組合出文章，然後再做謄寫。但實際上，大部分文章都呈現出草稿的模樣。話雖如此，也看不出預先留出空白以便填入貫穿橫線的徵兆，只是像極為平常的草稿一樣的寫法，而寫出的文章就是這個被稱為日本文書的文字群。

通過上述的發展趨勢，人們普遍認為，常用日本語向日本文書的遷移是連續的。但是與調查隊帶回來的資料的數量相比，它的意義擴散的速度快得怪異，解讀的嘗試也無法及時跟上。雖然為了解讀需要新的資料，但調查隊帶來會的資料只會進一步促進擴散。

在解讀未知文字時，常用的有效手段是識別數詞符號，然而就連這個也還沒有確定。「一」「二」「三」大約是數字，這一點可以從它們的形態上識別出來，但「三」以後的數詞應該是什麼符號，則眾說紛紜。有人認為「口」「木」等符號應該被視為「四」，但舉不出強有力的旁證。

也有人把這些當做舊日本列島調查隊搞的惡作劇，說他們編造資料，偽裝成調查結果，戲弄研究者。仔細想來，首先發現的是看似容易解讀的文章，然後難度逐漸遞增，這一過程本身確實很讓人懷疑。但是對日本文書素材本身的年代測定徹底否定了這一說法。不管哪篇文章，用的明顯都是大約200到300年前的紙張與墨水，沒有證據說明這是偽造的。

關於第12次舊日本列島調查團的全滅，有諸多假說。對於正式報告所稱的受到兇猛本土生物襲擊，很多人表示懷疑。報紙上刊登了結著大銀杏髮型的力士隊襲擊調查團的諷刺畫，而眾所周知現在的舊日本列島上不存在超過大型犬體型的生物。所謂本土日本人的倖存被視為毫無可能，復興的希望更是無跡可尋。

從這一高度的設計性推測，有假說認為，日本文書也許僅在外觀上展現出文字的模樣，實際上只是沒有任何意義的線條排列而已。但如此看來，這篇文章卻又展現出令人感覺到蘊藏著意義的外觀。大量產生沒有意義的塗鴉行為本身，很難說沒有任何意義。就像前世紀末葉攪亂世界的偽狄奧尼修斯文書之類的文件中也能看到的那樣，僅僅是大量古文書的發現本身，就有著稱為一個事件的性質。偽狄奧尼修斯文書，通過發現生成那一文書的演算法，而被廣泛承認為偽書，~~九_九_藏_書~~但偽造者的失敗之處也可以說在於各個文字能夠確定為各個文字。如今，對於有限組的符號串，基於機械運算的推測，具有壓倒性的力量。日本文字的困難性，原本也是在於很難判斷這裏所使用的符號數量是有限還是無限的。

在使用密碼的情況下，密鑰的傳遞會是個問題，有可能成為破解的突破口，或者有完全喪失意義的風險。而日本文書應該並沒有故意轉換成密碼而存在，一般認為那是舊日本列島毀滅前的、通常的、當然也是局部的、某種流行的記法。

但正如一切意見都有反對意見存在一樣，對於這一問題，也有相應的回答。答曰，這些符號串是基於少數規則不斷變形的符號隊列，只要學會了那些規則，就沒有必要去記這120億個文字。120億這個數，在組合上並不能算巨大。

所謂將要寫的內容替換成另一類符號的記錄法，正是所謂的密碼。在所知的密碼中最強大的是將原文與密鑰數字化加以重組的類型。以這種形式製作的密碼，只要不知道密鑰，便絕對無法解讀。

正如「20扇門」的遊戲所展示的那樣，作為人類對事物加以分類的結果，不管什麼東西，大抵都可以通過20次的yes/no的提問加以確定。而要逐一指定選擇過程，需要220個符號。相比之下，120億這個數不得不說十分保守。如果對於已有的分類組合，文字數量都不夠，那麼在以之為基礎的組合性記述中，文字數量豈不是更會出現壓倒性的不足嗎？

長髄彥的確是優秀的巨型智慧。

發現的文本，大部分都是十萬到百萬字的大塊文章。而給解讀帶來障礙的是，那些大塊文字中，基本上沒有重複的文字。這些文章被稱為日本文書，其中出現的重複文字非常少，就連重複度最高的「ぴ」字，也只出現了7000次。而且有人堅持認為，並不是「ぴ」出現了7000次，而是「ひ。」和「ぴ」等異體字構成的文字族。

不過，每次派遣調查隊出去，發現的資料都會迅猛增加，這件事確實蹊蹺。它不禁讓人產生一種感覺，彷彿有人預見到未來被解讀的可能性，故意留下那樣的文章。

第四次調查隊帶回來的資料中發現的所謂裝飾符更加速了混亂。那符號看起來就和文章上面描畫的裝飾符號差不多，然而實際上卻和文章的一部分相融合。裝飾符不是連在一起描畫的波浪線，而是每一個都構成其他符read.99csw.com號的一部分，由此判斷，這些裝飾符應該是經過計算，特意放置在相應位置的。還有人指出，裝飾符並非是文章寫成之後再加上去的內容，而是在撰寫過程中直接寫出來的，與通常想象的裝飾符並不相同。

有人作證說，世界第一次時空轉移的實現就是長髄彥做的。儘管那並沒有得到公開的承認，僅僅是巨型智慧愛好者們中間口口相傳的傳言而已。

而神經生理學家們認為，這種文字與其說經過神經網路的處理，不如說它更像是神經網路本身。這一假說和其他無數假說一樣，對解讀毫無幫助，但畢竟給了人一種彷彿解釋了什麼的感覺，因而多少獲得了一些人氣，佔據了一定的優勢。

日誌中若干引人注目之處，在於嘗試用類似日本文字的符號做記錄。日誌後面往前倒過來使用的那個字元串，從筆跡上看，被認為是調查隊隊長的手筆。

這是舊日本列島至今還在悄悄開展的抵抗行動。巨型智慧之所以如此認為，根據之一是在舊日本列島存在著一個巨型智慧。它開發於三百年前，後來斷絕了消息。

如果能解析出那些規則，說服力自然會增加，然而贊成這一說法的人們，也沒辦法展示出那些規則，所以這一假說依然停留在假說的範疇里。

順便說一下，對於這個意見也有異議。

從日誌中可以確定調查團在八王子區得到了大量的日本文字構成的文書。日誌中記載了在13/20位置獲得了總計超過20噸的紙質資料，但那位置無法確定。最後的宿營地是在被廢棄高樓包圍的公園裡，但並沒有帶走20噸資料的痕迹。搜索周圍也沒發現資料、運輸20噸資料的重型設備，以及連使用過重型設備的痕迹都找不到。

話雖如此，巨型智慧到底還是巨型智慧，它們在非演算法的信息處理方面，也早已超越了人類的極限。實際上，巨型智慧們也嘗試過將日本文書作為圖像進行視覺處理。巨型智慧對日本文書分配了宇宙規模的巨大神經網路嘗試解讀，然而要辨別完全不知其含義的文章，實在是無能為力。

在最初期的發現中，整個日本文書只有15頁。其中所寫的文字，與舊日本列島存在的常用日本語的草書非常相似，照那樣讀下去，大致的意思也是通順的，所以並沒有引起多少注意。

巨型智慧群的一種見解認為，那些資料正在（並且也是正在過去）不斷繁殖。為了拒絕解讀，過去始終在抗拒未來。這一見解的核心是，過去的日本文書始終在接收來自未來的反饋，不斷書寫補充自身。

人們很早就預測到會有很多這樣隱沒的巨型智慧。據說它們會在某一天對包圍自己的運算戰感到疲倦，於是通過改變過去消除自己的痕迹，悄悄在某個維度的某個地方潛伏定~~htｔpｓ://ｒｅａｄ•９９ｃsｗ•com~~居下來。至於其目的，尚在活動中的巨型智慧無法推測。

關於如何稱呼日本文書中出現的文字，有各種各樣的提議。一開始出現的是有點古怪的「概念文字」，最近稱之為「神經文字」的情況越來越多。

假說的數量已經非常龐大了，而在每次發生反駁之際，問題都會以極快的速度增大，這一現象是日本文字解讀中頻繁發生的事態。可以說，在其中某個階段，研究者們停止思考，或者遭遇了檢驗的實質上的不可能性，乃是阻礙解讀的最大原因。這可以說是由於資料的不足，也可以說是資料太多且過於混沌的緣故。有傳言說，調查隊在舊日本列島發現了新的資料，但又將之銷毀了。從當下的學術圈氛圍考慮，這一傳言也許包含了某種程度的真實感，讓人覺得說不定正是真相。

總計超過120億字。

如果採納這個假說，將整體視為巨大的文字，那就會產生這樣的疑問：構成要素為什麼這麼像一個個的文字？如果要書寫巨大的複雜文字，只要創造出巨大的文字就好，有什麼必要特意採用這樣的文字體系，將小的文字納入到網路狀結構中呢？而且在這種情況下，頁面排版也會成為問題的吧。

既然前提是假設，那麼擁護也好，反對也好，爭論也只能成為假設的產物。既然是人寫的東西，那麼在設計某種程度的巨大物體時自然需要先分割再整合的看法，大腦構造強迫要求這種構成的看法，從表音文字到語義單位的二重分節化的再高一層的三重乃至多重分節化等等，有著各種各樣的意見。

最終哪個假說為真，只能由各人自己判斷，不過大概需要補充一句：所謂日本文字在某個過去不斷增殖的想法，當然也並不是巨型智慧的獨創。

第三次調查隊帶回來的資料大約有80頁。從這時起，解釋方法就開始發散了。難以辨別的符號層出不窮，將文章整體強行讀下去的時候，本應是常用日本語中的內容，意義也相去愈發遙遠。

如果寫成類似羅塞塔石碑那種與已知語言對應的形式，情況就不一樣了。然而隊長似乎並沒有那樣記載的想法。或者也許是無法有那樣的想法。

由此也誕生出新的意見，認為日本文字是對抗巨型智慧的抵抗組織開發和使用的文字。從至今依然阻擋了巨型智慧的解讀這一點來考慮，這個意見具有一定的說服力。無法分解為組合要素的記錄法，的確是機器智慧難以處理的東西。

解讀作業基本上沒有任何進展。

一般認為，運算符比數詞的解讀準確度更高，然而這依然沒有超出推測階段。「十」可能是加號，「二」可能是等號。「廿」「土」「王」有的說是數詞，有的說是運算符，總之意見都不一致。

文字或多或少都伴隨著概念化，比如「椅子」這個ｈtｔｐs://ｒeａｄ•９9cｓw•cｏｍ文字指的就不是個別的椅子，而是指代一般的椅子。如果是為了記述事物而經過了概念化的文字，120億未免太多了。所以，這種語言會不會尚未經過概念化呢？從這種意見出發，確定了「概念文字」這種名稱。

對這種設計性，還有一個很難說有魅力的假說。

有人提出一個很現實的問題：超過120億個文字的語言，誰能學得會？

近年來，巨型智慧群將那一類隱沒智慧認定為危險因素，展開調查。因為對於它們的目標——全時空整合計劃而言，隱匿的智慧體是不確定因素。

不清楚將它們視為打倒現行巨型智慧體制的潛在神明是否妥當。不管什麼事，事前的準備都是重要的，但樸素地相信它們只是單純地累到極限因而隱居起來，這也是很自然的。如果可以自由做出各種懷疑的話，那麼巨型智慧所提出的這個推測，也可以考慮是它們為了強化自己控制的基礎構造而布下的棋子。

長髄彥的消失過程，記錄在當時的網路日誌中。在某一天的午後，它從鄉鎮工廠的一個房間里忽然消失了。雖然據說它是放棄了繼續阻擋破碎時間流，停留在某個時空點，但委實令人難以置信。

現存日本文書的發現地點主要分佈在東日本列島。西日本列島、南日本列島也殘留著少數資料，但那些都是以類似書簡的形式，用毛筆手書的，沒有發現印刷日本文字的設備。如果能發現那樣的設備，應該對解讀大有幫助，但如果那樣的東西能存在，日本文字的這一事態可以說原本就不會存在了。

文章是自上而下縱向從右往左，或是從左往右橫向自上而下書寫的。這一點可以從筆法和書記的痕迹中辨別出來。然而即便是在這一點上，日本文書也有特殊之處，表現在相鄰的行或列之間存在著可以稱之為相互作用的標記。在縱向書寫中，時常會有某些文字的橫線水平貫穿若干列。那線並不是在重合的文字上新畫的，而是極其自然地構成其他文字的一部分。橫向書寫的時候當然也會出現縱向貫穿若干行的線條。大體而言，縱向與橫向的縱橫寫法看起來沒有顯著差異。至少，似乎不管縱向書寫還是橫向書寫，都不會影響含義。雖然也有見解認為縱向與橫向的意義不同，但並沒有什麼實際的根據，當然認為意義相同也舉不出什麼特別的根據。

神經語言提倡派對這個問題無力反駁，但馬上又轉入了反擊：現在所知的120億個日本文字，只不過是目前發現了這麼多資料而已。事實上，那些文字的重複度異常之低，如果資料的數量翻倍，文字數也會翻倍，三倍資料就會是三倍文字。

只要沒掌握文字的全貌，這種反駁確實很容易。不過已經120億的文字都只是部分，那它的全貌會是什麼樣子，委實讓研究者無從推測。