【數據、信息、知識、智能除了轉換外,是否還有變異、彌聚等?能否把這些變化看成是態、勢、感、知結構扭曲而產生的必然現象?】
摘要 如何把信息轉換為解決問題所需要的智能,是信息科學領域的核心研究課題. 本文報 道的“信息轉換原理”提供了一種把信息轉換成為智能的可行方法。為了能夠把信息轉換為智能, 它首先突破了信息論局限于統計形式的限制, 建立了全信息理論; 然后,研究了作為信息與智能中介的知識理論, 發現知識的生態規律“信息-知識-智能轉換”就是智能的生成機制,因而提出了智能生成機制的模擬方法, 使人工智能三大主流方法(結構模擬、功能模擬、行為模擬)實現了統一;在此基礎上定義了意識-情感-理智三位一體的高等人工智能模型,證明了意識、情感和智能都可以由各自條件下的信息轉換生成出來,從而建立了基于信息轉換的高等人工智能理論, 成為溝通信息理論、知識理論和智能理論的一體化理論。
關鍵詞 信息論 全信息理論 知識生態 機制模擬 信息轉換 高等人工智能
信息、知識、智能,是現代科學3個具有基礎性和關聯性的當代重要研究領域,如何把信息轉換成為解決問題所需要的智能,是信息與智能科學領域的核心研究課題, 也是整個現代科學技術十分關注的問題. 當今世界各國經濟和社會發展的信息化、知識化和智能化進程,對信息理論、知識理論、智能理論、特別是信息-知識-智能的一體化理論研究提出了 十分迫切的需求.
然而, 關于信息、知識、智能3個領域的理論研究卻發展得不太平衡, 而且基本上處于互相獨立發展的狀態.
在信息理論研究方面,1948年由Shannon所創立的信息理論(原來稱為《通信的數學理論》)實際上是一種建立在概率論和隨機過程理論基礎上的統計通 信理論, 它所關心的問題是在噪聲環境下如何有效、可靠、安全地把信號從一個地點傳送到另一個地點. 同年Wiener出版的《控制論》研究了動物與機器中的控制與通信問題, 其中的信息理論實際上與 Shannon的信息理論異曲同工.
在知識理論研究方面,雖然在20世紀70年代出現了以知識推理為特征的“知識工程”研究, 20世紀90年代興起了面向特定數據庫的“知識發現”研究. 但是, 這兩方面的研究都還處在發展的初級階段,而且,它們之間幾乎沒有建立任何互相關聯. 因此, 至今沒有形成系統性的知識理論.
在人工智能理論的研究方面,主要關注的問題則是如何在計算機平臺上編制“聰明軟件”來解決諸如定理證明、問題求解、機器博弈和信息檢索等復雜問題.而且,這一方向的研究一直與人工神經網絡的研究和感知-動作系統以及多智能體的研究缺乏必要的溝通, 在智能領域呈現出鼎足三分的狀態. 不僅如此, 在人工神經網絡研究與人工智能研究之間以及感知-動作研究與人工智能研究之間 還存在嚴重的分歧. 事實上, 學術界也作了很大的努力, 試圖消除人工智能、人工神經網絡和感知動作系統3種研究方法之間的歧見,達成研究方法的統一。但是,并未取得實質性的成功.
顯然, 信息理論、知識理論、人工智能理論之間這種相互脫節的研究狀況, 不利于信息科學技術、知識科學技術和人工智能科學技術的發展,更不利于信息理論、知識理論、智能理論的一體化研究,不能適應現代科學技術和經濟社會發展的需要.
有鑒于此, 信息理論、知識理論、智能理論及其一體化理論的研究具有十分重要的意義, 值得人們高度關注. 本文以下將介紹信息、知識、智能一體化 理論的基本結果“信息轉換原理”, 包括這一原理的 主要支撐理論: 全信息理論、知識生態學規律、智能的生成機制、人工智能的機制模擬方法、人工智能的統一理論以及高等人工智能理論. 由于篇幅的緣故, 這里將主要介紹取得這些結果的研究思路和科學方法. 詳細的情況參見相應文獻.
1 全信息的理論
1948 年, Shannon在《貝爾系統技術學報》發表了題為“通信的數學理論”的長篇論文, 針對通信系統的需求提出了信息的概念和度量方法, 定義了信道容量公式, 建立了反映信息傳輸基本規律的三大編碼定理, 成為信息論的奠基之作.
至今, Shannon信息論仍然在通信領域發揮著重要的指導作用. 而且, Shannon 的信息論和Wiener的控制論以及 Bertalanffy 的系統論一起(史稱“三論”)成為現代科學研究方法論的三大支柱.
20 世紀 70 年代末, 本文作者曾經這樣設問: 既然Shannon理論是關于通信的數學理論,為什么后來要改稱為信息論?既然改稱為信息論,是否就意味著Shannon理論不僅適用于通信領域,而且也適用于信息過程的其他領域(包括傳感、計算、人工智能和 控制)?
結果發現, Shannon信息理論的應用有著很強的限制條件. 一方面, 它的主要數學基礎是概率論, 不滿足概率公理條件的場合原則上不能應用; 可是, 信息過程的許多領域并不滿足概率公理的條件.另一方面,針對通信工程的特殊需要,Shannon信息理論只考慮了信息的形式因素(信號波形),有意地忽略了信息的內容和價值因素(見文獻[1]的第一部分); 可是, 在信息過程的許多領域(特別是智能決策領域)卻需要同時考慮信息的形式、內容、價值因素. 由此可以判斷, Shannon 信息論主要適用于通信這類能夠滿足統計條件的領域,而不能適用于信息的整個過程, 特別不能適用于信息過程的核心領域——智能決策領域.
有了這樣的認識, 我們便決心研究“同時考慮信息的形式、內容和價值因素而且既能適用于統計條件又能適用于非統計條件的信息理論”.并把這樣的信息理論命名為完全的信息理論, 簡稱為“全信息理論”; 以這一理論為基礎, 系統研究和總結了全信息在整個信息過程(包括傳感、通信、計算、智能、控制)的工作原理, 在1988年出版了題為《信息科學原理》的學術專著. 這是國內外第一部系統闡明信息科學基本原理的學術著作, 于1996, 2002, 2005年3次再版.
“全信息理論”和《信息科學原理》所以取得成功,主要得益于兩個重要條件:
首先, 在方法論上得益于自覺應用了“信息觀和系統觀”:堅持“全信息理論”的信息概念必須是一個 完整的體系, 即它的內涵應當包含信息的形式、內容 和價值(而不僅僅是信號波形); 全信息理論的適用范圍必須是全部信息過程, 而不僅僅是通信過程. 這樣就在方法論上奠定了超越Shannon信息論的創新基礎.
其次,在數學方法上得益于同時應用了概率論和模糊集合理論,正是借助了模糊集合理論的數學工具才建立了信息內容和價值因素的描述和測度, 并使全信息理論能夠適用于概率和非概率場合. 這樣就在數學方法上具備了超越 Shannon 信息論的 條件.
應當指出,方法學上的“信息觀和系統觀”與數學上的模糊集合理論這兩者都是 Shannon那個時代還不曾出現的, 是1948年至今這段歷史時期才出現的科學新成果. 因此, 全信息理論和信息科學原理是時代進步的產物.
有了全信息理論, 原來各自獨立研究的傳感、通信、計算、智能、控制學科就可以相應地被定義為信 息的獲取、信息的傳遞、信息的處理、信息的轉換、 信息的執行, 因而都可以建筑在全信息理論這個統一的理論基礎上,形成統一的信息科學理論.這樣,Shannon信息論就成為“全信息理論”的一個“統計通信理論”分支.
理論上的統一性和完整性, 對于信息科學理論的發展來說具有十分重要的意義。
2 知識的生態學規律
在完成了《信息科學原理》的出版工作之后, 研究的注意力便聚焦到了信息過程的核心領域——智能理論的研究.
我們首先自我設問: 智能是怎樣生成的? 我們認為:作為發現問題、分析問題和解決問題能力的智能, 必然來源于與問題和問題求解目標相關的“知識”: 若是沒有知識, 何以有智能? 于是, 知識的理論成為智能理論研究的先導和關鍵.
自古(特別是近代工業革命)以來,科學技術的進步和社會經濟的發展創造了極其豐富的文化科學知識. 可是, 人們對于知識的發展規律卻鮮有顧及. 哲學家們悉心探討和論述了知識的理論, 特別探討 了知識的概念和性質, 但對知識的生長規律卻少有論述.
雖然Feigenbaum等人在20世紀70年代提出了“知識工程”的課題,20世紀90年代學術界也興起了“知識發現”的研究.但是,“知識工程”只關心了如何由知識推演策略的問題; “知識發現”只關心從特定數據庫的數據中發現知識的方法. 兩者都沒有對知識的生長規律展開專門的探究.于是,經過深入的研究,我們在2000年的《中國工程科學雜志》上發表了題為“知識理論框架”的論文,探討了知識的定義、分類、描述和度量的方法, 特別總結和闡述了“知識的生態學規律”.
論文指出: 知識既非自古就有也非萬古不變的東西; 相反, 知識是一個活生生的生態學系統, 遵循著固有的生態學規律: 在內部, 它是在本能知識的支持下首先由信息生長出“欠成熟”的經驗知識, 進而生長出“成熟”的規范知識, 最后生長(沉淀)出“過成熟”的常識知識, 后者又通過某種機制生長成為本能知識的新內容, 使本能知識逐漸增長; 在外部, 它不斷由信息生長出來, 又不斷向智能策略生長而去. 論 文把前者命名為“知識的內部生態學規律”,把后者命名為“知識的外部生態學規律”, 兩者的整體稱為 “知識的生態學規律”.
因為知識的外部生態規律就是智能的生成機制,闡明知識的生態學規律不僅對認識知識本身的發展規律具有重要指導意義; 而且對認識智能的生長規律具有決定性的貢獻.
3 智能的機制模擬方法
由于智能研究所具有的基礎性和復雜性,人們沿用了“分而治之”的傳統方法論把模擬人類智能的研究分解為結構模擬、功能模擬、行為模擬三大主流研究方法, 并分別形成了基于結構模擬的人工神經網絡研究、基于功能模擬的物理符號系統研究、基于行為模擬的感知與動作系統研究.3種研究方法各自都獲得了不少令人鼓舞的成果. 但是由于對人類智 能系統在結構、功能、行為之間相互聯系和相互作用的機制缺乏深刻的認識,3種研究方法之間一直未能互相溝通形成合力, 卻常發生“孰優孰劣”的激烈爭論, 造成了互不認可各自為戰的研究格局, 在一定程 度上延緩了人工智能研究的發展.
許多有識之士都希望打破這種各自為戰的格局.人工智能領域資深權威學者Nilsson于1998年出版了題為“Artificial Intelligence: A New Synthesis”的學術 專著, 試圖用“新的集成”來集成3大研究方法; 人工智能的后起之秀Russell等人則于1995年出版了1000多頁的宏篇巨著“Artificial Intelligence: A Modern Approach”, 試圖以“現代途徑”來溝通三大研究方法.據悉,這部著作于2003和2006年連續再版, 先后被 89個國家 900 多所大學用作教材, 可見影響之廣泛, 也可見人們期望三大方法走向溝通統一的愿望多么強烈.
但是,仔細閱讀這些新著可以發現,它們除了把三大主流研究方法的成果直接拼合在一起之外, 并沒有找到三大方法之間的內在本質聯系. 因此, 溝通 三大主流方法形成人工智能統一理論的目標基本沒有實現.
人工智能是一類開放的復雜信息系統, 傳統的“分而治之”方法論在把復雜信息系統分解為若干子系統的時候, 往往丟失了這些子系統之間相互聯系相互作用的信息; 而這些信息正是復雜信息系統的靈魂和生命線. 同樣, 把智能模擬分解為結構模擬、功能模擬、行為模擬的時候, 也丟失了結構模擬、功能模擬、行為模擬之間互相聯系和互相作用的信息. 這是三大主流方法之間無法實現溝通的方法論原因.
為了克服傳統方法論帶來的上述問題, 我們認為: 既然人工智能是一類開放的復雜信息系統,就必須堅持“信息觀、系統觀、機制觀”的科學觀念和“信息轉換”的方法論.于是提出了新的智能模擬方法——機制模擬.因為,只有“智能的生成機制”才是統領智能系統全局的決定因素, 只有“智能的生成機制”才可以全面揭示智能的奧秘, 而系統的結構和功能都是為實現智能生成機制服務的, 系統行為則是實現智能生成機制的必然結果.
如上所說,“知識的外部生態學規律”指出: 知識由信息生長而來, 又向智能策略生長而去. 這就明確無誤地昭示人們: 智能的生成機制就是“信息-知識智能策略的轉換”. 這對于智能理論的研究來說, 無 疑是“一語中的”.
為了簡明, 可以把“信息-知識-智能策略轉換”簡 寫成為“信息轉換”. 后面很快就可以看到, 信息不僅可以轉換成為知識和智能策略, 而且可以轉換為注意能力、基礎意識能力、情感表達能力、理智謀略能力和綜合決策能力. 當然, 這里的信息必須是全信息.
于是, 基于“信息轉換”的人工智能機制模擬方法是獨立于結構模擬、功能模擬和行為模擬這三大主流方法之外的第4種智能模擬方法. 而且, 從方法論的意義上可以判斷:它是比三大主流方法更加深刻更加科學的智能模擬方法. 這是人工智能研究 的突破.
4 人工智能研究方法的統一
如上所說, 人工智能的機制模擬方法的實現途徑, 就是“信息-知識-智能策略轉換”. 按照“知識的內部生態學理論”把其中的“知識”具體展開, 就可以得到機制模擬方法在不同知識(本能知識、經驗知識、規范知識、常識知識)條件下的4個具體型式: A, B, C 和 D 型, 如表1前4列所示.
不僅如此, 表 1 還進一步表明, 現有人工智能三大主流方法——基于結構模擬的人工神經網絡研究、基于功能模擬的物理符號系統研究、基于行為模擬的感知-動作系統研究——分別是機制模擬方法在各自相應知識條件下的特例.
根據“知識的內部生態學規律”,經驗知識、規范知識、常識知識和本能知識互相之間是“相生”的關系,而不是“相克”的關系.這就表明,人工智能的結構模擬方法、功能模擬方法、行為模擬方法之間也應當是 “相生”的關系, 而不是“相克”的關系. 換言之, 原來一直“互不認可”的三大主流方法, 卻在機制模擬方 法的框架內實現了和諧的統一.
這是一個發人深省的啟示: 如果運用的方法論不恰當, 事物之間的本質聯系就會被掩蓋; 而一旦運用了正確的方法論, 事物之間的內在本質聯系就會豁然顯現. 人工智能原有三大主流方法之所以“互不認可”, 不能形成合力, 根源就是“分而治之”方法論 在人工智能這類開放復雜信息系統的研究中失靈. 而人工智能機制模擬方法之所以能夠實現三大主流方法的和諧統一,根源也在于“信息觀、系統觀、機制觀”的科學觀和“信息轉換”方法論適應了人工智能 這類開放復雜信息系統研究的需要. 由此, 可見科學 研究方法論的重要性.
5 高等人工智能理論
基于信息轉換的人工智能機制模擬方法和諧地統一了原來長期各自獨立發展的三大主流研究方法, 形成了統一的方法和理論, 消除了內耗, 形成了合力. 這是自1943年以來人工智能理論研究歷史上一個意義重大的進步.
但是, 當進一步思考人工智能理論研究的時候, 我們又發現了更大的問題: 一方面, 長期以來, 人工智能的研究回避了人工意識的研究; 另一方面, 人工智能研究也在相當長時期內忽視了人工情感的研究. 然而, 沒有意識能力的系統不可能擁有智能. 這就是說, 沒有意識的智能是不真實的. 同樣眾所周知的是, 沒有情感的系統不可能擁有完全的智能, 換句話說, 沒有情感的智能是不完全的. 因此, 雖然人工智能原 有的三大主流研究方法在機制模擬方法的基礎上得 到了和諧的統一, 但是, 人工智能本身的概念、模型、方法、理論是不能令人滿意的, 是人工智能理論研究的重大缺陷.
于是, 經過深入研究我們提出了“以基礎意識、情感、理智3位一體為特征的高等人工智能理念”和相應的高等人工智能系統功能模型, 后者如圖 1 所示.
在圖1的模型中, 現行人工智能意義上的“智能” 被賦予了新的名稱——理智, 這是為了與情感相默契 (情感也是一種智能, 可以稱為情智); 一般意義上的 意識被限制為可以明確界定和便于實際檢驗的“基礎 意識”(接近于臨床醫學意義上的意識概念), 這是因 為一般意義上的意識概念太籠統, 又太復雜, 不便研 究. 此外, 模型中還表現了“注意”的功能, 這是任何 真實的智能系統所不可缺少的. 還有, 情感生成和理 智生成被安排成了兩個不同的支路, 這是腦神經科 學和認知科學已經證明了的結構. 正因為如此, 模型 中需要安排“綜合決策”的模塊, 它負責對情感和理 智進行協調和綜合. 最后, 記憶系統也是在“全信息” 意義上工作的, 這是很重要的特色. 此外, 圖中記憶 系統提供的 a 代表本能知識和常識知識; b 代表本能 知識、常識知識和經驗知識; c 代表本能知識、常識 知識、經驗知識和規范知識; d 代表本能知識、常識 知識、經驗知識、規范知識和藝術知識等. 把知識做 這樣的劃分只是為了使功能分析上更加清晰,實際的情況可能會更復雜.
詳細解釋這個模型需要太多的篇幅, 有興趣的 讀者可以參看作者在科學出版社出版的學術專著《高等人工智能原理: 觀念-方法-模型-理論》。
研究發現,高等人工智能的所有要素——注意能力、基礎意識能力、情感能力、理智能力和綜合決策能力的生成機制, 分別是在外來刺激所呈現的信息 (稱為“本體論信息”)的激勵下啟動、在各自的知識支持下展開、在各自目標的導控下完成的信息轉換: 包括第一類信息轉換(由本體論信息到全信息的轉換) 和第二類信息轉換(包括由全信息到注意能力的轉換、全信息到基礎意識能力的轉換、全信息到情感能力的轉換、全信息到理智能力的轉換以及到綜合決策能力的轉換), 這樣, 就完成了高等人工智能原理的基本建構. 這些信息轉換的情形, 如表 2 所示.
解釋表2所示的各項結果需要較大的篇幅, 有興趣的讀者可以參閱文獻[34].
特別值得指出的是,無論是通過機制模擬方法實現人工智能3大主流方法的統一, 還是通過機制模擬方法實現高等人工智能理論體系的建立, 其間最為重要的科學基礎是由“信息觀、系統觀、機制觀” 啟迪的“信息轉換”原理. 正是通過信息轉換原理, 才揭示了長期互相脫節的信息理論、知識理論、智能 理論之間內在的本質聯系, 形成了信息、知識、智能 的一體化理論. 同樣, 也正是通過信息轉換原理的應 用, 才可以把粗糙的信息資源(這是與物質、能量同 樣重要的戰略資源)轉換成為人類所需要的各種高級 智能產品. 因此, 信息轉換原理的科學意義, 當可與質量轉換和能量轉換定律相媲美.
6 結語
人類生存與發展的基礎條件是資源; 科學技術的任務就是把資源轉換為人類生存發展所需要的能力產品. 信息是當代3大戰略資源之一, 因此, 把信息資源轉換成為人類需要的各種智能能力產品, 是信息科學技術面臨的歷史使命.
本文所介紹的“信息轉換原理”就是把信息資源轉換為智能能力產品的理論, 包括以下幾方面:
(1) 把只考慮形式因素(因而主要適合于通信領域的)信息論拓展成了形式-內容-價值三位一體(因而適用于全部信息過程)的“全信息理論”, 完善了信息的理論.
(2) 總結了知識的生態理論, 包括知識的內部生態和外部生態理論.
(3) 注意到“知識的外部生態規律——信息-知識-智能轉換(簡稱信息轉換)”正是生成智能的普遍機制, 由此建立了基于信息轉換的人工智能機制模擬方法; 證明了結構模擬、功能模擬、行為模擬方法都和諧統一于機制模擬方法, 從而建立了人工智能的統一理論.
(4) 注意到現行人工智能忽略了意識和情感, 提出了意識、情感、理智三位一體的高等人工智能系統 模型(其中的理智就是現行的人工智能); 并且證明了高等人工智能的所有要素(注意能力、基礎意識能力、情感能力、理智能力和綜合決策能力)的生成機制分別是在各自條件下的信息轉換,從而建立了基于信息轉換原理的高等人工智能理論.
(5) 上述成果表明: 信息轉換原理就是信息、知識、智能的一體化理論, 它使原先互相隔離的信息理 論、知識理論、智能理論得以全面溝通. 從把資源轉 換為產品這個歷史使命判斷, 信息轉換、質量轉換、 能量轉換三者具有同等重要的科學意義和實踐價值.
來源:《科學通報》2013.14期
轉載自:北京物聯網智能技術應用協會