以數智方法賦能中華文明研究
![](/img/2020wbc/imgs/icon_type.png)
中華民族擁有五千多年源遠流長的文明脈絡,中華優秀傳統文化是中華文明的智慧結晶和精華所在。習近平總書記高度重視中華文明和中華優秀傳統文化,強調“推動把中國文明歷史研究引向深入,推動全黨全社會增強歷史自覺、堅定文化自信,堅定不移走中國特色社會主義道路”“隻有全面深入了解中華文明的歷史,才能更有效地推動中華優秀傳統文化創造性轉化、創新性發展,更有力地推進中國特色社會主義文化建設”。當前,新一輪科技革命和產業變革深入發展。推動中華優秀傳統文化創造性轉化和創新性發展,不僅要善於傳承和發展人文研究的傳統方法,還要善於用好大數據、人工智能等當代資源和研究手段,充分發揮數智技術的賦能作用,深入把握中華文明發展的宏大歷程,以量化手段和科學標准來深入揭示中華文明的結構特征,深入解讀中華文明上下五千年的文脈。
科學測度文明文化
對文明文化的探究是一個系統工程,需要把考古探索和文獻研究同自然科學技術手段有機結合起來。習近平總書記指出:“要加強統籌規劃和科學布局,堅持多學科、多角度、多層次、全方位,密切考古學和歷史學、人文科學和自然科學的聯合攻關,拓寬研究時空范圍和覆蓋領域,進一步回答好中華文明起源、形成、發展的基本圖景、內在機制以及各區域文明演進路徑等重大問題。”如何對社會意識、價值觀等文化因素進行科學測度,是哲學社會科學領域長期以來面臨的難題。比如,對於文化影響力、知名度和美譽度等“軟指標”,即使採用定量研究、問卷調查等方法,也會因為研究者的主觀偏差而對研究結果的客觀性產生影響。這不僅使傳統的研究方法面臨一些局限,也會影響人們對文明發展的時空特征及其在文明交流互鑒中地位的准確認知。隨著新一代信息技術的發展應用,運用大數據、機器學習等方法,我們能夠對書籍文本數據、全球互聯網檢索數據、新聞媒體數據、自媒體文本數據以及全球學術數據庫等海量信息進行收集、分析和整理,並構建起針對不同文化符號如人物、建筑、文化產品等在全球發展和傳播中的多維度測量指標,進而更加科學精准地對文化因素進行測量。
以書籍文本數據為例。書籍是承載數千年來人類思想和文化觀念最重要的載體,一個文化符號在海量書籍中出現的頻率越高,它在相關文化中的影響力、知名度自然也就越高。借助圖書大數據,我們可以對各類中華文化符號進行多語種詞頻檢索與計算,形成數百年來中國文化遺產、名著和名人的全球文化影響力指標,並與其他各種文化符號進行科學精准對比。比如,通過對英文書籍大數據進行分析,我們可以繪制出精確的詞頻圖,簡明形象地獲知在英語世界中,數百年來是中國長城更具文化知名度還是埃及金字塔更勝一籌。類似地,基於圖像、音頻和視頻等多模態數據,我們能夠基於檢索、收聽、收看、分享、評論和互動等信息,為文化符號的影響力建立起多種測量指標。李白和杜甫誰在德語世界更知名?湯顯祖和莎士比亞誰在東亞諸國的影響力更大?諸如此類以往無法回答的文化測量問題,大數據都能夠給我們提供新的解決方案,也能夠為我們進一步堅定文化自信、促進文明交流互鑒提供扎實的計量依據。
透視文明文化深層結構
文字和文本作為文化與文明的核心載體,承載著豐富的歷史信息與文化意義。中華民族自古以來就十分重視保存歷史資料。從二十四史到詩詞歌賦,我國豐富的歷史文獻保証了中華文化的延綿不斷。習近平總書記指出:“要運用現代科技手段加強古籍典藏的保護修復和綜合利用,深入挖掘古籍蘊含的哲學思想、人文精神、價值理念、道德規范”。面對浩如煙海的文本,僅憑個體研究者的力量,難以形成全面、精確、鳥瞰式的觀察與分析。例如,現存的唐詩有約5萬首,隻有勤勉的學者才能遍讀﹔現存的清詩數量龐大、體例繁復,尚未有精准公認的估計值,其浩瀚規模可想而知。這意味著,盡管我們有數千年的詩教傳統,但作為個體,我們對中國歷朝歷代總體詩歌很難全部讀一遍。大量文學史、詩歌史中的理論和假說的來源,隻能依賴於學者對部分作品的感性認識與把握。從這個意義上說,大數據和機器學習方法的引入,能夠幫助人類形成更加完整、精確的文學文化史。
對於詩詞歌賦甚至小說等海量文本大數據,運用無監督學習的聚類算法技術,可以迅速從全局視角獲得文本內容題材的分布和結構,彌補傳統研究方法的局限。例如,LDA(Latent Dirichlet Allocation)主題模型作為一種文本挖掘工具,能夠從文本中發現潛在的主題結構,可以廣泛應用於信息檢索、文本分類和情感分析等領域。運用這一模型,可以識別出全唐詩、全清詩或其他海量文學作品中的不同題材。進一步對每篇作品的單字屬性分布進行計算和加總,還能將每一首詩歸入識別出的題材中,比如邊塞詩、田園詩等,甚至能繪制出一個歷史時期中的詩歌題材演化圖。這種方法不僅有助於增強對單一文本的閱讀和理解能力,也為從宏觀上鳥瞰文化脈絡的時間之變、世代之變提供了前所未有的工具。此外,深度學習模型的引入,尤其是卷積神經網絡和循環神經網絡模型的應用,使得圖像與文本的聯合分析成為可能。以文人畫為例,通過分析圖像和題詩之間的關系,深度學習模型能夠揭示圖像與詩詞之間的潛在聯系,如詩詞中的意象如何與畫面中的視覺元素相呼應。這種分析突破了單一文本數據的局限,使得對文本和圖像的研究更加立體和多維,為研究傳統藝術形式提供了全新的方法和視角。此外,生成式人工智能同樣也能在海量文本內容分析中展現巨大潛力。具有自然語言處理和圖像生成功能的人工智能可以對海量文本數據進行自動分析、生成與總結。總的來看,以數智方法賦能文明研究,可以讓文明脈絡中的深層結構,特別是那些由個體研究者憑借心腦能力難以發現的內在特征變得可視化,從而為更好地理解文脈演變和結構特征提供重要方法。
捕捉文化遺產之美
文化遺產是老祖宗留下來的寶貴財富。習近平總書記指出:“保護好、傳承好歷史文化遺產是對歷史負責、對人民負責。”一個城市的歷史遺跡、文化古跡、人文底蘊,是城市生命的一部分,也是文化遺產的重要組成部分。文化底蘊毀掉了,城市建得再新再好,也是缺乏生命力的。習近平總書記在北京考察時強調“要把老城區改造提升同保護歷史遺跡、保存歷史文脈統一起來,既要改善人居環境,又要保護歷史文化底蘊,讓歷史文化和現代生活融為一體”,在上海考察時強調“要注重傳承城市文脈,加強文物和文化遺產保護”。數智技術為文化遺產保護提供了重要的數據基礎和監測手段,能夠描繪出呈現歷史文化變遷的“大視野”“大脈絡”。建立一套針對老城區輪廓、肌理與風貌的古今對比數據體系,對於保護和弘揚中華優秀傳統文化、延續城市歷史文脈具有重要意義。
傳統的文化遺產保護方法有賴於歷史文獻、實地調研和有限的遺跡保護手段,在面對龐大且復雜的文化遺產數據和歷史演變時,很難精准重現大規模舊城改造之前的真實老城風貌,也難以實現精准監測和動態評估。數智技術為古城保護提供了全新的數據重建思路和工具。比如,把歷史衛星圖像作為大數據,可以建立起二維的歷史畫卷﹔運用機器學習等智能算法,能夠對海量歷史資料中的文本、圖像、影像和地理信息進行分析整合。輔以激光雷達、無人機掃描等數字化建模手段,運用高精度的地理信息系統與視覺強化技術,能夠在虛擬空間展現古城牆、古街巷、古河道等遺跡的分布和演化過程。南京大學的“中華古城保護數字圖譜”就形成了這樣一種數據集成創新。此外,數智技術通過引入社會發展指標,利用時間序列和空間分析,能夠研究文化遺產變化的規律及其背后的社會文化因素。這有助於讓文化遺產保護實現從靜態記錄到動態監測的轉變,實時追蹤文化遺產保護面臨的變化和風險挑戰,不僅有利於提升保護的精確性和效率,也賦予文化遺產新的生命力。
通過數智方法賦能,文化遺產之美也得以立體而生動地呈現。無論是對於城垣、村落等大型人類聚居空間,還是其他小規模的不可移動文物,這種全方位、多維度的呈現方法均有助於突破傳統靜態展示的局限,使每一件文物、每一處遺跡都“活”起來,具備更強的敘事屬性。文化遺產之美將不再隻能通過文本或圖像靜態展示,而是可以通過更加生動的展示方式,幫助追溯文明發展、展現歷史沿革、融入社會生活,從而更深刻地反映民族精神內涵。這種呈現方式能夠推動文化遺產作為中華優秀傳統文化的經典符號加強傳播,使其成為跨越時空的文化紐帶。在全球范圍內,文化遺產傳播促進了不同文明之間的對話與理解,為全球文化交流與文明互鑒提供了新的視角和動力。
守正創新加強文明研究
推進中國特色社會主義文化建設,守正創新是一條重要原則。習近平總書記在文化傳承發展座談會上強調“守正才能不迷失自我、不迷失方向,創新才能把握時代、引領時代”,在二十屆中共中央政治局第十七次集體學習時強調“要錨定2035年建成文化強國的戰略目標,堅持馬克思主義這一根本指導思想,植根博大精深的中華文明,順應信息技術發展潮流,不斷發展具有強大思想引領力、精神凝聚力、價值感召力、國際影響力的新時代中國特色社會主義文化”。以數智方法賦能中華文明研究,正是守正創新加強文化建設的生動實踐。以多來源大數據為依托,以人工智能技術為方法,以時間變遷、空間差異、時空演化為視角對文明文化發展過程進行全方位“遙感”,與傳統哲學社會科學研究模式形成了類似遠觀天象和近察物情、望遠鏡和顯微鏡那樣的相互補充。這種數智賦能的文明文化研究方法通常被稱為“文化遠讀”。
大數據與人工智能技術為“文化遠讀”提供了更廣闊的視野和更精確的分析工具,對文化現象和歷史文化遺產的分析不再局限於傳統的局部經驗積累研究。通過綜合運用多元異構的海量大數據,深入探討中華文明的深層結構,有助於揭示中華優秀傳統文化經典符號在全球范圍內的影響力與傳播效應,並有助於糾正西方數據庫和大語言模型中的偏見問題。通過智能算法分析,可以呈現中華優秀傳統文化在不同歷史階段的分布特征、演化路徑、傳播效果和影響因素。這種研究方法不僅有助於推動中華文明的傳承和創新發展,也為理解全球文化的多樣性和獨特性提供了新的視角。
在看到“文化遠讀”這一研究方法巨大應用潛力的同時,也要注意其有一定局限性,比如技術門檻較高、依賴海量數據源和復雜算法等。它仍需與傳統的文化研究方法結合,才能幫助研究者更加全面深入地理解文化意涵。以數智方法賦能中華文明研究,能夠促進該領域的跨學科發展,加速中國哲學社會科學自主知識體系的構建,為其他國家的文化治理實踐提供中國思路。同時,也有助於提升中華文明在全球文明體系中的話語權,為真正理解中國道路的歷史必然、文化內涵與獨特優勢奠定知識基礎,為鞏固文化主體性、堅定文化自信開辟科學路徑。
(作者為南京大學黨委副書記)
《 人民日報 》( 2025年02月06日 09 版)
分享讓更多人看到
- 評論
- 關注