zh-CN ZH-CN en EN
English
  • 首頁
  • 頭條新聞
  • 聚焦英國
  • 經濟觀察
    • 金融
    • 证券
    • 商业市场
    • 公司
    • 能源
    • 汽車
    • 科技
    • 醫藥
  • 全球連線
    • 軍事
    • 政治
    • 文体
  • 中國視野
  • 全球精英連線
  • 電子報紙
  • 新聞資訊
  • 旅遊
  • 英中投资
  • 深度· 言論
  • 視頻
  • 首頁
  • 頭條新聞
  • 聚焦英國
  • 經濟觀察
    • 金融
    • 证券
    • 商业市场
    • 公司
    • 能源
    • 汽車
    • 科技
    • 醫藥
  • 全球連線
    • 軍事
    • 政治
    • 文体
  • 中國視野
  • 全球精英連線
  • 電子報紙
  • 新聞資訊
  • 旅遊
  • 英中投资
  • 深度· 言論
  • 視頻
没有结果
查看所有结果
SKY ECONOMY NEWS
没有结果
查看所有结果
您當前的位置 : 科技 > 文章内容 返回
AI進軍古代文本研究:人工神經網路正成為解讀古文字鑰匙
发布:2025-01-14

“碎片集”專案正在將數以萬計的楔形文字數位化。圖為一份天文學文本。

 

2019年,研究人員利用英國鑽石光源同步加速器掃描赫庫蘭尼姆古卷殘片。 圖片來源:英國《自然》雜誌

從金融到醫學,人工智慧(AI)正深刻改變著現代生活。如今,它開始進軍古代文本研究:從希臘與拉丁典籍到中國甲骨文,人工神經網路正成為解讀古文字的鑰匙。它不僅能駕馭浩瀚檔案,填補字元空缺,還能解碼幾乎無跡可尋的罕見或滅絕語言,令古代智慧在現代科技之光下重現輝煌。

2023年10月,費德裏卡·尼科拉爾迪收到了一封電子郵件,郵件附帶的一張圖片徹底改變了她的研究。此圖顯示了從西元79年維蘇威火山浩劫中倖存的一卷莎草紙殘骸,它於18世紀在赫庫蘭尼姆古城的一處豪華別墅遺跡中被發現。這些歷經滄桑的莎草紙,曾是數百卷古籍之一,卻因歲月侵蝕而變得脆弱不堪,多數已無法展開。

尼科拉爾迪是義大利那不勒斯大學的一名莎草紙學者,她曾參與一項利用AI讀取難解文字的研究。而今,她見證了一項奇跡:圖片上,一片莎草紙帶上,希臘字母密佈如織,於幽暗中煥發新生。

這一名為“維蘇威挑戰”的專案只是AI重塑古代歷史研究的“冰山一角”。

神經網路重建古代文本

幾十年來,電腦一直被用於對數字化文本進行分類和分析,但目前最令人興奮的是神經網路的使用。神經網路由相互連接的節點組成的分層結構組成,尤其是具有多個內部層的“深層”神經網路。

卷積神經網路(CNN)模型能夠從這些圖像中精准捕捉網格狀數據結構。CNN模型在光學字元識別領域大放異彩的同時,也開闢了其他多元化的應用途徑。例如,中國研究團隊在探索甲骨文時,巧妙地運用這些模型來復原遭受嚴重侵蝕的文字圖案,深入分析甲骨文隨時間的演變軌跡,並將破碎的文物碎片重新拼湊起來,重現歷史原貌。

與此同時,迴圈神經網路(RNN)作為一種專為處理線性序列數據設計的模型,開始展現出在搜索、翻譯以及填補已轉錄古代文本缺失內容方面的巨大潛力。RNN已被用於為古巴比倫時期數百份格式嚴謹的行政和法律文本提供缺失字元的智能化建議。

那麼,神經網路能否在歷史的殘片中找出人類專家難以發現的聯繫?2017年,英國牛津大學的一項合作開啟了探索之旅,當時,兩名研究人員正面臨破解西西里希臘銘文的難題。

古典學者通常依賴對現存文本的理解來詮釋新材料,但難以全面掌握所有相關資料。牛津大學研究人員認為,這正是機器學習可發揮作用的領域。他們使用基於RNN的Pythia模型,並用數萬份希臘銘文來訓練它,最終成功預測了文本中缺失的單詞和字元。

2022年,他們又推出Ithaca模型,不僅能預測缺失內容,還能為未知文本提供日期和來源地建議。Ithaca利用了Transformer模型的突破,能捕捉更複雜的語言模式。當前風靡全球的聊天機器人,如OpenAI的ChatGPT就是基於Transformer模型。

翻譯復原浩瀚歷史檔案

韓國研究人員有一項棘手的任務:整理世界上規模最大的歷史檔案之一。該檔案詳細記錄了27位朝鮮王國國王自14世紀至20世紀初統治時期的日常,涵蓋數十萬篇文章。美國紐約大學機器翻譯專家金亨俊表示,這些文本數據量極為龐大。

將這些文本人工譯成現代韓文,預計需耗時數十年。金亨俊攜手韓國同行,利用Transformer網路訓練自動翻譯系統。結果顯示,AI譯文在準確性和可讀性上遠超古韓文,有時甚至優於現代韓文。

對於僅存少量文本的古代語言,研究人員也會採用神經網路進行破解。希臘帕特拉斯大學的卡特裏娜·帕帕瓦西裏歐及其團隊,利用RNN恢復了克里特島諾索斯邁錫尼泥板中缺失的線性文字B文本。測試顯示,模型預測準確性高,且常與人類專家建議相符。

面臨驗證與利用雙重挑戰

利用AI破解古文字依舊面臨諸多挑戰。AI技術使非專業人士也能接觸到大量古代文獻,如何確保研究成果準確無誤,成為了首要挑戰。神經網路的強大雖令人矚目,但其偶爾產生的誤導性結果,即“幻覺現象”,也讓人對結果的可靠性產生擔憂。

英國《自然》雜誌指出,為解決這一問題,人文科學專家與電腦科學家需攜手合作,共同研究並驗證AI的解讀結果。同時,提倡將所有相關數據(包括原始文本、掃描檔、訓練模型及演算法)實行開源,以此提升研究的透明度與可驗證性。這一做法被稱為“數字來源鏈”,旨在構建一個從原始數據到最終結論的完整鏈條,便於任何人回溯並核實研究過程。

此外,隨著數位化文本數量的激增,如何有效利用這些龐大的數據資源,從中提煉出關於古代社會的重要資訊,也是研究人員面臨的新課題。這要求研究者轉變視角,從單一的文本分析轉向對整體文化的深入理解,並嘗試將不同地域、不同時期的文本數據相互關聯,以獲得更為全面的認識。

來源:中國科技日報

上一篇:中國建立世界第一套微波亮溫度國家計量基準
下一篇:OpenAI重組機器人部門,將打造實體AGI智能
相關推荐
  • 電動汽車永不斷電!法國高速公路測試“邊開邊充”技術:暫態功率達300千瓦
    链接阅读
  • 穿在腳上的“電動自行車”:耐克推出全球首款動力鞋系統
    链接阅读
  • 穀歌AI晶片獲大單:Anthropic將使用100萬個TPU訓練大模型
    链接阅读
  • “水下幽靈”問世!西工大研製透明仿生水母機器人:功耗僅28.5毫瓦
    链接阅读
  • 首個全國產!兆芯、聯想開天聯合打造AI教室:螢幕巧妙
    链接阅读
  • 中國首顆海洋鹽度探測衛星完成在軌測試,功能、性能均滿足或優於設計指標
    链接阅读
  • 蘋果A20晶片首發臺積電2nm工藝,單顆成本預估280美元
    链接阅读
  • OpenAI發佈流覽器ChatGPT Atlas,挑戰穀歌
    链接阅读

歡迎瀏覽閱讀星空經濟新聞華文網

投稿郵件:
news@skyeconomymedia.com

東盟峰會將接待特朗普,中美尋求避免貿易戰升級

2025-10-24

日本高市早苗面臨特朗普訪日帶來的國防抱負早期考驗

特朗普將赴韓國會晤習近平 作為亞洲之行環節

日本新執政聯盟計畫大規模支出,但不支持安倍經濟學2.0

2025-10-23

同花順前三季度淨利增85%,員工持股平臺已減持69萬股至少套現2.49億元

日本新首相將以皮卡車和大豆爭取特朗普支持

2025-10-22

關於我們

星空經濟新聞華文網是一家專注於提供英中兩國最新資訊的新聞媒體,作為英中新聞分享的領導者,我們致力於打造一個全球化、多元化的新聞環境,旨在搭建東西方文化橋樑,連接同一星空下的每一處角落。

聯絡我們

編 輯 部:KINGTON UNITED KINGDOM HR5 3DJ
電子郵箱:skyeconomyandmediagroup@gmail.com

總编寄语

穿越天際,照亮世界,星空新聞,不負每一份關注。
友情:英國駐中國大使館 中國駐英國大使館 新華網 中國日報 鳳凰網 中國僑網 歐洲時報 俄羅斯龍報
没有结果
查看所有结果
  • 首頁
  • 頭條新聞
  • 聚焦英國
  • 經濟觀察
    • 金融
    • 证券
    • 商业市场
    • 公司
    • 能源
    • 汽車
    • 科技
    • 醫藥
  • 全球連線
    • 軍事
    • 政治
    • 文体
  • 中國視野
  • 全球精英連線
  • 電子報紙
  • 新聞資訊
  • 旅遊
  • 英中投资
  • 深度· 言論
  • 視頻

© 2023 SEMG.