您當(dāng)前的位置 : 中國甘肅網(wǎng) >> 書香隴原 >> 要聞

      數(shù)字化為古籍研究帶來怎樣的“蝶變”

      22-04-15 09:27 來源:光明日報(bào) 編輯:張?zhí)m琴

        數(shù)字化為古籍研究帶來怎樣的“蝶變”

        數(shù)字與古籍,以前像兩條涇渭分明的河流。

        當(dāng)它們相遇后,能產(chǎn)生怎樣的效能和反應(yīng)?

        循著新近出臺(tái)的《關(guān)于推進(jìn)新時(shí)代古籍工作的意見》所提出的“推進(jìn)古籍?dāng)?shù)字化”“積極開展古籍文本結(jié)構(gòu)化、知識(shí)體系化、利用智能化的研究和實(shí)踐”等要求,記者采訪了國內(nèi)從事古籍智能化研究的學(xué)者,探一探數(shù)字化能給古籍保護(hù)與研究帶來怎樣的“蝶變”。

        沉寂的典籍,動(dòng)起來了

        一幅橫向流動(dòng)的《千里江山圖》上,標(biāo)注了“涑水”“濂溪”“玉山”等若干個(gè)古地名。數(shù)百個(gè)衣袂飄飄的儒生,正在圖上緩緩挪動(dòng),像是在“趕路”。他們從一個(gè)地方挪到另一個(gè)地方的行程,代表著他們的求學(xué)歷程和所屬學(xué)派。

        這是北京大學(xué)人工智能專業(yè)學(xué)生馬源和她的同學(xué)們向首屆“北京大學(xué)數(shù)字人文作品展”所提交的展品——用JavaScript完成的H5習(xí)作,取名為“宋元學(xué)案傳承可視化系統(tǒng)”。

        “像《宋元學(xué)案》這樣的大部頭古籍,離我們的時(shí)代太遙遠(yuǎn)了。如果不是做專業(yè)研究的學(xué)者,可能根本想不起來要翻閱它。我們想通過這種像游戲界面一樣的形態(tài),吸引年輕人了解古籍。”馬源說。

        展覽現(xiàn)場,同樣能帶來“躍動(dòng)”感的,是北京大學(xué)中國古代史研究中心副主任史睿指導(dǎo)桑宇辰等同學(xué)制作的“朱子年譜可視化系統(tǒng)”,它利用GIS(地理信息系統(tǒng))技術(shù),對《朱熹年譜長編》進(jìn)行了時(shí)空的可視化呈現(xiàn),讀者能自主點(diǎn)擊、了解朱熹求學(xué)、游歷、交友的生平。

        數(shù)字技術(shù)甚至賦予古籍研究人文學(xué)科的能力,遠(yuǎn)不止讓它們像游戲一樣動(dòng)起來。

        “數(shù)字人文代表著智能信息環(huán)境下,人文社會(huì)科學(xué)研究范式的轉(zhuǎn)型,從傳統(tǒng)的文本驅(qū)動(dòng)向數(shù)據(jù)驅(qū)動(dòng)轉(zhuǎn)型。人文研究的材料,如文獻(xiàn)、圖錄、器物等,都可轉(zhuǎn)化成某種形態(tài)的數(shù)據(jù),從而使得大數(shù)據(jù)和人工智能技術(shù)也能處理它們。視覺化只是數(shù)字人文帶來的附帶效應(yīng),讓人易于理解學(xué)術(shù)成果。而其深層邏輯,是研究范式的變化。”北京大學(xué)數(shù)字人文研究中心主任王軍教授告訴記者。

        展覽現(xiàn)場有他指導(dǎo)的博士生王林旭對《宋元學(xué)案》《明儒學(xué)案》《清儒學(xué)案》所做的數(shù)據(jù)挖掘成果展示——

        “學(xué)術(shù)關(guān)系網(wǎng)絡(luò)圖”,用正則表達(dá)式對《宋元學(xué)案》和《清儒學(xué)案》進(jìn)行人物關(guān)系統(tǒng)計(jì),共有“弟子”“家學(xué)”“私淑”“同調(diào)”“學(xué)侶”“講友”“交游”“從游”“其他”9種類型,出現(xiàn)頻次一目了然。

        “通過知識(shí)圖譜的重構(gòu),古籍不再是一座座文字的大山,古文里的內(nèi)在結(jié)構(gòu)和語義關(guān)系能在短時(shí)間內(nèi)被清晰的抽繹和展示出來。”王軍說。

        除了中國古籍能“數(shù)”讀,國外的古籍能“數(shù)”讀嗎?

        答案是肯定的。

        在北京大學(xué)外國語學(xué)院西葡意語系教師成沫對意大利詩人但丁進(jìn)行的數(shù)字化研究項(xiàng)目中,《神曲》中重復(fù)頻率最高的三行詩韻律結(jié)構(gòu)valle(山谷)、spalle(肩膀)、calle(小道)被精準(zhǔn)地提煉了出來。

        不僅是“讀取”,還要能“演繹”

        過去的典籍研究,主要靠大師。

        大師在大量閱讀文獻(xiàn)的基礎(chǔ)上,靠一己的記憶與思辨能力,產(chǎn)出具有思想性的研究成果,再訴諸筆端,以文字的形態(tài)傳遞給大眾。

        機(jī)器智能輔助下的典籍研究,則是以數(shù)據(jù)為基礎(chǔ)的。在機(jī)器智能的介入下,學(xué)者能獲得瞬間處理海量資料的能力,王軍分析。

        清華大學(xué)中文系教授劉石和首都師范大學(xué)中國詩歌研究中心專職研究員尹小林發(fā)表的一篇文章,對先秦到清代的百部經(jīng)典古籍做了大數(shù)據(jù)分析,發(fā)現(xiàn)頗豐。如果依賴于人工統(tǒng)計(jì),這樣的成果是難以在短時(shí)期內(nèi)產(chǎn)生的。數(shù)字帶給經(jīng)典典籍研究的變化之一,是效率的提升。

        “在詩歌研究領(lǐng)域,前輩學(xué)者主要通過例證,來進(jìn)行分析和總結(jié)中國古典詩詞的聲律。后來出現(xiàn)了手工標(biāo)注統(tǒng)計(jì)和基于大量詩詞的定量分析統(tǒng)計(jì)。然而這些研究結(jié)論都來源于人工統(tǒng)計(jì),單項(xiàng)研究的耗時(shí)長。”北京大學(xué)中文系教授杜曉勤回顧道。

        有沒有一個(gè)軟件,能“一鍵”就準(zhǔn)確標(biāo)注所有中國古典詩詞的聲律格式和合律程度呢?

        從2004年起,杜曉勤等開始建設(shè)中國古代音韻數(shù)據(jù)庫和中國古代詩歌文本數(shù)據(jù)庫,共錄入1萬多個(gè)漢字的音韻和900多萬字的詩歌。在此基礎(chǔ)上,他們研發(fā)了“中國古典詩歌聲律分析系統(tǒng)”。這個(gè)系統(tǒng),能快速、大批量標(biāo)記與統(tǒng)計(jì)分析中國古典詩歌的聲律。

        利用這個(gè)系統(tǒng),杜曉勤撰寫了《齊梁詩歌向盛唐詩歌的嬗變》《六朝聲律與唐詩體格》等多部專著,刊發(fā)了多篇論文。

        在古籍?dāng)?shù)字化領(lǐng)域耕耘多年,王軍想做的不僅僅是對古籍進(jìn)行單向度的知識(shí)抽取和信息集成。

        他指導(dǎo)唐雪梅、嚴(yán)承希等博士生研發(fā)的古籍自動(dòng)整理系統(tǒng),通過對算法的深度學(xué)習(xí)和大規(guī)模語料訓(xùn)練,能對古籍的句讀和人名、地名、職官、書名、時(shí)間五類實(shí)體進(jìn)行自動(dòng)標(biāo)記。其中句讀平均準(zhǔn)確率達(dá)94%,命名實(shí)體識(shí)別在史料上的準(zhǔn)確率達(dá)98%。

        “智能技術(shù)支持下的古典文獻(xiàn)研究,是未來古籍研究的重要方向之一。”王軍說。

        人文學(xué)科新氣象的“薪火”,從這里誕生

        “昨夜星辰昨夜風(fēng),千秋靈會(huì)此宵同。一枝月桂和煙秀,人在瓊樓玉宇中。”在一次公開演講中,清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系教授孫茂松向聽眾展示了一首詩。

        “你們能看出,這是一首從4篇古詩里摘錄句子組成的集句詩嗎?關(guān)鍵是,能看出這是機(jī)器人創(chuàng)作的嗎?”孫茂松問。

        通過算法和深度學(xué)習(xí),人工智能已經(jīng)能媲美人類進(jìn)行攝影、畫畫、作曲、寫詩。

        創(chuàng)造性,這一人類所獨(dú)有的領(lǐng)域,正逐步被機(jī)器介入,由此也產(chǎn)生了一些倫理問題——例如,機(jī)器通過習(xí)得而非人類在感情充沛時(shí)產(chǎn)生的創(chuàng)造物,能被稱為“藝術(shù)”嗎?

        同樣的問題,也易產(chǎn)生在人工智能賦能后的人文學(xué)術(shù)研究領(lǐng)域。

        機(jī)器介入各類古籍研究后產(chǎn)生的結(jié)果,如各類統(tǒng)計(jì)數(shù)據(jù)、可視化“圖譜”或者“頁面”,能被認(rèn)定為具有思想性的人文研究成果嗎?如果能,怎樣量化它們的學(xué)術(shù)價(jià)值?

        “這些應(yīng)該也算作成果的一種形式。在各個(gè)學(xué)界,對數(shù)據(jù)集的重視都在日益增強(qiáng),以古籍研究為基礎(chǔ)的史學(xué)、文學(xué)等人文學(xué)科不應(yīng)輕視,而且要更加重視。而可視化本身,一方面可以幫助學(xué)者獲得更多洞見,另一方面也能更好地向大眾進(jìn)行傳播。有一些方式,是傳統(tǒng)手段難以達(dá)到的,是人文學(xué)科新氣象的‘薪火’,需要保護(hù)好。”北京大學(xué)智能學(xué)院教授袁曉如這樣回答記者的疑問。

        “無論是可視化成果本身,還是成果產(chǎn)生的傳播效應(yīng),都是可以計(jì)量的。當(dāng)然,雖然數(shù)據(jù)驅(qū)動(dòng)將智能技術(shù)引入了人文學(xué)科,但是數(shù)據(jù)的使用和意義的闡釋,還是需要人文學(xué)者的介入和指導(dǎo)。”王軍說。

        新近出臺(tái)的《關(guān)于推進(jìn)新時(shí)代古籍工作的意見》要求,“加強(qiáng)古籍?dāng)?shù)據(jù)流通和協(xié)同管理,實(shí)現(xiàn)古籍?dāng)?shù)字化資源匯聚共享”“支持古籍?dāng)?shù)字化重點(diǎn)單位做強(qiáng)做優(yōu),加強(qiáng)古籍?dāng)?shù)字化資源管理和開放共享”。

        這背后,有著怎樣的原因?

        “因?yàn)楣偶悄芑耙云錇榛A(chǔ)的人文學(xué)術(shù)研究需要大量的資金投入。計(jì)算工具平臺(tái)、數(shù)據(jù)資源、技術(shù)服務(wù)團(tuán)隊(duì)等,都需要投入。然而,每個(gè)研究機(jī)構(gòu)的資金實(shí)力是不一致的。傳統(tǒng)依靠一兩位學(xué)者皓首窮經(jīng)就能產(chǎn)生大量成果的研究方法,在數(shù)字化時(shí)代可能不適用了。為了彌補(bǔ)資金投入差別造成的學(xué)術(shù)鴻溝,就有必要加強(qiáng)共享。”王軍談道。

        “北京大學(xué)可以肩負(fù)起建設(shè)國家基礎(chǔ)設(shè)施的任務(wù),同時(shí)也將這些設(shè)施對外分享,幫助偏遠(yuǎn)地區(qū)或者學(xué)術(shù)資源不足的地方開展研究。”袁曉如說。

        古籍?dāng)?shù)字化保護(hù)與利用的新樂章,已經(jīng)奏響了。(記者 韓寒)

      版權(quán)聲明:凡注有稿件來源為“中國甘肅網(wǎng)”的稿件,均為中國甘肅網(wǎng)版權(quán)稿件,轉(zhuǎn)載必須注明來源為“中國甘肅網(wǎng)”。

      西北角西北角
      中國甘肅網(wǎng)微信中國甘肅網(wǎng)微信
      中國甘肅網(wǎng)微博中國甘肅網(wǎng)微博
      微博甘肅微博甘肅
      學(xué)習(xí)強(qiáng)國學(xué)習(xí)強(qiáng)國
      今日頭條號(hào)今日頭條號(hào)

      互聯(lián)網(wǎng)新聞信息服務(wù)許可證編號(hào):6212006002 | ICP備案:隴ICP備17001500號(hào) | 經(jīng)營許可證編號(hào):甘B2-20060006 | 廣播電視節(jié)目制作經(jīng)營許可證編號(hào):(甘)字第079號(hào)增值電信業(yè)務(wù)許可證編號(hào):甘B2__20120010

      食品藥品監(jiān)管總局投訴舉報(bào)電話:12331 | 互聯(lián)網(wǎng)違法和不良信息舉報(bào)電話:12377

      主辦:甘肅中甘網(wǎng)傳媒有限責(zé)任公司 | 本網(wǎng)常年法律顧問團(tuán):甘肅和諧律師事務(wù)所(0931-8580115)甘肅天旺律師事務(wù)所(0931-8864528)

      Copyright © 2006 - 2016 中國甘肅網(wǎng)(GSCN.COM.CN) All Rights Reserved

      網(wǎng)站簡介 | 人才招聘 | 廣告服務(wù) | 聯(lián)系我們 | 違法和不良信息舉報(bào)電話: 0931-8960109 0931-8960307(傳真)

      分享到
      主站蜘蛛池模板: 日产精品99久久久久久| 精品久久久噜噜噜久久久| 国产综合色在线视频区| 一本精品99久久精品77| 日本高清乱理伦片中文字幕啊| 亚洲国产综合第一精品小说| 理论片中文字幕在线观看| 又粗又大又长又爽免费视频| 视频一本大道香蕉久在线播放| 国产日韩一区二区三区在线观看 | 日本高清二区视频久二区 | 国产精品亚洲w码日韩中文| 中文字幕AV一区中文字幕天堂| 日本高清色www网站色| 二区久久国产乱子伦免费精品| 欧美在线一级视频| 亚洲欧美日韩精品久久| 玩乡下小处雏女免费视频| 午夜寂寞在线一级观看免费| 色综合久久伊人| 国产亚洲综合成人91精品| 黄网站在线免费| 国产成人啪精品视频免费网| 日本三级韩国三级美三级91| 国产精品成人一区二区三区| 777奇米视频| 国产高清在线不卡| 99精品一区二区三区无码吞精| 好男人在线视频www官网| 一男n女高h后宫| 影院成人区精品一区二区婷婷丽春院影视| 中文字幕在线电影| 成年网在线观看免费观看网址| 久久99精品久久久久子伦小说| 日本三级韩国三级美三级91 | 久久乐国产精品亚洲综合| 日韩一级片在线观看| 久久精品国产99国产精偷| 日韩欧美色综合| 久久精品国产亚洲AV果冻传媒| 日韩视频免费在线|