亚洲女同精品中文字幕-亚洲女同japan-亚洲女人网-亚洲女人天堂a在线播放-极品小帅哥连坏挨cao记-极品销魂一区二区三区

學(xué)術(shù)咨詢

讓期刊論文更省時(shí)、省事、省心

國(guó)內(nèi)外網(wǎng)頁(yè)存檔理論與實(shí)踐研究歷程與特征分析

時(shí)間:2022年03月31日 分類:經(jīng)濟(jì)論文 次數(shù):

摘 要: [目的/ 意義] 存檔網(wǎng)頁(yè)具有憑證價(jià)值、 情報(bào)價(jià)值及檔案價(jià)值。 對(duì)國(guó)內(nèi)外網(wǎng)頁(yè)存檔研究歷程進(jìn)行梳理, 以期對(duì)我國(guó)實(shí)踐項(xiàng)目的發(fā)展及后續(xù)研究提供借鑒及參考。 [方法/ 過(guò)程] 對(duì) 1993 年至今的國(guó)內(nèi)外網(wǎng)頁(yè)存檔文獻(xiàn)進(jìn)行研讀, 參照 OAIS 模型, 將國(guó)內(nèi)外網(wǎng)頁(yè)存檔研究整

  摘 要: [目的/ 意義] 存檔網(wǎng)頁(yè)具有憑證價(jià)值、 情報(bào)價(jià)值及檔案價(jià)值。 對(duì)國(guó)內(nèi)外網(wǎng)頁(yè)存檔研究歷程進(jìn)行梳理, 以期對(duì)我國(guó)實(shí)踐項(xiàng)目的發(fā)展及后續(xù)研究提供借鑒及參考。 [方法/ 過(guò)程] 對(duì) 1993 年至今的國(guó)內(nèi)外網(wǎng)頁(yè)存檔文獻(xiàn)進(jìn)行研讀, 參照 OAIS 模型, 將國(guó)內(nèi)外網(wǎng)頁(yè)存檔研究整體劃分為 4 個(gè)階段, 分別為初始研究階段、 縱深發(fā)展階段、 功能全面提升階段、 智慧型實(shí)踐項(xiàng)目探索階段; 將各階段發(fā)展概況及研究歷程進(jìn)行梳理, 歸納階段性研究熱點(diǎn)及特征。 [結(jié)果/ 結(jié)論] 網(wǎng)頁(yè)存檔實(shí)踐項(xiàng)目以理論與實(shí)踐并行的方式發(fā)展。 同時(shí), 向智慧型實(shí)踐項(xiàng)目不斷探索。理論模型、 系統(tǒng)框架、 技術(shù)革新、 資源采集方式、 歸檔資源評(píng)估、 資源開(kāi)發(fā)利用及人工配置七者交融并互相促進(jìn), 共同將存檔網(wǎng)頁(yè)資源推向深層化應(yīng)用。

  關(guān)鍵詞: 網(wǎng)頁(yè)存檔; 網(wǎng)頁(yè)保管; 存檔網(wǎng)頁(yè)利用; 網(wǎng)頁(yè)資源長(zhǎng)期保存

圖書(shū)情報(bào)文獻(xiàn)

  隨著互聯(lián)網(wǎng)的普及、 互聯(lián)網(wǎng)技術(shù)的日趨成熟,互聯(lián)網(wǎng)中的 “網(wǎng)頁(yè)信息資源” 已經(jīng)成為全球最大的信息資源庫(kù)。 中國(guó)互聯(lián)網(wǎng)信息中心 2021 年 2 月3 日發(fā)布的 《中國(guó)互聯(lián)網(wǎng)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》 中的統(tǒng)計(jì)數(shù)據(jù)顯示, 截至 2020 年 12 月, 我國(guó)網(wǎng)民規(guī)模達(dá)到 9􀆰 89 億, 較 2020 年 3 月增長(zhǎng)了8 540萬(wàn), 互聯(lián)網(wǎng)普及率達(dá) 70. 4%, 我國(guó)互聯(lián)網(wǎng)行業(yè)在抵御新冠疫情和疫情常態(tài)化防控方面發(fā)揮了積極作用, 為我國(guó)成為全球唯一實(shí)現(xiàn)經(jīng)濟(jì)正增長(zhǎng)的主要經(jīng)濟(jì)體做出了重要貢獻(xiàn)[1]。

  網(wǎng)頁(yè)信息資源是一種動(dòng)態(tài)增長(zhǎng)的、易逝的且不可再生的 “原生性” 網(wǎng)絡(luò)文獻(xiàn)[2], 研究表明一個(gè)網(wǎng)頁(yè)的平均壽命只有 44 天[3], 網(wǎng)頁(yè)中的高價(jià)值資源一旦消失便難以復(fù)原, 將會(huì)給國(guó)家和社會(huì)文化資源的持久保存和歷史傳承造成難以挽回的損失。

  為此, 需要學(xué)界更多關(guān)注并研究網(wǎng)頁(yè)存檔問(wèn)題, 實(shí)現(xiàn)網(wǎng)頁(yè)信息資源長(zhǎng)期保存與持續(xù)利用。所謂網(wǎng)頁(yè)存檔( Web Archive, 簡(jiǎn)稱 WA), 又稱 “網(wǎng)絡(luò)存檔”, 是指一種在 “原生性” 網(wǎng)絡(luò)信息資源的整個(gè)生命周期內(nèi)對(duì)其進(jìn)行有目的的評(píng)價(jià)、 選擇、 采集、 描述、 元數(shù)據(jù)表示、 存儲(chǔ)、 發(fā)布和維護(hù)等一系列工作以確保其當(dāng)前可用和未來(lái)價(jià)值增值的管理活動(dòng)[4]。

  近年來(lái), 國(guó)內(nèi)外相關(guān)領(lǐng)域的專家學(xué)者投入了大量的精力和時(shí)間成本開(kāi)展網(wǎng)絡(luò)存檔研究工作, 不斷完善網(wǎng)絡(luò)存檔的理論研究并積極推進(jìn)實(shí)踐探索, 相關(guān)研究?jī)?nèi)容眾多, 研究主題龐雜, 研究質(zhì)量差異, 使得有必要更好地了解國(guó)內(nèi)外網(wǎng)絡(luò)存檔的研究現(xiàn)狀, 對(duì)國(guó)內(nèi)外網(wǎng)絡(luò)存檔研究進(jìn)行系統(tǒng)梳理,以期對(duì)我國(guó)相關(guān)研究提供借鑒和參考。

  1 研究方法

  本文采用文獻(xiàn)調(diào)研法, 國(guó)內(nèi)文獻(xiàn)選取中國(guó)知網(wǎng) 為國(guó)內(nèi)文獻(xiàn)檢索平臺(tái), 選擇高級(jí)檢索方式, 檢索條件的篇名中分別包含“網(wǎng)頁(yè)存檔” “網(wǎng)絡(luò)存檔” “網(wǎng)頁(yè)保存” “網(wǎng)絡(luò)信息資源長(zhǎng)期保存” “Web Archive” “Web Archiving” 等關(guān)鍵詞。 國(guó)外文獻(xiàn)通過(guò)檢索 Web of Science、 Scopus等外文文獻(xiàn)數(shù)據(jù)庫(kù), 關(guān)鍵詞 “Web Archive” “WebArchiving” “Internet Archive” 等, 經(jīng)過(guò)整理最后得到全部文獻(xiàn) 637 篇, 其中國(guó)內(nèi)文獻(xiàn) 294 篇, 國(guó)外文獻(xiàn) 343 篇。

  國(guó)外最早出現(xiàn)本關(guān)鍵詞相關(guān)文獻(xiàn)是 1993 年,國(guó)內(nèi)是 1999 年。 國(guó)外最早的文獻(xiàn)是 1993 年 C, SIM⁃MONDS 發(fā) 表 的 SEARCHING INTERNET ARCHIVESITES WITH ARCHIE-WHY, WHAT, WHERE, ANDHOW 一文。 國(guó)內(nèi)外在 1993—1999 年共發(fā)文 5 篇,2000—2004 年共發(fā)文 17 篇, 2005—2012 年共發(fā)文159 篇, 2012 至今共發(fā)文 456 篇。 由此可見(jiàn), 與“網(wǎng)頁(yè)存檔” 相關(guān)主題地研究是以遞增的趨勢(shì)發(fā)展,說(shuō)明一直以來(lái)都是國(guó)內(nèi)外眾多學(xué)者研究的重點(diǎn)。

  可以發(fā)現(xiàn), 國(guó)內(nèi)文獻(xiàn)總量為 294 篇, 其中有25 篇為碩士論文, 沒(méi)有相關(guān)主題的博士論文, 說(shuō)明國(guó)內(nèi)對(duì)網(wǎng)頁(yè)存檔的研究還不夠深入。 國(guó)內(nèi)總文獻(xiàn)量呈遞增趨勢(shì), 說(shuō)明在國(guó)內(nèi)越來(lái)越多的專家學(xué)者投入精力完善網(wǎng)頁(yè)存檔的研究工作, 隨著網(wǎng)絡(luò)技術(shù)研究的深入, 未來(lái)會(huì)在此領(lǐng)域有大量新的研究文獻(xiàn)發(fā)表。國(guó)外從 2003 年開(kāi)始文獻(xiàn)量大幅遞增, 這與各個(gè)國(guó)家紛紛投入網(wǎng)頁(yè)存檔實(shí)踐項(xiàng)目有直接聯(lián)系。 隨著實(shí)踐項(xiàng)目的不斷發(fā)展及完善, 在采集、 歸檔保存及長(zhǎng)久保存過(guò)程中所使用技術(shù)的不斷更新, 針對(duì)網(wǎng)頁(yè)存檔過(guò)程中涉及的核心技術(shù)進(jìn)行深入研究的文獻(xiàn)將變多, 由此文獻(xiàn)總量呈明顯遞增趨勢(shì)。

  隨著公眾認(rèn)知增加、 獲取途徑增多, 新的未知問(wèn)題將會(huì)不斷涌現(xiàn), 未來(lái)網(wǎng)頁(yè)存檔將仍然是國(guó)外學(xué)者研究的熱點(diǎn)。在前述基礎(chǔ)之上, 研讀國(guó)內(nèi)外相關(guān)主題文獻(xiàn),挑選時(shí)區(qū)研究重點(diǎn)主題, 并結(jié)合現(xiàn)有研究進(jìn)行階段劃分。 網(wǎng)頁(yè)歸檔實(shí)踐項(xiàng)目的進(jìn)展影響研究主題的更新, 所以, 本文還采用網(wǎng)站調(diào)查法和案例分析法,使用 IIPC(國(guó)際互聯(lián)網(wǎng)保存聯(lián)盟)官方網(wǎng)站獲取最新資料。 通過(guò)對(duì)國(guó)內(nèi)外網(wǎng)頁(yè)歸檔實(shí)踐項(xiàng)目的具體研究, 從整個(gè)網(wǎng)頁(yè)歸檔的流程, 其中包括:

  采集方式、 采集頻率、 技術(shù)方法、 存檔內(nèi)容管理、 系統(tǒng)平臺(tái)搭建、 開(kāi)源工具研發(fā)、 責(zé)任體系構(gòu)建、 法律及權(quán)利等角度作為出發(fā)點(diǎn), 系統(tǒng)歸納并總結(jié)階段性研究熱點(diǎn), 為劃分本文網(wǎng)頁(yè)存檔研究的階段提供了重要依據(jù)。雖然網(wǎng)頁(yè)存檔的理論研究始于 1993 年, 但實(shí)踐研究則始于 1996 年。 本文將網(wǎng)頁(yè)存檔研究歷史進(jìn)程共劃分為 4 個(gè)階段: 第一階段(1996—2005)為網(wǎng)頁(yè)存檔初始項(xiàng)目研究, 第二階段(2006—2010)為網(wǎng)頁(yè) 存 檔 研 究 縱 深 發(fā) 展, 第 三 階 段 ( 2011—2014)為網(wǎng)頁(yè)存檔系統(tǒng)功能全面提升研究, 第四階段(2015—至今)為探索智慧型網(wǎng)頁(yè)存檔實(shí)踐。

  本文在對(duì)國(guó)內(nèi)外近年相關(guān)研究文獻(xiàn)和網(wǎng)絡(luò)存檔項(xiàng)目調(diào)研的基礎(chǔ)上, 參照 OAIS 模型, 將各階段歸納為采集、 管理、 保存、 利用 4 個(gè)主要階段[5], 對(duì)每個(gè)階段的研究進(jìn)行細(xì)分。 以時(shí)間流逝線為主線, 對(duì) 1996 年至今的網(wǎng)頁(yè)存檔相關(guān)主題研究進(jìn)行全方位梳理。

  2 網(wǎng)頁(yè)存檔實(shí)踐項(xiàng)目發(fā)展概況

  縱觀整個(gè)網(wǎng)頁(yè)存檔研究歷史進(jìn)程, 1996 年 In⁃ternet Archive[6]的提出正式意味著網(wǎng)頁(yè)存檔實(shí)踐項(xiàng)目的興起。 同年, 澳大利亞建立 Pandora 項(xiàng)目[7],開(kāi)發(fā)了 “PANDAS” 數(shù)字信息存檔系統(tǒng), 項(xiàng)目保存澳大利亞境內(nèi)在線出版物, 包括社會(huì)科學(xué)和自然科學(xué)、 政治、 宗教文化等方面的資源, 建立與各州立圖書(shū)館的合作關(guān)系, 在系統(tǒng)開(kāi)發(fā)上, 主要在數(shù)字對(duì)象存儲(chǔ)系統(tǒng)、 數(shù)字對(duì)象管理系統(tǒng)及數(shù)字對(duì)象存檔系統(tǒng) 3 個(gè)領(lǐng)域進(jìn)行主要投入[8]。 同年, 瑞典建立 Kul⁃turarw3 項(xiàng)目[9], 收集瑞典頂級(jí)域 “ se” 下的 Web服務(wù)器及部分其他服務(wù)器的資源。1997 年北歐圖書(shū)館在借鑒 Kulturarw3 項(xiàng)目的實(shí)踐經(jīng)驗(yàn)后, 啟動(dòng) NWA 項(xiàng)目[6], 并成立專門(mén)的技術(shù)小組負(fù)責(zé)制定長(zhǎng)期歸檔資源的保存、 訪問(wèn)等技術(shù)規(guī)格, 逐步建立與北歐各國(guó)圖書(shū)館、 整個(gè)歐洲地區(qū)的網(wǎng)頁(yè)存檔合作機(jī)制。

  同年, 美國(guó)國(guó)會(huì)圖書(shū)館建立Minerva Prototype 項(xiàng)目[10], 對(duì)長(zhǎng)期保存資源的數(shù)字化、 元數(shù)據(jù)、 選擇與采集、 可獲取等問(wèn)題進(jìn)行試驗(yàn), 通過(guò)與 Internet Archive 項(xiàng)目合作, 獲取 “Way⁃back Mechine” 及采集技術(shù), 為收集的網(wǎng)頁(yè)資源進(jìn)行索引, 同時(shí)提供短期的數(shù)據(jù)存儲(chǔ)服務(wù), 用戶可以按照網(wǎng)站、 日期或類別獲取資源。1999 年新西蘭國(guó)家圖書(shū)館啟動(dòng)網(wǎng)頁(yè)存檔項(xiàng)目,對(duì)政府、 歷史、 醫(yī)學(xué)、 音樂(lè)、 政策等主題進(jìn)行選擇性采集[11], 保存的資源內(nèi)容支持網(wǎng)址搜索、 關(guān)鍵字搜索、 字母搜索、 主題瀏覽。 2000 年捷克國(guó)家圖書(shū)館建立 WebArchiv 項(xiàng)目, 提出基于重大事件的采集方式。

  2001 年挪威國(guó)家圖書(shū)館啟動(dòng) Paradigma項(xiàng)目, 通過(guò)法定存繳框架對(duì)長(zhǎng)期保存的資源進(jìn)行框定, 并提供獲取服務(wù)[12]。 同年英國(guó)國(guó)家檔案館開(kāi)展網(wǎng)頁(yè)存檔項(xiàng)目并采取選擇性、 事件、 主題的收集方式對(duì)境內(nèi)網(wǎng)站進(jìn)行保存。 在此項(xiàng)目中, 部分內(nèi)容可追溯至 1996 年的英國(guó)中央政府網(wǎng)站[13]。

  3 研究歷程及代表性觀點(diǎn)

  3. 1 資源采集2000 年我國(guó)就有學(xué)者提出建立網(wǎng)上資源庫(kù)的設(shè)想[19], 認(rèn)為創(chuàng)建網(wǎng)上信息資源庫(kù), 收集和保存網(wǎng)絡(luò)產(chǎn)生的信息資源能在 “時(shí)間、 空間和經(jīng)濟(jì)行為” 三者之間進(jìn)行有效配置。 這一想法啟發(fā)了楊道玲[20]提出網(wǎng)絡(luò)資源要及時(shí)、 系統(tǒng)的采集, 應(yīng)建立完善的數(shù)字資源呈繳本制度, 以立法形式確保產(chǎn)生的網(wǎng)絡(luò)資源置于國(guó)家控制下。 2003 李春明等[21]在以上研究基礎(chǔ)之上提出為保證采集內(nèi)容的準(zhǔn)確性, 應(yīng)先基于區(qū)域進(jìn)行模糊抽取, 再基于正則表達(dá)式進(jìn)行精確抽取, 兩種方法需要同時(shí)進(jìn)行。

  2004 年趙俊玲[22] 在提出在資源采集環(huán)節(jié)需要采用選擇性采集、 全域采集等多種方式混合采集資源, 在對(duì)美國(guó)國(guó)會(huì)圖書(shū)館開(kāi)展的 Minerva 項(xiàng)目研究中, 加深自己的研究, 提出基于重大事件的采集方式, 以此, 能夠反映事件的全貌。 同年, 我國(guó)學(xué)者提出, 對(duì)重大事件, 如非典、 人民代表大會(huì)進(jìn)行專題的收集[23], 以上觀點(diǎn)不謀而合。 難以收集資源所有歷史版本及隱藏的或動(dòng)態(tài)資源的難題一直困擾著網(wǎng)絡(luò)資源采集, Hiiragi W 等[24] 提出一個(gè)網(wǎng)絡(luò)歸檔的系統(tǒng)模型, 按照提供網(wǎng)絡(luò)資源的個(gè)人或組織確定的資源歸檔策略來(lái)收集資源的, 從技術(shù)上解決了此問(wèn)題。

  2015 年 Gossen G 等[25]通過(guò)整合社交網(wǎng)絡(luò)和聚焦網(wǎng)絡(luò)抓取來(lái)提高網(wǎng)絡(luò)收藏的新鮮度, 提出通過(guò)一個(gè)新的集成的爬蟲(chóng), 將網(wǎng)絡(luò)和社會(huì)媒體無(wú)縫地整合在一起, 從而為一個(gè)感興趣的主題收集新鮮的、 相關(guān)的網(wǎng)絡(luò)和社會(huì)網(wǎng)絡(luò)內(nèi)容。2016 年陳為東等[26] 在社交媒體資源進(jìn)行網(wǎng)絡(luò)存檔的基礎(chǔ)之上, 從采集工具的角度出發(fā), 提出社交媒體采集工具分為捕獲形式、 插件技術(shù)、 專門(mén)針對(duì)某一資源或社交媒體、 保存對(duì)象、 其他種類共 5類, 從 API 獨(dú)立性、 采集內(nèi)容、 適用對(duì)象、 是否開(kāi)源與是否免費(fèi) 5 個(gè)指標(biāo)比較了捕獲形式下以 API獲取信息的 7 種工具。

  2017 年張衛(wèi)東等[27] 通過(guò)對(duì)歐盟 FP7 框架下發(fā)展成熟且具有代表性的社交媒體信息采集與保存項(xiàng)目 ARCOMEM 采用的信息采集機(jī)制、 采集標(biāo)準(zhǔn)、 采集策略和采集方法等方面予以深入剖析, 提出了建立多元的組織協(xié)作采集機(jī)制、 制定科學(xué)規(guī)范的采集標(biāo)準(zhǔn)、 運(yùn)用多目標(biāo)驅(qū)動(dòng)的采集策略、 開(kāi)發(fā)智能化的采集方法, 提出需要資源保存風(fēng)險(xiǎn)評(píng)估及控制的技術(shù)做出進(jìn)一步研究。

  3. 2 資源管理關(guān)于采集數(shù)據(jù)管理問(wèn)題, 2006 年陳清文[28] 提出在管理方面, 軟件、 硬件、 人力等因素需要經(jīng)濟(jì)費(fèi)用支撐, 應(yīng)該重視經(jīng)濟(jì)效益, 在長(zhǎng)期保存管理策略也提出了提高全民意識(shí)、 制定有關(guān)網(wǎng)絡(luò)信息資源長(zhǎng)期保存的法律、 建立網(wǎng)絡(luò)信息長(zhǎng)期保存的責(zé)任制、 并提出網(wǎng)絡(luò)信息資源呈繳制。 王志庚等[29] 在2007 年提出各國(guó)項(xiàng)目管理數(shù)據(jù)所采取的措施不同,例如數(shù)據(jù)交換。

  因此, 需要聯(lián)合制定存檔數(shù)據(jù)管理的統(tǒng)一標(biāo)準(zhǔn), 但在當(dāng)時(shí)我國(guó) WICP 的總量較小, 還沒(méi)有開(kāi)展系統(tǒng)的數(shù)據(jù)管理研究和實(shí)踐。在 2008 年, 作者對(duì)網(wǎng)絡(luò)信息呈繳制的研究繼續(xù)深化, 提出將網(wǎng)絡(luò)信息資源納入呈繳之列, 呈繳制度應(yīng)該明確呈繳者的權(quán)利和義務(wù)并建立符合我國(guó)國(guó)情的呈繳制[30]。 2011 年楊智勇等[31] 提出要從 4個(gè)方面進(jìn)行網(wǎng)頁(yè)資源長(zhǎng)期保存的管理分別是: 更新技術(shù)、 數(shù)字遷移技術(shù)、 仿真技術(shù)及自動(dòng)管理技術(shù)。

  4 階段性研究特征分析

  4. 1 第一階段(1996—2005)在此階段, 國(guó)內(nèi)外網(wǎng)頁(yè)存檔發(fā)展涉及較為廣泛,這是因?yàn)閷?shí)踐項(xiàng)目剛興起, 帶來(lái)較多可以進(jìn)行研究的切入點(diǎn)。 國(guó)外在對(duì)網(wǎng)頁(yè)歸檔過(guò)程中的采集工具、采集方式、 歸檔資源組織、 網(wǎng)站評(píng)估、 索引網(wǎng)站、保存系統(tǒng)的開(kāi)發(fā)、 升級(jí)等問(wèn)題的研究較為突出。 國(guó)內(nèi)研究則多數(shù)以國(guó)外較成熟的實(shí)踐項(xiàng)目為研究對(duì)象, 充分論述國(guó)內(nèi)實(shí)踐項(xiàng)目的同時(shí), 多角度進(jìn)行分析, 為我國(guó)的網(wǎng)頁(yè)歸檔實(shí)踐項(xiàng)目的發(fā)展提供建議;整體研究呈現(xiàn)增長(zhǎng)的趨勢(shì), 維度趨于橫向拉寬。由 1996—2005 年每一年的發(fā)文數(shù)量逐漸變多,研究代表性思想呈現(xiàn)逐漸朝著整個(gè)實(shí)踐項(xiàng)目各階段進(jìn)行深入研究的趨勢(shì), 研究的范圍逐漸變廣, 有趨于深入研究的趨勢(shì), 隨著時(shí)代的變遷會(huì)帶來(lái)新技術(shù)的革新, 研究的成果將會(huì)呈繼續(xù)增長(zhǎng); 在理論研究方面, 國(guó)內(nèi)的理論研究較多, 技術(shù)方面的研究較少。 國(guó)外相反, 對(duì)技術(shù)問(wèn)題研究較國(guó)內(nèi)更深入也更前沿。

  1) 資源采集: 國(guó)內(nèi)的研究, 對(duì)于網(wǎng)絡(luò)資源采集方式進(jìn)行較為具體的刻畫(huà), 以選擇性采集、 全域采集及主題事件采集等多種采集方式并行的方案受到推崇; 首次提出 “呈繳本制度”, 以確保采集到的資源在國(guó)家的管控之下。2) 資源保存: 國(guó)內(nèi)從資源自身屬性、 保存內(nèi)容的著作權(quán)及信息資源保存框架入手, 對(duì)資源保存策略開(kāi)展試探性研究, 首次出現(xiàn)對(duì)于 “歸檔資源評(píng)價(jià)” 的相關(guān)研究。3) 技術(shù)研發(fā): 國(guó)內(nèi)對(duì)于技術(shù)研發(fā)較少; 而國(guó)外熱度較高, 出現(xiàn)將文本網(wǎng)絡(luò)挖掘技術(shù)、 網(wǎng)絡(luò)考古、 新算法等技術(shù)應(yīng)用于網(wǎng)頁(yè)存檔實(shí)踐項(xiàng)目, 從而解決了網(wǎng)頁(yè)存檔過(guò)程中文件種類多樣化、 腳本語(yǔ)言障礙、 域內(nèi)鏈接結(jié)構(gòu)等技術(shù)難題。4) 系統(tǒng)框架: 國(guó)內(nèi)外的系統(tǒng)框架聚焦于資源采集部分框架搭建, 是因?yàn)榇穗A段對(duì)于網(wǎng)頁(yè)歸檔資源的采集研究較多, 出現(xiàn)基于采集方式的系統(tǒng)框架及社會(huì)正義與道德框架, 以此指引網(wǎng)頁(yè)存檔實(shí)踐活動(dòng)。

  4. 2 第二階段(2006—2010)第二階段, 技術(shù)相關(guān)研究越發(fā)深入; 國(guó)外此階段的重點(diǎn)是技術(shù)的研發(fā)研究, 包括系統(tǒng)架構(gòu)升級(jí)、保存網(wǎng)絡(luò)分布式體系結(jié)構(gòu)、 存儲(chǔ)框架及存檔質(zhì)量等。 國(guó)內(nèi)的研究, 除借鑒國(guó)外的實(shí)踐經(jīng)驗(yàn)之外, 對(duì)我國(guó)網(wǎng)頁(yè)存檔項(xiàng)目的個(gè)性化建議也出現(xiàn)較多研究成果, 對(duì) “責(zé)任體系” 的研究為重點(diǎn)。 在此階段,國(guó)內(nèi)外對(duì)于存檔流程研究更為細(xì)化, 趨近于完善的網(wǎng)頁(yè)存檔應(yīng)用型項(xiàng)目。

  1) 資源采集: 我國(guó)學(xué)者對(duì)于國(guó)內(nèi)重大事件進(jìn)行專題收集, 以此反映事件全貌, 國(guó)外研究從技術(shù)角度解決了采集過(guò)程中, 難以收集資源所有歷史版本及隱藏的或動(dòng)態(tài)資源的難題。2) 資源管理: 國(guó)內(nèi)研究開(kāi)始涉足元數(shù)據(jù)及元數(shù)據(jù)管理, 從軟件、 硬件、 人力、 資金等方面完善網(wǎng)頁(yè)存檔實(shí)踐項(xiàng)目, 對(duì)于 “呈繳制” 的研究進(jìn)一步深化, 呈繳制度應(yīng)該明確呈繳者的權(quán)利和義務(wù)并建立符合我國(guó)國(guó)情的呈繳制。 相較于國(guó)內(nèi), 國(guó)外此階段的研究重點(diǎn)在系統(tǒng)研發(fā)及系統(tǒng)框架搭建。

  3) 資源利用: 國(guó)外學(xué)者研究聚焦于促進(jìn)工具的利用, 從而促進(jìn)資源利用。 國(guó)內(nèi)研究有相似之處, 提倡使用 “Wayback Mechine” 并且在法律允許范圍內(nèi), 盡可能開(kāi)發(fā)系統(tǒng), 在技術(shù)上國(guó)內(nèi)的實(shí)踐項(xiàng)目需要技術(shù)發(fā)展。4) 技術(shù)研發(fā): 國(guó)外對(duì)于技術(shù)研發(fā)實(shí)現(xiàn)一次峰值, 在開(kāi)發(fā)元數(shù)據(jù)、 元數(shù)據(jù)的應(yīng)用、 編目歸檔內(nèi)容的方法等進(jìn)行的研究較多, 也出現(xiàn)了一些設(shè)想, 例如在面對(duì) Web2􀆰 0 時(shí)代的解決方案, 技術(shù)革新需要緊隨時(shí)代發(fā)展的步伐。

  5 結(jié) 語(yǔ)

  網(wǎng)頁(yè)存檔是人類網(wǎng)絡(luò)信息資源長(zhǎng)期保存的重要任務(wù), 時(shí)代的發(fā)展帶來(lái)了眾多新技術(shù)的革新問(wèn)世,這也給實(shí)踐項(xiàng)目帶來(lái)了巨大挑戰(zhàn)。 首先, 網(wǎng)頁(yè)存檔實(shí)踐項(xiàng)目針對(duì)每個(gè)國(guó)家都帶有特色的烙印, 采集工具、 采集內(nèi)容、 資源管理、 保存方式、 利用側(cè)重點(diǎn)、技術(shù)開(kāi)發(fā)方向、 系統(tǒng)平臺(tái)建設(shè)、 法律法規(guī)標(biāo)準(zhǔn)迥異,各具特色。 其次, 作為網(wǎng)頁(yè)存檔實(shí)踐項(xiàng)目責(zé)任主體,長(zhǎng)期保存體系的構(gòu)建者, 又要為廣大用戶提供服務(wù),需要在系統(tǒng)功能方面滿足用戶需求的同時(shí), 在法律允許的范圍內(nèi), 遵守知識(shí)產(chǎn)權(quán)以及隱私權(quán)等相關(guān)法律約束。 隨著各國(guó)網(wǎng)頁(yè)歸檔實(shí)踐項(xiàng)目的發(fā)展, 項(xiàng)目過(guò)程中的各個(gè)流程都將會(huì)進(jìn)一步得到深入研究。 系統(tǒng)梳理以往的研究具有重要作用, 對(duì)于日后網(wǎng)頁(yè)存檔理論及實(shí)踐有啟示意義。

  對(duì)各國(guó)家圖書(shū)館或檔案館而言, 網(wǎng)頁(yè)存檔實(shí)踐項(xiàng)目是技術(shù)與資源及人工共同結(jié)合的一項(xiàng)工程, 網(wǎng)頁(yè)存檔實(shí)踐項(xiàng)目發(fā)展的方向, 始終是指向 “資源深層開(kāi)發(fā)利用” 環(huán)節(jié), 提高資源利用率是最終核心問(wèn)題。 理論模型、 系統(tǒng)框架、 技術(shù)革新、 資源采集方式、 歸檔資源評(píng)估、 資源開(kāi)發(fā)利用及人工配置, 七者交融但又相互促進(jìn)。 后續(xù)的相關(guān)研究中,可以根據(jù)這五方面特點(diǎn), 開(kāi)展更為深入的探索。

  參 考 文 獻(xiàn)

  [1] 中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC). 第 47 次中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告 [R]. 2021-02-03.

  [2] 陽(yáng)廣元. 國(guó)內(nèi)外 Web Archive 研究綜述 [J]. 圖書(shū)館雜志, 2014,33 (10): 88-94.

  [3] 楊道玲. Web 資源保存現(xiàn)狀與思考 [ J]. 圖書(shū)館雜志, 2004,(10): 32-36.

  [4] 陽(yáng)廣元. 國(guó)外 Web Archive 研究進(jìn)展及啟示 [ J]. 圖書(shū)館工作與研究, 2016, (6): 18-21.

  [5] 黃新平, 王萍. 國(guó)內(nèi)外近年 Web Archive 技術(shù)研究與應(yīng)用進(jìn)展[J]. 圖書(shū)館學(xué)研究, 2016, (18): 30-35.

  [6] Developers. Internet Archive [ EB/ OL].

  [7] Pandora [EB/ OL].

  [8] 李華, 吳振新, 郭家義, 等. Web Archive 發(fā)展歷程與發(fā)展趨勢(shì)研究 [J]. 現(xiàn)代圖書(shū)情報(bào)技術(shù), 2009, 3 (1): 1-10.

  [9] National Library of Sweden. Kulturarw3 [EB / OL].

  [10] Library of Congress. Minerva [ EB / OL].

  作者:初彥伯 王 萍∗ 李依凝 李佳恒

主站蜘蛛池模板: 99久久久久精品国产免费麻豆 | 18禁黄久久久AAA片 | 最近2018年手机中文字幕 | 国产精品99 | 中文字幕一区二区三区在线观看 | 亚洲午夜精品一区二区公牛电影院 | 色宅男看片午夜大片免费看 | 欧美精品专区免费观看 | 俺来也俺去也视频久久 | 日韩精品特黄毛片免费看 | 欧美精品九九99久久在观看 | 看电影就来5566先锋av | 又黄又猛又爽大片免费 | 精品免费在线视频 | 538视频这里只有精品 | 四虎永久在线精品免费A | 亚洲精品免费网站 | 花蝴蝶在线高清视频观看免费播放 | 亚洲区视频 | 国产人妻麻豆蜜桃色69 | 色婷婷国产精品视频一区二区三区 | 国产99视频在线观看 | 国产成人在线观看网站 | 毛篇片在线观看 | 一本道高清不卡v免费费 | 久久高清一级毛片 | 亚洲精品视频免费看 | 四虎影视国产精品亚洲精品hd | 欧洲电影巜肉欲丛林 | 伊人精品在线 | 欧美亚洲色帝国 | www色视频在线观看 WWW色视频片内射 | 久久久久国产精品美女毛片 | 校花爽好大快深点h | 日韩精品无码久久一区二区三 | 男男腐文污高干嗯啊快点1V1 | 国产日韩在线欧美视频 | 免费精品美女久久久久久久久 | 无码欧美毛片一区二区三在线视频 | 日本高清不卡一区久久精品 | 男污女XO猛烈的动态图 |