時間:2021年03月17日 分類:電子論文 次數:
社會信息化的趨勢使得世界各國在政治、經濟、軍事等方面對信息基礎設施的依賴性不斷加強。 一方面,隨著信息化與辦公自動化(OA)程度的不斷加深,傳統的紙質文件與檔案逐步被電子文件所替代,真正的“無紙化”時代在不久的將來就會成為現實。 由于電子文件較之傳統文件的較多的不同之處,使得管理原理與方法都要發生相應的改變。 另一方面,社會的不斷進步使得人們對檔案信息的價值也更加重視,對信息的利用也提出了更高的要求。 由于電子文件具有信息與載體的可分離性、信息的可操作性、信息的流動性、數字信息的不穩定性等特性,使得電子文件的真實性與完整性的鑒定變的非常困難。
所以,如何保證電子文件的信息真實性與完整性已經成為信息化時代電子文件管理領域最重要的問題之一。 元數據技術成為管理維護電子文件的最重要的工具之一。 由于電子文件元數據記錄了電子文件的特征及其變化情況,是電子文件內容、結構、背景等信息的反映,所以掌握了電子文件元數據就可以對電子文件進行有效與安全的管理與控制,保證電子文件的完整性、真實性,從而保證其證據效力。
一、元數據技術概論
1.電子文件元數據的定義
在計算機專業術語中,這樣定義元數據:“元數據是關于數據的數據,是數字信息組織和處理的基本工具,為各種形態的數字化信息單元和資源集合提供了規范,普遍的描述標準和方法。 ”對于元數據的解讀,各個領域由于對元數據應用的側重點各不相同,對元數據的定義也各不相同。 最早將元數據引入到檔案界的是美國匹茲堡大學的戴維-比爾曼,他在1992的“Documenting document”一文中首先使用元數據這一概念。 據文獻分析,在檔案或電子文件管理領域,元數據存在以下定義:
(1)GB/T18894-2002《電子文件歸檔與管理規范》:“元數據指描述電子文件數據屬性的數據,包括文件的格式,編排結構,硬件和軟件環境,文件處理軟件,字處理和圖形工具軟件,字符集等數據。 ”
(2)ISO15489《文件管理國際標準》:“元數據是描述文件的背景,內容,結構及其整個管理過程的數據。 ”
(3)何嘉蓀教授在《電子文件管理元數據規范》一文中認為:“元數據是與電子文件的制作形成、運轉、處理、儲存、檢索、傳輸和利用有關的數據。 它是在上述過程中自動隨機,或由人工幫助產生的,可以獨立于文件之外記錄、積累、保存、管理和利用的信息。 人們可以通過它來幫助記錄電子文件形成時的背景信息和軟、硬件環境,記錄文件的內容和結構以及整個的管理和檢索利用過程。 ”
簡而言之,可以說:電子文件元數據是描述電子文件背景、內容、結構及其整個管理過程并可為計算機及網絡系統自動辨析、分解、提取和分析歸納的數據。 它既可用于保障相關電子文件的真實性、完整性、一致性、關聯性和長期有效性; 又可幫助對分布式網絡環境下的電子文件進行有效的集成管理和協助提供集成服務,更是構建數字檔案館信息組織體系必不可少的工具。
2.元數據的類型
按照不同的分類方法,元數據可以劃分為不同的類型。 以下主要是按照元數據的功能來劃分類型。 元數據作為一種描述信息特征,組織、評價、識別、開發信息的結構化數據,具有多種類型。 具體來說主要有五類:
(1)管理型元數據。 用來管理與支配信息資源的元數據,如信息收集、版權與翻版跟蹤、排架信息、數字化標準選擇、版本控制等。
(2)描述型元數據。 用來描述文獻信息結構、特征的元數據,如編目記錄、專題索引、書目信息、文摘簡介、網頁鏈接等。
(3)保存型元數據。 用來保存文獻信息資源的元數據,如資源實體條件方面的文獻,數據更新和移植方面的文獻。
(4)技術型元數據。 用來保證系統正常運轉、管理系統的元數據,如硬件、軟件操作源代碼、文件壓縮比率、格式、數據驗證和安全等。
(5)使用型元數據。 直接與用戶接口掛鉤的元數據,如用戶記錄、用戶認證、用戶消息管理、用戶使用跟蹤等。
3.關于元數據的進一步認識
由于元數據是一個比較新的概念,所以人們對元數據的認識還存有一定的誤區,在此將對某些容易產生誤區的方面進行闡述說明。
(1)元數據并非一定以數字形式出現。 元數據的形式是多樣化的,只不過是隨著計算機等數字信息技術的發展,人們越來越頻繁的生成并使用計算機所能夠識別的數字式元數據,并且將原來已經有的元數據進行數字化。
(2)元數據來源的廣泛性。 元數據的來源非常廣泛,可以由人類提供最初的元數據(例如作者、編者、使用者等提供的信息),也可以由計算機自動生成。 雖然隨著計算機軟硬件技術與知識的逐漸普及,計算機自動生成元數據在人類社會生活中所占據的比例越來越大,但是事實上計算機自動生成的元數據并不能替代傳統意義上的提供者所生成的元數據。
(3)元數據是改變的。 元數據不是一成不變的,元數據是在信息對象系統生命周期中生成并自然增加的。 元數據的變化同時也記錄著文件發生變化的過程。 元數據首先被生成,接著被修改,甚至在某個階段被摒棄。 相對電子文件生命周期來說,元數據也具有自己的生命周期。 但是,并不是隨著電子文件的消失,該電子文件的生命周期就結束了,元數據的生命周期將遠遠比電子文件的生命周期長,在某種特殊情況下,甚至元數據的生命周期一直活躍。
二、元數據在電子文件管理過程中的作用
1.電子文件管理系統設計階段
根據“前端控制”思想,對電子文件全程的管理和監控措施應該向前延伸到電子文件管理系統的設計之中。 由于電子文件在系統中運轉,這就要求我們在系統設計時盡可能將文件生命周期各階段的管理要求設計在系統中,以優化管理功能,提高管理效率。 系統設計階段是從電子文件的管理需求出發,根據電子文件在整個生命周期的運行規律及相關條件提出系統功能的需求分析并設計元數據模型。 元數據模型是文檔管理設計的重要內容,由檔案人員和計算機人員共同完成,檔案工作人員主要對元數據的內容、屬性、功能和工作模式提出專業要求,而計算機技術人員負責技術實現。
元數據集將伴隨電子文件始終,從文件創建之時便自動攜帶一個元數據表,隨著文件的形成和運行,元數據不斷得到補充和修改。 文件管理系統也生成系統管理元數據,用作記錄系統操作日志。 元數據的操作大部分由系統自動完成,而對于系統無法勝任的工作,則由人工進行填補。 人工包括文件制作者、利用者、文件管理者和系統管理員。
2.電子文件形成階段
電子文件形成階段是指文件進入到文件管理系統中,系統將自動撲捉文件內容、背景、結構等信息填入元數據表(如:文件標題、文件編號、作者、日期等),然后作者對其他需要在此階段填寫的元數據(如:主題詞、文摘、分類號、密級、保管期限、與其他文件的關系、寫作意圖、機構職責、事務處理流程等背景信息)手動填寫,最后將文件鎖定。 以后除了特殊原因外,用戶無法擅自修改文件內容。 新形成的電子文件保存在臨時文件庫中。
3.電子文件運行階段
電子文件在社會活動中產生,用于表達意圖、進行聯系、記述情況和作為憑證,和傳統文件一樣,有一個運轉、辦理和使用的過程,這便是電子文件的運行階段。 電子文件在文件管理系統中運行時,元數據不斷得到擴充,具體變化情況如下:①電子文件通過網絡被送達給用戶A,系統自動記錄文件的出發地地址、傳輸路徑、目的地地址及相關的身份驗證信息。 用戶A如果對其進行處理,系統會記錄下此用戶對文件的操作過程。
用戶要在一份類似《文件處理單》的電子表格中作必要的登記,并填寫文件辦理意見,如閱讀人姓名、閱讀時間、批注、相關文件等,然后由系統自動將這些內容導入到元數據表中。 ②完成這些操作后,文件被送到下一個用戶N,然后重復步驟①的工作。 ③直至文件辦理完畢,被保存在文件庫中。 可以看出,文件在運行過程中,當文件內容在不斷的補充和完善時,元數據表也不斷得到擴充,可以說這些元數據是維護電子文件運轉和辦理的真實與安全的重要依據和參考。
4.電子文件維護階段
電子文件維護階段的工作宗旨在于保證電子文件的真實性、完整性、有序性、安全性與可用性。 維護工作具體包括:鑒定與歸檔、整理與保管、檢索與利用、脫機備份管理等多個環節,元數據管理貫穿于電子文件維護階段的各個工作環節之中。
(1)電子文件鑒定與歸檔環節的元數據管理。 電子文件鑒定是電子文件管理中最難也是最具挑戰性的環節,比紙質文件的鑒定更具復雜性和難度,而且電子文件形成的時候就應進行相應的鑒定。 此時,元數據將為電子文件內容鑒定和技術鑒定工作提供重要依據,如元數據中的作者職務、機構組織、文件主題、時間、密級、簽署、保管期限、文件品質、利用頻率等元數據元素都是鑒定時非常重要的判定依據。
元數據不僅給文件的歸檔鑒定提供依據和憑證,而且它還將詳細記錄下歸檔鑒定的操作過程、責任者和鑒定結果等信息,并指示系統做出相應處理,同時這些記錄鑒定信息的有關元數據要素又將被保存下來,作為下一次電子文件鑒定工作的基礎和參考。
歸檔的過程也是元數據運動的過程,首先元數據隨文件一起被移入檔案保管系統的檔案庫中,同時元數據自身也在不斷的存取和補充之中。 電子文件進入檔案保管系統需要經過一系列的驗證和檢查,這些驗證和檢查是針對文件和文件元數據兩者同時進行,而且檔案保管系統還將對文件進行歸檔處理,如加入數字簽名或水印、檔案號、歸檔時間、歸檔說明等,處理過程和結果都將補充到文件元數據中。 與此同時,系統也會對文件進行登記、定位保存等操作,此類信息將記錄到系統相關管理元數據中。
(2)電子文件整理與保管階段的元數據管理。 整理時,由于電子文件所攜帶的元數據是文件內容、背景和結構特征的描述,并以結構化規范化的形式存在,所以文件的元數據在此階段是系統的直接操作對象,系統通過繼續補充元數據,并提取元數據的相關元素進行重組,來完成對文件的組織和加工。
元數據還將依然擔任過程跟蹤和記錄工作,記錄管理系統對文件的操作軌跡。 保管時,電子文件元數據為信息保護技術提供裝載平臺和記錄空間,記錄文件保管的經過和結果,向系統管理員提供各種統計和維護數據,起到輔助管理的作用。 文檔管理人員可以通過元數據提供的信息打印統計報表,了解電子文件的維護狀況,從而為以后的維護工作做準備。
(3)電子文件檢索和利用階段的元數據管理。 電子文件信息資源開發和利用不僅是檔案工作者的責任,也是電子文件管理的目標所在。 電子文件的檢索與利用工作包括:用戶管理、存取控制、用戶界面管理、檢索、公布等。 為了達到滿意的檢索和利用效果,元數據將應用于電子文件檢索與利用的每一個工作環節中。
(4)脫機電子文件管理階段的元數據管理。 把那些非現行的、同時又具有保存價值的電子文件導出信息管理系統,保存在磁帶、磁盤和光盤中,甚至轉換成縮微膠片,至此,電子文件進入脫機保存階段。 這時候元數據就顯得尤為重要了,它像一座橋梁,聯系著系統與原文件。 由于文件不在系統中,系統只能通過保留在系統中的元數據了解原文件目前的狀況和位置,保持與原文件的聯系,實施對文件的管理。
在檢索利用的過程中,系統也只能完全根據元數據提供的信息來判斷原文件是否滿足用戶的檢索要求,然后決定是否將原文件返回到系統中接受調用。 元數據在電子文件管理中發揮著巨大的作用。 一是元數據具有靜態映射功能,能夠映射出電子文件的內容、背景技術等信息,反映了該文件的原始狀態及其生成環境; 二是元數據具有動態跟蹤功能,記錄備案了電子文件創建、形成、使用以及載體和設備的更替、銷毀全過程,能在動態中反映電子文件的真實與可靠。
三、元數據的應用對于電子文件管理的意義
元數據應用于電子文件管理解決了電子文件管理領域的三大難題:電子文件的長期可用、電子文件的真實性和電子文件的完整性。 破壞電子文件長期可用性、真實性和完整性的主要原因有以下幾個方面:(1)文件存儲載體受到物理損害; (2)計算機病毒或人為的邏輯損壞; (3)軟硬件環境的升級; (4)人為的對信息內容的篡改。 所以,電子文件的真實與完整性遠遠不如紙質文件那么明顯直觀。
電子文件論文范例:電子文件“電子化歸檔”相關概念辨析及浙江實踐
元數據以通用的語言規范格式來描述電子文件的內容和結構以及文件的背景,具有穩定性,不容易受到環境的影響。 另外元數據能夠實時的跟蹤和記錄文件的操作與變化過程,為維護真實與完整提供有力的憑證。 此外,元數據的應用,改變了現有電子文件的管理模式與方法,大大降低了電子文件管理的風險,改進了電子文件的檢索與利用,同時為分布式數字檔案館的信息組織提供了整合的工具與紐帶,為實現電子文件的分布式管理創造了條件。
參考文獻:
[1]劉家真.電子文件管理與實踐.科學出版社,2003年版
[2]劉嘉.元數據導論.華藝出版社,2002年版
[3]何嘉蓀.電子文件管理元數據規范.浙江檔案,2005(4)
[4]何寶梅.電子文件管理中元數據問題的研究述評.秘書,2003(6)
作者:王云慶,劉振華