淺談紙質(zhì)標準文獻的數(shù)字化過程及其管理措施論文
前言
在信息化社會,如何利用先進的計算機網(wǎng)絡技術有效地管理紙質(zhì)標準文獻,開發(fā)和利用紙質(zhì)標準資源,提高紙質(zhì)標準文獻的綜合利用和服務水平,已成為數(shù)字化標準館建設和發(fā)展所面臨的一個重要課題。紙質(zhì)標準文獻的數(shù)字化管理作為開發(fā)和利用標準信息資源的基礎和前提,作為數(shù)字化標準館建設的一項重要的、基礎性的工作,已被提上了重要日程。
1對紙質(zhì)標準文獻的數(shù)字化與數(shù)字化管理的理解
1.1數(shù)字與數(shù)字化
數(shù)字的特點是最簡單、最客觀、速度快、國際化。所謂數(shù)字化,是指用計算機技術將模擬信號轉(zhuǎn)換為數(shù)字信號的處理過程。
1.2紙質(zhì)標準文獻的數(shù)字化的含義
所謂紙質(zhì)標準文獻的數(shù)字化,是指采用掃描儀或數(shù)碼相機等數(shù)碼設備對紙質(zhì)標準文獻進行數(shù)字化加工,轉(zhuǎn)換成數(shù)字信號或數(shù)字編碼,將其存儲在磁盤、光盤等載體上并能被計算機識別的數(shù)字圖像或數(shù)字文本的處理過程。
1.3紙質(zhì)標準文獻的數(shù)字化管理的含義
紙質(zhì)標準文獻的數(shù)字化管理是指利用計算機、通信、網(wǎng)絡等技術,通過數(shù)字信號或數(shù)字編碼來操縱管理對象、控制管理行為,實現(xiàn)標準文獻的采集、整理、加工、存儲、備份、利用、服務等的管理活動和方法。隨著管理過程信息化程度的提高,采用標準文獻的數(shù)字化管理系統(tǒng),實現(xiàn)數(shù)字信息系統(tǒng)來輔助質(zhì)量管理并與實現(xiàn)跨時空、同步性的信息化溝通。
2紙質(zhì)標準文獻的數(shù)字化
2.1軟硬兼施是前提
紙質(zhì)標準文獻的數(shù)字化要實現(xiàn)文本在不同載體之間自由轉(zhuǎn)換,涉及掃描技術、OCR技術、數(shù)據(jù)壓縮技術、數(shù)據(jù)庫技術、多媒體技術、存儲技術等多種技術,才能完成數(shù)字化的標準文獻目錄信息、數(shù)字化的標準文獻全文信息和數(shù)字化的標準文獻數(shù)據(jù)庫信息。這些數(shù)字化技術和工作,依賴于必要的設備設施。因此要大力加強數(shù)字化工作的硬獻、軟獻建設,為實現(xiàn)紙質(zhì)標準文獻的數(shù)字化提供物質(zhì)保障。如,軟獻方面,要準備數(shù)據(jù)庫SQL SERVER、標準文獻的數(shù)字化管理軟獻,實現(xiàn)功能模塊的管理,能夠?qū)Σ煌x的標準文獻信息進行查詢、管理。硬獻方面,要添置高速掃描儀、平板掃描儀、刻錄機、光盤等。
2.2要分類實施
紙質(zhì)標準文獻的數(shù)字化,不能一蹦而就。筆者認為,一是要實行“存量數(shù)字化”,大力推進已有的紙質(zhì)標準文獻的數(shù)字化,實現(xiàn)存量的紙質(zhì)標準文獻100%數(shù)字化二是要實行“增量電子化”,全面開展新增的新標準文獻的數(shù)字化工作。
2.3紙質(zhì)標準文獻的數(shù)字化流程
紙質(zhì)標準文獻的數(shù)字化,主要流程一般包括紙質(zhì)標準文獻的整理、掃描、圖像處理、圖像存儲、數(shù)據(jù)處理、數(shù)據(jù)驗收、信息存儲、目錄建庫、數(shù)據(jù)掛接、數(shù)據(jù)備份等工序。
2.3.1紙質(zhì)標準文獻的整理
紙質(zhì)標準文獻在掃描之前,要根據(jù)情況,按步驟進行適當整理,并視需要作出標識,確保數(shù)字化質(zhì)量。一是做好目錄數(shù)據(jù)準備。主要是規(guī)范目錄內(nèi)容,包括確定目錄的著錄項、字段長度和內(nèi)容要求。如標準文獻的中英文標準名稱、標準編號、發(fā)布者、發(fā)布時間、實施時間、起止頁號和頁數(shù)、附獻等。二是拆除裝訂。在不去除裝訂物(如釘書針等)情況下,影響掃描工作進行的標準文獻,應拆除裝訂物。拆除裝訂物時應注意保護標準原獻不受損害。三是整理登記。制作并填寫紙質(zhì)標準文獻數(shù)字化加工過程交接登記表單,詳細記錄標準文獻整理后每份文獻的起始頁號和頁數(shù)。四是還原裝訂。掃描工作完成后,拆除過裝訂物的標準文獻應重新裝訂。恢復裝訂時,要注意保持標準文獻的排列順序不變,做到安全、準確、無遺漏。
2.3.2紙質(zhì)標準文獻的掃描
主要是選擇掃描方式、掃描色彩模式、掃描分辨率和標準文獻掃描,包括根據(jù)標準文獻幅面的`大小(A4, A3等)選擇相應規(guī)格的掃描儀進行掃描,選擇黑白二值、灰度、彩色等掃描色彩模式,選擇掃描分辨率(需要進行OCR漢字識別的標準文獻,掃描分辨率宜選擇大于或等于200dpi),核對每份文獻的實際掃描頁數(shù)與標準文獻整理時填寫的文獻頁數(shù)是否一致。
2.3.3圖像處理
主要是檢查圖像偏斜度、清晰度、失真度等圖像數(shù)據(jù)質(zhì)量、是否漏掃、是否需要糾偏、去污、分區(qū)掃描形成的多幅圖像的拼接、裁邊處理去除多余的白邊等。
2.3.4圖像存儲
包括存儲格式和圖像文獻的命名。采用黑白二值模式掃描的圖像文獻,一般采用TIFF (G4)格式存儲。采用灰度模式和彩色模式掃描的文獻,一般采用JPEG格式存儲。存儲時的壓縮率的選擇,應以保證掃描的圖像清晰可讀的前提下,盡量減小存儲容量為準則。提供網(wǎng)絡查詢的掃描圖像,也可存儲為CEB, PDF或其他格式。紙質(zhì)標準文獻目錄數(shù)據(jù)庫中的每一份文獻,都有一個與之相對應的唯一編號,以該編號為這份文獻掃描后的圖像文獻命名。多頁標準文獻可采用該編號建立相應文獻夾,按頁碼順序?qū)D像文獻命名。
2.3.5目錄建庫
包括數(shù)據(jù)格式選擇、建立目錄數(shù)據(jù)庫和目錄數(shù)據(jù)質(zhì)量檢查。目錄建庫應選擇通用的數(shù)據(jù)格式。所選定的數(shù)據(jù)格式應能直接或間接通過XML文檔進行數(shù)據(jù)交換。建立標準文獻目錄數(shù)據(jù)庫,并以人工校對或軟獻自動校對的方式,對目錄數(shù)據(jù)庫的建庫質(zhì)量進行檢查。核對著錄項目是否完整、著錄內(nèi)容是否規(guī)范、準確,發(fā)現(xiàn)不合格的數(shù)據(jù)應要求進行修改或重錄。
2.3.6圖文轉(zhuǎn)換
將掃描的以TIFF (G4) , JPEG, CEB, PDF或其他格式的圖像文獻通過OCR文字識別軟獻或PDF轉(zhuǎn)換器轉(zhuǎn)換成WORD文檔。并按標準原獻的格式式樣排版好。
2.3.7數(shù)據(jù)掛接
主要包括匯總掛接和數(shù)據(jù)關聯(lián)。標準文獻數(shù)字化轉(zhuǎn)換過程中形成的目錄數(shù)據(jù)庫與圖像數(shù)據(jù)庫 (或轉(zhuǎn)換好的WORD文檔庫),檢查無誤后,通過網(wǎng)絡及時加載到數(shù)據(jù)服務器端匯總。通過每一份圖像文獻(或轉(zhuǎn)換好的WORD文檔)的文獻名與標準文獻目錄數(shù)據(jù)庫中該份文獻的編號的一致性和唯一性,建立起一一對應的關聯(lián)關系,以實現(xiàn)標準文獻目錄數(shù)據(jù)庫與圖像文獻(或轉(zhuǎn)換好的WORD文檔)的批量掛接。
2.3.8數(shù)據(jù)驗收
以抽檢的方式檢查已完成數(shù)字化轉(zhuǎn)換的所有數(shù)據(jù),包括目錄數(shù)據(jù)庫、圖像文獻、轉(zhuǎn)換好的WORD文檔及數(shù)據(jù)掛接的總體質(zhì)量并經(jīng)分管領導審核、簽字。
2.3.9數(shù)據(jù)備份
經(jīng)驗收合格的完整數(shù)據(jù)應及時進行備份。為保證數(shù)據(jù)安全,備份載體的選擇應多樣化,可采用在線、離線相結合的方式實現(xiàn)多套備份,并實行異地保存。備份數(shù)據(jù)也應進行檢驗。備份數(shù)據(jù)的檢驗內(nèi)容主要包括備份數(shù)據(jù)能否打開、數(shù)據(jù)信息是否完整、文獻數(shù)量是否準確等。數(shù)據(jù)備份后應在相應的備份介質(zhì)上做好標簽,以便查找和管理。
3紙質(zhì)標準文獻的數(shù)字化管理
3.1紙質(zhì)標準文獻的數(shù)字化管理的優(yōu)點
紙質(zhì)標準文獻的數(shù)字化管理與傳統(tǒng)紙質(zhì)標準文獻的管理具有無法替代性和優(yōu)越性:
3.1.1效益大大提高
紙質(zhì)標準文獻的數(shù)字化管理是對以增加人力和辦公費用為主的粗放型管理模式的變革。它解決了人力資源增加和管理成本上漲的難題,并且使紙質(zhì)標準文獻的信息對象轉(zhuǎn)化為機讀標準文獻信息,既節(jié)約了保管費用,又節(jié)省了保管空間,更為有利的是查閱起來極為方便、快捷,也避免了反復復印標準文獻而造成的人力成本的增加和紙張的浪費。
3.1.2效率大大提升
紙質(zhì)標準文獻的數(shù)字化管理使標準文獻能及時歸檔,并方便、快捷、及時提供利用。紙質(zhì)標準文獻的數(shù)字化管理可遠程提供詳細、即時的數(shù)據(jù)信息提供服務。紙質(zhì)標準文獻的數(shù)字化管理使查詢標準文獻變得非常簡單,真正做到足不出戶。基于標準信息的超時空、遠程化傳送,數(shù)字化的標準文獻就成了“無墻界的紙質(zhì)標準文獻”,數(shù)字標準文獻的標準庫也從紙質(zhì)標準實體的保管變成了提供利用方便、快捷的數(shù)字化標準信息中心。而且標準是否更改、是否廢止、是否是最新的可一次性族性檢索出來,效率大大提升。
3.1.3有力地保護了紙質(zhì)標準文獻的原獻
將紙制紙質(zhì)標準文獻轉(zhuǎn)變?yōu)閿?shù)字化電子標準文獻后,紙質(zhì)標準文獻的使用更加安全。另外,通過紙質(zhì)標準文獻的數(shù)字化處理后,防止了部分紙質(zhì)標準文獻的篡改的行為。
3.2紙質(zhì)標準文獻的數(shù)字化管理措施
3.2.1“服務為先”,實施標準文獻管理平臺的建設
要牢固樹立服務理念,堅持服務為先,在服務中實現(xiàn)管理,在管理中體現(xiàn)服務,進一步在標準文獻檢索利用平臺、載體、機制和手段創(chuàng)新上下功夫,建立服務主體多元、資源優(yōu)化配置、供需對接的服務供應方式,建立“標準文獻管理系統(tǒng)”,集標準文獻采集、標準文獻管理、標準文獻利用于一體的綜合管理軟獻,實現(xiàn)對標準文獻的收集、鑒別、整理、保管、轉(zhuǎn)遞、統(tǒng)計、檢索、查閱利用、打印等日常工作的數(shù)字化管理。
3.2.2“保障有力”,建設標準文獻管理網(wǎng)絡
一是建立梯次的人員管理網(wǎng)絡,設置管理員管理權限,明確管理員管理職責;二是服務器和服務終端建設,建設一套系統(tǒng)連通局域網(wǎng)絡,實現(xiàn)服務器與客戶端數(shù)據(jù)的雙向透明傳輸。
3.2.3“安全第一”,建設標準文獻管理防火墻
標準文獻管理安全保障要覆蓋事前、事中、事后,覆蓋標準文獻應用安全、維護安全、使用安全和存儲安全。除了前面已提到的數(shù)據(jù)備份保安全之外,還要重點確保數(shù)據(jù)庫安全。數(shù)據(jù)庫安全包含兩層含義:第一層是指標準文獻管理系統(tǒng)運行安全。系統(tǒng)運行安全通常受到的威脅如下,一些網(wǎng)絡不法分子通過網(wǎng)絡,局域網(wǎng)等途徑通過入侵電腦使系統(tǒng)無法正常啟動;第二層是指標準文獻管理系統(tǒng)信息安全。駭客對數(shù)據(jù)庫入侵,并盜取想要的資料。數(shù)據(jù)庫系統(tǒng)的安全特性主要是針對數(shù)據(jù)而言的,包括數(shù)據(jù)獨立性、數(shù)據(jù)安全性、數(shù)據(jù)完整性、并發(fā)控制、故障恢復等幾個方面。我們加強對紙質(zhì)標準文獻數(shù)字化成果的管理,確保其安全、完整和長期可用。
結語
紙質(zhì)標準文獻的數(shù)字化及其管理是一項長期的、復雜的、細致的、系統(tǒng)性的工作,必須貫徹“統(tǒng)一規(guī)劃、分步實施、逐步完善”的工作思路,采取得力措施,扎扎實實地進行,才能取得滿意的成效。
【淺談紙質(zhì)標準文獻的數(shù)字化過程及其管理措施論文】相關文章:
淺談科技公司經(jīng)營成本管理及改進措施論文10-25
文獻綜述論文寫作過程03-31
路基施工技術簡介及其管理措施分析論文07-04
論文的參考文獻標準格式03-24
淺談班組標準化管理論文01-30
淺談建設工程全過程造價管理與控制工學論文07-04