《馬恩全集》信息化

作者：陳聰發布時間：2004-01-07

分享到：

新版馬恩全集以馬恩全集中文第一版為依據，參照馬恩全集的德文歷史考証版、德文版和英文版，以馬克思和恩格斯寫作或發表時的原文為藍本，對他們的所有著述重新進行校勘和翻譯，計劃出書70余卷，目前已正式出版10卷。馬列部著手進行信息化探索，有計劃、分步驟地向編譯工作的信息化轉型。

馬恩全集二版編譯工作可大略地劃分為正文翻譯和資料編輯兩大塊業務。馬恩全集二版“編”和“譯”的信息化是統一的，二者都要依賴相同或相似的信息資源，二者都需要共享彼此的工作成果。為此，馬思全集二版編譯工作的信息化分成二步走。第一步，建立編譯共享數據庫，這是翻譯和資料工作都必需的信息資源基礎，實現了這一步，也就基本實現了二版編譯流程中各個點的信息化﹔第二步，工作稿電子化，優化工作流程。工作稿的電子化使翻譯工作和資料工作在同一信息平台上無縫結合，實現了二版編譯全線的信息化。

在數據庫建設方面，我們以多年積累的各類卡片資料為基礎，建立了人名、地名、譯名、文獻、注釋和引文等6大數據庫，其中的大部分數據庫已經和即將投入使用。這些數據庫不光起到有效保存各類資料的作用，還為用戶提供了強大、完善的資料查詢、引用和管理功能及豐富的輸出格式，滿足不同場合和應用的需要。所有這些數據庫都是動態的，用戶可以利用數據庫管理工具建立自己的個人數據庫，以數據庫記錄的形式與他人交流資料。當資料積累到一定數量時，經審查，用戶個人數據庫的資料可以添加到公共數據庫中，供全體人員共享。

在數據庫建設基本完成后，我們開始著手實施信息化規劃的第二步，建立統一的工作稿電子平台，形成全集編譯工作電子化的完整解決方案。

數據庫

數據庫是對信息資源進行存貯、管理和查詢的強大工具，能最大限度地消除信息冗余和錯誤，提高信息的管理和利用效率。很多翻譯工作者對計算機文件系統很熟悉，習慣於將各種資料存貯在文件中，而對數據庫的使用則比較生疏。的確，在計算機信息處理應用的早期，所有信息都是以文件形式進行存貯和管理的。隨看信息資源的增多和種類的擴大，特別是各種看似不相干的資料間還存在著某些聯系時，文件系統就難以勝任，弊端越來越明顯，主要表現在：信息重復存貯、維護管理困難﹔資料彼此孤立，查詢效率低下。更嚴重的是，當資料數量超過一定規模時，維護管理成本急劇升高，凝聚無數心血的龐大資料庫幾乎就成了一堆支離破碎的信息垃圾。

筆者曾見過一名資深翻譯耗費大量的精力和時間將自己二十多年積累的某領域的專業術語整理到WORD文件中，可是到使用時才發現這個自編的詞庫查詢起來效率低下，極為不便，最后隻好打印出來，作為一本普通的字典使用。假如當初以數據庫的形式來建立這個詞庫，這樣的情況就可以避免。

當前，數據庫系統的種類很多，對於翻譯來說，最好選擇比較流行的桌面數據庫。加ACCESS等，這類數據庫操作簡單，與主流文字處理軟件易結合。如果要存貯和查詢的資料比較簡單，甚至可以使用EXCELL。EXCELL雖然不屬於數據庫，但它能完成很多數據庫才有的功能，而且使用起來更為簡單、直觀。

電子文檔處理軟件

在文字處理工具中，WORD和ACROBAT表現最為出眾。尤其值得一提的是，在WORD中可以直接訪問用尸指定的數據庫，從數據庫中提取和查詢資料，或把WORD中的數據直接保存在數據庫中。ACROBAT是專門面向多語間文件交流和電子文檔共享的文字處理軟件，非常適合在不同語種人群、不同類型的計算機間交換文件，現在，很多大型的國際機構（如聯合國）已將PDF文件格式（ACROBAT產生的文件格式）作為電子文檔的標准格式。

互聯網

　從翻譯工作的角度看，互聯網就是一個巨大的、廣義的數據庫，裡面存貯著海量的信息。在翻澤過程中需要查詢和引用的資料，或者某個最新詞語的約定譯法，都可以利用互聯網來解決。