《马恩全集》信息化
新版马恩全集以马恩全集中文第一版为依据,参照马恩全集的德文历史考证版、德文版和英文版,以马克思和恩格斯写作或发表时的原文为蓝本,对他们的所有著述重新进行校勘和翻译,计划出书70余卷,目前已正式出版10卷。马列部着手进行信息化探索,有计划、分步骤地向编译工作的信息化转型。
马恩全集二版编译工作可大略地划分为正文翻译和资料编辑两大块业务。马恩全集二版“编”和“译”的信息化是统一的,二者都要依赖相同或相似的信息资源,二者都需要共享彼此的工作成果。为此,马思全集二版编译工作的信息化分成二步走。第一步,建立编译共享数据库,这是翻译和资料工作都必需的信息资源基础,实现了这一步,也就基本实现了二版编译流程中各个点的信息化;第二步,工作稿电子化,优化工作流程。工作稿的电子化使翻译工作和资料工作在同一信息平台上无缝结合,实现了二版编译全线的信息化。
在数据库建设方面,我们以多年积累的各类卡片资料为基础,建立了人名、地名、译名、文献、注释和引文等6大数据库,其中的大部分数据库已经和即将投入使用。这些数据库不光起到有效保存各类资料的作用,还为用户提供了强大、完善的资料查询、引用和管理功能及丰富的输出格式,满足不同场合和应用的需要。所有这些数据库都是动态的,用户可以利用数据库管理工具建立自己的个人数据库,以数据库记录的形式与他人交流资料。当资料积累到一定数量时,经审查,用户个人数据库的资料可以添加到公共数据库中,供全体人员共享。
在数据库建设基本完成后,我们开始着手实施信息化规划的第二步,建立统一的工作稿电子平台,形成全集编译工作电子化的完整解决方案。
数据库
数据库是对信息资源进行存贮、管理和查询的强大工具,能最大限度地消除信息冗余和错误,提高信息的管理和利用效率。很多翻译工作者对计算机文件系统很熟悉,习惯于将各种资料存贮在文件中,而对数据库的使用则比较生疏。的确,在计算机信息处理应用的早期,所有信息都是以文件形式进行存贮和管理的。随看信息资源的增多和种类的扩大,特别是各种看似不相干的资料间还存在着某些联系时,文件系统就难以胜任,弊端越来越明显,主要表现在:信息重复存贮、维护管理困难;资料彼此孤立,查询效率低下。更严重的是,当资料数量超过一定规模时,维护管理成本急剧升高,凝聚无数心血的庞大资料库几乎就成了一堆支离破碎的信息垃圾。
笔者曾见过一名资深翻译耗费大量的精力和时间将自己二十多年积累的某领域的专业术语整理到WORD文件中,可是到使用时才发现这个自编的词库查询起来效率低下,极为不便,最后只好打印出来,作为一本普通的字典使用。假如当初以数据库的形式来建立这个词库,这样的情况就可以避免。
当前,数据库系统的种类很多,对于翻译来说,最好选择比较流行的桌面数据库。加ACCESS等,这类数据库操作简单,与主流文字处理软件易结合。如果要存贮和查询的资料比较简单,甚至可以使用EXCELL。EXCELL虽然不属于数据库,但它能完成很多数据库才有的功能,而且使用起来更为简单、直观。
电子文档处理软件
在文字处理工具中,WORD和ACROBAT表现最为出众。尤其值得一提的是,在WORD中可以直接访问用尸指定的数据库,从数据库中提取和查询资料,或把WORD中的数据直接保存在数据库中。ACROBAT是专门面向多语间文件交流和电子文档共享的文字处理软件,非常适合在不同语种人群、不同类型的计算机间交换文件,现在,很多大型的国际机构(如联合国)已将PDF文件格式(ACROBAT产生的文件格式)作为电子文档的标准格式。
互联网
从翻译工作的角度看,互联网就是一个巨大的、广义的数据库,里面存贮着海量的信息。在翻泽过程中需要查询和引用的资料,或者某个最新词语的约定译法,都可以利用互联网来解决。