中华书局“中华古籍语料库”及数字化产品,完成2亿多字已整理出版经典古籍的数字化,目前质量最高的古籍数字资源。已经成功应用在经典古籍再版。
“中华古籍语料库”是2003年由中国出版集团公司所属中华书局启动的项目,目前已完成了2亿多字已整理出版经典古籍的数字化工作,数据差错率控制在万分之一以下,可以说是目前质量最高的古籍数字资源。该语料库按照复合出版的构想,已经成功应用在中华书局经典古籍的文本自动化处理、再版制作、纸质书印刷等方面,如“二十四史”的修订底本生成。
基于知识服务的探索——《资治通鉴分析系统》
着眼于未来,中华书局将目光放在了更具潜力,能更好为读者服务的古籍知识分析系统上来。基于语义网络技术,中华书局实验开发了《资治通鉴分析系统》。该系统能将《资治通鉴》中的人名、地名、职官、事件等等分类检索和分析。提供了基于语义的查询检索、基于信息重组的分类导航、基于扩展知识服务的阅读浏览功能。
金文资源的开发——“商周铜器铭文”知识库
中华书局出版过一大批包括《殷周金文集成》、《三代吉金文存》、《金文编》等金文著录及研究图书,形成了丰富的商周铜器铭文出版资源,建立了“商周铜器铭文”知识库系统,提供给读者一个阅读、检索、统计分析商周铜器铭文的工具。系统提供给读者高清晰的拓片、摹本、照片图像12000多幅,附有全部释文,提供相关的检索,附有参考文献及相关论文,形成一套基于商周铜器铭文的知识体系。