“识典古籍”是一个古籍阅读平台,由抖音公益与北京大学合作共建,致力于为用户提供免费公开、稳定、快速、方便的检索和阅读古籍的服务。该平台的目标是智能化整理一万种古籍,基本覆盖儒家、道家和佛学的核心典籍目录,并将全部免费开放。[1]
据“识典古籍”项目负责人介绍,该平台当前主要使用了三种技术,包括文字识别、自动标点和命名实体识别。文字识别技术,是对古籍的影印版文字进行单个切分,再进行文字识别和顺序识别。自动标点技术,是通过序列标注的方式对古籍自动进行标点划分。[0]
“识典古籍”平台包含了多种类别的古籍,例如道家经典、文学经典等,同时也提供了高级检索功能。用户可以通过书名、作者、关键词等多种方式进行检索,以便更快地找到需要的古籍。[2]
据“识典古籍”项目负责人介绍,“识典古籍”平台目前亟需修复的古籍数量达到1000万册件。其中,已有8万种古籍完成影像数字化扫描,近4万种完成文本数字化。[4]
“识典古籍”平台的目标是智能化整理一万种古籍,但并不是所有古籍都能够进行智能化整理。因为古籍的质量和保存情况不同,有些古籍需要进行修复和整理才能进行数字化处理。[4]
用AI让经典重新跳动,这个平台开放了3000万古籍字符
相关导航
暂无评论...