“引得数字人文平台”:www.inindex.com
试用时间:2022.7.25——2022.9.25
该平台包括“中国历代人物传记资料库(CBDB)”、中国通用古籍文库“两库”,以及文本处理工具套组与可视化图表“两工具”。其中,CBDB是目前全球最为成熟的结构化数据库,该数据库除可作为历代人物研究的参考资料外,还可以用作统计分析、地理空间分析与社会网络分析之用。这四个部分共同为人文研究者、学生构建数字人文训练环境、教学环境和研究环境,助力探索人文研究的新范式,促进高等院校“新文科”建设。
引得平台介绍:
1.传记查询:中国历代人物传记资料库(CBDB)
是全球较早进行数据结构化的大型中国历代人物关系传记数据库。目前由哈佛大学费正清中国研究中心、北京大学中国古代史研究中心、台湾“中研院”历史语言研究所共同主持开发,将内容用于学术研究之用。数据库经全球150余位顶级学者四十余年研究积累,目前已积累约51.5万结构化数据(约4亿字),并且每年的数据量仍在持续新增。数据库所收录的人物主要出自先秦至晚清,其中以唐、宋、明、清的人物传记最为充实。CBDB共有七大查询模块,可通过单一条件或多重复杂条件快速查询符合要求的人物,并通过群体传记学、社会网络分析及历史地理信息系统三大研究方法论的支撑,对人物进行分析研究,CBDB还提供可视化查询功能。(注:试用期间无法批量下载数据)
2.通用文献:通用古籍文库
是一款可在线实时全文检索的大型古籍资源库数据。文库收录中国公私机构现存从先秦至民国撰写并经写抄本、刻本、印本、影印的历代汉文古籍资源约2万种31亿文字。该数据库可以做到字字可检索,可按照部、属、书名、著者进行高级检索。(注:试用期间无法批量下载数据)
3.人文工具:数字人文文本处理基础工具套组
为学者提供文本识别、自动句读、专名识别、学科标注、繁简转换的全流程、一站式文本处理工具箱服务,大幅提高文献数字化、结构化效率。截至目前,古籍在线OCR工具对竖排古籍识别正确率接近92%,横排简体识别正确率接近98%。
4.元引图表:数据可视化挖掘工具
数字人文可视化挖掘系统包括100余款多样化基础图表,可以接入多种数据源,利用知识图表工具、大数据和相关概念构建可视化图表,实现从数据置入、存储、展现、挖掘的全流程管理,帮助数字人文领域的专家学者用可视化手段分析,生动呈现研究过程中的结构化数据。无需编程便可轻松制作专业图表。数据可视化挖掘工具助力学者视野更宽更广,发现研究新方向。