2020年6月15日下午,应上海外国语大学语料库研究院邀请,南京师范大学文学院副教授、哈佛大学CBDB访问学者李斌做了题为“数字人文知识库的构建与计算”的讲座,上外语料库研究院李晓倩博士主持了讲座。本期讲座为上海外国语大学语料库研究院举办的“语料库与跨学科研究”讲坛第11讲。
李斌副教授首先从普通人阅读中国古籍时所遇到的问题谈起,阐述了构建数字人文知识库的缘起,并结合哈佛大学中国历代人物传记资料库等国内外古籍数据库建设的具体案例,讲解了数字人文的定义。然后,李斌副教授结合自己丰富的研究经历,以《左传》和《史记》历史人文数据库的构建为例,通过现场实操,演示了如何对汉语古籍文本进行断句、加注标点、分词和多层标注,并借助丰富的图表和计算公式,展示了如何利用数据库来表示和获取历史人物之间的关系、性别比例、旅行距离等人文知识,从而对历史古籍中的人名、地名和时代信息进行现代化和多媒体化呈现。此外,李斌副教授还结合汉语词汇历时演化数据库的构建,以成语搭配和日汉语词汇交互为例,说明了数字人文应用于词源学研究的重要意义。
在提问环节,针对师生们提出的汉语古籍版本的选择原则、古籍语料断句分词的准确性、古籍语料标注工具、人工读古籍的当代意义等问题,李斌副教授进行了耐心细致地回答。报告展示了数字人文知识库构建与计算的方法和研究思路,生动详实、深入浅出,吸引了近300名师生观看。
李斌,南京师范大学文学院语言科技系副教授,哈佛大学CBDB访问学者。在文学院讲授中文信息处理概论、数据库、语法学、逻辑学等研究生和本科课程。研究领域包括汉语词法分析、认知语义、语料库技术、语法理论、数字人文等方面。出版专著3部,发表论文40多篇。主持完成国家社会科学基金青年项目1项、教育部社科青年项目1项。目前主持国家社科基金项目1项。