由上海外国语大学语料库研究院胡开宝教授领衔的研究团队经过一年时间的努力,成功研发出智能化多语教学与科研平台,并于2020年12月19日在语料库、语言数据与智慧教育研讨会暨上海外国语大学语言数据与智慧教育研究中心揭牌仪式上进行了公开展示。智能化多语教学与科研平台旨在推进语料库在不同语种教学与科研中的应用,实现语言教学与科研的自动化、可视化与智能化。目前已获得2项国家软件著作权。
智能化多语教学与科研平台基于B/S架构,而非传统的C/S结构设计,使得其在跨平台、稳定性方面有所保障,满足用户在不同场景下的实际操作需求。平台分为后台和前端。后台可进行数据管理、用户管理等。前端包含了三个主要功能模块:语料库(教学科研平台)、知识库、文献库。
语料库(教学科研平台)包含教学模块和科研模块,两者相辅相成,可以直接应用于语言教学与科研。教学模块可进行语篇展示、翻译策略与技巧查询。其中,语篇展示功能可以显示单语语篇或实现句级对齐的多语平行语篇,有助于教学过程中了解某一特定语篇的篇章内容。翻译策略与技巧查询功能可根据不同目录、语对以及某一翻译策略与技巧等进行相应查询,考察特定语境中具体词汇、短语的翻译策略与技巧。
科研模块可以进行单语或平行语料的检索与查询,实现词频、词簇、搭配、索引行等功能,并在提供具体检索结果的基础上,实现词频、搭配等的智能化和可视化呈现。具体而言,词频页面可以查询选定语篇的词汇使用频率信息,可进行选择语种、词性,或排除某些词性的操作,并且上述信息可以用云图或具体表格的形式展示。在词簇页面,用户可以通过选择语种和词簇长度,生成相应长度的词簇,或者输入关键词,查询包含特定关键词的词簇。在搭配页面中,用户可根据语种、节点词查询某节点词的搭配词以及互信息值;此外,还可以根据搭配强度,实现搭配信息的可视化。索引行页面可提供关键词搜索,检索结果可以以单语或多语形式显示,且支持复合检索和排除检索,如检索同时包含“世界”和“中国”但不包含“特色”一词的句子。
知识库模块由术语库和典故库两部分组成,前者提供专业术语的多语种查询,并提供相应语种的的解释,后者提供典故的多语种查询,同时提供典故出处、典故意义等信息。
文献库模块可以按标题、作者、来源、出版时间、标题和主题等检索项进行单一检索或复合检索,并支持查看相关文献、影像资料、图片资料等,为用户提供便利快捷的多模态文献资料检索功能。