自2020年成功申请语言数据科学与应用二级交叉学科点以来,上外语料库研究院高度重视人才培养工作。2021年12月,语料库研究院成立语言数据开发与应用研究生创新工作室和自然语言处理研究生创新工作室,并依托这些工作室活动的开展,培养语言数据科学与应用专业研究生的创新能力和实践能力。研究生创新工作室充分利用研究院现有资源,通过内部培训、专项指导、技术交流等方式培养学生的创新思维和创新能力。语言数据开发与应用研究生创新工作室旨在培养学生在语言数据开发与应用方面的创新精神与创新能力,自然语言处理研究生创新工作室旨在进一步打破学科壁垒,推动文理交叉融合,以信息技术为文科专业发展赋能。
自成立以来,语言数据开发与应用研究生创新工作室定期召开内部培训会,讲解语料库建设基础,现场指导工作室成员进行语言数据处理,承接多项语言智能平台建设工作,培养成员的语言数据处理与语料库建设能力。自然语言处理研究生创新工作室积极开展各种专项培训工作,其中包括Python基础培训、Python爬虫培训、服务器远程使用培训、PyQt应用软件开发培训等多种专项培训课程,补强研究生的技术短板,提升研究生的自然语言处理技术应用能力。
经过努力,创新工作室成员在学术研究、软件开发和平台建设等方面取得了突出成绩,共发表学术论文4篇(其中CSSCI期刊论文1篇,国际会议论文1篇);取得软件著作权2项(另有2项软件正在内测阶段);参与编写国家标准1项;参与语言智能平台建设项目3项。
学术论文
[1]Huang, B. Translation for professionals: corpus-based study of translation universals in computing[C]. Proceedings of the 35th Pacific Asia conference on language, information and computation. Shanghai, China: Association for Computational Lingustics, 2021: 80-88.
[2]龙绍赟,黄宝荣.专业学生情态序列主题性年级趋向[J].外语教学理论与实践,2021(03):95-107.
[3]闫潼.基于语料库的政治文献英译被动句语义韵研究[J].东方翻译,2020(04):32-39.
[4]胡开宝,闫潼.中国当代文学作品英译对外传播的策略[N].中国社会科学报,2021-12-17(A06).
软件著作权
VocabDetector 词汇提取与分层软件
玩译翻译练习软件
国家标准
国家标准《翻译服务 笔译服务要求》
平台建设
《习近平谈治国理政》多语种数据库综合平台
中国特色大国外交话语数据库综合平台