招生与人才培养

语言数据科学微专业招生简章 Language Data Science

Published:2024-06-11 

一、项目背景

在教育部新文科发展战略背景下,上海交通大学外国语学院积极响应国家人工智能,尤其是语言智能重大发展战略,顺应外国语言文学学科交叉与融合的趋势,精选符合国家社会需求与学科前沿的优势课程,强力打造“语言数据科学”微专业。

该项目为非学历非学位项目,致力于培养具备语言科学、认知科学和计算机科学等多学科知识,具有广阔国际视野、社会责任感和创新实践能力的语言数据科学拔尖创新人才。

二、项目特色

  • 平台优势:2022年底教育部第五轮学科评估中外国语言文学学科位居全国前3%。依托语料库与数据科学研究中心、海内外知名高校和企业,提升学员语言数据处理与分析能力。
  • 优质师资:遴选国内知名高校教师任教。
  • 前沿性强:对接国际前沿新兴学科,创新发展融合课程。
  • 零基础:课程内容针对没有编程基础的学员进行设计和优化,让零基础学员也能轻松掌握语言数据科学相关的编程技能。

三、课程设置

  • 跨学科交叉课程设置:包含计算机科学、认知科学等多个领域的知识。
  • 理论与应用相结合:通过分析真实案例,提升学生实践能力。
  • 6+2+2阶梯式课程设置:从基础课到进阶课到应用课,共10学分。

四、课程修读(共10学分)

1.基础模块(4学分)

①课程名称:编程与语言数据分析

学分:2  学时:理论+实践 32学时

课程简介:讲授Python基础编程知识和技巧以及语言数据分析中的编程技能;编程基础知识、编程工具与技巧、数据采集与清洗、数据处理案例应用。

②课程名称:语言数据统计与分析

学分:2   学时:理论+实践 32学时

课程简介:讲授统计学的基本原理和方法,并将R语言与相关方法应用于语言数据处理过程之中;统计学方法及其适用性、数据检验。

2.进阶模块(4学分)

①课程名称:自然语言处理与机器学习

学分:2   学时:理论+实践 32学时

课程简介:本课程系统讲授自然语言处理框架下机器学习的基本原理和方法,涵盖传统机器学习和深度学习以及两者融合等内容。学生可通过不同机器学习模式训练得到各种语言模型并实现模型的有效应用与评估。课程注重理论实践结合,通过代码复现、小型项目和案例分析,培养运用机器学习技术解决语言问题的能力,助力学生在人工智能、语言服务等领域的学术研究与职业发展。

②课程名称:语音数据科学与应用

学分:2   学时:理论+实践 32学时

课程简介:本课程讲授语音科学的基本概念、原理以及语音数据处理技术与应用。课程涵盖语音学三大分支,即发音语音学、声学语音学和听觉语音学,以及语音库构建与数据分析。同时,将介绍语音识别、语音合成领域的最新成果及其在语音测试评估、语言认知健康评估领域的应用。

3.应用模块(2学分)

①课程名称:语料库与翻译

学分:0.5    学时:理论+实践 8学时

课程简介:讲授语料库的相关知识、方法、技术和工具以及语料库与翻译的关系;语料库技术、语料库翻译、翻译技术。

②课程名称:机器学习与翻译质量评估

学分:0.5    学时:理论+实践 8学时

课程简介:讲授翻译质量评估的基本原理与方法以及机器学习方法加持下的评估模式;翻译质量评估、人评与机评、机器学习算法。

③课程名称:大语言模型与应用

课程简介:本课程介绍大语言模型的历史及现状。主要讲解语言模型的基本原理及其背后的算法,同时介绍目前大语言模型研究的进展以及应用。

④数字人文

学分:0.5    学时:理论+实践 8学时

课程简介:讲授数字人文的科学领域及其数字化资源研究对象和所依托的现代通讯技术、超媒体和数字图书馆、数智技术等基础性研究平台和技术手段,并以此作为方法论的共同基础;核心基础活动、远读+细读、人文概念+技术、舆情监测。

五、师资阵容

“语言数据科学”微专业项目师资团队构成依托上海交通大学外国语言文学一流学科优秀师资,选拔语言数据科学领域颇有建树和丰富教学经验的拔尖教师组成教师团队,同时强势联合国内一流高校优秀师资,带给学习者富有前沿性、学科交叉融合性的系列语言数据科学微专业课程体验。

吴诗玉,上海交通大学晨星青年学者教授,在《外语教学与研究》《心理学报》《外国语》,Second Language Research, Journal of Pragmatics, IRAL等国内、国际期刊上共发表50余篇研究论文;在Routledge以及科学出版社等共出版5部学术著作。已出版《第二语言加工及R语言应用》(外语教学与研究出版社,2019)、《R在语言科学研究中的应用》(科学出版社,2021)和《基于R的语言研究多变量分析》(上海交通大学出版社,2023)3部向外语界同行推介R语言应用的著作。担任JSLS“二语研究与数据科学专业委员会”会长,上海交通大学法学院智慧司法实验室兼职教授,Journal of second language studies联合执行主编。

庞双子,上海交通大学外国语学院教授、博士生导师。北京外国语大学文学博士,上海交通大学外国语言文学博士后,英国曼彻斯特大学访问学者。教授英汉笔译、语料库翻译研究、英汉语言对比与翻译等课程。主要领域为语料库和翻译研究。近年来,主持国家社科基金项目、教育部社科项目多项。在Target、《外语教学与研究》《中国翻译》《外国语》等发表学术论文约20篇。在商务印书馆、外研社、上海交大出版社出版学术专著3部。

管新潮,上海交通大学外国语学院副教授,MTI导师。长期从事德英汉翻译实践,至今已累计翻译和审校德英汉字数达3000万;主要翻译领域涉及海洋工程与船舶制造(英语)、医学(英语)、法律(德语+英语)、机电(德语)等。研究方向:计算翻译学、翻译技术与管理、法律翻译。曾经或正在为国际知名企业提供语言服务解决方案,如德国劳氏船级社、挪威船级社、艾斯维尔出版社、施普林格出版社、华为技术有限公司、毕马威咨询公司、联合国亚洲及太平洋经济社会委员会等。主持联合国项目1个、国家级项目3个,横向项目若干;发表论文20多篇,出版专著7部、译著10部,拥有专利2项、软件著作权2项。

王昊,上海大学计算机工程与科学学院智能科学与技术系副教授,主要从事人工智能与认知科学相关研究。2019年博士毕业于日本早稻田大学,曾获国家留学基金委CSC公派博士生奖学金资助。曾在微软亚洲研究院、东芝全球研发中心和日本NTT公司通讯研究所工作。在EMNLP、COLING、CogSci等自然语言处理和认知科学顶级国际会议以及SCI/SSCI/A&HCI三大索引国际期刊上发表论文30余篇。主持国家自然科学基金青年项目(人工智能交叉)、上海市科委扬帆计划项目,参与国自然重大、面上项目、科技部重点研发计划及社会治理专项项目多项。

胡海,上海交通大学外国语学院助理教授。2021年获美国印第安纳大学计算语言学博士学位(辅修认知科学)。获中国人民大学英语语言文学本科、硕士学位。 研究方向为:计算语言学、自然语言处理、大语言模型、认知科学。 在Computational Linguistics等计算语言学、语言学权威期刊发表论文多篇,在ACL, AAAI, EMNLP, COLING等自然语言处理即人工智能顶会发表论文多篇。 主持教育部人文社科青年项目、上海市浦江人才计划项目。

陈居强,博士,上海交通大学外国语学院助理教授。研究兴趣为:语音学、心理语言学、汉语失语症研究、语料库语言学、数据科学、数字人文等。学术论文发表在Journal of Phonetics, Laboratory Phonology, Across Languages and Cultures, Aphasiology, Second Language Research, Clinical Linguistics & Phonetics, 《现代外语》等期刊。主持一项教育部社科基金青年项目。

五、招生对象

全日制普通高等学校在校生、高等学校专任教师等。报名人数限100人,报名不足最低开班人数将不开班。

六、授课时间

2025年9月-2026年8月。具体上课安排详见后续通知。

七、收费标准

2.5万元/人。 

八、修读年限

从入学开始,最长2年。

九、上课地点

线上线下相结合;上课地点位于上海交通大学闵行校区内,校外学员可线下上课,也可申请线上课堂同步听课。

十、证书授予

学生完成微专业要求学分,获得上海交通大学颁发的微专业结业证书。

十一、报名咨询

报名方式:微信二维码填表报名,报名截止时间:2025年8月16日(含)

报名咨询:

蒿老师

上海交通大学外国语学院

地址:上海市闵行区东川路800号上海交通大学外国语学院216办公室

电话:86-21-34204723

邮箱:lyhao@sjtu.edu.cn

Copyright: 2013 School of Foreign Languages, Shanghai Jiaotong University cross ICP No. 2010919

Technical support: Weicheng Interconnection