学术动态

语料库与跨文化研究院工作坊成功举办

发布时间:2018-03-19  

    3月14日语料库与跨文化研究院工作坊在外国语学院杨咏曼楼218-2会议室成功举办。来自外国语学院内外的近40名师生参加了此次活动。

    首先,语料库与跨文化研究院负责人徐政老师为本次工作坊致辞。徐老师表达了对所有与会师生的热烈欢迎,提出工作坊旨在了解各位演讲嘉宾近期关于语料库本体和语言学分支所做的研究,并以此展开讨论。之后介绍了各位演讲专家,并说明了工作坊的会议流程。在大家热烈的掌声中,语料库与跨文化研究院工作坊拉开帷幕。

    丁红卫老师展示了语音语料库的发展与未来及其实际操作。在介绍了实验语音学和语音语料库现状后,丁老师表示:基于大数据的研究是未来的主流和大方向。以TI(Texas Instruments)与MIT合作的英文TIMIT语料库,以及上海交大外国语学院与美国宾夕法尼亚大学LDC合作的中文TIMIT语料库为例,说明语料库本身不是万能的,需要借助统计学知识、掌握最新的统计模型及工具,更重要的是要有语言学的理论支持与引导。丁老师指出现今的语料库已经不再局限于传统的多模态语料,而已经渐渐扩展到行为神经数据库。最后丁老师的学生詹宇晴同学为大家演示了如何使用相关软件、利用最新的语音技术,对语音及视频数据库进行语音文本自动转写与语音自动标注。

    张建华老师详细介绍了大型赋码语料库管理软件ChaKi“茶器”的使用方法,并展示和分析了相关研究。张老师首先介绍了ChaKi的基本信息、软件特色、使用方法及其功能设置,之后展示了几个使用ChaKi对日语母语者语料库和日语学习者语料库进行探讨的案例。例如,张老师使用“茶器”对日语的多样性进行调查,发现日语母语者语料库文章平均长度和句长均高于学习者语料库,而母语者词汇多样性更高。张老师还展示了使用ChaKi语料库探索日语词类分布的案例和日语高频动词的调查。最后张老师总结了ChaKi“茶器”语料库在日语教学与研究中的应用。

    雷秀云老师以语料库与二语习得相结合的研究作为切入点,介绍了在对比语料库频率信息时应当注意的问题。基于语料库的二语习得研究一般是将二语学习者中介语语料库与目的语语料库或其他二语学习者中介语语料库进行对比,发现差异并分析差异产生的原因。在研究过程中,有很多可能影响对比结果的因素未得到足够重视,比如:很多研究将来自不同语言水平的学习者的语料混合在一起,导致语料库的代表性不高,对比结果不可靠;不同的一语语料库之间及一语语料库内部也存在很大差异;卡方检验和对数似然值的检验效果并不理想,更推荐T检验和方差分析的方法。

    王春艳老师探讨了搭配研究中节点词的确定方法及其合理性。王老师首先指出有些搭配研究中节点词选取方法存在一些问题,比如: 将搭配词组中的某个搭配词类在词表中的高频词作为研究的节点词。王老师带着这一问题,选取了50篇国内外搭配研究论文,总结分析了这些研究中节点词选取方法,其中包括:无说明或选取理由不明确或不合理、高频词、主题词、前人研究拿来直接用、前人研究进一步筛选、词典、词表基础上等距离随机抽取、穷尽文本中的搭配词组后再筛选等方法。在分析这些方法的利弊之后,王老师研究认为:使用主题词、在高频词表基础上等距离随机抽取以及穷尽文本中的搭配词组后再筛选的方法确定节点词更严谨,更科学。王老师还以强化语形容词搭配研究为案例, 详细讲解了节点词的选取方法、操作步骤和研究发现。

    各位演讲专家所展示的研究丰富多样,严谨新颖,讨论环节热烈。本次工作坊颇具启发性。与会师生反响强烈,受益良多。

 

 

地址:中国上海东川路800号上海交通大学闵行校区杨咏曼楼

邮编:200240  电话:86-21-34205664   网址:http://sfl.sjtu.edu.cn

Copyright $@ 2017 All Rights Reserved 旧版网站