为探索人工智能与数字人文研究的交叉融合,推动新文科背景下人文研究的范式创新,5月30日,外国语学院邀请北京大学苏祺长聘副教授在外院107会议室开展以“人工智能驱动的计算文化研究”为主题的讲座。讲座由胡海老师主持,外院师生线上线下约60人参会。
苏祺从数字人文与新文科的关系切入,指出数字人文研究正在深刻改变传统人文学科的研究范式,成为人文创新的前沿领域。她强调,文化组学与文化计算等新兴方法,如利用Google N-gram等工具分析文化变迁,为宏观文化研究提供了数据支撑,也为揭示语言背后的隐含信息提供有力工具。然而,此类研究的准确性高度依赖于语料库的规模、代表性与覆盖性,以及建库时语料的处理质量。
基于此,苏祺以北京大学数字人文研究中心的项目为例,详细介绍了其团队如何利用数字技术进行语料采集与处理,完成有关汉语古籍的大规模语料库的建设。在语料采集部分,讲述了古籍数字化过程中遇到的人工标注、古籍或碑文受损等问题,以及其团队采用的伪页面生成技术、多模态多任务模型等解决方法。在语料处理部分,苏祺副教授为大家介绍了其团队开发的古籍自动整理系统,实现了语料断句、赋标点以及分词的高精准自动化。
在文化计算的应用层面,苏祺重点阐释了如何通过数字技术揭示文本间的互文关系,通过采用近似最长公共子串匹配方法以及基于深度学习的互文分析追踪同源与不同源的重文。此种分析发现能够为文化、文学、翻译等人文领域做出重要贡献,例如,利用互文分析考察《论语》在后世儒家经典中的复用、追溯儒家、道家、法家等思想流派在历史上的影响力变迁等。
苏祺副教授介绍了北京大学数字人文研究中心开发的面向人文学科的通用型智能数据平台,该平台整合了文本、图像的智能处理、知识图谱自动构建和智能表格抽取等功能,为人文研究者提供了一站式技术支撑。
问答环节中,在学院朱一凡教授和甄凤超教授的带领下,与会师生就“互文引用内容的语境信息提取与分析”等话题与苏祺副教授进行讨论。本次讲座不仅展现了人工智能赋能人文研究的广阔前景,也为学院推动数字人文跨学科合作提供了重要启示。
地址:中国上海东川路800号上海交通大学闵行校区杨咏曼楼
邮编:200240
网址:http://sfl.sjtu.edu.cn
电话:021-34205664 (党政办公室)
021-34204723(教学科研办公室)
Copyright @ 2017 All Rights Reserved 旧版网站