2025年7月26日至2025年8月4日,本中心沈威副教授赴珠海参加了由北师香港浸会大学联合澳门大学、南京师范大学共同主办的第三届“语料库与数字人文暑期学院”。此次暑期学院汇聚众多学者,聚焦计算语言学与数字人文研究的核心议题,围绕“基于语料库的人文大数据构建”与“大语言模型的应用实践”两大主题展开,受到海内外青年学者与学子的热烈响应。报名开放后,迅速收到来自18个国家和地区、291所高校的980份申请(涵盖本科生、硕博研究生及青年教师),最终录取线上线下学员200名。

2025年7月31日上午,沈威副教授为暑期学院的学员做了一场题为“语言研究中的统计方法”的讲座。线下有近百人参加,线上(b站及腾讯会议)有2300多人收看了直播。

讲座旨在提升学员对统计方法的理解与应用能力。讲座从4个方面展开:(1)语言研究中统计思维的重要性。语言研究中拥有统计思维可以避免研究偏见并提高研究质量。强调正确的数据解读对理解语言现象的重要性。(2)语言研究中缺乏统计学知识导致错误的案例展示。通过实际案例深入剖析幸存者偏差、数据挖掘不当等导致错误发生的原因。强调统计学知识对于研究设计和结果解释的重要性。(3)语言研究中常见统计方法的案例展示。详细介绍t检验、非参数检验、卡方检验、相关性分析、聚类分析、调节效应、中介效应等多种统计方法。通过案例说明每种方法的适用场景及其效果。展示如何运用这些统计方法揭示语言现象背后的规律。(4)常见统计方法的实际操作。使用流行的统计软件SPSS进行实操演示。介绍如何根据不同的数据类型和研究目标选择合适的统计方法。
与会学员有的就研究方法的角度对“幸存者偏差”这一问题进行进一步思考,有的对研究样本的数量和代表性提出问题,现场互动氛围热烈。中国人民大学卢达威副教授对讲座进行了精彩点评。
