国内交流

北京语言大学语言科学院十周年院庆系列讲座——
“超越聊天机器人,走向通用人工智能——ChatGPT的成功之道及其对语言学的启示”成功举办

来源:语言科学院      日期:2023-11-23      访问次数:

2023年11月15日上午,值此北京语言大学语言科学院建院十周年之际,语言科学院《语言教学与研究》编辑部特邀澳门大学人文学院中国语言文学系讲座教授、知名汉语语言学家袁毓林教授为我校师生做了题为“超越聊天机器人,走向通用人工智能——ChatGPT的成功之道及其对语言学的启示”的学术讲座。本次讲座在综合楼1211会议室举行,由我院施春宏教授主持,讲座采用线下线上同步的方式举行,吸引了校内外近200余位师生共同参与。


袁毓林教授首先指出ChatGPT已经不是传统意义上的人机对话系统,而是一个以自然语言为交互方式的通用语言处理平台,是走向通用人工智能的第一块可靠的基石。从事不同职业的人群都可以在这个技术平台上构建符合自己要求的各种应用系统,使之成为更加称职的办公助手、外语译员、家庭医生、面试考官等。

然后,袁毓林教授从算法模型(生成式预训练+微调)、指令微调(在上下文中学习和思维链等提示策略)、跟人对齐(基于人类反馈的强化学习)等角度,深入浅出地介绍了ChatGPT的技术原理和工程构架。ChatGPT是一种基于认知计算和人工智能的大型语言模型,其基本的工作原理是通过使用多层的神经网络及多头注意力机制,模仿人类通过联系有关上下文来理解当前单词意义的习惯,来预测给定言语片段的下一个单词的概率分布,从而生成自然语言的文本。它的工作机制是首先会在预训练阶段使用大规模的非特定任务场景的语料进行训练,得到文本生成能力强大的基础模型。继而在微调阶段再使用特定任务场景的语料去对模型参数进行精细的调整,以便语言模型更好地完成当前的任务。

此外,袁教授还结合实例介绍了人工智能专家和语言学家对ChatGPT的批评意见,并简要说明了这些批评意见的理论依据。在语言识别、判断和交互方面,ChatGPT存在巨大的潜力,但它仍然不可靠,因为它有时会生成虚假或不准确的答案,给出草率甚至有害的建议。其次,我们无法得知ChatGPT泛化的边界和内部机制,故而我们也无法确认其是否有语言理解和语义推理的能力。基于此,正如Russell所认为的那样,现在的NLP社区只讲大模型或者用大模型刷新大基准,不讲语言结构和句法分析,不讲语言理解和语义分析,不再研究语言,这是非常不幸的。所以,今后人工智能发展的道路应该关注那些我们理解的方法,关注知识和逻辑推理。如果未来的人工智能系统果真回归知识与推理,那么语言学知识在新一代人工智能的自然语言处理系统中,必将发挥更加重要的作用。



最后,施春宏教授对此次讲座进行了总结,校内外师生展开积极讨论,袁毓林教授悉心解答了同学们关于ChatGPT指令微调、数据选取等问题的疑惑。至此,本次讲座圆满结束!



Copyright © 2023 北京语言大学语言科学院 版权所有