【励耘讲坛】贾维嘉教授作”ChatGPT 的横空出世——浅论其性质、应用和社会影响”主题讲座

作者:   2023-03-17

为开阔学子知识视野,提升人才培养保障力度,本学期学校将继续举办“京师励耘讲坛”系列讲座活动。这里将大咖云集,科研名家、教育名师、文化名人、社会名士将纷纷开讲,为全校师生献上一场场精彩纷呈的文化盛宴。

3月15日下午19:00,京师励耘讲坛第65讲在木铎楼A216开讲,由贾维嘉教授为大家带来“ChatGPT 的横空出世——浅论其性质、应用和社会影响”主题讲座。该讲座介绍了近期火热的人工智能程序ChatGPT,并为同学们普及该程序的来由和其开发历史及应用特点。主讲人贾维嘉教授结合自己的研究、教学经历和大家一同探讨ChatGPT及AI对我们当今与未来社会的影响。

贾维嘉教授是北京师范大学珠海校区人工智能与未来网络研究院的教授和院长,曾任澳门大学智慧城市物联网国家重点实验室副主任、上海交通大学致远讲席教授、德国国家信息科学研究中心(GMD)博士后研究员。贾维嘉教授在知名国际期刊/顶级会议发表了 500+篇文章、书籍和书籍章节,曾荣获多项省部级科技奖励,是人工智能领域的资深学者。

ChatGPT于2022年11月横空出世后,短短几个月用户超过一亿,目前在全世界掀起了一阵AI旋风。ChatGPT能和人聊天?帮助人进行工作?甚至能帮助人写论文?很多人都会对这一新兴事物产生各种各样的疑问,并对此表示惊讶。相信同学们也对ChatGPT很感兴趣,下面就让我们一起回顾本次讲座的精彩内容吧!

在讲座上,贾维嘉教授首先给同学们介绍了自己的研究生涯:自己从1987年就开始在加拿大做人工智能方面的研究,经过半年的NLP研究后转向其他路线,时隔二十多年后,在2014年重新开始在上海交通大学做NLP和AI的研究。进入正题后,贾维嘉教授分三个部分为大家展开讲解什么是ChatGPT、ChatGPT的母公司OpenAI的发展历程以及ChatGPT是如何干活的。

ChatGPT,全称聊天生成型预训练变换模型,是OpenAI开发的人工智能聊天机器人程序,于2022年11月推出。该程序使用基于GPT-3.5架构的大型语言模型并通过强化学习进行训练。ChatGPT目前以文字方式交互,而除了可以用人类自然对话方式来交互,还可以用于甚为复杂的语言工作,包括自动生成文本、自动问答、自动摘要等多种任务。如:在自动文本生成方面,ChatGPT可以根据输入的文本自动生成类似的文本;在自动问答方面,ChatGPT可以根据输入的问题自动生成答案。还有编写和调试计算机程序的能力。

贾维嘉教授认为,我们要以辩证的角度来看待世界的发展。他生动地把中国传统文化伏羲先天八卦与二进制的原理联系起来为同学们进行讲解,并提到了在莱布尼茨首先发明了二进制后,法国汉学大师布韦把周易和八卦介绍给莱布尼茨的故事。教授提出,二进制表示了我们最古老的八卦,而计算机的整个表达都是二进制,因此我们应当破除迷信:ChatGPT并非很神秘的事物。归根结底而言,ChatGPT是由二进制作为基础发展而来的。

贾维嘉教授提出,讲ChatGPT离不开人工智能。因为ChatGPT是人工智能发展过程中异军突起的一股力量。今天我们处于一个智能化革命的时代,社会急剧变化。其中,人工智能的发展,是社会发展的重点之一。人工智能的产生历史可以追溯到公元前4世纪,希腊哲学家亚里士多德的形式逻辑三段论使逻辑迈上了形式化的轨道,后人在此基础上对其理论不断完善和发展,让逻辑学得到了极大的进步,为人工智能的发展奠定了最坚实的基础。而直到1943年,神经网络才得到研发。1951年,普林斯顿大学建造了第一台神经元网络计算机。在20世纪30年代,图灵成为第一个在文章中完整描述了人工智能的学者。他提出图灵测试(The Turing test):指测试者与被测试者(一个人和一台机器)隔开的情况下,通过一些装置(如键盘)向被测试者随意提问。进行多次测试后,如果机器让平均每个参与者做出超过30%的误判,那么这台机器就通过了测试,并被认为具有人类智能。过往其他程序都无法通过图灵测试。直到ChatGPT的出现,才有了可能通过图灵测试的程序。甚至对于鸡兔同笼一类的数学问题,只要一步步告诉ChatGPT如何做,它就能回答正确。

接下来,贾维嘉教授为大家介绍了ChatGPT的研发公司OpenAI与ChatGPT是如何“教”出来的问题。事实上,训练ChatGPT与教导人类在本质上有相同之处,需要不断地对其灌输信息。所以,ChatGPT包含了一千五百亿个参数。ChatGPT的训练费用高昂,每训练一次就需要花费五百万到一千万美元,总过程需要训练半年到一年,需要无数人去进行设备的维护。

此外,贾维嘉教授还为大家介绍了GPT家族技术的演进过程。归根结底,ChatGPT的工作原理是简单的,并不神秘。ChatGPT模仿人类提供连贯的有逻辑的文本信息的能力就是文字接龙的能力。因此,贾维嘉教授认为在十年内人工智能只会是人类的工具,因为它的能力是在做文字接龙,所以人工智能不会统治人类。教授以提问ChatGPT世界最高山峰为例,为大家解读了ChatGPT的运作过程。因为ChatGPT有一千五百亿个参数可以利用,所以文字接龙的能力很高,一般情况下不会出错。

贾维嘉教授接着又为大家详细讲解了人工智能是如何在几十亿的信息当中进行文字接龙的。教授以ChatGPT的原始技术Transformer技术为例进行讲解,该技术需要对每一句话、每一个字进行学习,方能有回答问题的高准确率。人工智能在Transformer出来之前,学者使用递归神经网络进行研究,需要把所有消息了解后再进行输出,而到Transformer面世后,在技术上进行了革命性的创新,Transformer把每一个步骤都作为最重要的、把每个单词都作为核心同时进行学习。Transformer可以平行地进行运算,加上RLHF人工智能强化式学习,使得效率比以前的所有算法都要高。

贾维嘉教授生动幽默的讲解,赢得了在场同学们阵阵掌声。相信同学们在听过贾教授的讲座后,能够进一步接触科技前沿事物、开拓眼界、增长见识。我们作为新时代的青年学生们,有必要了解科技发展的前沿,努力学习掌握科学知识,使自己的思维视野、思想观念、认识水平跟上世界发展的步伐,跟上越来越快的时代发展,争取为科技发展和现代化建设贡献属于自己的一份力量。