云顶集团/a>

图片
首页
我们
党建
科研
学人
资源
教学
搜索

特别策划 | 沈家煊:读辛顿讲话有感

作者:沈家煊 来源:今日语言学 时间: 2024-12-16
字号:

  编者按:

  在2024年8月15日发行的《当代语言学》第四期,编辑部获得著名人工智能科学家杰弗里·辛顿(Geoffrey Hinton)授权,刊发了他4月8日接受尤利西斯奖章时获奖感言的译文,译者为陈国华教授。随后,《当代语言学》编辑部就辛顿批评乔姆斯基一事,咨询了国内语言学界11位前沿学者,得到11篇回应性评论。

  10月8日,瑞典皇家科学院宣布,将2024年诺贝尔物理学奖授予约翰·J. 霍普菲尔德(John J. Hopfield)和杰弗里·辛顿,以表彰他们通过人工神经网络实现机器学习的基础性发现和发明。消息一出,震动了语言学界。

  10月9日,“今日语言学”发布“特别策划”推文,全文推送辛顿在《当代语言学》发表的上述演讲全文。截至本推文发布时的统计,该推文获得2.3万次阅读,名列“今日语言学”论文类最受关注推文的第二位。

  10月17日,《当代语言学》与《语言战略研究》两个编辑部就“辛顿·乔姆斯基·语言学发展”这一热门话题,在商务印书馆共同主办“大语言模型与语言学发展座谈会”。线上线下共有20余位学者参加座谈,其中包括中国社会科学院语言研究所沈家煊学部委员、完权研究员和王伟副研究员。

  11月10日出版的《语言战略研究》第六期发表专栏“‘辛顿·乔姆斯基·语言学发展’多人谈”,刊登了12位与会者的文章,包括完权的“辛顿没能跳出‘中文屋’”和王伟的“辛顿与乔姆斯基之争中的三个事实”。这12篇文章随后通过“语言战略研究”微信公共号发布推文,广为传播。

  即日起,“今日语言学”将陆续刊发《当代语言学》编辑部特别策划的11篇回应性评论。希望这些文章能加深学界和爱好者群体对上述历史性事件的认识,启发云顶集团学术和文化的思考。

 

读辛顿讲话有感

沈家煊

 

1

  首先我觉得,谁都可以给ChatGPT挑毛病,但是最没有资格挑毛病的是语言学家,特别是主流语言学家。面对ChatGPT的成就,语言学家应该虚心一点,豁达一点,不然会阻碍语言学自身的发展。辛顿说很多人,特别是语言学家,对人工智能究竟是怎么回事并不了解,我当然也属此辈,是辛顿深入浅出的说明让我有点开悟。中国的语言学家更应该反思,因为主流语言学所假设的语言组织运行的“符号+规则”的模式本来就很难适用于汉语。朱德熙先生很早指出,S→NP+VP这样的“符号+规则”在汉语里“行不通”。遗憾的是,这个见识一直没有得到足够的重视和认真的对待,而且是谁不遵循这个模式就被视为不够科学不在前沿。国外非主流的认知语言学在中国大行其道,原因之一在我看来是它比较符合汉语的组织运行之道和中国人的思维习惯。辛顿是连接主义(connectionism)的主要倡导者之一,认知语言学家也讲基于神经网络的连接主义,但是如今ChatGPT取得的成就看不出有认知语言学家,特别是中国的认知语言学家的特殊贡献。很多认知语言学家认为基于神经网络的连接主义只对语言的低层次处理有效,对高层次的处理(如推理)无效。这也许还跟认知语言学家只动口不动手有关。如果承认在处理语言方面人脑是一只黑箱子,那么我记得辛顿说过,不能打开黑箱又想了解黑箱,那就动手仿造一部机器试试,看它能不能像人脑一样工作。讲得在理。我们语言学家怎么可以自己不做一点尝试而对人家的尝试横挑鼻子竖挑眼呢!辛顿说他自己一直在“做”的路上,对身后名望毫不在意,因为名望不会持久。

 

2

  科学研究,失败是常态,成功是罕见的。失败也对科研做出了贡献,证明这条路是走不通的。真正的科学家有认错的勇气,不以认错为耻,在科学发展史上留下诸多佳话。辛顿说,在人工智能界,许多人起初不相信他提倡的路子,后来发现它还真有效,从而改变了看法。这就是科学家的行为方式。科学的进步在于科学研究范式的转换,然而谁也不愿意在迟暮之年眼瞅着自己一辈子构建的理论大厦被新的范式超越或替代。这也是人之常情。难怪有哲人说寿太长不见得是好事,年轻的一代超越自己,这是迟早的事。我敬佩陆志韦先生,因为他曾致力于用他发明的同形替代法来离析汉语的单音词,出了书,后来又坦然承认,用这种方法离析出来的还是字不是词。我也敬佩朱德熙先生,他在《语法答问》里说,我们现在在这里批评某些传统观念,很可能我们自己也正在不知不觉之中受这些传统观念的摆布,这当然只能等将来由别人来纠正了。

  我觉得ChatGPT的成功将促使语言科学的研究范式发生转换,我们最好用开放的心态迎接新范式的到来,促成它的到来。

 

3

  只生成合乎语法的话,不生成不合语法的话,这个目标ChatGPT已经达到,而且证明,不采用“符号+规则”的方法就可以达到。那么理解呢?辛顿举了两个例子。你对一个多模态机器人说“画一幅戴红帽子的仓鼠的画”,它画了一幅戴红帽子的仓鼠的画,你对机器人说“打开抽屉”,它打开了抽屉,你能说它不理解你的话吗?他还说,一个透镜对物体的折射看似改变了物体的位置,AI同样会说出错误的位置,因此跟人一样有某种主观体验,意识是人对外部世界的功能性反应。想想我们人自己,说话颠三倒四、你说三他想四的情形难道还少见吗?辛顿是学实验心理学出身,他讲话中提到心理的“非故意虚构”现象。人的记忆都是在重构,在细节上常犯错而整体记忆正确,这方面ChatGPT也跟人一样。我理解,预测下一个词的特征,就是重构下一个词的词义,重构有细节偏差但大体不差,细节偏差还可以通过反馈信息来调整。

  真要对ChatGPT的表现挑毛病的话,我倒是觉得它生成的语篇在语法上太过干净了,缺少人与人聊天时经常出现的看似不太规范的话,例如 “我气坏了,都”,“阳了,我也”。另一方面我又觉得它生成的日常话语不够美丽,日常话语可以是很美丽的,例如《红楼梦》里凤姐跟平儿聊天谈起贾府人事:

  一个是美人儿灯,风一吹就坏了;一个是拿定了主意,不干己事不张口,一问摇头三不知。

  但我相信ChatGPT会在学习中不断进步。人自以为万物之灵,机器还不都是人造出来的!但是老这么说你觉得有意思吗?辛顿在回答听众提问时,打了个愚蠢的CEO和聪明的女助理共生共存的比方,将来愚蠢的人可以跟聪明的机器人共生共存。这个比方至少提出一种哲思,告诫人类不要自视太高。听到这里,我还有点喜欢上不光佩服这个老头了,都。

 

4

  我们语言学家先不要急于给ChatGPT挑毛病。我这个只会动口不会动手、从事语言本体研究的人,从辛顿的讲话中得到一点启发,生出一个想法。

  针对语言学家说ChatGPT只是在临摹拼凑文本,辛顿着重指出,ChatGPT并不储存任何文本,而是从文本中通过学习词与词之间的特征交互来预测下一个词,实现理解,这跟人的理解方式是相同的。理解不是通过符号加规则的操作,而是通过学习词与词之间的特征交互来实现,这个认识跟新兴的互动语言学(interactional linguistics)的观点相通。互动语言学家强调语言的一切都是互文(intertextuality),互文是语言的根本属性,但好像还没有深入到词的特征层面,也没有提出可操作的程序,应该向AI专家学点什么。我们是否真的理解了ChatGPT的工作原理——词例化(tokenization)?按我的粗浅理解,词与词的特征交互都是指词的用例(word token),不是词的类型(word type),在交互中每个词的特征都处于动态变化和更新之中。在ChatGPT的启发下,我们应该赋予传统所说的“互文”以新的含义。

  如果把语言看作游戏,那么汉语是围棋型语言。赵汀阳说围棋有三个特点:一,相对性:先验设定的是非零和博弈,输赢只是个相对量,不存在胜者通吃的性质。二,等重原则:每个棋子的权重是平等的,不存在等级制。三,动态性:每一个事物的存在及其赋值是完全动态的,每个空间位置和每个时间点的意义或权重都是未知数,完全取决于布局、形势和时机,意味着空间和时间具有不可分的一体性并且存在着互相转换的关系。围棋的性质、定理和规则所蕴含的思想具有普遍有效性,这一点已由人工智能所证明。我最近通过对汉语基于用法、互文、“字等价”的“大语法”的思考,觉得汉语的运作原理跟ChatGPT的运作原理十分接近,汉语的运作就是语词与语词的交互作用,这种交互作用可分为“二元倚变”和“二元共享”两种类型,是这两种交互类型的交织。ChatGPT取得的成就证明汉语大语法具有普遍意义。

  我的一个想法是,辛顿的研究建立在计算主义(computationalism)的基础上,认为人类认知和理解根本是计算,其实乔姆斯基也说语言的生成根本是计算。看来在语言的计算性上大家的看法是一致的。我在想,要讲计算的话,语言学家可以提一个不无意义的问题:在汉语乃至汉藏语里普遍存在四言格,如“你死我活、人来车往”,是一种典型的互文格式,词与词交互见义。别的语言里也有四言格,但限于“噼里啪啦、滴滴答答”这样的四音拟声词。问题是四言格为什么偏偏是数字4?是上帝掷骰子正好掷了个4点?为什么四言格是2+2而不是1+3或3+1,因而是一种1-2-4指数级增长机制?我对计算知之甚少,但总是在想,任何云顶集团:语言的计算理论如果不能解答这个问题,那是不是有缺陷和改进的余地呢。作为典型的互文格式,四言格不仅互文见义,而且互文传情。重视四言格,也许可以使聊天机器人多带上点人情味呢。

  科学探索没有止境,AI的更新迭代是必然的。目前的AI对数据和算力的依赖很大,然而儿童习得语言并不需要外部提供大量数据,也无须绞尽脑汁做算计。为什么儿童能在很短的时间内习得语言?这样提问的前提是认为语言的组织运行是极其复杂的。在我看来,大道至简,语言的组织运行之道是极其简单的,儿童依靠举一反三的一般认知能力(不必假设一个先天的语言习得机制)就能轻松掌握。探索语言的至简大道,这仍然是我们语言学家的任务。

 

作者简介:

  沈家煊,中国社会科学院学部委员,语言研究所研究员。从事语言理论和汉英语言比较研究,主要论著有《名词和动词》和《超越主谓结构》。

 

 

往期回顾:

 

 

《当代语言学》过刊电子版下载:

https://www.ncpssd.org/journal/details?gch=82143X&nav=1&langType=1

 

《当代语言学》电子版微信小程序订阅: