很高兴在线上跟大家相会,一起讨论语法研究问题。我今天报告的题目是“实验研究呼唤汉语语法理论的更新”,漫谈形式的。
01
汉语语法理论的现状制约实验研究的进展和突破,原因是现在的汉语语法其参照系来自西方语言,难以覆盖语言结构类型的多样性,而实验的设计却大多建立在这个参照系上,由此出现许多难以解决的问题。我今天介绍近年来突破这个参照系、引入新参照系的努力和取得的成果,涉及名词和动词的关系、中西方的范畴观、对言语法和对言格式、汉藏语四字格等问题,我想强调语言的运作具有平行处理和动态处理的特点。
我先从王选说起,我一直说王选院士了不起。他解决了汉字输入的问题。要不然在这个电脑时代,我们这个汉语汉字怎么办?因此这个贡献真是非常的了不起。汉字对汉语的重要性远大于英文字对英语的重要性。语言与文字的关系,汉语和英语有同有异,要重视异。
现在我们面临更大的挑战,就是如何让电脑来理解汉语,用汉语来传情达意。处于当今人工智能的时代,从事语言本体研究的语言学家感到被冷落了。语言智能是人工智能的核心部分,然而他们的研究成果,人工智能专家不管不问,依靠大数据输入和机器自我学习,就能大致管用。
我想这不能怪人家,要怪就怪自己,因为语言学家描写的语言现象、总结的语言规律,在从事语言工程的人看来,缺乏可操作性。有的“规律”(要打引号)覆盖性差,只见树木不见森林,有的“规律”复杂无比,甚至比语言事实还复杂。
我曾经问一位专攻语言智能的工程专家,阻碍前进的瓶颈在哪儿,他回答说,机器究竟是如何处理语言的,这是一只黑箱子,我们还不清楚里面是怎么回事。看来要弄清电脑是如何处理语言的,还是先要弄清人的大脑是如何处理语言的,人脑内部处理语言的机制,虽然已经成为研究重点,但基本上还是有如一只黑箱。西方语言有形态的帮助,好一点,但好像帮助也不大,汉语没有西方语言那种形态,究竟是如何运作的?
02
科技竞争,实验研究是重要一环。在做实验研究、做信息处理工程的时候,汉语语法的参照系来自西方语言:词-短语-句子,主语谓语宾语,名词动词形容词。实验的设计就是建立在这个框架上,出现许多矛盾和难以解决的问题。
比如核磁共振脑成像的实验,在呈现名词和动词的时候,英语是名词激活脑后部,动词激活脑前部。但是汉语是前后部都激活,只在尾状核部位显示名动有所区别。那么问题就来了,在一次王士元先生召开的语言演化的国际会议上,一位国外顶尖的神经语言学家跟我讲,他们真是非常的困惑:汉语里名词和动词到底是分还是不分?要我讲呢,就是汉语里名词和动词是既分又不分的一个包含格局。那位国外的神经语言学家听了,会后马上跟我要讲稿,说原来还有这样一种可能。我的这个讲稿发表在《中国语言学报》(JCL)的一个单行本(monograph)上,大家感兴趣可以看。
03
要弄清语言使用时大脑的运行状况,这个语言学的核心问题,也离不开研究儿童是如何学会说话的,有个所谓的7岁临界期。汉语儿童如何习得名词和动词,实验研究得出两种截然相反的结论,都有实验数据的支撑,实验方法好像也无懈可击。一种发现是汉族儿童习得动词比英语、日语的儿童都慢,有很强的“名词偏向”;另一种却发现汉族儿童有“动词亲和”的倾向,首先大量习得的是动词。我们该怎么来解释这样的矛盾现象?
我想强调的是,每种语言有自己的“设计特点”(design feature)。以机器翻译为例,英译汉,英语she married a wrong man,汉语不是“她嫁了一个错人”,而是“她嫁错了人”。汉译英,汉语“这条街长”,英语不是This is a long street,而是This street is longer。
中文信息处理,我们按西方语言那样标注词类到底有多大用场?标词类,不就是要说明句法的结构规则嘛,句法的结构规则现在不就是依靠名词、动词、形容词这些词类标签嘛,不就是据此来识别主谓、定中、动宾这些结构关系嘛。然而现在大家承认汉语的词类在充当句法成分的时候是多功能的,那么你这个标词类对了解句法结构到底有多大的用处呢?比如小孩说:“我怕抓”(怕猫抓的意思)是动词“抓”做宾语。“哭没用”是动词“哭”做主语。很小的儿童就拿动词做主宾语,很正常。你把句中的“抓”“哭”标注动词,这到底是有助于还是不利于机器识别汉语句子的主宾语?汉语好像根本违背西式造句规则,按照生成语法来说,句子应该是NP+VP,VP应该是V+NP。再看“出租汽车”,它可以是动词-宾语,也可以是定语-中心语,还可以是主语-谓语(“出租者,汽车也。”)。“汽车出租”呢,可以是定语-中心语,也可以是状语-动词(以出租汽车的方式出租),还可以是主语-谓语。在这样的一种状况下,你把“出租”标动词,“汽车”标名词,没有多大用处。人工智能专家说不要语言学家来添乱,不无理由。
04
我顺便说一下对外汉语教学,现在有很多国外的孔子学院,国内的对外汉语学院,但教学效果如何?老外说:汉语是最难学的语言。老师无法回答学生的问题。我发现外国学生在说“山上有座庙”时候犹豫不决,问是不是该说“山上是座庙”?他们弄不清“有”和“是”区别,情有可原,因为英语里there is(有)也是一种is(是)。汉语里那个“了”字,都说是体标记,但是“吃饭了”“下雨了”,既可以表过去,又可以表现在进行,也可以表完成,还可以表将来(即将发生)。老外真是被弄得莫名其妙,你这个“了”到底是什么东西?
我们究竟应该怎么办?是用主语谓语、名词动词这一套来做解释,还是让外国学生从根本上转变他们习惯的语法观念?我们中国人学英语,老师要告诉他:英语可不是汉语,你要习惯他们这一套东西。那么老外学汉语,我们为什么不能跟他说:汉语可不是英语,你们要习惯汉语的这一套设计特点。
中国人学英语,投入了大量人力物力心力,效果如何?许多大学生英文没有学好,中文却带坏了(余光中语)。他们只会仿照英语she sadly missed her mother,只会说“她伤心地想念母亲”,不会按汉语的习惯说“她很伤心,思念母亲”。
学英语出现有大量的偏误,其中词类的偏误要比西方人学英语多五倍,还有形态缺失和过度使用,冠词缺失和过度使用等。我写过一篇文章,登在外语期刊上,分析指出,这些多种类型的偏误,追根溯源,都是由汉语名词和动词的包含关系所造成的“负迁移”。
中学语文教学也是这样,实践证明,现行的汉语语法教学体系是不成功的、甚至失败的。学生不愿学,老师不愿教。
综上所述,我们一定要对汉语的设计特点,有一个深入的思考。吕叔湘先生在晚年呼吁,汉语语法研究要大破特破。朱德熙先生也说要继续摆脱印欧语言眼光的束缚。我们要把汉语的设计特点上升到思维模式的高度。
05
下面,我就来说一说近年来的一些进展和突破。
一个就是我提出来的“名动包含”格局,全面的论证见《名词和动词》一书。它的意思是什么呢?就是汉语的动词其实全是动名词,或叫动态名词,是名词的一个次类。我经常跟一些汉语教师说,你们教老外学汉语的时候,要告诉他:汉语的动词其实都是动名词,都是V-ing,兼有名性和动性,处于两性的叠加态。名词是个大名词(super-noun),包含动词、形容词。从集合论讲,名词和动词的包含关系是全集和子集的关系。交集和并集是两个类分立的时候才出现的。这个包含格局是名词和动词“异而同”的格局,“既分又不分”的格局,它可以推广到整个汉语系统。
我建议大家去看看现在网上的一个热视频,西湖大学校长施一公的演讲,讲到爱因斯坦的时空观,四维时空。时间是不能脱离空间而独立的,时间是四维时空的一维而已。实际上这也就是一个时空的包含格局。韩礼德有一句话说了不止一遍,他说语言学的研究还处于牛顿以前的时期。不要以为我们现在对语言已经了解得有多透彻,实际上我们不知道不了解的东西远远比我们知道了解的多得多。
云顶集团:这个名动包含格局,有必要提醒大家,Lyons在他的巨著《语义学》里已经明确提出,甲乙两个类之间存在两种关系,一种是类分立,叫class distinction,可能有小部分的交叉(兼类),还有一种就是类包含,叫class inclusion,名动包含就是这种关系。甲乙分立可能形成甲乙的并集和交集,甲乙包含不会有并集和交集,因为乙是甲的子集。这个区别在数理逻辑上是很明确很清楚的。
假如有人现在盯着Lyons问,你这个类包含格局里,不属于乙的那一环是什么东西?面对这样的问题Lyons 一定会十分奇怪。它是乙的补集,集合论的常识呀!西方人认为甲乙分立是常态,甲乙包含是非常态,中国人认为甲乙包含是常态,甲乙分立是非常态,这就是中西方在范畴观上的差异。对于甲乙包含格局,如果要问,到底这里是一个范畴还是两个范畴?这是个难以回答的问题,有人说是一个,有人说是两个。西方强调甲乙分立才是两个范畴,中国强调甲乙包含就有两个范畴。一方强调分立,强调“是”,一方强调包含,强调“有”。这是我发在《中国社会科学》上那篇文章的要点。我非常希望大家能理解,包含格局不仅在逻辑上是可能的,而且实际存在于一些语言里面。在汉语里包含格局是一种常态,而不是非常态。
这个名动包含格局属于以用法为本的大语法。我在书里讲得很清楚,汉语的名词和动词就是语用上的指称语和陈述语,因此“名动包含”实际上是指称语包含述谓语的“指述包含”格局。用法包含语法,语法不能脱离用法而独立。尤其是汉语,离开了用法就没有办法讲语法,或者没有多少语法可讲。对索绪尔的“言语”和“语言”绝对二分,对语用和语法绝对二分的主张,需要反思。
我最近读到刘海涛的文章《数据驱动的应用语言学研究》,觉得写得好,因为讲清了数据驱动和用法为本之间的联系。在这个人工智能时代,依靠大数据来处理语言,必须以语言的用法为本。这为如何克服语言学家集体失语指明了方向。
06
我在阐释名词和动词包含格局的基础上,最近又提出对言语法和对言格式。西方以主谓结构为主干,主语加谓语才能表达一个完整的意思,成为一个完好的形式。汉语以对言格式为主干,两个词、两句话对着说才能表达一个完整的意思,才成为一个完好形式。
大阪外国语大学的一位日本老师跟我讲,日本学生学汉语的疑问:“左一件右一件”是不是一共两件?“里三层外三层”是不是一共六层?可见汉语这种对言明义的方式外国人觉得很新奇,而这在汉语里实在太多了,“你来我往,男欢女爱,你死我活”等等,举不胜举。“你死我活”,就像薛定谔的猫,你我都处于死和活的叠加态。叠加态,这个量子物理学的概念,是超越牛顿物理学的。
汉语的对言格式是缩放型的,从构词开始一直到语篇。“来往”不等于“来+往”,放大成“你来我往”,再放大到“天下熙熙,皆为利来,天下攘攘,皆为利往”。
多四字语是很多汉藏系语言的特征。为什么是“四”?外国人可以不重视,情有可原,他们语言里没有这个东西。中国人不能不重视,我写过一篇论四言格的文章,就是想解决这个问题:为什么偏偏是“四”?主要的意思就是汉语是单音节语,每个字都是等价的1;四字语有的是2+2,但大量的是2x2,不是2+2,比如“你来我往,男欢女爱”。而数字4既是2+2又是22。
最近《南方周末》的科学版,讲数学里的柯拉茨猜想,写得很好,我读了很受启发。柯拉茨猜想指什么呢?对于任何一个自然数n,如果是个奇数,则下一步变成3n+1;如果是个偶数,则下一步变成n/2。无论n是什么数,最终都要跌落到谷底1,准确的说,最终无法逃出落入底部的4-2-1循环。
最近刚刚因为新冠肺炎去世的著名科学家、数学家John Conway曾对这个问题着了迷,他找到一个自然数27,按照上述方法进行演算,要经过77步上浮到顶峰值9232,然后又经过34步下沉到达谷底值1。我觉得这个4-2-1的循环啊,跟汉语真是非常的契合。“1”就是一个个等价的单音节,“2”就是双音化形成的双字组,“4” 就是四字格。有了这个4-2-1,就可以产生千变万化的语篇。
还有就是汉语的回文,大家看《围城》里面,一个说“我是众叛亲离”,一个说你是“离亲叛众”,就是回文。“莺歌燕舞”,可以回文说成“舞燕歌莺”,这是赵元任的例子。“屡战屡败”可以回文说成“屡败屡战”。
数字里面也有回文数(palindromic number),例如1001、1221等等。我在网上看到,一个回文数如果同时还是某个数的平方,就叫做平方回文数。比如11的平方121,就是一个回文数,顺着倒着都是一样的。那么1和4是正整数里最小的两个平方回文数。汉语为单音节语的实质是“字等价”,例如“国家”,两个字是等价的,不像英语country两个音节不等价,“数量”,两个字也是等价的,不像英语amount两个音节也不等价。
07
我们面临的问题就是汉语究竟是怎么运作的,如果说语言的运作根本是计算(乔姆斯基),那么汉语的运作到底是如何计算的呢?
一个叫平行处理或平行计算。国外现在有不少语言学家已经认识到语言需要平行处理,而不光是线性处理。语言的结构,就其本质而言,应该是极其简单的,而不是搞得非常复杂的一套规则,冗长无比的树形图。生成语法的新进展,就是在句法操作上用“合并”(merge)取代“移位”(move),乔姆斯基认为,合并很可能是一种最简单的、自然而然的句法计算操作。“最简方案”一出,句法理论开始转向,跟过去的“管辖与约束”(GB)理论有了重大的带根本性的区别,对此国人不可不察。据我所知,生成学派内部很多追随最简方案的人已经认识到,最简方案与功能学派的主张逐渐合流,他们认同语言的习得和演化是“涌现性”(emergentist)的。
UG普遍语法不仅要回答儿童为什么能在短时间内习得语言(语言习得机制),还要回答人类为什么能在短时间内(仅8-10万年)演化出语言(语言演化机制)。我建议大家看一看O’Grady(2021)的Natural Syntax一书,网上就可以找到,里面就讲这个问题。顺便提一提生成语法的一位大将Richard Larson,他2009年的文章论证,汉语和伊朗的一些语言一样,名词是个大名词类(super-noun category),包含动词和形容词。难道这样一位生成语法的大将,他没有意识到提出大名词会跟生成语法的基本假设——名词和动词分立——相矛盾吗?这个问题值得我们来思考。我们必须认识到,他敢于提出这种新的见解,是因为这种新的大名词的处理办法,可以对汉语和伊朗一些语言的句法做出更简单的解释(在生成语法的框架内)。《名词和动词》的绪论部分就专列一节“以简洁为准则”。
可见,简单原则凌驾于不同的学派之上,不管你是哪个学派,哪个流派,哪种理论,简单原则是科学研究里面的奥卡姆剃刀。还可以读Kaufman(2009)的文章,他从生成语法、历史语言学和语言类型学三个方面论证,他加禄语的名词是大名词,所谓的动词其实根本上都是名词。我们国内,计算语言学家白硕(2014)在网上有篇短文,实际上是讲汉语的动词是处于名性和动性的叠加态,具有不确定性,在用的时候发生“坍缩”。我的《名词和动词》书里有个附录,介绍白硕的看法。还有继词序类型学之后发展起来的词类类型学,已经发现有大量的语言是以名词为本而不是以动词为中心。以上这些,我们都不可不察。
08
继续讲平行处理。汉语中有大量词语是互文见义,必须要依靠平行处理。现在人们认识到,互文不仅仅是一种修辞手段,而是语言的根本属性,汉语比其他语言更好地体现这一属性。除了“来往”“你来我往”这种双音四音互文,还有大量的互文句,汉式“驴子句”是其中一种:
abac 谁有驴谁打驴。
abcb 有什么吃什么。
abbc 轮到谁谁请客。
abca 哪里苦去哪里。
互文的计算处理需要一个对称的三维模型。“你来”的合并和“我往”的合并是平行进行的,在这个模型里,“你我”和“来往”二者互为中枢、互为共享成分,两个平面不分主次:
更重要的是,“合并”(merge)这个概念还不足以处理互文现象,因为“来往”和“你来我往”不是简单的1+1或2+2式的合并,它是一种“统合”(unification),统合的含义就是互文见义,合并的结果要作为统一的整体来看待,两个组成部分不能割裂开来。Jackendoff(2011)提出,云顶集团:大脑对语言的组合性操作,其特性要用统合取代合并。这是我们不可不知道的一种新的见解。例如,英语不能说John drank the apple,但是可以说John drank it,这种词项搭配的选择限制只能用统合来解释:drank it,合并前it本身并没有流汁的意义,是跟drank互文才获得这个意义的。所以说,互文见义是语言的本质。
我曾经举过这样的例子:“老骥”和“老筍”,“伏枥”和“伏虎”。这个“老”的意义到底是跟“幼”相对还是跟“嫩”相对,“伏”是卧伏的意义还是降服的意义,都是要看跟它搭配的词才能显现的。Jackendoff 还指出,最简方案合并说的出发点是假设语言的设计是最佳的,简洁无冗余,讲究计算效率,但是实际的语言中有大量的冗余或重复成分,如three books,其中复数标记-s就是冗余的。汉语的对言不避重复,“什么好买什么”,“什么”重复。语言传情和达意是一体的,而且稍纵即逝,非有复沓不可。
09
平行处理的概念十分重要,如果说处理是计算,那么平行处理需要平行计算。对于传统计算机来说,它处理的通常是二进制码信息,比特(bit)是信息的最小单位,它要么是0,要么是1。但是在量子计算机里,一个比特不仅只有0或1的可能性,它更可以表示一个0和1的叠加,可以同时记录0和1,这样的比特可以叫“量子比特”(qubit)。
从量子计算看,汉语的复合字如“阴阳”是一个量子,阴=0,阳=1,“阴阳”同时代表了0和1,是0和1的叠加,因此是一个量子比特的信息单位。汉语以互文对言为本,非量子计算无从处理。我看到国外一个数学杂志上讲到语言的量子计算,说我们语言学家没有理由排斥量子计算。
大家也许知道,量子物理学跟群论有关。杨振宁说:群论所讨论的是对称,把对称的观念用了数学的语言叫做群论。用群论这个数学语言,来了解对称在物理的应用,这是二十世纪最重要的物理学的精神之一。
我就联想到汉语这个四言互文:“你来我往”,“男欢女爱”,都是2乘2,不是2加2。凡是乘法都可以变换成加法,而加法不都能变换成乘法。有一本讲物理对称的科普书,我读了知道群论的乘法是一种高级乘法,它可以是T1xT2≠T2xT1,就是次序不同,乘的结果会不一样。你看汉语不也是这样吗?屡战屡败≠屡败屡战,我说是2乘2,不是2加2,“屡战屡败”回文变成“屡败屡战”,意思就不一样。双音字组“来往”、“死活”也大都是1x2,不是1+1。语言的组合性原理是乘法原理不只是加法原理,是Jackendoff说的是“统合”而不是“合并”。
10
还有就是非线性递归。云顶集团:语言结构的递归性(recursion),正统的生成语法认为它是人类的天赋语言能力。一个最简单的递归性规则的集合如下(→表示“可由__构成”):
a. X → Y
b. X → X Z
规则表示,X可由Y构成,也可由XZ构成。这个规则集是递归性的,因为X既是(b)的输出又是(a)和(b)的输入。按照这两条递归规则就可以生成很多的序列,实际上可以生成带无穷多个Z的序列,即生成一个无限的序列集合。
包括这些:
a. Y
b. Y Z
c. Y Z Z
d. Y Z Z Z
实际上规则(b)就是一个事物由自身来定义,确切地说,是用作为一个构成成分的自身来定义。如,“美丽的姑娘”是用“姑娘”自身作为一个构成单位来定义的。“姑娘”是名词性质的,所以“美丽的姑娘”也是名词性质的,进一步扩展后的“美丽的、聪明的、善良的姑娘”(可以不断扩展下去)也是名词性质的。这就是所谓的递归,是线性递归,大家知道。
然而,Jackendoff(2011)的文章指出,下面的视觉图形也存在结构递归性,是非线性的。
这样的一个图形可以看作:每行4个X或4个O,先由两行组成一个含8个项目的单位,两个这样的单位组成一个较大的单位(含16个项目),这些较大的单位又构成一个2x2的矩阵,而且可以不断地放大扩展下去。虽然每行没有结构中心,项目不分主次,不是二分结构,但是显然存在结构递归性。线性的结构递归无法涵盖这种二维的非线性结构递归。
绿兮衣兮,绿衣黄里。心之忧矣,曷维其已?
绿兮衣兮,绿衣黄裳。心之忧矣,曷维其亡?
绿兮丝兮,女所治兮。我思古人,俾无訧兮。
絺兮绤兮,凄其以风。我思古人,实获我心。
(《国风·邶风·绿衣》)
上面我举了《诗经》里的一首诗,就是这样的一种非线性的递归方式。非线性递归需要平行处理和平行计算。
11
除了平行处理,还有动态处理。这跟汉语造句的精神——递系式——密切相关。汉语造句的递系规律,通俗地表述为“上罩下、下承上”的方法,这是启功先生的表述。句子不是非要按主谓结构作层次分析才能理解,完全可以分析为若干“链接对”前后接续的平铺结构,同样能实现理解。比如“两岸猿声啼不住,轻舟已过万重山。”采用递系式的分析方法,或者“上罩下,下承上”的方法,理解过程是这样的:
两岸者,猿声也;猿声者,啼也;啼者,不住也。
轻舟者,已过也;已过者,万重也,万重者,山也。
推而言之,汉语统统都是“X者,Y也”这样的“起说-续说对”,通过“上罩下、下承上”,链接成文,统统是平接型的链对格式,链接成分不限词性,不论大小。
这种递系式理解,按认知语言学的最新进展,是连续开视窗的理解过程。就“老骥伏枥”一句而言,连续开视窗的认知处理过程是这样的,见下面的图:第一个视窗“老-骥”,第二个视窗“骥-伏”,第三个视窗“伏-枥”。“老骥伏枥,志在千里,烈士暮年,壮心不已”,也是一样的,只是放大了而已,第一个视窗前两句,第二个视窗当中两句,第三个视窗最后两句。每一个视窗内都是一个起说-续说对。这是一种广义的递系式,它的处理过程显然是动态的。
著名的认知语言学家Langacker(2012,2016)两篇文章,讲的就这种动态的连续开视窗的处理方式,大家应该看一看,了解一下。我说汉语的构造原理,类似动画的制作原理,不妨说汉语是一种地道的“动画型语言”。
我们也不可不了解国外形式语义学家提出 “动态语义学”(dynamic semantics),以及在这个基础上提出“动态句法”(dynamic syntax)的构想。有的还设计出一种动态逻辑(dynamic logic)来刻画语句从左至右、逐次递进的组合方式,以此来解释语言普遍的结构特性。仍以“老骥伏枥”一句为例,它的组合方式和解读过程,其逻辑有如一棵树的生长(tree growth):
每个节点都用0和1标示,节点n下辖的左子节点标为n0,右子节点标为n1,也就是一次增加一个信息。注意这里的节点不仅代表字词,还代表对字词在上下文和语境中的解读。最重要的是,这棵语义-句法结构树是处于生长中的树,表示的是递进生长的过程。语序不同,‘老骥伏枥’和‘骥老枥伏’,生长的次序不同,但根本都是树在生长。
我认为,这种动态句法,或者动态逻辑,就是汉语的句法,汉语的逻辑。动态句法和动态逻辑起始于动态语义学,动态语义学是非常有名的语义学家Ruth Kempson建立的学说,她曾经当过英国语言学会会长。对这种与汉语有密切关系的学说,我们难道可以不了解不重视吗?我上面提到的O’Grady(2021)的“自然句法”也接近动态语义学和动态句法的思路。
12
并行处理和动态处理是相通的。我最近看到宋柔先生的研究成果,觉得很好,很乐意为他即将出版的新书作序。宋柔先生是位计算语言学家,他对汉语的语篇处理,基于一种广义的“话头-话身”结构,是超越主谓结构的,尤其是他提出的“话头共享”:
王老师生病了,(1)
今天李老师来上语文课,(2)
同学们觉得很新鲜。(3)
其中,“王老师生病了(1)”,是个话头、话题,“今天李老师来上语文课(2)”是话身、说明,而这个话身又同时成为下一句“同学们觉得很新鲜(3)”的话头。这不就是递系啊,当中的小句是一个递系项,它既是上一句话题的说明又是下一句的话题,是前后小句的共享成分,兼为话头和话身。赵元任先生说,这种递系式结构正是汉语的造句精神所在。汉语语法学界过去主要研究话题的延续性,也就是开头一个话题连续管辖后头多个小句。话头共享是对话题延续的重要补充,更加贴近汉语的造句精神,能覆盖的语言事实更广。宋柔先生特别指出,这种套接结构有如几何学论证的“双父共享结构”,其树形图不是单向的左分叉或右分叉,而是双向分叉的对称结构。这使我们对汉语的造句精神有了更深刻的认识。宋先生还辨析了话头共享和话题缺省、零形指代等传统概念的异同,指出前者比后者的合理和优越之处。
13
前面我讲了,印欧语语法以主谓结构为主干,汉语语法以对言格式为主干。
英语主谓句:We talk to each other.
汉语对言句:你说一言,我说一语。
汉语里也有英语这样的主谓句:“梅瑞,买了一对玉镯。”但是汉语的主谓句也可以是对言的形式:“梅瑞买了,一对玉镯。”“梅瑞买了”是主语,“一对玉镯”是谓语。既然我们已经承认汉语的动词和动词短语可以做主语,汉语的谓语不排除名词短语,那么这样的一种分析当然是很自然的。我最近发在《中国语文》上的一篇文章,列举了大量的语言事实,说明这样的一种对言式的主谓句,在汉语里并不罕见。
过去我们只是按英语句子的切分方式,把第一刀切在“梅瑞”后面,这是受先入为主的观念支配而形成的一种成见,误以为语言普遍都是以欧式的主谓结构为主干。其实布龙菲尔德(Bloomfield 1917)早就指出这是偏见。他说在有的语言里,主语和谓语应作为“对等项”(equated terms)看待,主谓句为一种“等式型”(equational type)句子。这方面我有一个归纳,就是:递归是不对称主谓结构的扩展原理。递系是对称的对言格式的扩展原理。
这里有个“正对与偏对”的概念:“梅瑞买了,一对玉镯。”左右字数相等,是正对。“梅瑞,买了一对玉镯。”就是偏对。不管正对偏对,都是对言格式。对言格式可以容纳欧式主谓结构的分析,但是欧式主谓结构无法覆盖汉语的对言格式。所以说汉语的对言格式具有普遍意义。我们可以把英语的主谓结构看作一种偏对,它是对言格式的一个特例而已。
14
下面回到实验研究上来,来讲讲同一项目实验结果不一的原因。云顶集团:词类的实验研究,在行为感知、神经心理、脑电和脑成像等领域广泛展开。就名词和动词而言,我们看到,有时相同的研究课题得出的实验结果很不一样,结论甚至相反。都是利用功能磁共振成像(fMRI)技术,研究成人失语症者和脑损伤患者产出汉语名词和动词的大脑神经表征情况,但两项实验的结果相反,一项发现汉语的名词和动词在大脑中的表征差异很大,一项则发现汉语名词和动词在大脑表征区域没有明显区别。
实验结论差别很大,原因是多方面的,包括实验的任务和方法、实验技术、数据测算统计、样本的大小、实验设计、被试的个体差异等多项因素。对于上面提到的两项云顶集团:汉语名词和动词的fMRI研究来说,应该是实验的方法或者目的不一样而造成的。一项是把动词、名词放在句子里面呈现来做实验,比如,把“出版”分别放在“这本书的出版”和“这本书出版了”里呈现,而另一项是名词和动词单独呈现,这样得出的结果肯定会很不一样。
如果我们是想知道存储在“心理词库”里的一个个词有没有名词和动词的区分,而测试的时候把词放在句子里呈现,我们有理由提出疑问,所呈现出来的实验结果究竟是词库里的词本来的状态,还是被试“依句辨品”辨出来的,或者是根据词与词搭配的语义差别辨出来的,这对于词形上看不出名动区别的汉语来说尤其如此。
确实,有很多实验结果的差别可以用实验本身的差异来解释。但是我想强调的是,除了实验本身的原因以外,还有一个重要原因,就是我们在设计实验方案和解释实验结果的时候,所依凭的语法理论的参照系就有问题。
比如说,我看到有的儿童习得词类的实验或者观察研究,依靠母亲和研究者来判断儿童产出的词是动词还是名词,而不是儿童自己心目当中的名词和动词。这种判断是很难的,并且不可靠。有人统计汉语儿童的词汇产出,说发现大量的词是动词,于是得出汉语是“动词亲和”的语言。其实,即便儿童已经能够说出一个成人眼中的动词,这也不能表明儿童已经跟成人一样掌握了这些动词的意义,特别是在独词句和双词句阶段。研究者其实并不知道,儿童说出的词在儿童心目当中到底是名词还是动词,或者两者兼是。小孩说了一个“掉”,你凭什么说它是动词drop,而不是名词(a) drop?小孩说了“我怕抓”,你怎么能肯定这个“抓”就是动词scratch,而不是名词(a)scratch,或者是动名词scratching,既有名性又有动性?
有的实验研究的是名词动词与单双音节的关系,在设计的实验材料里面,已经先按欧式语法认定单音的“抓、掉、哭”是动词不是名词。你这种名动必然二分对立的前提可能就有问题,那么不管得出什么样的结论都会有问题,别人都可以提出质疑。
我们应该认识到:语言的实验研究,不能忽视语言学理论本身的建设对交叉研究的重要性。语法理论的更新对实验设计改进应该有很大的作用。传统的词类理论需要更新,才能更好地解释实验的结果,改进实验的设计,实验研究呼唤语法理论的更新。汉语语法理论的更新应该具有普遍意义,不光是适用于汉语。
有志的理工男文科女(这也是互文),迎接时代的挑战,不迷信权威,不顺应潮流。科学研究的本质就是要不断地提出问题,解决问题。我就讲到这里,拉拉扯扯,只是想让大家活泼思想,减少执着。谢谢大家!
提问和回答
主持人: 好的,非常感谢沈教授的精彩报告!现在到提问环节,大家如果有问题可以直接打开话筒来跟老师交流,或者在评论区里留言。
王静:沈老师您好,我是沈阳师范大学的研究生王静,对您提出的互文见义的四言格非常感兴趣。您提到的例子有一类比较特别,比如“铜墙铁壁、惹是生非、千辛万苦”,它们的一三或二四位置上是一个双音词。像这样的四言格,有没有可能是把一个双音词拆开,然后再构成四字格?
沈老师:汉语里面的双音词在我看来,绝大部分都是离合词,可分可合,只是可离的程度有所区别。两个字组合成双音词,前提就是要可分。为什么可分?我们现在总是把汉语的词按照印欧语的word来理解,但是赵元任早就说了,大家可以去看他的文章,汉语里面跟英语word地位相当的单位是字而不是词。虽然我们现在也有类似于word的概念,现代汉语紧密组合的双音字组非常多。赵元任说,单音字仍然相当的活跃。当有的外国人说:“汉语是单音节语,这只是一个神话。”你们知道赵元任怎么回应的吗?他说:“这是汉语最真实的神话。”汉语的双音字组可分可合,可离可合,这也是造成四字格互文见义的一个原因,重要原因。
王静:谢谢沈老师。还有一种比较特殊的情况,比如“伶牙俐齿”,“伶俐”是一个联绵词,或者“不尴不尬”的“尴尬”也是,拆成了四字格。这样的情况,要怎么分析?
沈老师:不要以为联绵词就是绝对不可分。你刚才提到“尴尬”,现在你看网上不是有说“尬聊”的吗?这个“尬”不也是可以拆分出来吗?当然联绵词可以拆分的程度很低,但也不是绝对不能拆分。
王静:对,还有“尬舞”。最后一个问题,像“千奇百怪”和“稀奇古怪”这样的四言格,感觉就是两种不同的方式构成的。“千奇百怪”感觉像是您说的二乘二,是一种统合;但是“稀奇古怪”,感觉就像是二加二。
沈老师:你觉得“稀奇古怪”不一样,无非是“稀古”不成一个词,但是汉语里词和短语的区别并不那么重要,也很难区分,成不成词只是个程度问题。没有两片树叶是完全一样的,你区分梧桐叶和枫树叶是有意义的,区分这些梧桐叶和那些梧桐叶意义就不大。重要的是“稀”和“古”仍然是互文关系(还有“古稀之年”)。遇到这种分不清、分不尽的情形,我们怎么办?不是硬分,而是不分为好,分了反而添麻烦。这个道理,有很多人不理解,其实非常重要。你们都学英语,英语语法原来把V-ing形式分为两类,一类叫动名词,一类叫动词的分词形式。动词的分词形式嘛,还是动词,而动名词则属于名词。但是现在的英语语法学家认为不应该分,应该统称V-ing形式。为什么?因为分不清、分不尽。你们去看夸克的英语语法书就知道,这个V-ing从名性强到动性强之间,可以分出十几个不同的等级来,你再细点,分出20个等级也没有关系。这就叫分不清、分不尽,遇到这种情况,硬要给它分出不同的类来,没有多大的意义。这个研究的道理,我希望大家能理解。
黄锦章: 沈老师您好!(沈老师:黄锦章你好!)您的大作,最近网上讨论很多,我也非常感兴趣。这里有两个问题。刚才您说到汉字也跟字本位有一定的关系,徐通锵老师讲的字本位,我也真的很有启发。但是,我们现在从语素到词到短语等等,都是从西方来的,如果把字这个概念引进来,跟原来的系统如何衔接起来,汉字和语素的关系究竟怎么处理?
沈老师:我是这样认为的,假如我们有了字这一个概念,而且把它看作汉语的基本单位以后,严格地讲,引进语素这个概念其实是不必要的。实际上徐通锵他也是这个意思。现在我可以把这个意思表述得更明白一点。
我建议看一看陆志韦先生的著作和文章,当时他就是想通过那个同形替代法来离析出汉语的单音词。因为当时就是要搞文字的拉丁化,那当然要确定词的地位,要分词连写。陆志韦先生是在解放前就开始这项工作的。你要确定汉语里面词的地位,先要确定单音词的地位。因此他就发明他的同形替代法、扩张法等方法来离析单音词。但是最后他在1955年写的那篇文章(发在《中国语文》上)中说,实际上这样离析出来的单音词,还是有很多是语素,也就是说实际上是字。这个字可以是语素,也可以是词。最典型的例子就是“铁路”里这个“铁”,到底这个“铁”是个词还是个语素?在“铁路”里面两可。也就是说,它既可以是词,也可以是语素,是语素和词的叠加态。既然这个字是这样的一种性质,当然也会有黏合和自由的程度差别。但是这种黏合和自由的程度差别,我刚才讲了,分不清、分不尽。(黄锦章:谢谢,这个我很同意)既然是分不清分不尽,那么我们干脆就叫它字。所以说引进语素这一个东西,实际上对汉语来说没有太大必要。当然我们现在也承认现代汉语这个二字组,有的结合很紧密,很像词这么一个东西。但是我们千万不能够忘记,汉语里面的这个词绝大部分都是可离可合的。因此,假如我们现在还要保留一个词的层级,我是这样考虑的:“字”是基本单位,然后在二字组或三字组有词的这么个层级,但是这个词的层级,它具有离合的性质,不是绝对的是词就不是语,是语就不是词,或者是词就不是语素,是语素就不是词,不是这样一种二分的关系,我大概是这个意思。
黄锦章: 很感谢。那我还是有点困惑,如果我们把语素改用字的概念,语素存在一些分界上的问题,换成字依然会有分界纠结。因为在语法单位这个层面是音义结合单位,区别就在大和小,黏着还是自由的等等。但是如果用了“字”这个概念,您知道“字”不一定有意义,也有些联绵词,可能有争议。但是比方说“巧克力”是音译的,三个字各都代表一个音节。如果讲语素的话,我们可以说这是一个多音节语素;但是要讲字的话,它们就只是没意义的音节。那么在语法单位里面是否允许存在一个只有声音,没有意义的语法单位?
沈老师:我是这样看,这里面牵涉到一个问题,语素这个概念,实际上是先有了词的概念,然后才会有语素的概念。从英语、印欧语来说,因为这个构词的成分里面,有的它没有意义,也肯定不自由,是黏附的,所以它需要建立一个语素的概念。那么汉语里面有你说的音译词“巧克力”,还有联绵词。我刚才说了,“尴尬”也不是绝对不可以分,“你吃巧克力,我吃笨克力”,没有意义的音节我们也会赋予它一个意义。我总觉得,我们做研究的,有一条原则叫做分清主次。在汉语里面,绝大部分或者在绝大多数的场合下,每一个字都是音义的结合体。而在英语里面绝对不是这样,它的词里面有很多音节都是你说不出来是什么意义。分清主次这一条,做研究的时候,说说容易做起来难,但是我觉得又是十分的重要。假如我们不能够分清主次的话,我们就难以在语法体系上有一个整体上的准确把握。这是我的一个看法。
黄锦章:谢谢沈老师,这个问题我们可以求同存异。下面第二个问题是当前争论比较大的,就是跟您的名动包含(沈老师:就是大名词),对,我也在学习消化过程中。在您的这个理论里面有两个核心概念。第一个是云顶集团:名词的定义,不过因为陆俭明老师上次也提过,我先放后面。另外一个,指称是一个非常重要的概念。您说是动词获得指称性。但指称是有歧义的。符号学理论里面任何符号都有指称性,有些符号指称的是实体entity,有些符号指称的是性质、状态,或者动作等等,这是指称的一个理解。指称另外一个定义是句法上的指称性,跟陈述性相对。我们讲话题,是表示讨论什么。后面comment,就是陈述性的,像theme跟rheme。所以我想明确一下,您讲的这个指称性是符号学意义上,还是句法上的一种解释?
沈老师:我的回答是这样的,我的书里面就是这样说的,我的这个指称和陈述,主要就是从句法上讲的。当一个词入句,充当主语或者宾语的时候,它成为一个指称语;当它入句作为说明语,作为谓语的时候,它就成为一个述谓语。因此主要就是从句法上讲的。我在论证名动包含的时候,就是根据词的句法分布情况来论证的,书里面讲了五个方面的分布状况(都是扭曲分布)。我强调分布情形要挑主要的,如出现在主宾语位置、定语位置、否定词后的位置等,不然的话没有两个词的分布会完全一样的。
这个是不是跟符号学上的指称有联系?我觉得有联系。不能说两种指称是截然分开的,因为语言学是符号学的一部分,我在书里明确讲了语言学的指称跟一般符号学的指称有什么不同(见第四章第一节),有人也许没有注意。有联系的是什么地方?比较接近前一种符号学意义上的指称的,就是刘熙《释名》的这个“名”,动词和形容词也叫“名”,“名”就是个name。但是我在书里的论证主要是后一种句法上的指称。
黄锦章:您刚才把这些分得很清楚,我也一下子明白了很多。当动词出现在主位的时候,您说它获得了指称性,变成了名词。按照同样的逻辑,名词进入陈述位的时候,是陈述性,应该是动词。但是您的论证讲到,当一个表示动作的词语进入了一个陈述位的时候,认为有指称性,因为它指称的是经验世界的一个entity。如果说在陈述位这个词语,依然是表示entity,那么在主位的动词,其实也是表示动作,并没有因此而变成一个entity。所以我就觉得这两个指称,能不能统一起来?
沈老师:当你提出这样的一个问题的时候,实际上你的前提就还是动词是动词,名词是名词。我说这个动词做主宾语的时候,因为动词本来就是名词,谈不上“变成了名词”,所以它可以做主宾,那么当名词作谓语的时候,你说是不是名词本身也变成了动词啊,是不是就可以这样说呢?我在书里专门有一章嘛,就是讲名词和动词的不对称。在名词包含动词这个格局里面,并不否认名动有别,名动是不对称的。具体说就是,动词作主宾语是常态,而名词作谓语是非常态。这种不对称又可以上升到认知的高度。我专门有一章(第五章)讲名动在认知上面的不对称,这种不对称,用包含格局是对它最好的刻画。
刚才讲到指称的两种意义的问题,我们可以继续探讨。我建议大家仔细读一读Kaufman(2009)研究他加禄语的那篇文章。他详细论证,他加禄语用在句中的动词和动词短语其实都是名词性的,他还说了一句话,还用材料来证明,归根结底是这种语言里面的动词根具有名词性。动词根并没有入句,也具有名词性,这个名词性就接近符号学上的指称性。他认为,这是造成他加禄语动词在句法上有指称性的根源。他是这么说的,对这个话我们还可以再深入的去理解,到底对不对。
黄锦章:您刚才提到是从认知的高度,这点也是我对您的理论特别感兴趣的一个原因。柯姆里(B. Comrie)也讲过名动对立具有某种普遍性,当时我的看法,认知的开始就是从实体和实体的状况开始的。一个苹果,能够在理念中分解开,一个是比较抽象的entity,一个是可以独立的颜色、性状什么的。如果这个假定能够成立,名动对立就是认知的最基础的一个反应,这个可能会争议。因为这个问题比较大,我想是不是以后有机会向您请教一下,好不好?
沈老师:我简短地回答一点。一句话,就是从认知这个角度来说,名动有别是人类普遍的认知基础,但是名动有别不等于名动分立。因为在名动包含格局里面仍然是名动有别。很高兴跟你有深入的探讨。
徐政:老师能不能提一个问题,我叫徐政,是上海交通大学的。听完沈老师报告,很受启发。当中有个问题我没有听懂,就是“老骥伏枥”为什么要分析成一个线上的产出,先是“老骥”,然后是“老骥伏”,然后是“老骥伏枥”。为什么不能把它分析成为,用这个主流……
沈老师:你的意思是按主谓结构来分析是不是?
徐政:对,就是西方语言学的乔姆斯基的,为什么不能够这样,我就没有太理解。
沈老师:不是不能够这样,完全可以。用西方的主谓结构的分析法,“老骥”是主语,“老骥”又是一个定中结构;“伏枥”是谓语,“伏枥”又是一个动宾结构,完全是可以的。不是说我要排除这样的分析,我恰恰要表明的是,不能够排除用连续开视窗的方式来分析这样的句子。我要说的是这个意思。而且我认为,连续开视窗的这种方法是语言最原始最根本的一种处理方法,而主谓结构的分析方法是后来才形成的。
主持人: 好的,谢谢各位老师、同学来参加我们今晚的“实验语言学+”云上论坛,由于时间原因,今天的讲座就到这里结束了。最后我们再次感谢沈教授的精彩报告!
(记录:王大佐;整理:石锋)
会后沈老师又对回应做了一点补充。
沈老师的补充回应:
因为黄锦章先生在提问中提到名词的定义问题,时间关系来不及展开,这个问题也是很多人有疑惑的地方,我想补充回应一下。
就汉语而言,恰恰是在名动分立的格局里,那个名词无法定义,无法从正面定义。朱德熙先生讲了,凡是名词所具有的语法特点动词也都具有,这实际上已经承认名词只能从反面定义,定义为“它不是动词”。在名动包含格局里,名词(包含动词在内的大名词)是可以从正面定义的,就是它具有指称性。动词除了有指称性还有述谓性,原来说的(名动分立的)名词(可以叫小名词或静态名词)是动词的补集,就只需从反面定义,即不是动词。坚持名动分立的人倒是有义务说明,他那个名词如何从正面定义?详细参看《名词和动词》第二章第1节“名词的界定问题”和第三章第3节“两种标记类型”。
报告中提到的部分参考文献
Bloomfield, L. 1917. Subject and predicate. Transactions of the American Philological Association 47:13—22.
Jackendoff, R. 2011. What is the human language faculty? Two views. Language 87(3): 586—624.
Kaufman, Daniel 2009. Austronesian Nominalism and its consequences: A Tagalog case study. Theoretical Linguistics 35-1: 1-49.
Kempson,R., W. Meyer-Viol, & D. Gabbay 2001. Dynamic Syntax: The flow of Language Understanding. Oxford: Oxford Blackwell Publishers, Ltd.
Larson, R. K. 2009. Chinese as a reverse ezafe language. 《语言学论丛》第39辑,30—85.
Langacker, R. W. 2012. Access, acitivation, and overlap: Foucusing on the differential. Journal of Foreign Languages 35(1): 2—25.
Langacker, R. W. 2016. Baseline and elaboration. Cognitive Linguistics 27(3): 405—439.
Lyons, J. 1977. Semantics. Vol.2. Cambridge: Cambridge University Press.
O’Grady, Williams 2021. Natural Syntax: An Emergentist Primer. 2nd ed. http//ling.hawaii.edu/wp-content/upload/OGrady-Natural-Syntax-2ndEd-2021.pdf
Shen, Jiaxuan 2017. Nouns and verbs: evolution of grammatical forms. In G. Peng, and F. Wang (Eds.), New Horizons in Evolutionary Linguistics, Journal of Chinese Linguistics Monograph Series 27: 222—253.
白硕 2014,论“这本书的出版”与X-bar理论的兼容性,载于博客论坛:
http://blog.sina.com.cn/s/blog-729574a00102uzf6.html。
刘海涛 2021,数据驱动的应用语言学研究,《现代外语》第4期,462—469。
陆志韦 1955,对单音词的一种错误见解,《中国语文》4月号,11—12。
沈家煊 2016,《名词和动词》,商务印书馆。
沈家煊 2017,从语言看中西方的范畴观,《中国社会科学》第7期,131—143。
沈家煊 2017,“能简则简”和“分清主次”——语言研究方法论谈。《南开语言学刊》第2期,1—10。
沈家煊 2018,汉语“名动包含”格局对英语学习的负迁移,《外国语言文学》第1期,4—22。
沈家煊 2019,说四言格,《世界汉语教学》第3期,300—317。
沈家煊 2019,《超越主谓结构——对言语法和对言格式》,商务印书馆。
沈家煊 2020,“互文”和“联语”的当代阐释——兼论“平行处理”和“动态处理”,《当代修辞学》第1期,1—17。
沈家煊 2021,动主名谓句,《中国语文》第1期,3—17。
宋柔 2021,《小句复合体的语法结构》,即将出版,商务印书馆。
朱德熙 1985,《语法答问》,商务印书馆。
赵元任 1968,中文里音节跟体裁的关系,《中研院史语所集刊》第40本,另载《赵元任语言学论文集》,2002,商务印书馆,591—600。
赵元任 1975,汉语词的概念及其结构和节奏,原文(英)载台湾大学《考古人类学学刊》第37—38合刊,中译文载《赵元任语言学论文集》,2002,商务印书馆,890—908。
(本文是在“实验语言学+云上论坛”报告的基础上整理而成,将发表于《实验语言学》刊物2022年第一号)