家电网

学者声音 | 汪锋:语言学田野调查的假设与实践

0人浏览   2025-04-16 14:10:00

来源:【北京大学】

有语言的地方,就是语言学的田野。每个人去田野都带着特定目的和装备(理论以及技术),如果回顾一下语言学的发展历程,我们或许可以看到制约语言田野调查的根本因素是对语言本质的假设,这也验证了通常的说法:“人们只能看到自己愿意看到的。”北京大学中文系汪锋老师在《语言学田野调查的假设与实践》一文中提醒研究者们,只要保持警惕,并时常反思自己的田野实践,就有可能冲破这一限制,因为语言田野提供的事实永远大于语言理论。

语言学田野调查的假设与实践

文 / 汪锋

2008年,我们编了一本《到田野去—语言学田野调查的方法与实践》,戴庆厦、罗仁地二位教授鼓励我也总结一下自己的田野工作,我自觉所做的调查和思考积累都还远远不够,就没有敢下笔成文。转眼间,十五年过去了。在这期间我继续调查白语、彝语以及相关的汉语方言,跟着陈保亚老师等调查茶马古道上的语言,也开始自己带研究生下到田野,跟他们一起调查。我们调查的时间主要是暑假,地点主要是在云南大理等。离开暑热难耐的北京,到气候宜人的云南调查,一方面完成了田野调查收集资料的工作,另一方面深度体会了各地不一样的文化,用陈保亚老师的话来说:“大家都兴高采烈的。”

▴2023年5月,汪锋老师在文研院做题为语言学田野调查的故事、假设与实践”的讲座

突如其来的疫情打断了我们田野调查的连续性,2020年、2021年连着两年不能去云南了,这让我突然意识到田野调查已经成了生活工作的一部分。这个暂停也促使我开始重新思考一个问题:田野调查对于语言学来说究竟意味着什么?

一、田野调查:找到“活”材料

对于一个语言学的学生来说,最重要的是处理语言材料与语言理论的关系,而其中首要的任务是找到材料。语言材料一种是“死”的,就是文献;一种是“活”的,就是当下使用的各种语言及方言。要抓到活材料,就要通过田野调查。

1994年我刚分到中文系汉语专业,系里就给我们宣告了大三专业都有“田野”的传统,汉语专业是方言调查,文献专业是敦煌考察,文学专业是民间采风。据说,方言调查是最累的,要把3000多字的《方言调查字表》记完,还有连读变调与语法例句以及一个小故事《北风与太阳》要记。那时候年轻,莫名地觉得这种“累”是一件很酷的事情,就很期待。

1997年我们汉语专业去韶关调查方言,好像是坐了27个小时的火车,然后再转中巴车,抵达韶关翁源镇政府招待所。第二天就开始调查,就是用丁声树、李荣的《方言调查字表》,3800多字按历史音韵地位排列。我们人手一册,分成小组,每个小组四到五人,围着一位当地发音人,记下他的字音。

▴丁声树、李荣编写:《汉语方言调查简表》中国科学院语言研究所,1956年

当时我们上午、下午记音,晚上核对,花十几天时间记完字表后,整理同音字表,抄到一张大表上,请发音人再快速读一遍,记错音很容易发现。之后再整理该方言与中古的对应规律,比如,中古的“定母”字都变成了什么音,变化有什么语音条件,等等。另一个任务就是整理该方言跟普通话的对应规律,似乎是为了推广普通话服务。在这个工作中,我们真切感受到语音演变规律的威力——语音大多是一类一类地变,确实是“可以很快掌握方言音系及其演变规律和结构特点”。另一个感受是,例外也很多,总有一些字不按照常见的规律来,就都搁在那里。

这是第一次田野调查的印象。严格说来,只是一次限制条件下的田野调查练习,因为如何选发音人、为什么要调查这个方言、采用什么方法都不用我们操心,老师们已经提前把工作做好了。

《方言调查字表》其本质是利用《广韵》的声韵调体系来调查方言音系的演变特点,向前可以追溯到赵元任先生的《方音调查表格》。如果进一步往前追溯,可以追溯到高本汉的《中国音韵学研究》。中国方言调查研究深受此传统的影响。之后大规模的方言调查,如《湖北方言调查报告》《湖南方言调查报告》《云南方言调查报告》《汉语方音字汇》等都遵循此框架。罗杰瑞指出:“高氏从一开始就把方言田野调查和古音学密切地结合起来。他设计的框架至今还有相当深的影响。但是有一点值得我们特别注意:对高氏而言,田野调查只是研究古音的手段,是次要的,音韵历史才是他研究的重心。”至此,我们对于之前方言调查实习时所做的具体工作才算是有了一个全然的了解。

▴高本汉(Klas Bernhard Johannes Karlgren)瑞典汉学家、音韵学家(1889-1978)

这个调查框架所做的假设至少包括:(1)现代汉语方言是从中古《广韵》音系演化而来;(2)音韵系统的演化脉络是语言最基础的部分;(3)“字音”在系联古今时起到了枢纽作用。

并不是要说这些假设都有问题,而是想提醒说,如果在这个框架下做调查实践,要注意到这些假设所造成的影响。

二、从符号到感知:语音记录的多维性

我在讲授“理论语言学”课时,做了一个关于田野调查记录的小调查。我放了一个人朗诵《静夜思》的录音,请同学们记下来。刚放完录音时,就有同学嘀咕:“要记什么啊?”这个嘀咕其实很重要,说明记录时得有一个目的,明确记下什么样的内容。我只是解释说:“听到什么记什么。”然后又放了一遍录音。

三十多位同学,大部分是用国际音标记下来,声调大多采用五度标调法,有的用数值,如35、51之类,有的用折线标记;还有一份是用韩文记音,可见其或许没有受过国际音标记音训练,而且是韩国同学;另一份只用汉字写下了“床前明月光,疑是地上霜。举头望明月,低头思故乡”,没有任何音标;最齐全的一份是既有汉字,又有国际音标,还有汉语拼音。

从这个小调查可以看出,每个人做田野调查的记录必然受制于自己对“记录”的理解以及自己的记音手段。不管是国际音标还是汉字,抑或是韩文,都是要把自己听到的音记下来。通常我们会认为国际音标记音最精准,韩文记音没有记下声调部分;但我们要留意到汉字记录其实充分利用了汉字的储备,把听到的语素也记下来了。

国际音标是一个很有效的记音工具,设计的原则是“一音一符,一符一音”。孙天心老师曾告诉我一个关于国际音标记音的原则,由一个调查人记下发音,另一个人根据音标发音,得到发音人认可,才算是准确的国际音标记音。当年上课时,老师开玩笑说,碗掉到地上摔碎的声音都可以用国际音标记下来。通常将国际音标的记音称为严式记音,一些调查者录完音后,就从田野离开,回去把录音转写为国际音标,以为记录工作就算完成了,或者自己仔细比对录音,来判定语音系统。很多调查者认为这是客观的操作,因为录音设备忠实地记录了语音,而国际音标忠实地转写了语音。

事实上,只要是符号转写,就不可能绝对客观,因为要通过转写人的听感来区分音的同与不同,并且将之定位到一个作为中介的国际音标表中。国际音标是目前最为细密的语音格子,比英文字母和汉语拼音要细密得多,但仍然是一个“格子”,并不是语音系统本身。

▴弗迪南·德·索绪尔(Ferdinand de Saussure)瑞士作家、语言学家(1857—1913)

对于语言而言,最重要的是语音的区别功能,所以索绪尔说:语言是形式,而不是实质。我以前也谈过这个问题:“一个语言的音位系统是语言使用者对语音的感知范畴的划分,什么样的音是相同的,什么样的音是不同的,不同的语言有不同的分法,这也是语言多样性的一个体现。汉语普通话者对[æ]和[ɑ]的不同不在意,因为在他们的感知范畴中不区分二者,它们是一个音位/a/的条件变体,但英语者却很敏感,因为英语中它们是两个不同的音位,在感知范畴上严格区分。田野调查中一再强调的一个原则是‘发音人永远是对的’。其根本原因就在于,对于语音异同的判断依赖于发音人的感知范畴。核对同音字表,就是让发音人来确定哪些音是相同的,哪些是不同的。这一基本工作必须依赖发音人。有田野调查经验的人都知道,经过这一核对过程,就会发现自己的有些记音过细,发音人不区分的,我们做了区分,有些记音过宽,发音人要区分的,我们没有区分出来。所谓语言记录和保护,自然要体现发音人在声音感知范畴上的性质,否则,记录和保护的只是调查者范畴感知下的语言,那就失去了语言记录和保护的本义。”

我的课堂调查中还有一份记录比较“特别”,除了记录了《静夜思》四句诗的文本,还说明了“音色为年轻女性,南方人或海外华人”,还认为是“带口音的汉语普通话”“节奏感较差,能找到最基本的2+3音节”。其“特别”之处在于记录了国际音标以外的语言信息,这也提醒我们,受过国际音标训练的,一到记录语言时,第一反应就是用国际音标记下听到的音,这一自动化很容易刻板化,反而可能在无意中忽略了要记录语音的其他方面,而语音中体现的与发音人相关的信息其实也非常重要,就沟通行为而言可能更重要。

三、案例:白语方言的田野调查

我的博士论文选择做白语方言的历史比较研究。白语是白族使用的语言,其系属地位在学界长期以来都有争议,有人认为是一种汉语方言或者是汉语的姊妹语言,有人认为是一种藏缅语,但借用了很多汉语词汇。我发现这些争议的一个重要起因是他们依据的材料主要来自一个白语方言点——剑川方言。我就想尽量找一些不同的白语方言,再来推测其历史演变。

真正从头开始做田野调查,就会发现第一难题是找到这些白语方言点,总想找到偏远地方的方言点,一般来说,受语言接触影响小一些,能找到一些早期的保守特征和词汇等。听说云南镇雄县有白族,我们就去寻找这个地方—坡头镇德隆村。翻山越岭找过去,他们的身份证上确实写着白族,但所说的话明显就是汉语方言,据说当时民族识别时他们的口音跟周围人不大相同,就认定成白族了。

▴王士元先生

后来跟王士元先生讲这个事,王先生就讲了一个故事。1973年,他应北京大学和中国社科院的邀请,回国讲学,主办方给他安排了一次旅行。其中一个地方是丝绸之路上的兰州。在兰州的第一个早晨,他起得很早,刚刚拂晓,想早一点亲眼看看母亲河—黄河。然而,他并不清楚应该向哪个方向走。正好,在不远的地方有一个老婆婆,她的工作大约是管理停放的自行车。王先生就向她打听黄河的方位,顺便聊了起来。过了一小会儿,老婆婆似乎突然意识到什么,问王先生是从哪里来的。王先生告诉她是从外国来的。那老婆婆陷入了片刻的沉思。最终,她还是说出了她的疑惑,那是一个很有趣的问题:“那么,就是说,我们刚才一直都在说外国话了?”在老婆婆心目中,外国人都是说外国话的,而自己是不会说外国话的,那自己怎么能跟一个外国人说了半天外国话呢?我对这个笑话印象深刻,分享给大家——我们时刻得记住,人群的类别并不等于语言的类别。

白族也有不少支系,分布在怒江的主要是勒墨人,澜沧江沿线的主要是拉玛人,丘北县的自称为民家。我在怒江调查的一位发音人是当地勒墨人的领袖。在我调查之余,他常常跟我说自己不是白族,应该划分为独立的民族。他们自称“巴尼”,其实就是“白人”的意思。当然,我们只能通过语言比较来讨论这些支系之间的演变关系,但其族群划分问题就不能置喙了,这涉及更复杂的社会文化因素等。

▴王明珂:《羌在汉藏之间》上海人民出版社,2022年

二十年前我认识王明珂先生后,读了他不少关于历史人类学的著作,受他研究思路的影响,曾想过是否可以做一个三江并流区域的族群调查,沿着三条江,每隔一段距离取一个点,从语言、体制、文化等多个维度来进行田野调查,期望为中华民族的起源与形成贡献一点力量。可能这个工程太大了,但确实是我的一个梦想。随着现代各种记录手段的更新,或许这个梦想可望早日实现。

四、现实之困:语言材料的田野挑战

在调查白语等民族语言时,就没有字表好用了,只能用词表,很多时候要以手指物来获取词汇。这看起来很简单,实际上并不是,到抽象一些的名词就更难一些。在马者龙村调查白语时,问到颜色词,为了便于发音人理解,我就先问“狗”怎么说,再问“黑狗”怎么说,“白狗”怎么说,很顺利地提取了颜色词“黑”和“白”;顺势问下去,“红狗”怎么说,发音人迟疑了一下,也说出来了,去掉“狗”,就得到了“红”色。我接着追问:“‘绿狗’怎么说?”发音人终于忍不住了,说:“我们这里没有绿狗。”旁边围观的人们也哄笑起来。

后来,我们讨论这个事情,觉得很有意思。理论上讲,“颜色词+狗”这样的组合具有平行周遍性,因此,这个结构有生成性,是词组。比如,在绘画中,可以画任何颜色的狗,人们都能理解。中国画家周春芽的代表作之一就是《绿狗》。而且在现实生活中,也有“绿狗”,虽然很罕见,新闻曾报道一只英国金毛产下绿色小狗,据说全球仅有三只这样的小狗。

▴2018年,汪锋老师在云南大理开展语言与基因调查

尽管如此,但在田野调查中,发音人很难接受自己在现实生活中没有见到的组合,也很难调查出来。记得罗仁地先生也谈到过,在田野调查中,很多发音人往往把言语当作现实,难以分割。比如,你问他:“‘我有三头牛’怎么说?”他可能说,不知道;但你问他:“‘我有一头牛’怎么说?”他会告诉你。你说,把“一”换成“三”不就行了吗?他说,不行,因为他家里只有一头牛,并没有三头牛。

有的语言学家强调自然生成的语料,而对于通过例句诱导或者翻译出来的材料表示怀疑。其实,这背后也是语言观的问题。生成学派强调语言能力,认为通过内省语料提出语法规则完全没有问题。功能学派强调语言的功能,在社会交际情形下实际产出的语料才有语言学价值。

田野调查时,发音人出于礼貌考虑并不愿意否定调查者,而且很多此类询问需要发音人假设语境,就更容易造成一些偏差。因此,很多田野调查学者不主张单独提出一个句子来问发音人是否可说,而是直接记录发音人说出的故事等语料,以保证自然性和准确性。

因此,无论如何,我们得清楚自己调查的时候在调查什么才行。

五、田野无界:语言存在的日常维度

一说到田野,人们常常想到乡村,想到边疆,想到少数民族。这或许是早期人类学田野调查的典范对我们的认知造成的影响。二十多年前,也是抱着这种向往,我去云南调查白语、彝语,去四川调查贵琼语,等等。而且,跟别人说起这些的时候,感觉是“自带光环”的。

其实,大概从徐通锵先生开始,我们的田野调查就开始变得有点儿不一样。徐通锵先生、王洪君老师、陈保亚老师开始倡导一种“有序异质观”(orderly heterogeneity),开始关注语言中的变异(variation),也就是,研究人与人在语言上的“不同”,而不仅仅是人与人在语言中的“同”。陈保亚老师还专门写过一篇文章《20世纪语言研究中的同质化运动—索绪尔语言观与博爱士方法论的殊途与同归》,以往被忽略的“变异”成了观察语言最重要的窗口。徐先生、王老师在调查方言时更注重发现不同的社会人群之间的差异,寻找背后制约的因素。通常被称为社会语言学创始人的拉波夫(William Labov),其实并不喜欢这一头衔,他认为,语言就是社会现象,语言学怎么能离开社会来研究呢?

▴拉波夫(William Labov)美国语言学家(1927-2024)

我自己的本科毕业论文是研究自己家乡应山(方略)方言的小称变异,我就找亲戚朋友问:“‘狗’能不能说‘狗子、狗娃儿、狗娃子’?能说的话,意思上有什么差别?”他们就感到很奇怪:“你不是从小就说这个话的么?问你自己不就行了么?”我父亲觉得“猪子”可以说,我完全不能接受这种说法,他们的解释就是,我在外面说普通话说多了,方言不太会说了。后来我调查了更多的人,控制了各种社会因素变量,最后说明了我们方言小称词缀的格局是如何变化的。后来我的硕士论文继续走这个路线,因为我发现了我们方言中另外一种语音上的变异。比如,柴,有的人念chai,有的人念cai。我就想知道是怎么回事,就回到家乡调查了很多人,通过数据分析,分清哪些是内部自然变化造成,哪些是受普通话影响造成的。

以前,我一直觉得这是社会语言学的调查,跟田野调查没有关系,尤其是我是回家调查,并没有去陌生的偏远地方调查一个陌生的语言。现在我改变想法了。我觉得有语言的地方就是语言学的田野可能“田野”(field)在字面意思上容易误导我们,让我们觉得这地方得是在“野外”。对于语言学而言,这个“野外”是不必要的。

十几年前,王士元先生等提出语言是一个复杂适应系统(complex adaptive system),这在有序异质语言观的基础上更进了一步。我的理解是,将个人语言和个人语言之间的互动放到了核心地位,社会结构以及语言结构等都是个人语言互动交流的产物。

▴2002年夏天,王士元、陈保亚老师和汪锋在怒江流域的罗古箐,开展普米语调查

前一段时间,我注意到一个有意思的用法,就是不少北大人用“贵校”来自指。据我自己的记忆,这大概是近几年的事情。按道理,“贵校”只能用来尊称听者的学校,对同是北大的听者这么说,就破坏了这个常规,产生了一种调侃的言外之意,成了一种创新的表达。当然,这种破坏常规也可能被认为是用错了,被群体嘲笑,然后这个用法就会被淘汰。“贵校”的这个新用法是如何突然涌现的?想要搞清楚这个机制,就得通过内省,并调查其存在的生态—什么样的情形下可以用?哪些人在用?哪些人不会用?不会这样用的考虑是什么?等等。

21世纪初开始,办公软件PowerPoint(简称“PPT”)开始大行其道,几乎取代了幻灯片和板书。当然这也引起了一部分板书爱好者的批评,他们认为,PPT的滥用严重干扰破坏了教学的秩序。但从语言发展的角度看,由于PPT演示时,通过视觉传递的书面形式(PPT页面)与通过语音传递的口语形式一起呈现给观(听)众,二者互为补充,理想的情况是相得益彰,这样一种书面语与口语的综合语体实际上是从PPT的广泛使用催生出来的。我的感觉是,其最常见的使用场合是期待讨论互动的报告,而在这种典型的PPT演示体中,一种新型的平等沟通开始成形,学生在课堂上做演示汇报时,面对的老师是少数,而更多的是自己的同学。同样,学者们在会议上做报告时,会面对少量前辈先生,而更多的是自己的同辈或者学生辈;业务经理们在做产品规划时,不仅在向少数上级主管陈述,更多时候还有自己的同侪和下属。通常在演示结束时,PPT页面上会出现“谢谢”,伴随着口头结束语“谢谢大家,请多指教”之类。值得注意的是,致谢页面属于书面语,随之而来就有正式典雅的语体要求,现在不时会见到“感谢聆听”“感谢各位专家的聆听”的用例,也引起了不少争议。很多人认为此处“聆听”为误用,原本表示对讲者的敬意却用在了讲者自谦的场合,争论的焦点在于,“聆听”本身是否表达对所听的尊敬。这就得调查“聆听”一词的使用情况—这些用例是如何分布的?尊敬义跟使用者的心态有怎样的关联?“感谢聆听”这样的用法是否会推广到口语中?其扩散或者阻滞机制如何?这就需要通过“田野调查”来获取资料,从而回答语言作为复杂适应系统视域下生成的这些问题。

这些观察和思考促使我重新定位语言学田野调查。我们无时无刻不在语言之中,语言存在的事实是一切理论的源泉。语言的存在包括具体而微的个人语言以及其存在的生态。我们每天都“淹”在语言事实的海洋里。对于一个语言学专业的学生来说,语言存在的地方,就是语言学的田野所在。我们得清楚自己在田野调查时依赖的装备总是有限的,但只要我们意识到自己的“有限”,就有可能摆脱这种限制,从而接近语言的真相。

信息来源 | 北京大学人文社会科学研究院

本文来自【北京大学】,仅代表作者观点。全国党媒信息公共平台提供信息发布传播服务。

ID:jrtt