重构三千多年前的汉语:为何重构?如何重构?

重构三千多年前的汉语的语言特征,不仅仅是为了满足历史语言学家的好奇心,事实上,它更是解读中华文明基本典籍的锁钥。希腊或罗马的古文献因为是用拼音文字写下来的,辨识其中的词比较容易,研究者不必过分担心它们的实际发音就可以开始解析文本。但在阅读早期汉语文献时,古文字读音的重构通常对最初的离经辨志起到至关重要的作用。这是数百年来中国学者公认的事实。

什么是上古汉语?

我们用广义的“上古汉语”(Old Chinese)来指公元前221年秦统一中国之前各种形式的汉语。汉语最早的文字记录起源于约公元前1250年(商代晚期,周克商于公元前1045年)刻在兽骨和龟甲上的甲骨文,所以我们讨论的也就是这一千年里的汉语。很明显,在这样广阔的时空跨度下,当时应该有很多不同形式的汉语。原则上,我们希望重构这段时间内汉语整体的历史,包括它所有的复杂性,但是我们可以肯定的是,这些语言信息中有很多已经不可挽回地丢失了。

不过一个有益的出发点是,尽可能重构所有已证实的语言形式的共同祖先。后世的方言可以说是从这一共同祖先演变而来。虽然我们没法确定,但是似乎包括甲骨文、金文和最早的经典文献在 内的早期文本,也和这一共同祖先相差不远。历史语言学中一般将已证实的语言(如拉丁语、希腊语、梵语)和必须构拟的语言(如原始日耳曼语、原始印欧语)区分开来。从某种意义上说,上古汉语是可证实的,因为文献中有大量的书证。但因为上古汉语文字系统的性质,为了解析这些文本,我们必须重构它的音系和其他语言特征。这是因为早期汉字系统的最重要原则是用代表一个词的字符去记录别的读音相近的词(有时还添加其他部件)。因此对于上古时期的文本而言,没有拼音文字的便利,要确定文本中用的是哪个词,我们就必须弄清楚在文本写成时期哪些词是 读音相近的。而由于最早的汉语文献所记录的语言,看上去和所有已证实的汉语方言的共同祖先很接近,现阶段我们很难对上古汉语和原始汉语(Proto-Chinese=Proto-Sinitic)作出有意义的区分。 为了方便起见,我们用狭义的“上古汉语”来指根据现有证据构拟的最早期的汉语,并且我们认为来自任何汉语族语言的证据(包括借入其他语言的汉语借词)都有助于我们的构拟。

上古音构拟的传统方法

重构上古音最重要的早期工作是清代(1644—1911)学者完成的。他们把辨析古音作为语文学的工具,用来解析形成于上古时期的经典文献。他们用押韵和谐声来辨识经典流传过程中造成的文本错乱或文字讹误。

瑞典汉学家高本汉(Bernhard Karlgren,1899–1978)结合清代学者的成果、字母标音法以及当时他自己的一些语言学方法,建立了一个上古音的构拟体系[他称之为“Archaic Chinese”;高本汉(Karlgren 1954)中做了总结],他主要用三种证据:

1. 早期诗歌中的韵文,特别是中国最早的诗歌总集《诗经》;

2. 汉字中的谐声声符;

3. 中古汉语(高本汉称“Ancient Chinese”)读音的具体信息保存在《切韵》(成书于601年)和类似韵书以及其他书面材料中,如陆德明(550?-630)的《经典释文》(简称JDSW),其中包含对经典文字音义的解释。

高本汉的方法后来成为了传统,他提出的上古汉语读音既符合以 上这三种证据,又(在某种程度上)符合自然语言。 白一平的《上古音手册》(A Handbook of Old Chinese Phonology,1992)就继承了这一传统。这一传统方法已经取得了重要的成果,但是也存在一些局限:

1、中文文献以外的证据(即现代方言的口语材料和其他语言中的 早期汉语借词)很大程度上被忽略了。

2、多数研究者倚重清代小学家对《诗经》押韵的传统分析,而不是直接分析韵文证据本身。

3、大部分对谐声声符的分析,不是基于实际使用的先秦文字,而是用汉代(公元前206-公元220)以来的标准文字,或者是用许慎完成于公元100年、以分析秦篆为主的《说文解字》。这样的做法很明显是时代错乱的。

4、上古汉语多被看作是一个同质的、共时的系统;很少关注上古时期语言的变化。

5、主要精力集中在语音的构拟,而较少注意构拟形式的形态或句法、语义属性。

一种更全面的方法

我们的新构拟还是依靠传统构拟所使用的三种证据。但最近的一些进展使我们得以运用一种更全面的方法:现代方言——尤其是那些可能承载更多有关上古汉语信息的方言,比如福建及其周边的闽方言——现在的文献记录比过去要好得多,因此我们不必甚至不应该像高本汉那样,只依靠中古汉语的书面材料来替代上古汉语后来的语言形式。 

我们也有了对侗台语族(Kra-Dai)、苗瑶语族、藏缅语族、越语族方面更好的调查和研究,这些语言中保留了借自汉语的早期借词。这些借词常常为我们提供了从现代方言和中古汉语书面材料很难或根本不可能得到的语言信息,而这些信息是构拟上古汉语时应该考虑的。这些借词往往为我们提供了在现代方言和中古汉语书面材料中很难或根本不可能得到的语言信息,而这些信息是构拟上古汉语时应该考虑的。

另外一个新近的进展是中国激动人心的考古发掘了一大批先秦时期的出土文献。这些用统一和标准化之前的文字抄写的文本,不但出土数量日益增多,而且内容丰富,特别是湖北出土的郭店楚简和20世纪90年代上海博物馆收藏的战国竹书。以前出土的先秦时期文字材料内容有限,而且比较程式化,如商代的甲骨文和商周青铜礼器上的金文。多数常用词都不见于这些材料,因此高本汉倚重稍后的标准文字也是可以理解的。但最近出土的简帛写本,内容丰富多样,包括哲学、历史、神话、法律、占卜、医药等多个领域。这些资料中有一部分也见于传世文献,但多数是闻所未闻或以前仅知其名而不见其实的。此外,这些文本中有很多字形是前所未见的,为我们提供了构拟先秦读音的宝贵证据。相比之下,很多秦汉以来使用的标准文字,却完全不反映上古汉语的语音。

楚国竹简

楚国竹简

我们也认为上古汉语的构拟已经发展到可以有效利用内部构拟方法来重现上古汉语的形态。 高本汉在他1933年的文章《汉语中的词族》(“Word families in Chinese”)中已经为此打下一些基础。 他把音义相近的词放在一起,作为判定它们的词根和形态变化过程的初步工作。但是他在古音构拟方面的局限,限制了他对有关规律的辨识。改善后的古音构拟,加上方言以及早期借词的证据,使我们现在可以更精准地辨识形态变化的过程。

最后,使用更趋完善的古音构拟,能更好地理解早期文本中一些关于早期汉语及其方言变体的或明或暗的信息。

语言构拟的性质

我们把语言构拟看作是对一种或多种语言的较早阶段进行推论,这种推论是通过提出假设,然后进行实际验证。音系的构拟常常是最基本的工作,尤其在研究的初期,因为对音系的了解是理解其他语言结构的前提。但是原则上我们的目标是构拟一种语言的所有,包括所有词汇的语法及语义特征,而不仅仅是它们的读音。

这些目标看上去不可能做到,并且有时候的确不可能做到。从原则上说,我们怎样能获得对一种死语言,或者是一批死语言的认识呢?关于如何重构语言史,存在两种截然不同的观点。按照一种传统的看法,历史语言学家手上有某些科学的方法,如果正确运用的话,可以产生可靠的结果,万无一失。正确使用这些方法所得到的结论,就可以被看作是“证实”了(依照这种看法,如果两位学者得出不同的结论,那至少其中一位是用错了方法)。而且按照这种观点,研究者只能是一分材料说一分话,不能多说;讨论那些未观察到的现象是不科学的。

虽然很难说有任何人曾把这种方法自始至终贯彻到底,但是构拟的过程有时就是如此:某些结论说是被“证实”了,而且研究者之间的不同观点可归结于这方或那方的不合理操作。我们这里采用的是另外一种对于科学研究的看法,那就是假设-演绎(hypothetico-deductive)法,如迈尔(Mayr 1982:28–29)所描述的。在我们看来,语言的构拟是对一种语言的历史所作的一系列假设。假设并不仅仅是对观察到的现象的概括,更重要的是,它们一面基于已有的观察,另一面也对未来的观察提出可验证的预测。这就是该方法的演绎部分。假设不能被证实,但是根据它们推演出来的预测,是可以被检验的。如果它们的预测是错的,那就说明假设是有问题的;在这样的情况下, 科学家就要修正或替换原来的假设。

这一假设-演绎法最有名的用例是1919年5月29日的日食。 这次日食为比较牛顿物理学和爱因斯坦的广义相对论提供了一个很好的机会。在这之前,牛顿对古典物理学定律的归纳是深得人心的,大多数人可能会说它们就是被“科学地证实”了的。但是牛顿和爱因斯坦的理论,对光在被巨大的物体(如太阳)影响时应该怎样弯曲作出了不同的预测,而1919年的全日食正好为验证这些预测提供了机会。 结果是爱因斯坦的理论比牛顿的理论更符合观测到的现象。

这样,语言的构拟不仅仅是对所观察到的事实的总结,更是关于语言实际的一系列假设。这些假设与观察到的事实大致符合,但同时也能预测还没有看到的事实。我们的上古汉语构拟预测:在新发现的或还未经仔细分析的文本中,会或者不会押什么样的韵;上古时期写本中的某词,会或者不会被写成什么样子;在汉语方言或其他语言的汉语借词中,会或者不会找到怎样的发音。 因此,我们的构拟也会被已有的或是新发现的证据证伪。因此只要有新材料不断涌现,构拟的工作就永远没个完。很遗憾英语“reconstruct”这个动词似乎属于泽诺·万德勒所谓的“完成式动词”(accomplishment verbs),即暗含着一个过程和一个终点.对于完成式动词(更确切地说是动词短语)如“run a mile”,我们可以问“How long did it take you to run a mile?”完成式动词与“活动式动词”(activity verbs)不同。对于活动式动词如“run”(跑步),正常的问话是“How long did you run?”,但是我们不会说“How long did it take you to run”(除非你已经预设了一个终点,如某人每天跑一定的距离)。对于“reconstruct”(构拟)来说,“How long did it take you to reconstruct Old Chinese? (构拟上古汉语花了你多少时间?),这听起来是一句正常的话,因此“构拟上古汉语”似乎可以被看作是一个完成式动词。事实上,高本汉好像就是这么认为的,他1940年出版《汉文典》(Grammata serica)时,大概认为他完成了上古汉语的构拟。

但是我们认为,这样理解构拟的过程是容易引起误解的。 上古汉语的一些信息已经不可挽回地丢失了,构拟上古汉语的过程永远不可能完成。同时随着更多证据的出现,更多人来研究,现在的构拟就一定会需要修正。我们相信我们所构拟的基本假设是足够稳固了的,因此现在可以公布我们的结果。我们把构拟的结果放在一个公开的网站上,这样,有了新材料或新主张时就可以作必要的修正。值得强调的是,我们的假设应该能预测哪些现象是将来会观察得到的,但同样重要的是,也应该能预测哪些现象是不可能观察得到的。如果碰到构拟系统不能解释的实例,一般总是可以临时提出一些特设的修改来解释这些例外。但如果一个构拟系统能符合所有可以想象得到的现象,如果它什么都能解释,它也就没有预测力了。有时与其马上提出特设的修改,还不如等到能找出比较合理的解释方法。

我们构拟上古汉语的方法

我们最终的目的不只是构拟狭义的上古汉语,而且是构拟所有一切我们所能构拟的先秦语言史。 早期的语音系统是什么?它是怎么演变的?有哪些形态变化?有哪些方言差异?这些方言又是怎样发展的?每个词的语义和语法属性是怎样演变的?当时的汉语与哪些语言有接触?这样的接触在语言上产生了什么结果?汉语的语言史和说汉语的人的历史之间又是什么样的关联?为了回答这些问题,我们认为所有可能用到的证据都应该用上,不仅仅是上面所说的传统的三种证据。

(本文节选自《上古汉语新构拟》,[美]白一平、[法]沙加尔著,来国龙、郑伟、王弘治译,上海教育出版社2021年1月出版。本书介绍的白-沙上古汉语新构拟,是白一平和沙加尔对上古汉语的音系、形态和词汇较为全面的语言学构拟。)

读书推荐

读书导航