序
我对《红楼梦》的研究,可以说是始于对作品的捺字点数,事情的起因,是陈炳藻先生1980年6月在威斯康星大学召开的首届国际《红楼梦》研讨会上宣读的论文,那篇《从词汇上的统计论〈红楼梦〉的作者问题》认为,《红楼梦》的后四十回也是由曹雪芹所写。这个结论与大家阅读《红楼梦》的感受相异,而且胡适与鲁迅在二十世纪二十年代就已做过考证,结论都是后四十回并非出自曹雪芹之笔,几十年来人们一般也都接受这两位大家的主张。可是陈炳藻先生的“新论”是借助于计算机的统计,在二十世纪八十年代初,计算机在国内还是一般人接触不到的稀罕物,当时报上又以“计算机闯入大观园”之类的标题做宣传,人们一下子闹不清是怎么回事,对后四十回为何人所作的问题也变得疑疑惑惑,要知道这次出场的是大家当时还感到比较神秘,且又属于高科技的计算机,仿佛是它将后四十回的著作权判给了曹雪芹。
得知这一消息时,我还是复旦大学数学系的学生,也上过与计算机相关的课程,因此知道计算机的运算,其实是依赖于操纵者编制的程序,因此在探讨陈炳藻先生的“新论”是否靠谱时,计算机并不是需要质疑的对象,问题的关键在于研究者的设想及其操作的手段。阅读陈炳藻先生的论文,发现有几个要害处难以令人信服,其中包括母体与样本的设定,以及统计时只从《红楼梦》中抽取了6万字,检验的指标也只有14个,等等。
1982年3月,人民文学出版社出版了以庚辰本为底本且与诸本校勘的《红楼梦》,这对从语言学角度做统计提供了可靠的版本。1983年,我开始了对《红楼梦》的统计工作,统计对象是全书的72万余字,而非6万字,检验指标近80个而非14个,其中包括虚字、句长与作者习惯使用的专用词汇。这项工作历时一年多,其中大部分时间是在对《红楼梦》捺字点数。计算机在国内开始普及是二十世纪九十年代中期的事,我在八十年代初时的统计只能靠手工操作。第一步工作是点清作品各回的字数。第一次点完不放心,又做第二次复校。如果某回二次点数结果不一致,那就得点第三次乃至第四次。准确地掌握了作品各回的字数后,第二步工作是点清各虚字在各回中出现的次数,以便计算它们各自的出现频率。这一步操作得十分小心,因为同一个字,在不同的语言场合字义会发生变化。如“的”通常是虚字,但在“有的放矢”等场合,它却是实字;又如“了”通常是虚字,但在“一目了然”等场合,它也是实字,这样的例子还可以举出许多。点数本来就是烦琐的拼耐心的事,再加上不断地要做字义判断,其进度当然快不了。其实,就是使用计算机统计,它确可很快就告诉你有多少个“的”字或“了”字,但要从中筛滤出实字并剔除,还是得靠人工判断。关于句长的考察也是由手工完成,作品中各回有多少句,不同长度的句子各有多少,要得到这些数据,同样无法越过捺字点数的环节。
经过一遍又一遍的点数,我对作品的语言风格也越来越熟悉,这时有些念头会突然在脑海中闪过,提醒自己应作深究。这些念头怎么会冒出来的,我至今没弄明白,也许是点数点得多了,自然产生了语感的缘故。譬如对“索性”这个意思的表达,我突然感到前八十回是用“越性”这个词,只有后四十回才用“索性”。为了验证这一感觉,就需要将《红楼梦》从头到尾再查检一次。结果发现前八十回确实在用“越性”,偶尔也出现了“索性”。庚辰本源于己卯本,将两者做比照,可发现那偶尔出现的“索性”是过录者的笔误。又如前八十回喜欢用“越发”一词,但在后四十回里,同样意思的表达却是用“更加”一词;前八十回一般用“才刚”一词,而后四十回里却是用“刚才”。甚至“脏”字的使用,前后两部分也有明显差异,在前八十回里,就连尊贵的王夫人或清雅的林黛玉也难免有时要说个“屁”字,而那些婆子或丫鬟开口时,一些很不文雅的“脏”字有时就会直闯读者的眼帘。后四十回的作者似乎很不屑于使用“脏”字,在那二十多万字里只出现过两次,而且相对来说还较文雅。一次是贾政在气急之中骂了声“放屁”,一次是贾琏引用了“大萝卜还用屎浇”这俗语。诸如此类的用词差异发现了27种,而对每次的发现都需要将《红楼梦》查阅一遍以证实。
花费了一年多的时间,《红楼梦》也查检了百余遍,根据获取的约2万个数据,可以对作品的语言风格做数理定位。最后的结论是:将作品前八十回均分为A、B两组,它们的语言风格完全一致,确为一人所写,后四十回定义为C组,它的语言风格与A、B两组有明显差异,应非出自曹雪芹之手。若将后四十回按顺序均分为C1与C2两组,那么C1组的数据有向A、B两组靠拢的趋势,而C2组的数据则是更为远离,这表明在第八十一回到第一百回之间,当含有少量的曹雪芹的残稿。不过运用数理语言学做统计分析,只能指出残稿的所在区间,却无法确定究竟哪些内容属于残稿。
从数理语言学角度分析《红楼梦》的工作结束了,可是我在文学作品意义上对这部作品的关注却刚开始。先前只是考虑统计的需要,一次又一次地对《红楼梦》捺字点数,这一过程反复进行了百余遍后,对这部文学巨著已是异常熟悉,一些情节或细节的描写经常会在脑中萦绕,更有趣的是,书中的内容会自发地在脑海中越出情节线索做串联、归并之类的组合,冒出一些以往人们似不曾关注或研究的问题。譬如说,贾雨村是书中最坏的人之一,可是曹雪芹为什么偏偏要安排他去当林黛玉的老师?读者厌恶的人物与偏爱的人物怎么会形成这种奇怪的组合?与此相关联,因贪酷而被革职的贾雨村又为何偏为林如海所赏识?又譬如说,贾兰尚属年幼,父亲又早就去世,贾母与贾政怜爱他是情理中事,可是他的亲祖母王夫人为何从无这样的表示?相反,她还将贾兰的奶妈赶了出去,理由是贾兰大了,不需要了,而贾兰的姑妈辈如迎春等人,那些奶妈都还在她们身边照料呢。作品熟悉后,又会发现一些应有的内容作者却没写,如王夫人与李纨是很亲近的婆媳关系,几乎每天都有接触,可是书中却没有这两人的对话,这显然是曹雪芹的有意安排,但他为什么要这样做呢?同样,探春与贾环是同父同母的姐弟,也是很亲近的关系,可是书中也没有这两人的对话,作者只是极其概括地提了一句:探春的秋爽斋“不时有赵姨娘与贾环来嘈聒”。当然,要认定曹雪芹确实没写这些人的对话,都需要将《红楼梦》从头到尾再检阅一遍。
作品的前八十回以一个封建大家族的生活发展为主线,贾宝玉与林黛玉的爱情故事尤为其中的重要内容。这些描写具有很强的生活气息以及立体感,那是因为作者不是单纯地只关注情节的推进,他同时糅合了与此相关的方方面面的描写,向读者展示了贾府全方位的生活画卷。这些内容经常与情节进展似非直接相关,只关心故事进展的读者阅读时,甚至还会将它们自动筛滤。这样做不会影响故事的阅读,却会妨碍对故事内涵的理解,因为那些内容或是故事发生的起因,或是导致故事转折的潜在因素,或是烘托了故事进展的氛围,有时甚至参与了故事走向的决定。它们在阅读时易遭筛滤也可以理解,因为这是诸多种类内容的集合,作者对此又不是做系统的集中介绍,而只是视情节进展需要而显现,故而在作品中是一种零散的状态,阅读时也确实容易被忽略。可是对《红楼梦》十分熟悉之后,情况就发生了变化,那些处于零散状态的内容竟会在脑海里自行分类组合,成为一个个有序的小系统。譬如说,作品在叙述过程中,先后涉及二十多个管理机构,如总管房(又称总理房)、帐房、银库等等,它们在脑海里的自行分类组合,就形成了一幅荣国府管理结构图,有关荣国府管理制度的情形也同样如此。对这两者有所把握后就会明白,曹雪芹能有条不紊地展现荣国府的奢华生活,那一套完整的管理机构与制度的支撑是重要的因素。
大概是早年由数学专业出身的缘故,在那些自行分类组合的内容中,我最易敏感也最感兴趣的是数字,其中绝大部分属于经济数据。贾府中各色人等都无法脱离经济而生活,即使再清高洒脱者,也免不了为银钱所困扰。曹雪芹为各人物结局的设计,须得在贾府经济状况由盛而衰的大形势下方能实现,也正是由盛而衰的转折,加剧了那些人物之间的矛盾冲突。借用探春的话来说,尽管大家“是一家子亲骨肉”,却像乌眼鸡似的相互瞪视,“恨不得你吃了我,我吃了你”;而邢夫人的兄弟邢大舅讲得更干脆,那些矛盾冲突的发生,“就为钱这件混帐东西”。书中有些故事就是因经济问题而发生,有时经济内容是故事组成的重要部分,不过在更多场合,那些随情节而来的经济数据似乎可有可无,它们的整体也呈现为离散状态。《红楼梦》毕竟是一部文学作品,书中经济数据的提及完全服从情节发展的需要,若按经济学逻辑考察,其出现次序有点凌乱,但它们的全体,却有如针灸穴位显示着人体经脉网络似的功用,借助于对这些数据的梳理与分析,可以勾勒出荣国府的经济体系,并考察其发展变化。这一事实提示了理解《红楼梦》的新思路,书中那些情节的发展变化受到了潜在力量的有力制约,在曹雪芹创作的全盘设想中,有一个完整的经济体系在发展变化,它同时还配以一套完整的管理机构与制度,故而作者能采用网络式的结构展开故事,从而表现各种错综复杂的矛盾冲突。在中国古代小说史上,能运用如此高超的艺术手法的作品,《红楼梦》可以说是唯一的一部。
在曹雪芹的创作中,似乎游离于情节主干外的描写还相当多,但是这种游离状态只是表象,它们相互之间以及与情节主干之间其实有着密切的联系,只不过这类联系的揭示需要有细心的归类分析。通过对似乎游离于情节主干外的方方面面的描写做综合梳理辨析,我对这部文学巨著有了自己的理解,对一些易被忽略的方面较为关注,对一些问题做出了能自圆其说的解释,其中有不少就是围绕这部作品中的经济问题而展开。有些见解曾先后发表于报刊,后来人民文学出版社的李俊先生与我商议,能否就经济专题撰写一部关于《红楼梦》的书稿,我也很乐意能有机会,将阅读这部作品的心得体会做一次较系统的梳理总结。在我看来,曹雪芹笔下的情节发展是一个大系统,而我比较关注的许多内容,在某种意义上可以说是这个系统的“边角料”。这些边缘状态的细节描写在书中以零散状态呈现,可是将它们从大系统中抽取出来做归类分析,却也可形成一个新的专题性的系统。这是整个大系统中的子系统,它与大系统有着密不可分的联系,而将这两者时时做对应考察,子系统的性质方能显示得更为清晰。本书就是依循这一原则写成的,而对作品,特别是对那些似乎游离于情节主干外的描写的熟悉,是本书能够成稿的前提。若要追问此“熟悉”的由来,那就又回到本文开始时所说的捺字点数的统计工作。一部《红楼梦》被捺点了百余遍,这其实也是那些情节、细节以及人物的言行等等反复地向脑海中灌输的过程,其结果便是那“熟悉”的形成,尽管此时我的本意并不在此,而只是想获取相关的数据。当年统计的“副产品”,成了今日研究的基础,这是自己先前未曾想到的。为此,我在本书最后附上了二十世纪八十年代所写的两篇论文:《从数理语言学看后四十回的作者》与《“〈红楼梦〉成书新说”难以成立》,既是想以此说明本书的分析阐述为何只取材于《红楼梦》的前八十回,同时也算是对三十多年前那场研究的纪念。