各位专家:
第三届HNC的研讨会在北师大举行,我作为北师大的校友,也是HNC的老朋友,感到非常地高兴。
会议早就筹备了,这个时间也比较早地定了,但是我向大家坦白地说,由于刚从上海赶回来,对我今天到会的讲话,我没有时间准备。只好就是中午不休息、晚上晚睡准备讲话内容。到上海去,其中有一项工作,也是推进中文信息处理的应用。要说的话太多,我找最紧要的话说。
在座的专家都知道,计算语言学、中文信息处理,我是外行。虽然名为中文信息处理研究所的所长,但我只起到把握方向和组织协调、找经费等这些作用,剩下的工作都是我们的专家在做。虽然我也主持了“九五”的社科重点项目,就是钟校长所说的,又在主持着一期“八六三”的项目,可实际上我都是跟在专家们的后面蹒跚前进。这样说有两个好处。第一,没有准备,这个没准备不是我轻视啊,是我没有抽出时间来。第二,我是外行,所以下面说的话,哪怕全盘都是错误的,我也不脸红,因为本来外行就该说外行话。不像专家,早就名声在外,说了一句外行话,人家就会说:“他还是专家呢,你看他说的,这是什么呀?”我说错了话,顶多是大家酒后的谈资,呵呵,所以我胆子比较大。
我和HNC的关系大概到现在为止是第十个年头。如果说我在HNC项目的进步上起到一点作用的话,是友情之援,那就是我在黄曾阳先生的背后,狠狠地给了他一巴掌。因为他准备面壁十年来发展。我说不行,你这样十年后拿出的东西是空中楼阁,你必须在前进的过程中考虑转向应用,哪怕一点点的成果都要到实践中去,因为只有在实践当中才能检验出你原来的形而上和形而下的思维,检验出你的思路有哪些是不完善的,甚至可以检验出你的思路行得通行不通。再说,大家想想,九十年代中期,我们的科研经费,无论声学所还是语用所(就是李宇明先生手下的研究所),都是少得可怜。不知道黄先生还记不记得我打的比喻。你要从中关村开车去天安门,你车子里面的油箱没油了,你就需要在太平庄停下来加油,油加得不够,走到护国寺,还要拐进去再加油,你必须找到加油站。黄先生很谦虚,接受了我的意见,从此在进行基础研究的同时也在考虑哪些能拐个弯。
这次“八六三”项目科技部来验收,给予了很高的评价。认为面向计算机的现代汉语应用基础研究达到了国内先进水平,有些子课题达到了国际领先水平。我这里坦率地说,国际领先指的就是HNC理论及其产品。在这种前提下,我们开第三届研讨会,我想各路英豪,大家都来检验、批评、审视、协助HNC再向前跨进一步。这不是黄曾阳先生一个人的事情,不是声学所一个课题组的事情,也不是我们一个“八六三”的事情,涉及到整个国家,其中就包含了李宇明司长所说的中国的话语权问题。
我曾在《中国语文》上发表过一篇文章说,中国的中文信息处理,现在已经呈现出三大流派。一个流派是西方计算语言学的移植、吸收与消化;一个流派是基于语义函数所进行的探索;一个流派就是HNC。谁也不能包打天下。出现了不同的流派,意味着这个领域的学术研究达到了一个新的水平。通观古今中外的学术领域,文学领域,如果没有流派,只有一派,肯定是低水平的。当出现流派了,就意味着水平提高了。流派与流派之间要融合,当它融合成一个的时候就停滞了。当这一个再分化为流派的时候,就又提高了。我们从四大名旦、四大须生就能看出这个道理。京剧的路程就是这样。今天,京剧停滞了,为什么?程中有荀,荀中有梅,你分不出来了。只有几个人能唱原汁原味的四大名旦,新一代的多流派没有形成。我想我们中文信息处理能在九十年代呈现不同的风格,我姑且称之为流派,这就是进步。但第二句话就是:谁也不能包打天下。因此,当时我就想,我如何再次地把不同流派的朋友集合到一起。学术可以有不同,心相通。彼此争论、彼此否定、彼此学习、彼此吸纳,推进各个流派的前进。这就是我,作为一个外行,要向国家申请“八六三”项目的初衷。
经过这三年,我认为,这个点,形而上的目的达到了,形而下的也由科技部给予了肯定。现在,中文信息处理处在一个什么阶段?我一直渴望着、努力着,希望把中文信息处理进入句子处理的阶段,现在这一点还没有实现。刚才一进来,我拜会各位专家的时候,清华大学陈群秀教授给我提出来下一期的“八六三”。下一期的“八六三”正在申请当中,“八六三”办已经表示支持。我想以句子处理为中心,用这个目标向全国招标,很可能应标的、中标的不多。但是作为一个国家的工程当中的一项,不立一个更高的目标,仍然就着现状咱们再继续进行研究,恐怕力度,就是吸引力和支持力、精神力都不够。就像是百米赛跑,前面必须有一条红线,必须向那个线冲刺。为什么这样?的确,各位专家,包括刚才李宇明司长和陆俭明先生所说的,客观的实际给我们提出了紧迫的要求。
那么,我举两个简单的例子,可能都是小儿科的例子,但是这就说明人们对我们中文信息处理的渴求啊。一,在字处理这个领域,人人都要用键盘输入,输入方法层出不穷,加上联想功能。但是,繁简字转化,几十年了,海峡两岸都没有解决。这给海峡两岸的交流,给海外广大华人和学了繁体字的外国人进入大中华领域,进入中华文化造成了多大困难,社会中闹了多少笑话,以至于现在对于小学的电脑教学受到了阻碍。这个问题怎么解决?基于概率、统计,台湾试过,我们也试过,不行。如果基于语境,用HNC的话,情景,利用初级的智能,也就是基于语义,我想恐怕要比基于统计来得方便,成功可能性更大。不是我们不能解决,是很少有这样的高校和研究所把这样一个小小的,我说小儿科的问题,作为自己的攻克的方向。再一个例子,现在,搜索引擎成为一个新的经济增长点,在IT业里面,GOOGLE 称霸天下,当然也有竞争对手,包括美国的公司。我们的百度,以及中搜,走的其实是跟GOOGLE一样的路。如果我想搜索“黄曾阳”,但我不知道“黄曾阳”这个名字,我也不知道HNC这个简称,我就知道中国有一个专家,他是基于概念什么网络来从事计算机研究。如果把我刚才我所知道的全部知识敲进搜索栏去的话,能不能找到“黄曾阳”?如果我们的搜索引擎达到这一步了,GOOGLE就该淘汰了,起码中文要淘汰。而这走哪条路?没有关键词,“HNC”跟“黄曾阳”都没有,但是我就能把你找出来。我相信,能做到这一点。为什么?计算机的人机交互。模拟人类和语言的关系。比如,我是教哲学的,曾经听过许嘉璐先生说什么哪个研究所有这么一个专家,搞什么概念什么网络,他来做计算机研究,我就知道这一点,那我就试着敲敲,那我们的计算机工作者就有义务让这个人找到“黄曾阳”,找到“HNC”。这是人的思维嘛。当然真正的模拟不是模拟这个,是模拟掌握第二语言和孩子掌握母语的时候他的思维过程。咱们谁能满足这点?
再举一个非常现实,就是今天的例子,眼前的例子。会前我和钟校长谈汉语国际推广的事情。他向我介绍校方在这方面刚刚做出的决定。我到上海去也有这个任务。我和华东师大的党委书记和校长谈了一上午。我们想到的,我们专家常常想到的,计算机如何为中国人服务。实际上今天,中文信息处理的任何技术要想到为全世界人民服务。现在国内上网的人达到一个亿,计算机达到七千多万台。使用它,把它当成打字机的人可能更多。但是,现在在中国境外学习汉语而且人人用计算机的到零四年底是三千万,到二零一零年底,要达到六千万甚至一个亿。换句话说,今后使用计算机来处理中文、学习中文、阅读中文的,国内增长的曲线和国外增长的曲线,很可能到二零一五年,两个曲线重合于平衡点,那就是国外用的和国内用的各半。因此,我们现在还紧盯着国内的需求,不够了。宇明同志说的话语霸权问题,我们在中国你声音再高,出版物再多,只限于国内,霸权还是人家的。只有我们的话语权进入人家的肚子里,让别个国家有十分之一的人,学汉语,用汉语,用我们的中文软件,你才争得了一点点的话语权。汉语国际推广,可以说,彻底地改变了传统的对外汉语教学的一些观念。我说出下面的话,很可能钟义信先生、黄曾阳先生能够联想到自己的课题研究的内容。这个改变,一个很重要的质的改变在哪里?对外汉语教学与汉语国际推广,这个名词的变化意味着什么?第一,我用HNC的术语说,情景转化了。是一个人家母语的环境,每周只上最多四课时,一个中学生两到三年要能流畅地使用汉语。过去是汉语的环境,所以我问过留学生,你不上汉语课,我就把你放到师大留学生楼,你在师大住两年,你能不能说汉语。答复是,我可以说。所以过去的对外汉语教学的成绩,我认为有百分之七十是语境给的,不是老师给的,不是我们的教学体系给的。不过这些帐都算到我们的课本和教学体系头上。我这话很不客气的。现在撤掉你的语境,就在那个环境里去,怎么办?只靠过去的那种系统的、严密的、科学的教法不行了,只靠老师面面相授不行了,要大量地使用计算机,使用多媒体。现在不是汉语的学习语境变了,要求你必须使用这些,它是国外的中学和大学的学习习惯、通例,也就变成了人家校方和学生的要求,就是老师不能干讲,必须用多媒体。我在和外国人接触的时候得到这个信息,从我家里得到这个信息。家里的例子不至于遭到反对、指责。我儿子在国外教建筑学,他每次上课之前,很重要的一点是做PPT,POWERPOINT,有静有动。他原来用的是一个128M的这个U盘,回来跟我说,不行,不够我一次上课的。于是在国内买了512M的。但是他东西要存啊。国外这东西贵极了,而且现在咱们中文信息处理硬件啊,超过了英美,超过了一般国家。在伦敦要买一个128M的U盘,要70镑。70镑乘15,你算多少钱吧?所以我的孩子们都是回来在国内买了带走。于是我就又帮他配备了一个移动硬盘,40G。哎,这回差不多。这回我一学期的课的内容就够用了。我说的什么意思?这一堂课,老师的话不多,就是点,点键,对这个来进行解说啊。因为他教建筑学,一般一个照片是5M,很细密,占的空间大,所以你想想,如果他这110分钟,他要几百个图片的话,你想多少M?他128M肯定不够啊。这是教大学生、研究生的。我儿媳妇,教所谓对外汉语,就是汉语国际推广。她每天累在什么地方?每天晚上要下载当天的国内信息,从中国的网上下载东西,图片加上文字的东西。然后带着U盘上课去。一插,开始上。她教的是硕士。也是128M不行。这次我给她带的也是大的U盘。中学生也是如此。我的一个博士生,作为志愿者,今年到了美国去汉语推广。拿着课本上堂,光这个是不行的。连我孙子在国外读四年级,老师上课也是用POWERPOINT。孩子要上机敲,或者投影,或者在他局域网里,在他机子上,做游戏、学图画,等等。而这个背后,它的后台,咱们用咱们的话说,它的后台,就在咱们在座的各位,得提供那种技术手段让人家去制作。再进一步扩展,刚才我说了搜索引擎,我总想这样,比如我这个眼睛昏花了,看屏幕戴着眼镜行,要击键么,要摘下来,我不知道有没有仁兄们跟我也一样。我总希望我对着话筒说,黄曾阳,嘣,出来了。我认为很容易转化的。没人做。
而,专家们,同学们,谁做出来谁就是一个产业呀!现实给我提出了无数个急切的需求。换句话说,给我们提供了广大的应用的战场。对商业来说,提供了广大的商机。那么,中文信息处理在做着基础研究的时候,在做着应用基础研究的时候,脑子里必须有具体的、社会的需求,及时地把自己的产品让社会去用,用的时候提出来不行,这不行,那不行,还有这个需求,我再给你添一个需求。于是,回过头来再研究,新的问题再补充到我们的基础研究里,基础研究就越来越丰厚,越来越前进。那么,三个流派都应该这样走,都可以这样走。
今天我们既然谈,是HNC的研讨会。当然专家们的发言不一定是HNC的,可以各唱各的调。可是我想会后这个问题需要我们大家再认真地思考。否则的话,我们的研究只能依靠一个来源,这就是政府的拨款。而一旦我们像钟校长刚才所说的,师大在探索,产学研结合,你科研的成果本身可以产生财富,反馈回来再提高、支持你的研究,就形成一个良性的循环。这是我所说的一层意思。再一层意思,我想呼应一下李宇明司长。他谈到自主创新的问题,这一点,几乎所有的学者都有共识,越来越感到其重要。可能在生产领域,商务部门感受得更真切。比如十五期间,我们进口技术花了1700亿美元。如果中国的自主创新能力强了,我在进口1700亿美元的同时,我输出1700亿美元。这1700亿乘8,七八五十六,13600亿人民币。不是我们可以干更多的事情么?我们政府拨款不是可以更多么?我们的福利待遇不是可以更提高么?就业的人不是可以更多么?如果我进口1700亿美元的技术,我输出3400亿美元的技术,我不是又多了一千多亿么?现在只好眼巴巴地单向进口啊!这是从经济上说啊,更重要的是国家的经济安全和国防安全问题啊!计算机的核心软件,几乎都是IBM的,或者Intel的,或者是Microsoft,还有很多的公司啊。所以自主知识创新已经在中央提到了非常高的高度。十一五期间也有重要的部署。但是要达到自主创新,增加自主创新的力度,需要两个条件,这两个条件恰好就是今天阻碍中国经济建设、社会发展的瓶颈,也是我们要继续平稳而快速地发展的瓶颈,也是中华民族伟大复兴的瓶颈。一是人才,二是体制。
我在这里不是跟大家谈宏观的形势,我是紧贴着我们中文信息处理来说的。首先人才,今天讨论HNC,我就以HNC为例,黄先生这些年带出了不少好学生,张全、晋耀红、苗传江等等吧,我是觉得队伍太小。如果现在在全国有几百深入到HNC,掌握了HNC,沿着HNC的基本理论继续前进,同时有些把HNC的理念、结论,不管是概念的层次网络这个主体也好,还是情境模块它的深化和应用也好,继续去发展。就省得一个老头子一个人在那里苦啊苦啊。怎么样加快人才的培养?在做项目的同时多吸引些人来学习,形成一个浩浩荡荡的队伍。我这个思想也适用于陆汝占老师、钟义信老师,以及包括退了的林茂灿老师(你的研究所室还是不错的),现在啊,跟晋耀红他们也有合作,还有陆俭明、俞士汶的队伍,都要更加宏大。但是这个问题又涉及到体制的约束。无论是在高校,还是在社科院,还是在科学院,你必须去争取项目。争取项目的前提,交房租水电、发工资、发奖金。高校好办一点,工资不管,房租水电不管了。怎么办?剩下就是我们自己了。我们在机制上如果能有所改革前进的话,就可以解决现有这种体制给我们带来的局限。首先,现在这种体制,是鼓励科研院所、科研人员面向市场,横向地联合,到社会需求当中去找财源。应该说是好的。但是对这个冷门,这个小角落里可能不行。那怎么办?就按照中央锁定的把你放活这条路继续走下去,就是除了基础研究,应该还能够转向应用。陆汝占先生在,也是我下达的,就是触摸式的语音服务系统做成了。他们在这个基础上又有创新,就是用在公交车和出租汽车上的,一个最初级的人机对话的系统。在上海定居的外国人在全国是最多的,包括台湾人,香港人来的也多,和出租汽车司机无法对话。那么可以处理世界几种主要语言和国内几种--现在还没有方言--几种主要方言。只要客户说了,用现在的定位系统也行,不用定位系统也行,就用这个和信息中心无线通讯也好,马上就变成用汉语告诉司机,都是实时的,几乎是同时的。司机就用汉语来回答,然后话筒里传出的就是客户的那种语言。现在他们正在研究,就是出租汽车司机可以主动地为客户服务。“先生,你第一次来上海吗?”然后话筒里传出的是外语。外国人就会用他本民族语言来回答。两个人就交谈,“先生,我给你介绍一下上海吧。你看,这里原来是旧的跑马场。这里是什么……”说上海话说普通话都可以。这个东西要推向了市场,不是补陆先生养那批博士生、硕士生的不足么?还可以扩大招生啊。但是一味地“校长,你给我钱。”“许先生,你给我钱。”再给你钱,养也就养现在这些人,养不成一个浩浩荡荡的队伍。要市场来养。而任何一个流派如果不能形成一个浩浩荡荡的队伍,我们的智力、我们的人力都受到很大局限,不会跨一步地前进。所以产学研的结合,就摆在中文信息处理--我只说这个特定专业,因为中文信息处理本身是应用--摆在这个领域面前。能不能形成产学研结合,我在做一点实验。师大党委很支持,成立了中文信息处理研究所,招了硕士生、博士生,这就是学。八六三项目是研。大正研究院是产。
我再说一个需求就是刚才提到的汉语国际推广。北师大在策划着建一个国家重点网站--教学网站。这个网站完全建成以后,当然要有一个比较长的过程,可能它的功能要超过现在所有的门户网站。可是要想实现,我手里所缺的中文信息处理技术太多太多了。在国外学习汉语的人每年以一千万的数字增加,把全中国教对外汉语的人都派出去,不过一千多人,两千多人哪。把在校学生都送出去,学对外汉语教学的,本科生,不过再增加五六百人哪。满足不了。你必须是跟上去。可是现在我苦于很多我所设想的版面、所设想的功能、所设想的专栏缺基础。而作为我,和专家们学习十多年了,我是觉得是可以做到的。所以我们的网站,有些项目要招标,有很多东西要外包。比如上来我就要用,准备一百分钟的动漫。现在市场价格,一分钟一万一。花一百多万,我要做一百分钟的。但是国内的动漫公司给我做出来的动漫是说汉语的。我还要中英文的对译呀。中文信息处理问题来了。
我希望我们所有的从事中文信息处理的人要明析,基础研究踏踏实实做基础研究,不要想到什么功利。搞应用基础的,脑子里要有明确的目标。搞应用的转化的,就要想到市场,要做市场、打开市场。各有分工。无论是哪一级,基础研究、应用基础研究和转化,我再次重复,我在“八六三”项目里每次会都要说的,允许失败。今后下一期的八六三进行,也请专家们这一点放心。我给你四十万,定好了这个项目。最后你告诉我,没成功,没关系,科技部我来对付。哪有一搞科研就成功的?我说句不客气的话,乔姆斯基就是失败者。但是他仍然是大学者,对不对?他走了,他的智慧很多后人吸取。但是他的结论,人类有共同的语言机制,得不到证明,它是一种假设啊,它得求证啊。那么,用这种方法去求证不行,你看现在没人跟他再搞这一套了。这就是财富啊。不然弄得上千个人去这么研究,这不是人类的巨大浪费嘛。他在具体的问题上是失败的,但整个路子是成功的。我想我们也是这样。这个我不说了。各位仁兄都了解我的这个思想。
最后一层意思呢,我是受了黄曾阳先生等一下要给大家做的这个报告的精彩讲演的题目的启发,《一位形而上的老者与一位形而下的智者的对话》,但是我不知道他讲的内容。这个题目给我一个启发,引发了我下面想说的一段话。对与不对,向各位求教。就语言学的研究说,现在要和计算机结婚了,联姻、嫁接。从索绪尔一直到乔姆斯基,他们都是理性主义者。尽管乔姆斯基对结构主义不满意,但是他走的基本上是结构主义的路子。他们的哲学基础,是二元论。理性主义和二元论的基本概念是:世界上的一切事物,人都是可以认识的。只要人类把一个事物的规律把握住了,就可以把握这个事物,把握这个领域。如何把握事物的规律呢?按照二元论来分解。这个二元论的初始就是基督教,人与神的二元,现世与天堂未来的二元对立。于是,在工业化的过程中,修道院所从事的各个方面的研究,混沌的,再追溯到柏拉图和亚里士多德,分化出物理学、化学、生物学、医学等等。然后,随着技术的发展、科学的发展,化学、有机化学、无机化学,有机化学里又分什么什么化学。那么发展到今天,我们最直接的感知就是我们生病了去看医生。神经科医生,你去找他,“哎呀,我最近出现了偏头疼。”“哎呀,我给你介绍张医生,我是研究手神经的。”然后找到脑神经,“哎呀,我专研究颞叶的,我研究脑垂体的。你这偏头疼,你找某某医生。”这是咱们经常遇到的,遇到的吧?好,用西方的技术来研究人体,越来越精细,越来越精细。前几年,西方生产出一个最先进的机器,我们国家从去年进口,当你进口的同时,那边更精细的又在研究了,快形成产品了,这就是PET/CT。注入一种放射器,进到CT的机子里,噢噢地扫描,两毫米的癌肿块都可以发现。哦,趋之若鹜哦,精细呀,一万二千多块钱做一次,都去了。不久前,一个医学权威跟我说,这仪器是没用的。为什么没用?咱们在场是一百多人,如果谁拿一百多万让大家都做一做,有一半有癌肿块。人身体上带着大肠杆菌、结核菌、流感的病毒等等,都带着。为什么你没病?因为你机体的能力在抵御着它,特别是心情。当你的抵御受到破坏的时候,它就起作用了。我们身上都有乙肝病毒呀。我没有,我检测结果说大夫让我打乙肝疫苗,说你太没有了就不好了,一有什么你就马上有。 一般人百分之九十都带着乙肝的病毒,只不过它不发作。所以一半人一测,本来你那两毫米的,你高高兴兴,一过生日,孩子们回来一祝贺,或者是科研取得了成果,一高兴,没了。人是可以,世界上的病有百分之三十是可以自愈的。可是这一测测出来了,坏了,有一半要吓死。这不是玩笑,都是医学权威说的。今天的癌症病人死有一半是吓死的,剩下的一半有一半是治死的。这就是按照二元论,把人体解析到最小地步了,解析到基因了的必然结果。人研究到基因了,回不来了。怎么回不来呢?流感,不会治。我们这里吃中药。我孙子这两天刚得流感,弄得我们老俩口儿是寝食不安。什么药都不给呀,就让他多喝开水、多睡觉。孩子四十度烧了八天呀。这么先进的医学,感冒治不了。而中药不是。着眼于人的全体。望,先看,“冯先生你气色不错。吐出舌头看看。”我看你眼白,看看耳朵。这都是要点啊。看了以后,问你有什么不舒服。闻,还有你身上有没有异味,一说话,口里有没有异味。然后,切,辩证施治。你的病,我得给你下点毒药,但是这个毒只治你的病,不能对你的身体产生妨碍。于是,我添一味药把它平衡。既增强你体质,又去掉你的病。它是整体论,一元论。我用这个例子来说明两种哲学。
现在说我们的语言学。分篇章、句群、句子,切分词、词素。好了,“我是中国人”,请你给我自动处理一下,做不出来。有没有这个问题?模拟人学习语言,人掌握语言,如果加点桂冠的话,叫以人为本,当然不是以人为本的意思,语言的整体。可惜人的记忆,对往事的记忆,真正的记忆是六岁以后。当初两岁的时候怎么呀呀学语,学习主体本身不记得。父母、阿姨、老师,只观察表象,不了解大脑的机制。那么我们能不能从历代的学者对语言的观察、对语言的体味当中,包括自己的内省、语感体味,感受一点人掌握语言的过程和它的机制呢?这就是中文信息处理必须要解决的课题。人工智能,包括郑德忠同志那里,都在从各角度去想办法模拟人的思维,人如何掌握语言。但是在做研究的时候,到底是分析与综合相结合,还是一味地二元,我觉得我们应该反思了。而人在心理学的研究,人在掌握语言的时候--经过脑科学、认知心理学、发展心理学研究的成果--联想与想象起了很大的作用。也就是,比如说,当一个幼儿,这个时候和爸爸妈妈关系很好,当你抱着他走在路上的时候,他见到所有跟爸爸年龄差不多的人,容易叫爸爸爸爸爸爸,弄得抱他的人很尴尬。我年轻时候就碰到过这种情形,满街地叫我爸爸。他是抓住人的特征之后类推的。这个时候他没有理性,说生他养他的那个男子是爸爸,其他的人都不是爸爸。他还没学会叔叔这个词。于是他找外部的特征就联想了。诸如此类的,联想和想象在人类词、词义的发展当中,起了很大的作用。我们中文信息处理恐怕需要和认知心理学、发展心理学、脑科学嫁接了。这样尽可能地贴近人认识语言、掌握语言的规律,来模拟它。我高兴地看到,HNC理论当中,--也许我作为一个外行啊,有评价它不对,从我的感受啊,--一个亮点是抓情景,一个是抓联想。可能黄先生你没用联想这个词,实际上在我看来是联想。网络啊,一个纵横的联想,其实按心理学是联想。所以我这一层意思就是,恐怕我们的中文信息处理研究的专家和我们的学生要做到哲学的,--不是一般理性的,--是哲学的思考。同时要向远缘学科学一点东西。我作为一个跟着大家走的人,我是努力地学习。不瞒大家说,我在从北京到上海的火车上,这一夜我看的是《认知心理学》。本来回来的路上我还要读,但是我太累,同时我的书被秘书给我装进箱子里了,我拿不出来的。我在读《认知心理学》,为这我向华东师大要了一箱子的“认知心理学”的译丛,这是国外的。我们的学术,任何学术,发展到一定水平,只在这个领域内讨生活,路是越来越窄。发展到一定水平,必须向临近的学科,向远缘的学术再吸收营养。这就是中国的一元论,中国的整体论。三百年来西方的学术,把学科分得越来越细,越来越细。现在他们醒悟了,一个表现就是脸向东方,向二千五百年前的孔夫子寻找智慧。这是81名诺贝尔奖获得者在88年巴黎聚会的宣言中所说的。一方面,他们开始考虑什么交叉呀、渗透呀,走向综合。其实这里面正是东方的思维。那么八六三下一期项目力争早日开始。务点实,我是希望我们大家一起来论证一下我所说的,一,以句处理为目标为我们的工作内容合适不合适。一期八六三是解决不了的,但是让我们在句处理阶段迈出哪怕一小步,也是给国家给这个事业做贡献。二,我们八六三项目在新的一期里还有哪些成果可以转化。我们的基础研究如何和向其他学科学习、吸取营养。科学研究是非常艰苦的、长期的过程。想一口吃个胖子,很快就解决问题,每迈出一步都是正确的,这本身就违背了科学的规律。
以上几点,是我对这次会议表达的一点心意和我自己的期望。如果期望不符合现实,就请大家把这看成是一个外行人空占了大家时间。下面再给我多多地指教。祝我们研讨会圆满成功,也祝HNC理论、全信息理论、语义函数理论和基于传统计算语言学的各个领域都在十一五期间有长足的进步。
谢谢大家。
|