由北京师范大学中文信息处理研究所、中国科学院声学研究所语言知识处理实验室和北京大正语言知识处理研究院联合主办的第三届“HNC与语言学研究学术研讨会”12月21日至22日在北京师范大学举行。我国著名语言学家、全国人大常委会副委员长、北京师范大学中文信息处理研究所所长许嘉璐教授出席并讲话。
会议开幕式由北京师范大学中文信息处理研究所常务副所长朱小健教授主持,教育部语信司李宇明司长、人工智能学会钟义信理事长、中文信息学会曹右琦副理事长、北京师范大学钟秉林校长、中科院声学所田静所长和北京大正语言知识处理研究院陈小盟董事长等多位专家和领导出席了开幕式。
钟秉林校长在开幕式上发表讲话。他指出,北京师范大学始终把加大应用型学科建设的力度作为学校转型发展过程中的一个重要环节,北京师范大学中文信息处理研究所就是为加强应用学科的建设而在2004年新建的一个研究所。许嘉璐教授主持的国家863项目在学校加强应用学科建设过程中起到了重要的作用。人才培养与科学研究实际上是大学为社会服务的两个主要方面。
接着,许嘉璐教授发表讲话。他指出,中文信息处理的各个理论流派之间谁也不能包打天下,需要彼此争论、彼此否定、彼此学习、彼此吸纳。中文信息处理要以句处理为主攻目标,对语义问题进行深入研究。同时,他还就汉语的国际推广、自然语言处理领域的自主创新问题阐述了自己的一些看法,指出,科学研究是允许失败的。
“HNC与语言学研究学术研讨会”是面向自然语言理解处理,促进语言研究与语言信息处理研究交融,推进语言学家与信息处理专家交流的全国性会议,旨在加速推进我国中文信息处理领域科学研究、人才培养和社会服务的一体化进程。
许嘉璐教授曾多次指出,中文信息处理事业事关国家安全和社会稳定,中文信息处理的发展需要加强基础研究、应用研究和社会需求三者的结合,需要语言学界和计算机科学界专家学者的密切配合、共同攻关。HNC理论正是语言学与计算机科学结合的产物。
HNC是 Hierarchical Network of Concepts(概念层次网络)的缩写。HNC理论是中科院声学所黄曾阳研究员创立的面向整个自然语言理解处理的理论体系。该理论在深入挖掘汉语特点的基础上,以意义表达和语言理解为主线,建立了一种模拟大脑语言感知过程的自然语言表述模式和计算机理解处理模式,成为自然语言理解处理领域中具有鲜明汉语特色、富涵中国传统底蕴的理论。在包括国家重点科技攻关项目、国家973计划项目、国家863计划项目及中科院知识创新工程项目等科研任务的推动下,HNC已经形成了具有原始创新特点的理论与技术体系。
同时,HNC理论和技术及其应用研究是许嘉璐教授主持的国家863计划课题“中文信息处理应用基础研究”的重要组成部分。该课题组通过探索市场经济条件下的科学研究模式和项目管理模式,组织了中国科学院、北京大学、清华大学、上海交通大学、北京邮电大学、北京师范大学、教育部语言文字应用研究所、中国电子科技集团54所、北京大正语言知识处理研究院、深圳市桑夏高科技股份有限公司等高校、科研院所、高科技企业的专家集体攻关,打通语言学与计算机科学的壁垒,培养通识人才,从语义入手研究中文信息处理问题,在语义检索、网络安全、语言知识萃取、语音识别对比、知识库语料库整合运用等方面取得了令人瞩目的成果。
开幕式后,中科院声学所黄曾阳研究员、北京邮电大学钟义信教授和上海交通大学陆汝占教授分别作了大会主题报告。来自全国各地的60多位代表就包括中文信息处理现状、HNC自然语言理解理论研究进展、HNC理论与技术在中文信息处理中的应用、中文信息处理理论与技术的展望等在内的多个专题进行了深入研讨。
HNC与语言学研究研讨会的召开,适应了自然语言处理发展的新形势,为语言学界和计算机科学界的相互交流、相互促进、相互提高、相互碰撞提供了一个平台。同时也推动了HNC自身的发展。第一届“HNC与语言学研究研讨会”于2001年4月在武汉华中师范大学举行,由中国科学院声学研究所语言知识处理实验室与华中师范大学语言与语言教育研究中心联合主办。在这届会议上,HNC全面展示和交流了自己取得的进展;第二届研讨会于2003年9月在中科院客座公寓举行,由中国科学院声学研究所语言知识处理实验室与北京大正语言知识处理研究院有限公司联合举办。第二届研讨会在展示与交流的同时,更是HNC理论体系全面形成的标志;本次会议是第三届,是HNC理论全面展开跨越语句处理,迈向句群处理研究的标志。