多视角、多维度的人机语义研究

发布者:Eureka Chen,发布时间:2009年3月22日 下午6:54

——2005“心灵与机器”杭州会议综述

1030111, 2005心灵与机器全国学术研讨会在秋意阑珊的西子湖畔举行。此次会议由浙江大学语言与认知研究国家创新基地主办,北京大学逻辑、语言与认知研究中心、中国科技大学计算机系、北京师范大学科学与人文研究中心、浙江师范大学法政学院协办,来自中国科学院、中国社科院以及北京大学、南京大学、复旦大学、厦门大学、华中科技大学、中国科技大学、北京师范大学、华中师范大学、上海大学、汕头大学等20多个单位的30余位专家、学者进行了为期三天的主题发言和专题讨论。

本次会议是2004年厦门会议的继续,会议报告和讨论围绕“语义网与本体(the semantic web & ontology)──人-机语义研究”这一主题展开。会议在心灵与机器背景下,聚焦于语义网与本体,展开了关于意识、意义、认知的涉身性(embodiment)、感受性(qualia,脑机交互BCI)、自然语言语义学及其应用、汉语的认知研究与形式处理等问题的深入探讨。

1 语义网是通向“全球通用”公共平台的关键性步骤

语义网”(Semantic Web)概念是人工智能高度发展的产物,也是网络基本作用飞跃性的表现。语义网技术通过给网页文本附加语义信息并提供相应自动处理机制的方式,为机器在理解的基础上处理Web信息提供了一条有希望的新途径。

中国科学技术大学计算机系陈小平教授指出,近十年来,人机关系正在发生根本性变化,人际关系越来越多地借助于机器网络和人机关系得以实现。网络基本作用的改变体现了上述主要趋势,预期不久的将来将出现一个全球通用的公共平台,这个平台应具有两大特征:第一,它支持人机协作,机器在这个平台中的作用远远超过单纯的信息传送和信息显示;第二,它不仅支持知识传播、利用和生产,而且在此基础上支持其他形式的社会活动,比如成熟的电子商务、虚拟企业等等,他认为人机语义是实现这些功能的理论基础的核心概念之一,语义网是通向上述公共平台的关键性步骤。陈教授进一步指出:在通向公共平台的进程中,围绕人机语义这个核心,莱布尼兹的通用文字理想正在展现新的形式和内容。正因为此类意义,人工智能与邻近学科如逻辑学、语言学、心理学、脑科学和哲学等学科之间的交互出现了新的内容。他还具体探讨了当前网络应用的主要形式──文档检索存在的困难和局限;语义网底层功能──本体引进;简要描述了下一代信息检索主流技术──回答问题的基本问题和目标;继而讨论了语义网高层功能,特别是作为其基础的相对于规划的可证正确性概念,并对莱布尼兹的通用文字设想在语义网时代的新内容和新形式进行初步勾画。

华中科技大学陈刚教授从哲学层面探讨了塞尔(Searle)的汉字屋(Chinese Room)思想实验与语义网之间的关系,他论述了塞尔的汉字屋实验试图表明语义和句法之间有差别的观点,计算机系统是纯形式的,所以是具有句法特征的,不可能具有语义特征,他通过对比分析汉字屋实验和图灵实验之间的区别说明:这两种实验之间得出不同结论的原因应归结为语义与意识的关系问题,所以,与其询问计算机系统中的字符是否有意义,不如追问这些字符对谁有意义;陈刚教授指出:计算机系统和语义网中的字符在输入端和输出端对人都是有意义的;然而,在输入和输出之间的字符处理过程对计算机本身是没有意义的,因为计算机没有意识,没有意向性。因此,如何引入新的逻辑推理和字符处理形式规则,从本质上提升目前机器系统的字符处理能力正是语义网技术的建设性意义之所在。

厦门大学周昌乐教授作了面向自然语言处理的Ontology综述的主题发言,探讨了人工智能的前沿──本体与隐喻的关系”,教授指出,“本体”(ontology)是人工智能界向哲学借用的一个术语,最初产生于知识工程的研究,关于本体,Studer给出了较完整的定义:Ontology是共享概念模型的明确形式化规范说明。包含四层含义:概念模型;明确;形式化;共享。某个应用领域的一个本体,是一种用于描述该领域的知识的概念体系。本体作为一种知识表示体系已成功用于信息检索等多个自然语言处理领域,因此,借助本体来处理隐喻现象是一个自然的想法,周昌乐教授等计划今后以此为科研方向。

现有本体通常由一组基本范畴以及它们之间的一些逻辑关系构成。语义网技术借助本体来表示网页文本的语义信息。利用本体提供的语义信息,机器可以自动地对网页文本(或其它文本)进行一定的推理,从而达到在一定程度上自动处理网页信息的目的。而描述逻辑”(Description logic)作为本体表示和推理的逻辑基础与工具,得到了较充分的研究,SDRT理论在这种背景下应运而生。

2 自然语言语义学为语义网-本体研究提供可以借鉴的成果

自然语言处理的基础在于语义学的不断发展;在语义学的发展史上,逻辑一直起着奠基石的作用,在经过了Tarski Montague的经典静态语义学之后, Kamp & Reyle努力将语境参数引入逻辑形式描述,1991年以来,Asher教授等人在Kamp等人的DRT基础上,对语篇语义的形式描述进一步延伸和拓展到以话语片断为刻画单位,亦即SDRT──Segmented Discourse Representation Theory

北京大学的毛翊博士(Asher教授的博士)和周北海教授称SDRT基于语篇结构的自然语言语义学”, 用历时的方法详细介绍、分析了SDRT的思想渊源和理论基础。周教授指出,SDRT是超越DRT的一种新的关于自然语言的语义理论。在形式化方法传统下,从静态语义学到动态语义学、从语义学到语用学, SDRT是在这些理论和发展的基础上产生的,关键的一步在于:SDRT看到了语篇中由语义内容形成的语段和相应的修辞关系, 由此揭示了线性的语句串中的非线性语义结构。毛翊博士(Asher教授的博士)和周北海教授对SDRT的应用前景作了总体分析。以语篇结构为中心,通过SDRS框图和右前侧限制条件等技术手段, SDRT可以更好地解释和处理自然语言中的多种难以解决的语言现象和问题,如代词指涉、动词短语省略恢复、融贯性判定、预设明示、语词歧义消除、隐意明晰等。具有显著的理论指导意义。

浙江大学黄华新教授及其博士生肖家燕作了“SDRT及其应用初探──话语解读的新视角的主题发言,SDRT的三个核心概念说起,即修辞关系(篇结构)、右边界限制以及最大化语篇连贯性(MDC)原则,结合具体的自然语言实例,阐述了SDRT如何将语篇(话语)修辞结构处理为语境参数,参与语义的建构与表述,基于非单调逻辑的形式描述,以框图等方式,揭示线性语句跟进中语篇的非线性语义结构,更准确、精细地解读话语意义,解决时间结构、动词省略、预设、会话含义及指称(包括命题指称)等问题,并将SDRT的应用拓展到汉英翻译的评价中,通过初步应用表明:SDRT在汉语回指判断等话语解读中具有很强的可操作性及广阔的应用前景。

中国社科院的邹崇理教授多年来潜心于语言逻辑的前沿课题研究,作了“A Report on the Treatment for Discontinuous Quantifiers”主题发言。邹教授根据近期在美国宾夕法尼亚大学学习与研究情况,首先介绍了Clark教授两项有价值的研究成果:(1)把多元量词如“every…a different…”处理为与“more…than…”相似的非连续算子; (2) 经过某些调整,基于Lambek的后承演算,取得一种关于涉及到上述量词的句子的组合分析。 考虑到更多量化句子,教授认为, Clark的处理进行拓展和改进应该是合理的, 为了使处理更加清晰, 他因此构建了范畴类型逻辑的自然演绎的一类特殊系统,以显示整体过程。邹教授的报告充分展示了逻辑在形式语义学及意义的描述和计算中不可替代的作用。

复旦大学熊学亮教授探讨了语义的性质和隐义的推导模拟”,在从内涵和外延角度定义语义一般性质的基础上,阐述了语言使用中言语隐义的运行特征,并就其中比较有代表性的隐义的句内和句间运作进行了形式模拟。熊教授指出,虽然Gibbs(2002)的研究与Carston(1993) Sperber & Wilson(1993)Recanati(1993)的研究非常相近,但其结论是语义和语用的差别与所说所含并不相关,对命题内容的语用充实导致形式语义学和形式语用学的产生,如话语表征论、情景语义学,因此,他认为与语言形式相关的含义是一般性质的,是在语言结构触发的直接语义上生成或与语言结构有关的含义或言语隐义,在此基础上,进行模拟并揭示隐义的若干特点。

上海大学的程琪龙教授的主题发言:“谓元语义结构概念框架从认知连通可行性和认知操作可行性的角度出发,探讨概念框架和语义结构的理论和相互关系。通过关注概念语义的参与者和语义结构的谓元以及两者之间的异同;力图证明它们之间并非总是一对一的体现关系;证明概念框架表述的概念语义和语义结构表述的语法语义有必要在理论模式表述中分离开来。

华中师范大学胡珀老师作了基于WordNet建立中文同义词词林的上下位关系的主题发言,着重探讨利用现有的中文词汇资源,借助Wordnet的组织方式,Wordnet的上下位语义关系的导航下,充实、完善《同义词词林》的上下位关系,以期建立中文概念网络。

此外,浙江大学语言与认知研究中心陈宗明教授等对汉语形式化提出了新的构想; 浙江大学王小潞副教授等尝试运用逻辑手段描述语言与思维(反向思维和发散思维);浙江大学的金立博士、李海波、徐慈华、吴恩锋等青年学者分别提交了略论规约含义汉语的认知研究与形式处理隐喻表达与经济性原则概念隐喻源域类型的多元性认知机制等有关本议题的论文。上述主题发言和提交的学术论文分别从形式语义学、认知语义学及认知语用学、隐喻学等不同角度探讨了语义本体,使语义网研究进一步细化,并为人-机语义关系研究提供可以借鉴的成果和基础。

3 认知科学的哲学基础

认知科学是对心智、大脑、智能和行为进行多学科和跨学科的研究,它是21世纪一个重要的学科汇聚领域。

由于认知的符号主义范式的局限,上个世纪70年代以来,认知科学中出现了理解和研究认知涉身的、情境的和动力系统的诸多取向。北京师范大学的刘晓力教授以广阔的视角引出了“认知科学新进路的哲学基础”这一问题。尽管符号主义面临诸多困难,但她认为,不能简单否定、放弃这种范式,而应该更谨慎地理解“计算隐喻”。刘晓力教授认为:在认识的“交互隐喻”、“涉身隐喻”和“突现隐喻”的背后有着相似的哲学基础,概括起来就是现象学中的“生活世界”概念;这些哲学假定对传统认知理论关于心灵-世界的观念提出了深刻质疑,如果把情境涉身性交互作用动力系统突现这些概念所反映的不同侧面关联起来理解,我们似乎看到一幅更全面、更生动的认知科学的图景。

浙江师范大学的郑祥福教授认为:西方哲学已经实现了语言研究与认知研究的两大转向;认识论的自然化是认知转向的开端,而认知转向则与人工智能的发展直接相联系;正如语言研究是计算机发展的基础一样,认知研究是人工智能的基础;然而,要奠定这个基础,就必须解决四大哲学问题,即意向性问题、概念框架问题、语境问题和日常化认识问题。

北京师范大学的博士生孟伟从G. Lakoff的认知语言学出发分析了涉身性的三个层面:神经层面;现象学前反思层面;认知无意识层面,并讨论了涉身认知的意义问题。在随后的讨论中,与会者对“embodied”和“embodiment”的翻译提出了一些看法。浙江大学的李恒威博士等倾向于译为“具身的”。

浙江大学唐孝威院士主持的“语言与思维讨论组”在为会议提交的《表征、感受性和言语思维》的报告中提出了关于“认知意义的起源”问题。他们认为:人不同于计算机,人的认知不仅仅是表征的计算过程,它还牵涉人和世界之间的意向性意义的关联,即人的认知是具有意义的认知过程;在人的意识经验中,有一个“为我”的方面,即感受性的成分,这是认知意义的最初起源;因此,人的思维活动是从表达某种意向性的意义开始的;人类意向意义表达的演化历史经历了不同的思维表达水平;人类的言语思维是经历了动作思维、动作-意向思维之后发展起来的思维水平;在言语思维的水平,语义的加工(生成、存储和理解)和表达不是单一的过程,而是一个由语法约束和语义生成两种力量促成的辩证运动。

4 意识问题

意识研究自上个世纪90年以来迅速升温。到2005年,ASSCAssociation of Scientific Study of Consciousness)国际会议已经举办了9届。在本次“心灵与机器”会议上意识问题也受到与会者的强烈关注。探讨的论题主要有感受性、意义、意识的判据、脑机接口BCI)等。

意识是一种主观性的实在现象。正是这个特点,使得意识成为一个真正的“难问题”(hard problem),因为意识的研究不仅要关注意识作为一种实在的现象的客观的方面,它还必须关注意识经验的个体性和意义的方面。感受性(难问题解释的鸿沟)既是20世纪90年代以来推动意识研究蓬勃发展的中心问题,同时又是阻碍意识研究向前推进的一块磐石。

针对华中科技大学陈刚教授在“汉字屋与语义网”的发言中再次引出的如何判定智能体(agent)有无意识的问题,与会者形成了三方面的看法:(1)外在论的,即行为判定;(2)内在论的,即主观感受判定;(3)不可判定。

汕头大学的刘西瑞教授在“意义的诸方面”的报告中讨论了意义的实在性、意义的功能、意义的区分以及意义的各种理论。

浙江大学的郑筱祥教授介绍了当前脑机接口的研究现状。BCI的研究旨在建立一种新的交流系统,它通过提取脑电信号把人的意图转变成可控的信号用于某种输出设备。

这次会议的与会者具有不同的学术背景, 学者们从哲学、语言学、逻辑学、计算机科学、脑科学、信息科学等多学科交叉研究的视角,对人机语义及其互动进行多维度的探讨,体现了认知科学的思想观念和研究取向。可以说, 这是一次颇具前瞻性的学术研讨会。

(肖家燕  李恒威,浙江大学语言与认知研究中心)

Comments