探求真理 发展学术 服务社会
欢迎访问深圳市社会科学网 今天是

理论热点

推动语言研究跨学科发展

 日期:2024-03-20   来源:中国社会科学网

  当前语言研究的发展,已同多个学科产生了广泛交叉与深度融合。语言研究不应拘泥于某一特定学科的研究方法或研究范式,而是要根据实际情况和需求与时俱进,不断创新发展。认知神经科学、计算语言学、人工智能等领域的相关研究及对话合作,有力推动了语言研究的跨学科发展。

  认知神经科学。语言属于人脑的高级认知机能,认知神经科学的发展和相关研究成果对语言研究具有重要推动作用。在探索心智与大脑奥秘方面,神经科学和认知科学的研究路径略有不同。前者重在考察神经系统内分子和神经元之间突触连接变化过程及大脑中枢控制系统作用,对语言的研究主要基于失语症或脑损伤患者的临床案例,考察大脑的语言神经机制及相关神经基础。后者则重在揭示知觉、学习、注意、记忆、推理、语言理解和产出等高级心理现象的认知规律,多采用行为主义研究方法。20世纪70年代后期,认知神经科学打破了认知科学与神经科学的壁垒,运用无创性脑功能成像技术(如PET、fMRI、SPECT、ERPs、MEG等),通过记录与任务相关的关联神经元活动轨迹,使人们观察到脑内进行高级功能活动的具体脑区激活情况,将语言学研究从描写人类语言行为推进到解释人类语言能力,在认知机制、神经基础甚至神经元层次进行深入探讨。

  当前,认知神经科学对语言的研究和探索是脑科学领域“王冠上的明珠”,也是人类破解思维的密码。研究者们通过观察语言加工过程来讨论大脑的认知机制,进一步检验、修正相关理论,从而推进对语言脑机制的认识与把握。随着认知神经科学的进一步发展,语言研究范式也发生了一些新变化。比如,研究层次更为深化或微观化,研究领域呈现交叉化和集成化态势,研究方法和手段愈加科学化和技术化。语言研究从宏观层次语言现象描述及创建语言认知理论假说,到微观层次利用技术手段解释语言现象和言语行为的脑神经机制,体现出对语言、心智、脑三者之间关系的研究愈趋自然科学化。

  虽然语言研究和认知神经科学关系密切,但两者之间的兼容性平台尚未完全形成。一般而言,语言研究的方向是从理论到验证,而认知神经科学的方向则与之相反,是通过实证研究和数据支撑提出相关的理论假设。因此,认知神经科学的实证数据与语言研究的理论假设并不能完全对应。两者差异在于,语言研究的研究对象是一般语言知识,而认知神经科学的研究对象则是语言神经机制。大脑中言语处理的神经活动在几百毫秒内即可完成,是神经细胞的同步活动。两者对象不同,自然结果不一。此外,是否所有语言问题都可以从认知神经科学中找到答案?不同个体之间语言能力的差异,在脑与神经层面存在哪些决定性因素?语言专属的神经脑区有何特异性?这些都是认知神经科学亟待解决的问题。

  计算语言学。计算语言学是一个使用计算机处理和分析自然语言的新兴学科,专注于理解和自动生成自然语言。传统语言研究希望从有限的样本中寻找自然语言的普遍规律,但自然语言中充满了例外,仅依据几个特殊例子决定规则取舍的方法往往缺乏严谨性。在此背景下,以提供大量客观、可靠的语言资源为特征的语料库则较好地解决了这一问题。当前,语言数据库建设及语料库语言学的崛起,是计算语言学发展的重要标志。“大规模”和“真实”是语料库语言数据的核心特征。面对大规模真实文本处理的现实需求,语料库分析方法成为传统规则分析方法的有力补充。在语言信息获取方面,计算语言学从传统的“内省”方式过渡到“语料”证据方式,从“基于规则”的传统研究方法转向“基于大量自然语料”的数据统计方法,帮助人们从海量语言素材中总结语言规则,并将这些规则应用于自然语言处理。

  计算语言学对语言的研究方法,主要涉及形式化方法、自动剖析算法以及统计方法。在语音、词汇、形态、句法、语义、语用等方面的自动处理中,经常会使用各种形式化方法。自动剖析算法中的“剖析”是英语parser的音译兼意译,指分析语言的结构,即把线性的语言符号串转化成某种形式化的结构表达式(如依存关系树、线图等),常见的分析方法有自下而上分析法(bottom-up parser)和自上而下分析法(top-down parser)。在大规模真实文本的语料库处理中,行之有效的统计方法包括自然语言的马尔可夫模型(Markov model)、N元语法模型(N-gram model)和逻辑斯蒂回归(logistic regression)。

  自然语言中存在语义模糊、高语境相关性、语法灵活、不规范等现象。因此,计算语言学面临文本标注与分类(text annotation and classification)、信息检索(information retrieval)、词义消歧(word sense disambiguation)、本体匹配(ontology matching)等问题。相关研究发现,人们对句子语义的理解比较灵活,涵盖“自下而上”和“自上而下”两种不同的加工过程,而理解自然语言则是计算语言学的重要内容。创建更准确的语言模型,开发更好的算法剖析大型数据集,提高机器翻译能力,在处理歧义、反语、隐喻、语篇结构等复杂语言现象时提高效率等,成为摆在研究者面前的现实问题。此外,不同类型数据源的准确性和可解释性、从社交媒体收集大量文本数据时的隐私和伦理等问题也不容忽视。

  人工智能。人工智能与人类语言研究密切相关,语言智能是人工智能的重要内容。语言智能研究是基于语言数据的人工智能研究,主要通过各类数字技术处理和分析人类语言,从而实现人机交互和人机协同(如语音识别、语音合成、机器翻译、智能问答等),并希望通过模仿人类语言智能来破解人类语言奥秘。而基于人脑生理机制和语义处理规则,借助大数据、深度学习等技术对言语信息进行解析、标注、加工和特征处理等,或许可以让机器拥有更为高级的言语行为能力。

  人工智能的快速发展,也对语言研究影响深远。作为人工智能重点领域的自然语言处理,能够帮助人们快速处理大量文本数据,并从中提取有意义的见解,是实现人机对话、机器翻译和语言教学的根基所在。比如,以大语言模型和生成式人工智能为代表的数字技术,就在语言教学与研究领域应用广泛,而且拓宽了语言学的研究视野,并为数字人文研究带来了新的机遇。尽管人工智能可以作为语言研究的有力工具,但由于其在自然语言处理方面的解释性和准确性有限,所以目前尚不能完全取代传统的语言研究方法。探索语言研究的新范式与新路径,助推语言相关学科协同发展,帮助研究者了解和掌握数字人文研究方法,提升运用数字技术开展语言研究的能力,是学界需要关注的问题。

  认知、计算、人工智能三者内在联系紧密。基于认知的语言研究重在厘清言语理解及其产生的认知机制与神经基础,而基于计算和人工智能的语言研究则着力于进行智能模拟。认知神经科学的研究结果可以为语言研究提供理论假设和事实依据,而计算和人工智能在发展过程中则会不断产生新的应用需求,反过来又可以促进认知研究的发展。基于三者的辩证统一关系,语言研究将从单一学科模式扩展到相关学科彼此交叉整合的跨学科模式,以此揭示语言、心智、大脑之间的奥秘。研究方法将从单一维度扩展到多维度体系,从理论思辨和观察行为实验结果的外部研究过渡到同认知神经科学实验内部研究结果相互印证的内外互动系统。

  随着时代发展和科技进步,不同学科之间的相互渗透、交叉融合不断增多,渐趋形成协同发力、联合攻关的新局面,这也是各学科寻求新突破的自然交融。语言研究应加强跨学科交叉研究,注重吸收多种学科的研究成果,充分借鉴不同学科的研究理念和研究方法,推进多学科视角下的语言研究融合发展,推进新时代语言研究的理论与应用协同发展,从而更好地服务时代和社会发展需求。

  (本文系国家社科基金一般项目“基于语码转换加工机制的双语能力提升路径研究”(21BYY100)阶段性成果)

  (作者系苏州科技大学外国语学院副教授)