查看原文
其他

基于语料库的环境和生态话语分析研究:现状、问题与未来

张琳 胡开宝 上外国际传播研究中心
2024-09-08

以下文章来源外语教学理论与实践,作者张琳,胡开宝


摘要

近年随着数字人文的迅速发展,环境和生态话语分析研究与语料库的结合应运而生。本文基于相关概念、研究对象与方法的界定,梳理了基于语料库的环境与生态话语分析的现状。然而,现有研究在语料来源与规模、研究主题及视角与方法上还存有一定问题。鉴于此,我们应进一步加强语料库在相关研究中的应用和建设,拓宽研究视角与方法,推进该领域研究的发展。

作者简介

张 琳    上海外国语大学语料库研究院博士后

胡开宝  上海外国语大学语料库研究院教授、博士生导师

1

引言

近年,在全球环境问题日益严峻的背景下,人文学科出现“生态转向”趋势,表现出对环境问题的高度关注。语言学领域Halliday(1990)首次呼吁要关注“语言在环境问题上的作用”。之后,一些研究开始审视环境与非环境话语背后的人类环境行为。生态语言学的兴起使研究者聚焦语言对生态系统的影响,Alexander & Stibbe(2014)更提出“生态话语分析” (ecological discourse analysis)为生态语言学研究的一个主要路径。语料库是研究语言的“分析方法、语言数据与研究视角”(许家金,2019: 37)。话语研究作为语料库研究的重要领域,两者的结合以大量语料为支撑,通过定量统计方法,从数据中发现语言模式与规律,充实对话语的质性描述和解释。已有研究采用语料库方法进行环境和生态话语分析,但鲜有相关研究现状的介绍。鉴于此,本文先介绍这类研究的相关概念、研究对象与方法,再梳理基于语料库的环境和生态话语分析现状,最后,探讨现存问题并展望未来研究,以期语料库方法的应用推进该领域研究的发展

2

环境和生态话语分析:相关概念、研究对象与方法

基于语料库的环境与生态话语分析包括语料库与环境、非环境话语及生态话语分析结合的研究。根据Mühlhäusler & Peace(2006)的定义,环境话语是用特定语言形式讨论人与自然环境关系的话语,话题涉及环境污染、生态、气候变化及环保等。环境话语的研究可采用生态批评、隐喻等方法。除了环境话语,一些研究注意到非环境话语中人与其他生物、及环境间的关系,这类可归为非环境话语的生态性研究。生态话语分析的研究对象包括所有话语,研究者需在分析前持明确的“生态哲学观” (Stibbe, 2015),并借鉴普通语言学理论考察话语的语言特征与语篇模式,揭示语言如何影响人与人、其他有机体及自然环境间互动构成的生态系统,最后依据生态哲学观对话语中破坏、中性或有益生态的语言使用提出批评、改良或推广。何伟(2021) 也将生态话语分析的研究步骤概括为生态哲学观与语言学理论的确定、话语生态性分析及生态行动的采取。可见,生态话语分析的研究范围与价值取向更广泛、多元(黄国文、赵蕊华,2019)。虽然国内学者(黄国文、赵蕊华,2019;何伟、高然、刘佳欢,2021)提出环境话语分析等研究可纳入广义生态话语分析之下,同属生态语言学研究的韩礼德模式(黄国文,2016;何伟,2021),但考虑到环境、非环境话语及生态话语分析在研究对象与方法上的差异,本文将它们分类进行梳理。

3

基于语料库的环境与生态话语分析研究现状

语料库作为一种方法与视角,极大推动了话语研究的发展。语言与环境的关系研究近年备受话语分析领域关注,相关研究与语料库的结合也应运而生。 

1)基于语料库的环境话语分析 

基于语料库的环境话语分析是指用语料库方法,对环境话语中的语言特征进行数据统计和分析,揭示话语背后的人类环境行为和人与自然关系。环境话语的主要来源是媒体传播,企业、政府等机构与名人发言也不乏环境问题的讨论。从环境话语类型与研究话题来看,现有研究分为以下几类: 

(1)气候变化、大气污染及碳话语(话题)中的人类活动、环境政策与认识 

气候变化、大气污染是人类应对环境问题上的焦点话题,两者都由能源利用中的温室气体排放引起。此类话语或话题受话语分析者的普遍关注。常见研究方法是研究者基于数据库或通用语料库,选取气候变化等主题的文本,从词汇、语义切入进行研究;或直接在数据或语料库检索并分析气候变化等词汇的频数与搭配,考察话语如何建构气候变化等环境问题,揭示话语背后的人类活动、环境政策与认识。

人类活动,尤其企业活动的环境影响与责任是这类研究的话题之一。最早是Gerbig(1993)收集机构与媒体中的臭氧排放话语,采用批评话语分析方法对比作格动词的使用,探讨企业在环境问题上的影响与责任。之后,研究者借助不同语料库方法与语言学理论,从更多维度展开研究。Castello & Gesuato(2019)从生态语言学视角分析气候变化通谕中关键词的语义场、搭配及索引,揭示人类对环境的影响。Zottola et al.(2020)基于 Nexis建立氮污染语料库,依据框架理论考察关键词的语义集与搭配,发现英国媒体氮污染报道突显政府、企业责任等框架。然而,话语可成为企业规避环境责任的一种手段,Jaworska(2018)用Sketch Engine对比企业环境报告中climate change等词汇的频次与搭配,发现企业通过气候话语的建构推卸环境责任。

一些研究通过共、历时对比,剖析不同国家或同一国家不同时期的环境政策。应用Lexis Nexis平台,Grundmann & Krishnamurthy(2010) 对比不同国家气候变化报道的实词词频与搭配,讨论国家媒体如何构架气候变化及隐含的气候政策差异。Koteyko(2012)结合隐喻、批评话语分析与框架理论,比较英媒体碳话语中碳合成词的分布与搭配趋势,从词汇演变说明气候变化解决方案受全球、区域及国家环境政策变化之影响。 

气候变化与碳话语的历时比较也折射出国家、媒体、领导人对环境问题的认知与态度。基于Lexis Nexis,Nerlich et al.(2012)分析英美媒体碳话语中carbon的高频搭配词、词间距离、n/m-grams等,发现英美媒体气候变化的认知差异与影响。Collins & Nerlich(2016)借助WMatrix比较英国气候报道的语义类别与典型词汇,揭示从质疑气候科学到气候变化减缓措施的媒体态度。以奥巴马与特朗普政府的全球变暖与能源政策为语料,Napolitano & Aiezza(2019)用批评话语分析方法,对比典型词汇、关键词及高频词,发现奥巴马致力于可持续发展,但特朗普时期话语藐视并低估气候变化问题。同样,Currie & Clarke(2022)研究英议会气候变化辩论中的概念隐喻,揭示决策者对气候变化的认识转变。

大气污染话语分析还注意到公众的环境意识。Wang(2018)采用批评话语分析方法,对比两个时期China Daily空气污染报道中的关键词、搭配、语义分类等,分析并阐述中国民众与政府环境意识增强背后的媒体与社会原因。也有研究发现媒体气候话语影响下民众环境意识的提升(Dayrell, 2019)。此外,一些研究考察话语中低碳理念的传播。钱毓芳(2016)考察英国媒体低碳话语中“低碳经济”的词频、高频词及搭配网络等,发现低碳话语的媒体建构不仅普及低碳理念,还促成公众的低碳意识。 

(2)突发环境事件与环境辩论话语中的企业环境行为 

突发环境事件与环境辩论话语分析采用语料库方法,揭示话语中企业破坏生态的行为与意识形态。Alexander(2013)借用批评话语分析方法,分析BP原油泄漏报告中的词汇及隐喻等特征,揭示企业利用术语和词汇操控,歪曲报道生态灾难,掩饰真实意图。Poole(2016,2018)在生态语言学框架内,对比环境辩论双方话语中的词汇、语义集,并采用语义标注与GIS技术,以可视化形式呈现话语中高频语义项与地名间的配置,揭示矿产企业话语中的人类中心主义与利益倾向。 

(3)环保话语的责任与漂绿 

环保教材可以宣传环境理念。Stubbs(1996)借鉴批评话语分析方法,对比环保等教材与LOB 语料库中的作格动词、被动式、投射小句及索引行,发现环保教材话语倾向使用及物式与投射小句,从而说明因果与施事,明确环境责任。然而,并非所有的环保话语都具备生态有益性。Alexander(2018)从生态语言学视角分析可口可乐环保报告的高频词、委婉语等特征,揭示话语突显企业利益,实则为漂绿行为。

(4)生态类话语中自然的认识 

生态类话语指与生态、生物相关的话语。Wild et. al(2013)用批评话语分析方法,基于参照库UKWaC和生态专用语料库,采用Sketch Engine提取ecosystem同/ 类义词词表,并对部分生态词做同库或跨库的词汇素描、差异描述与索引分析。研究发现不同体裁语料库对自然的认识、态度与关注不尽相同。用语料库方法,Sealey & Oakley(2013)分析生态纪录片转写文本中代词he、she, 连词so及不定式的使用,认为拟人化词汇的使用反映非人类中心主义的视角下对自然物的感知。另外,rayne(2021)采用Python抓取转基因种子的网络争议话语,融合社会认知、批评及生态语言学等方法,从关键词、搭配及索引行等视角考察并阐释转基因技术对立方的认知差异与原因。

 2) 基于语料库的非环境话语生态性研究

 基于语料库的非环境话语生态性研究多以通用语料库(如COCA、BNC、LOB、iWeb、CCL等)或自建语料库为研究平台,挖掘词汇语法特征,揭示话语中的人类中心主义及人与自然关系。基于COBUILD语料库,Goatly(2002)采用批评话语分析与系统功能语言学理论,考察BBC中自然物的搭配与索引行,发现人类中心主义视角下自然被描述为可开发,但给人类造成威胁的存在。Gilquin & Jacobs(2006)分析BNC中关系代词who后接的非人类动物,认为这种搭配常用于和人类关系亲密的动物。国内研究中,邵斌等(2012)应用COCA考察并分析“碳族复合词”历时变化背后的认知机制。赵蕊华(2018)在CCL平台检索“野生动物”与其搭配词,并对搭配词做及物性分析,揭示语言背后的消费、数量与唯人主义。

研究者也自建专用语料库,考察话语中的环境态度与意识形态。Bevitori(2015)研究历任美国总统演讲中的典型词汇与高频搭配词,发现“环境”的意义随政策、时代等因素改变。Torkington et al.(2020) 分析欧洲旅游政策话语中“growth”与“sustainability/sustainable” 的频率、词簇与搭配,揭示话语中的“可持续性”概念实则不可持续发展。与环境相关的能源话语也是研究者关注的对象。赵秀凤、赵琳(2021)用批评话语分析方法研究特朗普政府能源战略话语的主题词,索引行与搭配词,揭示话语隐含的能源现实主义与霸权主义。

在上述基于语料库的环境与非环境话语分析中,大多研究结合批评话语分析理论与方法,这些研究也被称为“生态批评话语分析”。但不同于与批评话语分析,这类研究关注人与自然的关系,旨在通过分析语言使用,“批判造成这些生态问题的事件、行为与意识”(黄国文、赵蕊华,2019: 73)。 

3) 基于语料库的生态话语分析

 生态话语分析强调在生态哲学观指导下分析话语对生态系统的潜在影响。近年中国生态语言学研究者们不断完善其方法与基本假设。黄国文(2017,2018)结合中国语境和儒道哲学思想,提出和谐话语分析(harmonious discourse analysis)这一新的生态语言学研究进路。已有国内学者尝试在生态与和谐话语分析框架内应用语料库方法展开研究。夏蓉、徐珺 (2020)对比中德汽车企业社会责任报告,对we、Geely、Daimler、emission做及物性分析,揭示两家企业生态观的异同。张慧、盖飞虹(2022)对爬取的中美气候变化语料做语义域标注与分类,对比并解释中美话语中的概念隐喻差异、生态取向与形成因素。和谐话语分析是在“以人为本”的假定与“亲近” 、“良知”和“制约”原则指导下对语言使用与行为进行分析,依据的语言学理论是系统功能语言学(黄国文,2018)。现有研究遵循这一研究假定与理论依托,如结合评价理论与和谐话语分析方法,吴让越、赵小晶(2022)用UAM Corpus Tool分析新华网英文涉贫报道的态度词汇,发现报道多使用积极态度,其和谐思想遵循“以人为本”的生态哲学观。融合话语历史分析、生态与和谐话语分析的理论与方法,刘明(2023)以《中国日报》气候变化报道为例,借助KH Code与WordSmith语料库工具,从话题、词汇联想及搭配与索引等视角对语料进行多维度分析,研究表明报道凸显和谐话语分析的三个原则,并建构积极的中国生态形象。 

综上所述,我们从研究话题、研究对象与语料来源、研究方法与理论依托三个角度概括基于语料库的环境与生态话语研究现状:1)研究话题主要为话语背后的人类环境行为;2)研究对象包括环境与非环境话语,或可以说所有话语的生态分析。语料来源一类是研究者根据研究目的,自建小型语料库;另一类是现有的通用语料库或数据库,或从在线语料库提取语料,建立专用语 料 库;3)研究方法与理论依托:研究采用语料库方法与工具(如AntConc、WordSmith, UAM Corpus Tool, Sketch Engine, WMatrix)、Python编程语言、语言模型算法及GIS技术等,挖掘文本的语言数据;此外,大多研究借用批评话语分析的方法;近年一些学者尝试生态语言学视角分析话语,国内研究主要采用生态与和谐话语分析的路径,但数量有限。依托的语言学理论包括系统功能语言学、框架理论、隐喻等。

4

现存问题

近年基于语料库的环境与生态话语分析不断增多,但也存在一些问题。 

1)语料来源受限,且语料规模层次不齐 

现有研究的语料多限于环境话语,尤其是媒体报道中的气候变化话语。然而,生态语言学视域下的研究可涵盖所有对生态系统有影响的话语。因此,环境行为披露、环保、人与自然关系等为议题的科普材料、环境报告、儿童读物及经济、政治、农业话语等都可成为研究对象。此外,现有研究语料规模层次不齐。一些自建语料库库容过小(如Alexander, 2013,2018),仅有过千或万词。尽管“语料库规模受建库目的与语料库属性的影响”(胡开宝,2011: 43),但语料库太小,无法突显聚焦的语言特征,且结论所依据的频率信息太低会缺乏说服力(Baker et al.,2008)。 

2)研究主题过于聚焦人类环境行为

 现有研究多披露话语背后的人类环境行为,如环境影响、责任、政策及认识。虽有研究关注话语中人与自然的关系及对自然的认知,但数量较少。话语使用如何影响人与人、其他有机体及生态系统还需更多实践分析与理论的支撑。 

3)研究视角单一,方法难以联合 

首先,现有研究多限于词汇分析,即借助语料库工具分析文本中的高频词、关键词、典型词汇,或进行以主题为导向的语义分类与语义域考察。虽然词汇、语义分析联系到上下文局部语境,如搭配、搭配网络、词簇、索引行,但这些词汇信息仅是话语研究的一个层面,缺少语法与语篇层面的支撑,难以全面解读话语对生态系统的影响。

其次,多种方法难以联合。此处仅限于采用生态、和谐话语分析路径的研究,存在与Baker et al.(2008)谈及语料库方法应用于话语分析一样的问题。语料库研究者可能缺少生态、和谐话语分析理论与方法的了解,研究中仅借用一些术语或理论框架,对话语深层的生态性与实践意义揭示不够。而且,一些研究采用的方法在严格意义上并不属于生态或和谐话语分析,只能归为生态语言学视角的话语研究。另一方面,生态语言学研究者可能对语料库研究的理论与技术掌握有限,除了词频统计,很难采用更复杂的量化方法,缺乏对语言数据的多维度挖掘。此外,系统功能语言学框架内展开的研究多考察及物性,少有研究从其他词汇语法资源切入进行分析。 

4)话语的意识形态与研究者的生态哲学观混淆 

基于语料库的环境与非环境话语分析主要揭示话语隐含的意识形态,如人类中心主义。然而,生态与和谐话语分析还强调另一类意识形态,即分析者的生态哲学观。在进行这类研究时,研究者可能混淆话语的意识形态与自己的生态哲学观,将两者等同;或有明确生态哲学观,却不能应用于文本的阐释与评价,理论与评价脱节。因此,研究者需熟悉选择的研究路径,采用不同方法。

5

未来发展

针对现存问题,未来应从以下几点出发,切实推进语料库方法在环境和生态话语分析领域的应用。 

首先,推进语料库在相关研究中的应用和建设。语料库可以实现话语的增量效应,并减少研究者的偏见(Baker, 2006),增强文本描述和解释的说服力,未来研究可加强语料库方法的应用。在语料库选择与建设上,通用语料库或数据库(如LexisNexis、Factiva)库容庞大、时间跨度长,且体裁丰富,是研究者首选的平台。但一些学者如Poole(2018)也提出建设大型环境话语语料库的必要,用于生态语言学研究与环境教育。对于自建的专用语料库,许家金(2019)认为一般库容不低于 100万词最为合适,但不排除受研究话题所限,几十万词的语料库也具备一定说服力。其次,结合语言学理论,利用语料库工具,拓宽研究方法。理论层面,未来研究可结合系统功能语言学、认知语言学、语用学、修辞学等理论,从情态评价、衔接、语域或隐喻、修辞等角度切入,“多维度、多层次”分析话语的生态性;技术层面,充分利用语料库工具与计算机技术,尝试更复杂的考察视角与统计方法,最大程度挖掘话语的词汇语法、语义及语篇信息。最后,拓宽研究视角,推动生态语言学的发展。生态语言学为话语与环境关系研究提供了全新视角,且着眼于更多元协同的人与生态系统关系。未来研究可在这种生态视角下,结合语料库方法,分析、批评、改良或推广话语,推进生态语言学的实践发展。

6

结语

语料库方法与环境和生态话语分析的结合已成未来研究的一个发展趋势。本文详细梳理了此类研究的国内外发展现状,发现存在的问题。在此情况下,未来研究需推进语料库的应用和建设,结合语言学理论,充分利用语料库工具,拓宽研究方法,并在生态视角下解读语言、人类行为及环境间的关系,从而进一步推动良好的环保行为。

上下滑动阅读更多内容


参考文献





原文《基于语料库的环境和生态话语分析研究:现状、问题与未来》刊于《外语教学理论与实践》2024年第3期第28-34+98页。


继续滑动看下一个
上外国际传播研究中心
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存