通知公告:

发言范文网欢迎您
栏目导航
【工作总结】
【工作计划】
【述职报告】
【作文大全】
【心得体会】
【思想汇报】
发言范文网

基于语料库的《1976年海事索赔责任限制公约》文本特征研究

发布时间:2021-12-28 10:58:12   浏览量:

耿颖会 周淑莉

摘 要:随着社会的发展进步,如今出现了许多新兴的技术和学科。语料库语言学作为一门新兴学科,一经研究便获得迅速全面的发展。现在都流行跨学科交流,语料库和翻译结合起来,大大提高了翻译工作者的效率。本文将借助Antconc这一工具中的Concordance、Word List,File View,Collocates等功能,通过对《1976海事索赔责任限制公约》中某些词进行检索,对得出的数据进行分析,从而得出该文本用词、句法及篇章特征,为文本翻译和官方交流提供借鉴。

关键词:语料库; Antconc; 《海事索赔责任限制公约》

中图分类号:H313         文献标识码:A         文章编号:1006-3315(2021)12-092-003

一、引言

按照科学的方法定义,语料库就是书写文本或口语转写的集合体。语料库是“电子机读文本的有限集合,从最大程度上代表了某種语言或语言变体”(王春艳,2009:43-47)。随着科学技术的飞速发展,计算机逐渐被应用到更多领域,实现多学科跨领域的交流。语料库语言学作为一门新兴学科,它很好地结合了自然科学与文学,近几年来受到广泛的关注。无论文本多长多难,我们都可以借助语料库工具来检索,得到文本中有关语言使用情况的频率和概念信息。我们常见的语料库检索工具有:单语语料库检索和分析工具:Wordsmith、Antconc,双语语料库检索和分析工具:paraconc、Excel以及双语记忆库检索和校订:SDL TRADOS。

AntConc是日本早稻田大学Laurence Anthony博士实验室研发的基于Microsoft Windows操作系统的多平台的语料库分析工具包,界面简洁、操作方便,并基本实现了Word Smith的所有功能。截至2020年10月,对国内CNKI数据库输入关键词“AntConc”进行精确检索,检索区域从2007年-2020年一共获得184篇相关文献。国内学者最早使用AntConc进行研究的是2007年徐静的硕士研究生学位论文《一项基于语料库的大学一年级学习者动/名词搭配研究》(赵建军,徐祖熹,2019:23-27)。AntConc是一个绿色免费版的软件,一款十分不错的语料库检索工具。该软件支持txt格式,适用于语言文字领域,支持索引、词表生成、主题词计算、搭配和词族提取等功能。该软件一开始是作为相对简单的索引程序,不过慢慢地进步成了一个相对有用的文本分析工具,翻译工作者可以利用该软件对一定文本的主题、语言特点等进行分析,大大提高工作效率。本文将借助Antconc软件中的Concordance、Word List,File View,Collocates等功能对《1976海事索赔责任限制公约》这一文本中的某些单词进行检索,并对数据做定性分析,从而得出一定结论。

二、语料库的选取

本文选取了联合国20部公约中《1976海事索赔责任限制公约》作为研究的语料库。它是在1976年政府间海事协商组织在伦敦召开的外交会议上通过的公约。该公约主要是关于海事索赔责任限制的某些统一规则,主要包括有权享受海事索赔责任限制的人,须受责任限制的海事索赔以及责任限额、责任限额的船舶总吨数。该文本是一个涉及法律相关的索赔条款。选择这一文本作为语料库是因为想要通过语料库工具来检索这一公约中某些相关的词汇,对得到的相关数据进行分析,总结这类文本的基本特征和语言特点。

三、运用Antconc软件分析《海事索赔责任限制公约》

首先把《1976年海事索赔责任限制公约》文本用Antconc软件统计,它提供了有关这个文本的简略统计数字。

(token)是指形符数,也就是指语篇中一共有多少词,总形符数是原料库容量的最常用的测量单位。类符数(type)指语篇中一共有多少个不同的词。类符形符比率在一定程度上反映了文本的某种本质特征,即用词的变化性。一般来说,类符形比越高,用词变化性越高(冉凡敏,2016)。《1976年海事索赔责任限制公约》中总类符数是671,总形符数是4441,类符形符比为15.11。从上述统计数据中可以看出该语篇用词不算复杂,文本整体相对来说不是很长,词汇变化并不大,整体难度较小,易于理解。

(一)使用Wordlist和Concordance功能对词语出现的频率排序

用软件Antconc对该文本进行统计,生成一个Word List,Word List工具,可以对该文本的基本信息进行统计,自动生成词表,它可以提供文本中出现频率最高词的词频(以词的频率多少排列),对这些词的初步分析可以让我们了解有关文本内容的信息。利用Antconc软件中的Wordlist工具对《1976年海事索赔责任限制公约》中出现频率前100的词汇进行统计,如图2所示。

从上图2可以看出前九位出现频率最多的是介词和连词,因为一个文本中最多的就是像介词和连词这种功能词,它们只起到语法上的连接作用,没有实际的意义。除了前九个出现频率最多的介词和连词外,出现频率次数最多的有:article,convention, claims,liability,fund,limitation,ship等,其中article出现了57次,convention出现了56次,claims出现48次,liability出现了44次等,这些词汇表明该文本是涉及到和条款、协定相关的内容,并且对里面一些相关的责任和资金进行限制和约定。并且从这些词汇中还可以看出该类型文本选词专业化、正式、准确。

另外,通过观察,我们可以发现“which和 that”出现了41次和36次,这可以证明该文本中从句相对不是很多,说明文章句式相对比较简单,对于这种法律公约文本,最重要的是条理清晰,避免歧义和纠纷。所以句式一般不会复杂。

(二)利用Concordance Plot和Collocates来分析词汇的分布和搭配

Antconc语料库软件中Concordance Plot的功能是索引定位,每个文件的所有索引条数都在一个条形码上定位出来,能够表示检索词的位置所在。下面将通过检索“article、convention、limitation、liability”等词,利用Antconc语料库检软件中索引定位(Concordance Plot)来分析词汇在文本的分布特点。

根据上图1生成的词表,我们可以看出除了介词和连词出现的频率最高以外,实义词中“article”出现频率是最高的。然后通过查阅了索引定位,得到了如图3“article”这一词在文章中的分布。通过图3可以看出article这一词汇主要出现在文章的前半部分,由此可以看出来该文本前半部分主要是关于条款的一些事项。

通过文件视图(File view)可知,“article”一般出现在小标题中。

根据wordlist工具生成的词汇频率分布图1,我们可以看出convention这一单词在文本中出现的频率挺高的,但困惑的是通过查阅了索引定位,如图4,我们可以看出convention在文本中分布的不均匀,主要集中在文本中的某一部分,通过查看文件视图(File view)可知,convention主要集中分布在文章的开头,因为convention这个单词的意思是公约的意思,出现在前面是对文本主题的回应。

通过仔细观察搭配词表(Collates)发现,“convention”词汇常跟形容词“international”搭配,构成一个术语。常出现在联合国文件里面。

利用Antconc软件中的索引定位(Concordance Plot)功能,关于“liability”词汇在文本的分布如图5所示。通过上图我们可以看出该词汇在文中的分布贯穿整个文本,但相比较而言,“liability”分在文本的前半部分还是比较密集的。由此我们可以看出文本的主要内容是关于和责任相关的。和上图3结合起来,看出是关于条款里规定的责任。通过比较图3和图5可知“liability”比“article”在文中分布得更多,能够更好地反映文本的内容。

通过使用搭配功能“Collocates”里检索词汇“liability”,发现和它搭配的词有名词limitation,动词claims,还有介词to,of,for等。通过和名词和动词的搭配,我们同样也可以看出该文本语言规范,多为一些法律方面的词汇。这些搭配正好体现了与文本标题的呼应。这些词汇之间都是相互联系、相互修饰的,反映文本的内容及语言特征。责任(liability)这一词汇除了和名词、动词搭配外,它还和一些介词搭配如:“to、for、of”一起构成一些日常生活中会用到的动词搭配。利用Antconc这个软件我们能很快对一个很大的文本的词汇进行分析,从而对文本的主要内容进行把握。了解这个文本的一些基本信息。

(三)利用Antconc软件进行多项检索

Antconc软件除了检索单个词项以外,还具有检索多个词项的功能,这样可以把一个单词所有的形式都检索出来。检索方法为检索项间键入“|”符号。《1976年海事索赔责任限制公约》这一文本中,“limit”这一单词有多种形式,通过在“Search Term”中输入“limit|limits|limitation”就可以把文中“limit”的所有形式都检索出来了。检索结果如图6和图7所示。

通过多项检索功能,这样可以把所有关于limit的形式在文中的分布都展现出来。如上图7可以看出“limit”的各種形式贯穿整个文本。结合上述对“liability”的分析,“limitation”是和“liability”搭配的,这两个词在文本中分布是最广的,贯穿整个文本。所以该文本主要是围绕对于责任的限制。Antconc软件中的多项检索功能把一个词的多种形式全部呈现出来。如果要检索项目较多的情况下,除了使用“|”检索以外,还可以在TXT文本中键入所有要检索的词项,可多达250个词。然后为该文本起名保存。需注意的是键入的词项需以列的形式排列。然后点击Search Term旁的“Advanced”,选择“Use search term(s) from list below”。点击“load file”,在保存以上新建的文本的盘符路径点击文本名,然后点击“Apply”;回到语境共现的界面后,点击“Start”,开始检索。这种方法和上述方法检索出来的结果是一样的,所以Antconc软件里的功能十分强大。

四、结语

以上分别运用语料库软件“Antconc”中“Concordance、WordList、File View、Collocates和多项检索等功能对《1976年海事索赔责任限制公约》检索出来的数据进行分析,得出了词汇在文本出现的频率以及在文本中的分布情况。通过分析这些数据,了解该文本用词规范准确、句式简单、结构清晰明了。对于以后关于条约类型的文本提供一定的思路。该软件除了对于一些联合国的文件能够进行一定的检索分析,同时对于一些小说类型的文本,该软件同样适用,对小说叙事特征、情节发展、写作艺术、主要人物进行分析。由此可见,该软件在翻译中起着至关重要的作用。当然语料库工具分析不能代替人们主观上对文本的分析,但是二者互为补充,语料库的方法可以为人们的主观鉴赏提供佐证,通过图形、列表、统计等量化的方法来分析文本,可以对文本进行更加理性的诠释(赵建军,徐祖熹,2019:23-27)。所以我们应当注重技术和翻译的结合。

参考文献:

[1]管新潮.《语料库与python应用》[M]上海:上海交通大学出版社,2018

[2]雷圣春.基于语料库Antconc软件对《白鲸》的语言特点及主题词表征分析[J]数字通信世界,2019(2):249

[3]冉凡敏.基于语料库Antconc的小说《紫色》分析[J]科技展望,2016(16):241-243.

[4]江莉,王茎,张四红,程玲.基于语料库的中医术语翻译中essence和spirit的差异性研究[J]科教文汇(上旬刊),2013(03):109-111

[5]赵建军,徐祖熹.基于语料库工具AntConc对《故乡》研究[J]北第二师范学报,2019(01):23-27

[6]朱艳琼.基于Sketch Engine在线BNC语料库的英语近义词搭配辨析——以affect和influence为例[J]2021(04):117-118

[7]郑一菲.基于语料库的《瓦尔登湖》译本对比研究[J]散文百家,2021(02):138-140

猜你喜欢语料库语料库辅助英美文学教学模式初探校园英语·月末(2020年4期)2020-06-08可比语料库的建立及翻译教学研究神州·下旬刊(2019年10期)2019-11-22基于语料库翻译学的广告翻译平行语料库问题研究知识文库(2019年22期)2019-11-11护理英语语料库建设探索知识文库(2019年4期)2019-10-20如何利用语料库语言学提高英语教学世界家苑(2018年11期)2018-11-20浅谈语料库分类及用途求知导刊(2018年25期)2018-11-01近5年语料库应用于外语教学的研究综述新教育时代·学生版(2018年13期)2018-10-21国内外语料库建设研究简述知识文库(2018年21期)2018-05-14运用语料库辅助高中英语写作师道·教研(2017年11期)2017-12-10关于“nothing succeeds without a strong will”的语料库研究中国校外教育(下旬)(2014年7期)2015-04-03

相关热词搜索: 语料库 海事 公约
Top