文档库 最新最全的文档下载
当前位置:文档库 › 语料库常用术语

语料库常用术语

语料库常用术语
语料库常用术语

语料库常用术语

Type 类符

Tokens 形符

例如“I see a cat and a dog”类符6个,形符7个

Type/token ratio =TTR

TTR 是衡量文本中词汇密度的常用方法,可以辅助说明文本的词汇难度。但是,文本中有大量功能词出现,文本每增加一个词,形符就会增加一个,但类符却未必随之增加。这样文本越长,功能词重复次数越多,TTR会越低。因此用TTR衡量词汇密度不合理,于是,出现了标准化类符/形符比,即STTR。例如,计算每个文本1000词的TTR,均值处理,得出STTR。Frequency(频率)

例如每百万词、十万词中,某单词出现次数。常常将某个单词在两个语料库中出现的频率参照两个语料库的容量,用卡方检验或对数似然率进行对比,来确定两个库中该单词的使用是否有差异。

Wordlist词表

根据单词或词组在语篇中出现的频率大小而排列形成的列表。

Ranks

Lemma词目,词元

比如go是lemma,对应各种屈折变化形式(inflections),go,goes,went,going,gone共5种屈折变化形式。在分析语言时,需要将它们全部归到go名下,这个过程叫词形还原。Keywords关键词、主题词positive keywords 正关键词negative keywords 负关键词

Concordance 索引(KWIC 语境中的关键词key words in context)

运用索引软件在语料库中查询某词或短语的使用实例,然后将所有符合条件的语言使用实例及其语境以清单的形式列出。通过前后语境,可以分析“collocation词汇搭配”“colligation 类连接、语法搭配”“semantic preference语义倾向”“semantic prosody语义韵”Collocation词汇搭配

搭配强度MI,T-score ,Z-score

Colligation类连接、语法搭配

semantic prosody语义韵

词汇的语义韵大体可分为积极语义韵、中性语义韵、消极语义韵。

POS tagging 词性赋码

Regular expression regex 正则表达式

语料库术语中英对照

Aboutness 所言之事 Absolute frequency 绝对频数 Alignment (of parallel texts) (平行或对应)语料的对齐 Alphanumeric 字母数字类的 Annotate 标注(动词) Annotation 标注(名词) Annotation scheme 标注方案 ANSI/American National Standards Institute 美国国家标准学会 ASCII/American Standard Code for Information Exchange 美国信息交换标准码Associate (of keywords) (主题词的)联想词 AWL/Academic word list 学术词表 Balanced corpus 平衡语料库 Base list 底表、基础词表 Bigram 二元组、二元序列、二元结构 Bi-hapax 两次词 Bilingual corpus 双语语料库 CA/Contrastive Analysis 对比分析 Case-sensitive 大小写敏感、区分大小写 Chi-square (χ2) test 卡方检验 Chunk 词块 CIA/Contrastive Interlanguage Analysis 中介语对比分析 CLAWS/Constituent Likelihood Automatic Word-tagging System CLAWS词性赋码系统Clean text policy 干净文本原则 Cluster 词簇、词丛 Colligation 类联接、类连接、类联结 Collocate n./v. 搭配词;搭配 Collocability 搭配强度、搭配力 Collocation 搭配、词语搭配 Collocational strength 搭配强度 Collocational framework/frame 搭配框架 Comparable corpora 类比语料库、可比语料库 ConcGram 同现词列、框合结构 Concordance (line) 索引(行) Concordance plot (索引)词图 Concordancer 索引工具 Concordancing 索引生成、索引分析 Context 语境、上下文 Context word 语境词 Contingency table 连列表、联列表、列连表、列联表 Co-occurrence/Co-occurring 共现 Corpora 语料库(复数) Corpus Linguistics 语料库语言学 Corpus 语料库 Corpus-based 基于语料库的

语料库翻译学_问题与展望_龙绍赟

江西社会科学2012.12 244 语料库翻译学:问题与展望 ■龙绍眖语料库翻译学在汲取语料库语言学、描写性译学及其他相关学科营养的同时,不断丰富和发展自己的研 究内容和研究方法,颠覆了传统译学的研究方法,形成了自己独特的研究对象,拓展和深化了翻译学研究的外延和内涵。然而,语料库翻译学研究也存在内容上的缺陷。因此,未来的语料库翻译学研究应紧密结合翻译学的跨学科属性,构建并完善语料库翻译学的理论体系,发挥其方法优势,突破自身的缺陷,实现其发展预期。 [关键词]语料库翻译学;跨学科属性;代表性;应用文体;深度与广度 [中图分类号]H0[文献标识码]A[文章编号]1004-518X(2012)12-0244-05 龙绍眖(1969—),男,江西师范大学外国语学院副教授,硕士生导师,主要研究方向为语料库语言学。(江西南昌330022) 20世纪以来,描写性译学悄然兴起,语料库语言学蓬勃发展。20世纪90年代,以英国曼彻斯特大学翻译与跨文化研究中心Mona Baker为代表的一批学者相继将语料库应用于翻译学研究,开启了全新的译学研究范式—— —语料库翻译学。语料库翻译学注重实证研究,强调数据统计与理论分析的有机结合,主张从大量翻译事实或现象出发,在对获取数据进行统计分析的基础上来阐明翻译本质、翻译过程、翻译策略及翻译活动的制衡因素,有效地弥补了定性研究的缺陷与不足。短短十几年的发展,语料库翻译学已逐渐形成自己独特的研究领域,并发展为翻译研究领域不可或缺的学科。但语料库翻译学研究在技术层面、研究方法、研究广度和深度等层面还有很多不足,本文就此提出一些建议与策略。 一、语料库翻译学的发展概况 语料库翻译学,指以语料库为基础,以真实的双语语料或翻译语料为研究对象,以数据统计和理论分析为研究方法,依据语言学、文学和文化理论及翻译学理论,系统分析翻译本质、翻译过程和翻译现象等内容的研究。[1]语料库翻译学最早由Mona Baker于1996年正式提出[2],Tymoczko将该领域的研究命名为“Corpus Trans-lation Studies”(语料库翻译学研究)。[3]语料库翻译学是语料库语言学和描写性译学相互影响、相互结合的产物。Sara Laviosa认为:语料库语言学和翻译研究的结合形成了“一种连贯的、全面而丰富的研究范式。该范式涉及翻译理论、描写和实践等方面的问题,业已成为当代描写性译学研究的新范式”。[4]相应的,语料库翻译学具有这两个研究领域的特征,即语料库方法的运用与注重描写与实证。[1] 语料库翻译学已成为语料库翻译学区别于传统译学研究不可或缺的研究领域。译学研究语料库的建设应属语料库翻译学的研究内容之一。不同于以学者直觉和

基于COCA语料库和CCL语料库的翻译教学探索

基于COCA语料库和CCL语料库的翻译教学探索 南京大学 常熟理工学院 朱晓敏 提 要:从上世纪80年代起,作为一种研究语言现象和语言本质的新模式,语料库语言学取得了令人鼓舞的成就。语料库已经渗透到语言研究的各个领域。翻译研究领域里使用的语料库多为双语平行语料库和翻译语料库。单语语料库与翻译研究相结合,尤其是与翻译教学相结合,是一个鲜有人探索的未知领域。在课堂上使用可以免费获取的美国杨百翰大学的英语单语语料库(CO CA语料库)和北京大学汉语语言学研究中心的汉语单语语料库(CCL语料库)能改变传统翻译教学模式,为翻译教学的改革提供借鉴。 关键词:语料库,COCA,CCL,翻译教学 一、引言 作为一个新的研究领域,一种全新的探究语言现象和语言本质的方法,语料库语言学在上世纪80年代得到了蓬勃的发展。韩礼德(1993:24)曾指出: 语料库语言学将数据收集与理论论述有机地结合在一起,使我们对语言的理解发生了质的变化(转引自王克非,2004:4)。 根据收集语料的语言种类,语料库可分为单语语料库(monolingual corpus)和双语/多语语料库(bilingual/multilingual corpora)。前者仅采用一种语言的语料,通过大量收集本族语者的语言实例而建成;而后者是由两种或两种以上的语言文本构成的语料库,它可以有对应/平行的、类比的和翻译的三种形式。 单语语料库的研发历史要追溯到上世纪50年代末,由夸克等人在伦敦大学率先建立起现代意义上的语料库,即 英语用法调查(Survey of English Usage)。到目前为止,比较大型的英语单语语料库有BNC英国国家语料库,CBECobuild 英语库,Brow n布朗语料库,美国杨百翰大学M ark Davis教授主持的美国当代英语语料库(Corpus of Contemporary American English,简称COCA语料库),汉语的有北京大学汉语语言学研究中心的CCL汉语语料库等。国际上双语/多语语料库在近十几年得到了长足的发展,比较早的双语语料库有20世纪90年代早期建立的英语-挪威语双语平行语料库和英语-意大利语双语平行语料库,以及后来建立的英语和德语,英语和法语等双语语料库。国内目前规模最大的汉英双语语料库是北京外国语大学中国外语教育研究中心近年建成的达3000万字词的通用汉英语料库。国际上多语语料库有T he ECI M ultilingual Corpus多语种语料库(The ECI M ultilingual Corpus,简称IECI/M CI),近1亿字,包含了欧洲主要的语言及土耳其语、日语,俄语、汉语和马来语。而国内目前多语语料库的研究开发还是空白。 二、传统翻译教学面临的挑战与改革的出路 我国传统的翻译教学模式,即 理论讲解!举例验证!结论巩固,曾经为我国培养了一批优秀的翻译人才,他们中的很多人仍然是现在翻译行业的主力军。他们拥有扎实的中、英文功底和孜孜不倦的翻译探索精神。进入21世纪以来,信息技术迅猛发展,知识更新速度加快,传统的翻译教学难以适应新的挑战。从学生对课堂教学的反馈和专业八级考试中翻译部分的得分来看,传统翻译教学存在以下三个方面的问题:首先,翻译教学观念比较陈旧,课堂教学以教师讲述为主,学生听记为辅。学生只记得了抽象的翻译技巧,其实际的翻译能力并没有得到发展。其次,讲授的内容受教材限制,例句少且多为人造语境,学生感觉枯燥,难以提高学生的翻译能力。最后,课堂信息输入量小。 粉笔+黑板+教材+课后翻译练习的单一的教学方法导致课堂容量小,节奏缓慢。要改变以上现状,就要 实现翻译课程结构的科学化,扩大课堂教学的信息输入量,让学生在教师提 本文是南京大学2009年博士研究生科研创新基金课题 基于网络的英汉/汉英平行语料对自动获取(项目编号2010CW02)的前期研究成果。感谢匿名评审人员的宝贵意见。文责自负。

雅思王听力真题语料库的使用方法

哈喽宝宝们,今天给大家带来王陆老师语料库正确使用方法 首先说一下同学们雅思听力存在的问题,听到某些单词反应慢,或者拼写速度慢,或者写出来不正确,所以可能造成分数比想象的少个0.5 - 1分左右。 雅思听力7分以上要求更多的不常见单词写对,比如technician、secretary。雅思在2019年5月出现了一个新词,saliva(唾液,口水),这个估计很多同学反应不出来或者压根不会。 很多同学问,语料库对选择题有帮助吗?答案是肯定的,比如,给的选项是fruit、vegetables.假设听到的原文是asparagus,那么可能同学们不一定知道这个是芦笋。如果原文是cabbage,那么估计多数同学会选对。 这样来总结:听力想多分数,必须要增加一些会听会写,反应快的词汇! 语料库是一本学习雅思听力比较有帮助的词汇书。现在最新版的语料库是机考笔试综合版,通过雅思考试,我们可以看出语料库覆盖雅思考试中的听力词汇,请同学们一定要练习拼写和发音。 剑桥雅思系列4-14对于同学们考雅思熟悉题型有帮助,但是可能考试中出现的答案词同学在剑桥系列中没有见过,所以这就是语料库练习的好处了! 2020年的语料库重点章节:11章+5章+3章+4章 第11章和5章尤其重要。例如在2019年5月18日考试中,caravan出现在section 答案中,很多学生说多亏提前练习了,才能写对,今年1月18考试中也出现了这个词。 特别注意:同学可能3章正确率到95%,但是11章80%多,但是最后可能你遇到的答案词就是来源于不熟悉的11章。所以请同学们以最差章节正确率为自己的分数基准! 原因:可能有些人不会什么就考什么!!特别注意:只练习横向听力,不用练习纵向听力。 其中的预测试词汇重要度排第二位,在保证了普通词汇正确率95%之后或雅思听力7分之后再练习这些。(预测试单词很难,这些词来源于2016年雅思听力真题答案)所以,建议同学先保证普通的词汇听见能写对,再来预测试练习! 语料库第8章适合数字字母,地址等信息不能快速捕捉到的考生,这部分练习对于Section1想得分的同学尤其重要。 语料库听写的目标: 第3章第4章第5章+11章:单词加速1.6倍速度,95%正确率(5章不用加速)同学们会问,其它章节不重要吗?答案是重要重要重要。可是,如果练习时间不够,先把3、4、5、11章节练习好。 同学们只有在这四章听写正确率到了95%以上之后,才可以继续听写其它章节,这样听力分数提高更快。如果时间短,那么只能把这四章听写好。在练习这本书时,我们只需要听写横向听力就可以了,纵向听力不用练习(这是给雅思听力已经考到7分,又有时间准备,想到更高分数的同学准备)。其它同学不用练习纵向听力。 错误的学习方法: 很多同学觉得自己基础不好,所以听写完一个章节之后,立刻对答案,发现正确率太低,然后就猛背错词,然后就再重新刷,发现正确率高了之后又刷,来得到成就感,满足感,但是这样的方法存在的问题是你正确率高了,等刷到后面别的章节之后一两周再回来,正确率

语料库常用术语

语料库常用术语 Type 类符 Tokens 形符 例如“I see a cat and a dog”类符6个,形符7个 Type/token ratio =TTR TTR 是衡量文本中词汇密度的常用方法,可以辅助说明文本的词汇难度。但是,文本中有大量功能词出现,文本每增加一个词,形符就会增加一个,但类符却未必随之增加。这样文本越长,功能词重复次数越多,TTR会越低。因此用TTR衡量词汇密度不合理,于是,出现了标准化类符/形符比,即STTR。例如,计算每个文本1000词的TTR,均值处理,得出STTR。Frequency(频率) 例如每百万词、十万词中,某单词出现次数。常常将某个单词在两个语料库中出现的频率参照两个语料库的容量,用卡方检验或对数似然率进行对比,来确定两个库中该单词的使用是否有差异。 Wordlist词表 根据单词或词组在语篇中出现的频率大小而排列形成的列表。 Ranks Lemma词目,词元 比如go是lemma,对应各种屈折变化形式(inflections),go,goes,went,going,gone共5种屈折变化形式。在分析语言时,需要将它们全部归到go名下,这个过程叫词形还原。Keywords关键词、主题词positive keywords 正关键词negative keywords 负关键词 Concordance 索引(KWIC 语境中的关键词key words in context) 运用索引软件在语料库中查询某词或短语的使用实例,然后将所有符合条件的语言使用实例及其语境以清单的形式列出。通过前后语境,可以分析“collocation词汇搭配”“colligation 类连接、语法搭配”“semantic preference语义倾向”“semantic prosody语义韵”Collocation词汇搭配 搭配强度MI,T-score ,Z-score Colligation类连接、语法搭配 semantic prosody语义韵 词汇的语义韵大体可分为积极语义韵、中性语义韵、消极语义韵。 POS tagging 词性赋码 Regular expression regex 正则表达式

Corpus Linguistics and Translation Studies Mona Baker 1993 语料库翻译学文献

Corpus Linguistics and Translation Studies Implications and Applications Mona Baker Cobuild, Birmingham Abstract The rise of corpus linguistics has serious implications for any discipline in which language plays a major role. This paper explores the impact that the availability of corpora is likely to have on the study of translation as an empirical phenomenon. It argues that the techniques and methodology developed in the field of corpus linguistics will have a direct impact on the emerging discipline of translation studies, particularly with respect to its theoretical and descriptive branches. The nature of this impact is discussed in some detail and brief reference is made to some of the applications of corpus techniques in the applied branch of the discipline. 0.Introduction A great deal of our experience of and knowledge about other cultures is mediated through various forms of translation, including written translations, sub-titling, dubbing, and various types of interpreting activities. The most obvious case in point is perhaps literature. Most of us know writers such as Ibsen, Dostoyevsky and Borges only through translated versions of their works. But our reliance on translation does not stop here. Our understanding of political issues, of art, and of various other areas which are central to our lives is no less dependent on translation than our understanding of world literature. Given that translated texts play such an important role in shaping our experience of life and our view of the world, it is difficult to understand why translation has traditionally been viewed as a second-rate activity, not worthy of serious academic enquiry, and why translated texts have been regarded as no more than second-hand and distorted versions of …real? text s. If they are to be studied at all, these second-hand texts are traditionally analysed with the (233) sole purpose of proving that they inevitably fall short of reproducing all the glory of the original. A striking proof of the low status accorded to translated texts comes from the young but by now well-established field of corpus linguistics. A recent survey commissioned by the Network of European Reference Corpora, an EEC-funded project, shows that many corpus builders in Europe specifically exclude translated text from their corpora.1 This

学为贵雅思:雅思备考资料

学为贵雅思给不同雅思水平阶段的考生推荐备考书籍 许多烤鸭对于雅思学习的教材有着各种各样的疑问:这本书写的是什么?我应该买什么书?今天小贵贵就为大家介绍一下咱们学为贵的雅思真经教材,并为不同阶段的你做一个修炼手册的推荐! 一.听力真经修炼手册 1.《雅思王听力真题语料库》 语料库是每个烤鸭的必备书籍,语料库中所有材料首先建立在对2015年之前所有的语言类书籍的研究成果,特别是对剑桥1-10计算机分析成果之上还包括广大考生所提供的考试回忆。 书里面归纳总结了许多的听力考点词包括:名词,动词,形容词,数词,字母,词组等,这些词都是雅思考试中会听到甚至需要写出类的单词。王陆老师独创的点听,复听,魔鬼跟读法在这本书上都有详细的使用说明和介绍。 本书适合听力基础比较薄弱,刚刚接触雅思的“小白”,建议没有考过雅思的考生先用语料库打好单词基础,在此之上再加入听力技巧的使用,并用剑桥真题来做考前模拟。 2.《剑桥雅思听力考点词真经(剑10版)》 所谓考点词就是在测试环节中表征测试目的的词汇。雅思听力考试题目的本质和雅思阅读一样,是考查考生的同义替换能力。而这本听力考点词真经就是总结了剑4到剑10真题中,所有题目所对应的同义替换词。这些同义替换是剑桥官方要求考生所必需掌握的听力词汇,也是雅思听力考试的精髓。 这本书在总结这些考点词的基础上还配有词汇的音频。本书有两种排列形式,一种是按照雅思真题的分类方式,一种是按照九宫格的方式排列。无论是哪一种排列方式,都可以作为考生记忆和自我测试的工具。 本书适合具备一定词汇量,并已经开始做雅思真题的烤鸭。建议在做完一套真题后,对照本书中这套题的考点词来进行归纳,总结。这样才算真正做完,做懂一套雅思真题。

语料库翻译学研究内容

研讨五语料库翻译学 1. 什么是语料库翻译学? 2. 语料库翻译学的理论基础? 3. 语料库翻译学的研究内容? 4. 什么是翻译共性? 根据研究课题的来源,语料库翻译学的研究领域分为三类。 第一类源自传统译学研究,包括基于语料库的文学翻译、翻译史、翻译教学、翻译实践、机器翻译和口译等领域的研究。 基于语料库的文学翻译研究以文学翻译作品的文本分析为基础,研究文学翻译理论与实践的相关课题。这些课题具体为: 1) 意象和人物形象的再现与变形,2) 文学风格的再现与重构,3) 文学翻译的创造性,4) 译者风格,5) 文学作品空白和未定性的翻译,6) 文化负载词的翻译,7) 误译和漏译研究。 基于语料库的翻译史研究利用历时性平行语料库对名家译作进行文本分析,揭示翻译家在翻译策略应用、翻译风格和翻译语言等方面所表现出的个性特征及其所遵循的翻译规范。目前,翻译史研究大多将翻译家的观点或言论视为客观现实,满足于翻译事实的罗列,对于翻译规范和历史语境关注不够。事实上,翻译家的所做与所言往往不一致,翻译家所言并不能反映其翻译作品的特征。此外,翻译是一种特殊的社会文化行为,受特定规范的制约。这些规范因时代或文化的差异而不同。利用语料库分析翻译文本的具体特征,归纳不同历史时期的翻译规范,可以阐明翻译家的所作所为,还原历史的真实面貌。另外,该领域的研究还通过提取语料库的篇头信息,对于具体某一历史时期的翻译活动进行客观描述。这些信息包括出版商、出版时间、作品主题、译者姓名和性别等内容。应当指出,语料库翻译学与翻译史均强调对研究对象进行客观描写,重视还原语境方法( contextualization) 的应用。这些共性为语料库在翻译史研究中的应用提供了作为空间。 以上研究均属语料库翻译学理论层面的研究,而基于语料库的翻译教学、翻译实践和机器翻译研究都是应用层面的研究。前者侧重于探讨语料库在翻译评估、翻译教材编写和翻译教学模式中的应用,后者主要关注双语词汇和句式之间的对应关系、翻译策略和方法的应用等问题。基于语料库的机器翻译研究是指利用语料库的核心技术,建设具有海量信息的知识库,以满足机助翻译或自动翻译的需求。 基于语料库的口译研究侧重于分析口译语料词汇、句法和语篇等层面的特征,研究口译语言特征、口译规范、口译策略和方法等。该领域的研究是综合性研究,既有理论层面的探讨,也有实践层面的分析。 第二类研究领域源自描写性译学研究,涵盖翻译共性、翻译规范和批评译学等领域的研究。 翻译共性是指由于翻译过程而形成的翻译文本所具有的区别于原创文本的特征,与源语和目的语之间差异无关,具体表现为显化、隐化、简化和范化等。翻译规范是“译者在具体时间或社会文化环境中所做出的规律性或习惯性选择”。“翻译规范是关于翻译作品和翻译过程正确性的规范,体现了具体某一社会或历史时期关于翻译的价值观和行为原则”。翻译规

陆陆教你语料库的正确打开方式

陆陆教你语料库的正确打开方式 写在前面的话 雅思王听力真题语料库是一本学习雅思听力比较有帮助的词汇书。当当,亚马逊,卓越都有卖的。现在最新版的语料库是剑10版,通过2016年1月的四场考试,我们可以得出结论,现在经常出现ABC卷,所以请同学们认真准备雅思,这样才能得到理想的雅思成绩。 很多同学可能认为语料库只对于听力填空题有帮助,但是各位同学学习久了就会发现,词汇是基础,没有单词,选择题很难做出正确的判断。同学们可以想象:文章由段落组成,段落由句子组成,句子由词组组成,词组由单词组成,所以反过来,如果单词有问题了,文章也很难理解。 特别注意:淘宝网有好多盗版的语料库,如果封面没有烫金字VOICE OF CAMBRIDGE, 那么就是盗版的,盗版是没有光碟的.目前有封面IELTS (旧版) 和剑10(新版)的。最佳版本:剑10是最新的,IELTS,2013也可以使用,但是2011,和2012封面的就是古董啦。中间加了很多词,建议大家使用最新版本(807听力非常有名,如果大家是网上下载的王陆807升级版,建议扔掉啦(因为那是我2006年录的,雅思变化太大了,已经无法跟上时代了)如果是807那本书,大家如果喜欢,可以继续使用,但是没有重点,必须1-9章

都听写好)2016年语料库重点章节重点章节为:5章,11章,3章,4章。如果数字字母等第一部分的基本功有问题,推荐每周练习1-2次8章,这个尤其在有干扰的情形下练习效果最好了。5章:就是词组搭配比较多的章节,也是吞音连读的章节。这些词组就是雅思考试中的神组合,意思就是经常出现的搭配,如果在考试题目要求中看到了NO MORE THAN THREE WORDS, 那么一定要注意听词组搭配,尤其是同学们不太熟悉的搭配,例如,hall of residence (学生宿舍),blue folder (蓝色文件夹)这样的不常用搭配,另外,也要注意guided tour,有下划线的代表容易漏写的,请小心。1月9日考试的3,4部分答案大量来自于这个章节。例如,unsocial hours, internal clock, articles from journals, photocopies of notes等。11章:2014-2015年的雅思听力新增词汇,按照四个部分排列的,其中很多单词都是首次出现在雅思听力考试中,请同学们一定要加强练习,这个部分在1月23,30日的考试中出现在1,4部分。 最后的目标:单词1.6倍速,词组原速,正确率达到95%。经过基于大量数据基础上的统计,语料库听写正确率与听力分数的关系是这样的 通过4年的统计,大量数据表明: 语料库听写正确率20%左右,听力考试实际分数3.5.语料库听写正确率70%左右,听力考试实际分数5.0.语料库听写正

语料库语言学术语汇编Aglossaryofcorpuslinguistics.docx

语料库语言学术语汇编 ( V2.0 ) Last updated 2012-10-08 by许家金 Aboutness所言之事 Absolute frequency绝对频数 Alignment (of parallel texts)(平行或对应)语料的对齐Alphanumeric字母数字构成的 Annotate标注(动词) Annotated text/corpus标注文本 /语料库、赋码文本/语料库Annotation标注(名词) Annotation scheme标注方案 ANSI/American National Standards Institute美国国家标准学会 ASCII/American Standard Code for Information美国信息交换标准码 Exchange Associates (of keywords)(主题词的)联想词 AWL/academic word list学术词表 Balanced corpus平衡语料库 Base list/baselist底表、基础词表 Bigram二元组、二元序列、二元结构 Bi-text/bitext双语合并文本、双语分行对齐文本 (一句源语一句目标语对齐后的文 本) Bi-hapax两次词 Bilingual corpus双语语料库 Bootcamp debate/discourse/discussion(新手)训练营大辩论 /话语 /大探讨CA/Contrastive Analysis对比分析 Case-sensitive/case sensitivity大小写敏感、区分大小写 Category-based approach基于类(范畴)的方法 Chi-square test/ 2χ卡方检验 Chunk词块 CIA/Contrastive Interlanguage Analysis中介语对比分析 CLAWS/Constituent Likelihood Automatic Word-CLAWS 词性赋码系统 tagging System Clean text policy干净文本原则 Cluster词簇、词丛 Colligation类联接、类连接、类联结 Collocate n./v.搭配词;搭配 Collocability搭配强度、搭配力 Collocation搭配、词语搭配 Collocational strength搭配强度 Collocational framework/frame搭配框架 Collocational profile搭配概貌

在美国当代英语语料库(COCA)如何查词

在美国当代英语语料库(COCA)如何查词.doc 在美国当代英语语料库(COCA)如何查词 摘要:美国当代英语语料库(Corpus of Contemporary American English,COCA)由美国Brigham Young University 的Mark Davies教授开发,目前单词容 量在4.5亿,是美国当前最新的当代英语语料库,也是当今世界上最大的英语平衡语料库。该语料库的语料来自1990-2012年,每年更新,检索功能强大,是最佳的英语学习助手。本文以sorry为例介绍了如何在美国当代英语语料库中查询单词及对单词sorry的检查与研究结果。 关键词:美国当代英语语料库,平衡语料库,sorry Abstract: The Corpus of Contemporary American English (COCA) is the largest freely-available corpus of English,and the only large and balanced corpus of American English.The corpus was created by Mark avies of Brigham Young University,and it is used by tens of thousands of sers every month (linguists,teachers,translators,and other searchers).COCA is also related to other large corpora that we have created. The corpus contains more than 450 million words of text and is qually divided among spoken,fiction,popular magazines,newspapers,and academic texts.It includes 20 million words each year from 1990-2012. Key words: the Corpus of Contemporary American English,parallel corpus,sorry 中图分类号:H319.3文献标识码:A文章编号:1006-026X(2013)12-0000-02 一、引论

基于双语平行语料库的翻译教学

基于双语平行语料库的翻译教学 翻译是英语专业高年级学生一门非常重要的课程。传统的翻译教学以教师讲解为中心,以翻译教材为学习载体,学生在上完课之后很难具备一定水平的翻译能力。针对于此,我们把双语平行语料库及相应的检索功能引入到翻译教学当中,以提高翻译教学质量,提升学生的翻译能力。 标签:双语平行语料库;翻译;教学 双语平行语料库是指使用两种语言撰写相互间具有翻译关系的文本的集合平台,与普通的词典相比,这种翻译方法更加准确、便利、快捷,更新速度快,可以提供大量真实的双语对译语料以供学习者查询。 何安平指出,将语料库引入翻译教学,会改变传统的翻译教学模式,使学生可以开展各种学习活动,比如互动式学习、开放式学习和分析归类型学习,这一系列学习可以激发学生的好奇心、求知欲,帮助学生塑造的批判精神和反思精神,为培养学生的创新思维提供了条件。 本文例句所使用的双语平行语料库是指北京外国语大学通用双语平行语料库。 1.基于双语平行语料库的词汇翻译 曾有人提出,平行语料库最典型的应用范围之一是双语词汇教学。无论是英译汉还是汉译英,在很多时候英汉两种语言不存在一一对应的词汇,一词多义的现象很普遍,这就意味着这个词有多种译文;而且,在某些特定的语境中,有的词被赋予固定的意思,这又是新的译文。北京外国语大学王克非教授以汉语“克服”一词为例,在北京外国语大学通用汉语双语平行语料库中检索,发现24处“克服”一词中,有15处翻译为overcome。在学生学习完这24个例子后,他们就会明白,在以后的翻译中,不是所有的“克服”都用overcome翻译,在其他情况下使用cope with,fight down,get rid of 等会更加贴切。 学习者可以借助双语平行语料库的真实语境平台,找到单词在不同语境下的地道翻译,既丰富了词汇量,快速准确地译出对应语,同时可增强语感,提升双语翻译能力。 2.基于双语平行语料库的句式翻译 有时候,学生会感觉无论是英语还是汉语,其中一些句式很难理解,至于翻译更是无从下手。在这种情况下,双语平行语料库为学生们提供了大量的特殊句式翻译例句。我们以英文中“it is said that”为例。这是英语中常用的句式,很多学生张口就翻译为“据说”,好像也没有人怀疑过;包括我本人在接触双语平行语料库之前,见到it is said that也随口就翻译为“据说”。但是,笔者通过双语平行语

王陆雅思王听力真题语料库名词Test paper 1

Test paper 1 ability abstract accountant accuracy 能力概述会计准确性 acid action activity actor 酸行动活动男演员 adult adventureadvertisement advertising 成人冒险广告,宣传广告 advice age agency agreement 建议年纪代理机构同意 agriculture aidaim air 农业帮助瞄准,对准,目标空气allergy alley allowance alteration 过敏小巷津贴改变 altitudeambition ambulance amount 海拔高度野心报复救护车数量 analysis analyst anger animal 分析分析家生气动物 ankle answerAntarcticape 脚踝回答,答案南极洲猿 appearance architect architecture area 外貌建筑师建筑学地区 argument aristocrat army art

论证贵族军队艺术 article aspirin assignment atlas 文章阿司匹林作业地图册 audience auditorium author authority 观众礼堂作者权威 average awardbachelorbackground 平均奖励学士,单身汉背景 bacteria badge badminton backpack 细菌徽章羽毛球肩背包自助旅行baldness band bandage bands 秃头乐队绷带乐队(复数) bank banquet base basement 银行宴会基础地下室 bases basis bath batteries 基地基础洗澡电池(复数) battery beachbeard beats 电池海滩胡子调动的次数 beauty bed bedroom bedsheet 美女床卧室床单 bedsit behaviour belt benefit 小套房行为带子优势 beverage bibliographybicycle bill

双语对应语料库翻译教学平台的应用初探_王克非

语言技术与外语教学研究 *版权所有 文责自负* 双语对应语料库翻译教学平台的应用初探 王克非1 ,秦洪武2 ,王海霞 2 (1.北京外国语大学中国外语教育研究中心,北京 100089;2.曲阜师范大学外语学院,山东曲阜 273165) 摘 要:本文通过语料呈现实验探讨双语对应语料库翻译教学平台的应用效果。实验显示,学生在观察语料后能够归纳和总结出有意义的翻译技巧,并能据此评估或反思自己的翻译行为。实验表明,在翻译课堂教学中使用语料资源有助于自主学习和发现式翻译教学环境的创建,也有助于学习者形成 稳定的翻译技巧。 关键词:对应语料库;翻译教学;发现式学习;语料呈现中图分类号:H 319.3 文献标识码:A 文章编号:1001-5795(2007)12-0003-0006 近20年来,语料库的创建和应用取得了长足发展。对应语料库大都在上世纪九十年代开始创建,起步较晚,但已展现出广阔的应用前景。在欧美,这类语料库有十多个,涉及近20个语种,如H ansard(法-英对应语料库)和ENPC (英语-挪威语对应语料库)(V ron is 2000:14-15);在中国,有中科院计算所的大规模汉英对应语料库、北京大学的/B ABLE 汉英平行语料库0,以及北京外国语大学的/通用汉英对应语料库0(该库现有可检索语料2千万字/词以上,见王克非2004a),后者是本项研究使用的主要工具。对应语料库的创建有两个主要目的:一是用于语言与翻译研究,二是用于外语教学。用于前者的研究成果丰富,涉及语言对比、双语词典编纂和翻译研究(Lav i o sa 1997;Baker 1999;Serpellet 2000;H unston 2002)。用于后者尤其是用于翻译教学的研究也已取得不少成果,如Zanetti n 1998、Pearson (2003:15-24)和Bernardini (2004b :97-111),但大都研究平行语料为翻译训练提供的可能的资源和手段,还没有研究探讨大型对应语料库在课堂教学中的实际应用问题。 1 研究内容 有关运用语料库提高翻译效率和质量的研究还没有全面展开,而将对应语料库应用于翻译教学的研究则是刚刚开始(Bo w ker 2003;Ber nardi n i 2004b)。从理 论上看,语料库用于教学有利于自主学习环境的创建(Bernardini 2004a :22;秦洪武、王克非2007)。自主性学习主要表现在两个方面:研究性学习和发现式学习(learning as discovery)。前者假定学习者和教师研究兴趣相投、研究能力相当;后者则鼓励学习者自行调节兴趣点,并给他们提供机会来提高自己观察和处理问题的能力,使他们对两种语言的特征和差异有敏锐的觉识。本文认为,研究和发现虽不矛盾,但在以技能培养为核心的翻译教学中,不宜过分强调学生的研究能力,发现式学习这一提法更合适一些。 近年来,国内也有研究关注语料库在翻译教学中的应用问题。有些研究探讨了语料库在翻译教学中的用途(郭红2004;于连江2004;王克非2004b),但还没有研究系统地探讨对应语料在课堂教学中的应用方式和应用效果,也没有研究关注学生对于语料使用的态度。鉴于此,我们以/通用汉英对应语料库0为翻译教学平台,探讨在现有技术条件下翻译语料用于翻译教 作者简介:王克非:男,教授,博士生导师。研究方向:语言学、翻译学。 秦洪武:男,教授,博士。研究方向:语言学、翻译学。王海霞:女,讲师,硕士。研究方向:翻译学。 收稿日期:2007-03-18 基金项目:本文是国家社科基金课题/基于大型英汉对应语料库的翻译研究与翻译教学平台0的阶段性成果(编号05BYY 013),并获得曲阜师范大学科研启动基金资助(编号Bsqd2007022)。 # 3#第118期2007年12月 外语电化教学 C AFLE N o .118D ec . 2007

《双语平行语料库在翻译教学上的用途》评述

攻读博士、硕士学位研究生试卷(作业)封面(2016 至2017 学年度第一学期) 学号 姓名 题目《双语平行语料库在翻译教学上的用途》评述 课程名称语料库语言学 专业英语语言文学 入学年月2016年9月 培养方式 全日制□非全日制

题目:双语平行语料库在翻译教学上的用途。 作者:王克非,曾任北京外国语大学外国语言研究所副所长、中国外语教育研究中心常务副主任,现任《外语教学与研究》杂志主编,博士生导师,研究方向为语言学和翻译研究。 研究问题:本文以北京外国语大学建成的通用汉英平行语料库为例,探讨如何在翻译教学中运用双语平行语料库、如何处理翻译教学与双语平行语料库的关系、双语平行语料库对译者有何帮助、以及译者如何在翻译教学中运用双语对译检索(词语的对译检索、结构的对译检索和语句语篇的对译检索)时找到合适的对译,提高他们的英语语感,掌握正确的翻译方法。 研究方法: 本文根据北京外国语大学中国外语教育研究中心建成的通用汉英平行语料库(3000万字词)为例,探讨它在翻译教学上的用途。首先,本文作者采用了随机抽取的方法对克服(overcome)和找(find)进行了检索,找到了他们不同的翻译方法和用法;然后作者通过举例说明汉语中把字句结构的三种形式如何在英语中翻译;最后作者从台湾大学高建明所建的英汉平行语料库中,以“他心情很低落”为例,从语料库中找到相近的中英文短句、句子,找到了表示“心情低落”的各种不同词汇和方法。 结论:在翻译的教学和实践中,双语平行语料库和检索工具的运用不仅给译者提供了方便,而且使他们掌握了一种科学、多样的翻译方法。同时也能激发学生的兴趣,让学生在不同版本的对译中互相学习。这表明双语平行语料库是翻译教学中的一种重要的学习资源,应当引起

相关文档
相关文档 最新文档