文档库 最新最全的文档下载
当前位置:文档库 › 汉英双语命名实体识别与对齐的交互式方法_陈钰枫

汉英双语命名实体识别与对齐的交互式方法_陈钰枫

汉英双语命名实体识别与对齐的交互式方法_陈钰枫
汉英双语命名实体识别与对齐的交互式方法_陈钰枫

第34卷 第9期2011年9月

计 算 机 学 报

CH INESE JOURNA L OF COM PU TERS

Vo l.34N o.9

Sept.2011

收稿日期:2008-03-03;最终修改稿收到日期:2010-04-26.本课题得到国家自然科学基金(60975053,60736014)、国家支撑计划项目(2006BAH 03B02)和国家 八六三 高技术研究发展计划项目基金(2006AA010108-4)资助.陈钰枫,女,1981年生,博士,助理研究员,研究方向为自然语言处理和机器翻译.E -mail:chenyf@https://www.wendangku.net/doc/3415331997.html,.宗成庆,男,1963年生,博士,研究员,博士生导师,研究领域为机器翻译、文本分类、句法分析等.苏克毅,男,1955年生,博士,教授,研究领域为统计机器学习在自然语言处理中的应用,并致力于构建高性能的技术手册的英汉翻译系统.

汉英双语命名实体识别与对齐的交互式方法

陈钰枫1) 宗成庆1) 苏克毅

2)

1)(

中国科学院自动化研究所模式识别国家重点实验室 北京 100190)

2)

(台湾致遠科技公司 台湾新竹)

摘 要 基于汉英双语命名实体的识别与对齐特性,文中提出了一种双语命名实体交互式对齐模型,其中的修正对齐计算体现了汉英实体识别与对齐的密切结合:一方面,利用双语对齐信息帮助实体识别;另一方面,实体的对齐过程对实体的识别结果又具有一定的修正作用,两方面的结合实现了双语实体识别与对齐之间的交互式互助过程.实验证明,这种交互式对齐模型不仅显著提高了汉英实体对齐的性能(F 值从74 4%提高到81 2%),而且有效地提高了汉英实体识别的正确率和召回率.关键词 命名实体;识别;双语对齐;交互;机器翻译

中图法分类号T P 391 DOI 号:10.3724/SP.J.1016.2010.01688

Joint Chinese -English Named Entity Recognition and Alignment

CH EN Yu -Feng 1) ZONG Cheng -Qing 1) SU Keh -Yih

2)

1)(N

ational L a borator y of P atter n Recog nition ,I nstitute of A utomation ,Chine se Ac ade mic of S cie nces ,B eij ing 100190)

2)

(Be hav ior De sig n Corp oration,H sinchu,T aiw an)

Abstract Named entity (NE)r ecognitio n is an essential early stag e and has long been a tho rny pro blem in many natural lang uage processing pipelines.Gener ally,bilingual nam ed entity recog -nitio n and alignment ar e pr ocessed sequentially and independently ,reg ardless of interactions be -tw een the tw o stages.Ther efore,NE reco gnition errors are propagated and com pounded in NE alig nm ent stag e.Actually,biling ual alignment information,other than monolingual information,pro vides further indicatio ns for NE recog nition.It is necessary to capture the inter actio ns be -tw een NE recog nition and alig nm ent.According ly,based o n the characteristics of NE recog nition and alignment,this paper pr opo ses an interactive bilingual NE alignment model,w hich com bines basic alignment and cor rective alig nm ent.Basic alig nment is achieved as tr aditional alignment ap -proach,w hile the co rrective alig nment realizes the joint of NE r ecognitio n and alig nm ent.On the one hand,bilingual alignment inform ation is utilized for NE reco gnition;on the other hand,NE recog nition errors can be recovered in the NE alig nm ent stag e.Bo th the NE boundaries and ty pe can be cor rected in such inter activ e NE alignment mo del.T he experim ents show that this novel model not only achieves a sig nificant im pro vem ent of the Chinese -Eng lish NE alig nment quality (F -score from 74 4%to 81 2%),but also im pro ves the per for mance of NE recog nition.Keywords nam ed entity;recog nition;biling ual alignment;interaction;m achine translatio n

1 引 言

命名实体,尤其人名、地名与机构名这三类命名实体在自然语言中传递着关键信息,是信息处理的重点与难点.对于单语序列,命名实体识别是众多自然语言处理领域的基础工作,其性能直接影响后续的信息处理步骤.对于双语序列,双语命名实体的对齐旨在建立源语言和目标语言中命名实体之间关系,是机器翻译、跨语言信息检索等多语言处理领域的一项重要工作.

一般来说,双语命名实体对齐任务首先识别出源语言或目标语言中的命名实体,再实现它们之间的对应,这需要保证识别过程和对齐过程的准确率,因此,双语命名实体对齐成为一项挑战性很大的工作,具体体现在以下两个方面:(1)双语命名实体的对齐结果很大程度上依赖于实体识别,而识别结果中通常存在比较多的错误,主要包括部分识别、丢失和假性识别(把非命名实体识别成命名实体).实体对齐过程如果直接采用识别结果,必然导致识别错误的延续和扩大;(2)双语命名实体的对齐本身难度很大,因为它不仅属于多词对应多词的对齐任务,还包括意译①和音译两种对齐形式.因此双语命名实体对齐一般采用多特征和多语言知识融合的系统.

近几年来,双语命名实体对齐的研究主要致力于多特征对齐模型的建立,对齐本身已经取得了比较好的效果,但是它与实体的识别性能紧密相关,如果实体识别的错误没有经过修正,直接延续到对齐过程中,那么对齐性能将无法从根本上提高.因此,双语命名实体的对齐如何同实体识别相结合,具有一定的修正识别结果的能力,是双语命名实体对齐任务的瓶颈问题.从实体识别的角度上,双语命名实体对齐方法可以分为两大类.一类是识别双语实体后再对齐,表示分别在源语言和目标语言中识别出命名实体,然后再建立它们之间的对齐关系.例如,文献[1]建立了一个多特征融合的模型来抽取双语语料库中的命名实体翻译对.这类对齐方法需要双语实体识别,因此很大程度上依赖于识别结果.另一类是识别单语实体后再对齐,表示只识别出源语言命名实体,然后在目标语言中确定它们的翻译对应.只在一方进行实体识别,降低了对齐过程对识别结果的依赖程度,因此大部分对齐工作[2-5]都属于这类方法.但是这类对齐方法丢失了目标语言命名实体的识别信息,并且没有在根本上解决实体对齐过程对识别结果的依赖性问题.上述的两类对齐方法都没有校验识别结果的置信度,因此,这样的实体对齐系统无法修正识别错误,导致识别错误延续到对齐过程中,很大程度上影响到最后的对齐结果.

针对命名实体识别,国内外已经有大量的深入研究,但识别结果还有待完善,实体识别仍然是自然语言处理领域的热点.目前,实体识别除了利用单语序列上的局部信息(词条、词性标注、chunk标注等),还包括单语序列上的全局信息[6](全文标注统一性等).此外,另一有待深入研究的可利用资源是:双语序列的对位信息对识别的辅助.例如,文献[7]将双语语料作为反馈信息来提高源语言命名实体的识别性能.但利用双语对齐信息来辅助实体识别,同时提高实体对齐效果,目前尚无研究.

实际上,双语命名实体对齐虽然是实体识别的后续过程,但对齐信息却能辅助命名实体的识别,修正已有的识别错误.于是,我们的研究重点在于如何将实体对齐信息反馈给实体识别.针对汉英双语语料,我们建立起双语实体识别与对齐相结合的整体框架.提出一种汉英双语命名实体交互式对齐模型,使双语实体对齐具有修正识别的功能,实现二者性能的同时提高.

本文第2节给出汉英命名实体识别与对齐的特性分析;第3节提出了一种汉英命名实体交互式对齐模型,详细介绍了其中的修正对齐计算,它用于修正实体边界和类别识别的错误,从而实现了实体识别与对齐的交互;第4节给出实验结果和分析部分;最后一节是本文的结束语.

2 汉英命名实体识别与对齐的

特性分析

命名实体识别通常包括两部分:(1)实体边界识别;(2)确定实体类别(人名、地名、机构名或其他).英文命名实体具有比较明显的形式标志(即实体中的每个词的第一个字母要大写),所以其实体边界的识别相对容易,识别任务的重点在于确定实体的类别.与英文相比,中文命名实体的识别任务更加复杂,而且相对于实体类别的标注,中文实体边界的判断更加困难.通过平行的汉英双语语料是否可以使汉英实体双方的识别特性互补呢?实际上,双语

1689

9期陈钰枫等:汉英双语命名实体识别与对齐的交互式方法

①指普遍含义上的翻译概念,为与音译区别,本文均指意译.

对齐信息提供了双语实体边界和类别的统一性,可以用于调整和修正汉英实体的识别.

一方面,双语实体普遍是边界统一的(也就是双语实体的内部词一一对应的①).因此,双语实体的词对齐有利于单语实体边界的确定.例如:

(1)中文命名实体的识别结果:

官方的〈O RG 〉北韩中央〈/OR G 〉通信社引述海军声明

(2)英文命名实体的识别结果:

Official 〈O RG 〉N or th Ko rean s Centr al N ew s Ag ency 〈/ORG 〉quo ted the navy s st atement

(3)双语命名实体对齐

:

(4)中文命名实体的边界修正:

官方的〈ORG 〉北韩中央通信社〈/O RG 〉引述海军声明

上例中,中文实体的识别结果 北韩中央 属于部分识别的错误结果,英文实体 No rth Korean s Central New s Agency 是正确的识别结果.通过正确的汉英实体对齐(内部词对齐), New s Ag ency 和 通信社 对齐后,中文实体可以被修正为 北韩中央通信社 .

另一方面,对齐的双语实体应该是类别统一的.不仅类别统一性有利于确定双语实体的类别,而且不同类别的实体与对齐形式(包括意译和音译)存在很大的关联,也就是双语实体的对齐方式也有助于实体类别的判断.例如:

(1)中文命名实体的识别结果:

在〈L OC 〉康斯坦茨湖〈/LO C 〉工作的一艘渡船船长

(2)英文命名实体的识别结果:

T he capt ain of a ferr y boat w ho w or ks on 〈PER 〉Lake Constance 〈/PER 〉

(3)双语命名实体对齐

:

(4)英文命名实体的类别修正:

T he capt ain of a ferr y boat w ho w or ks on 〈LO C 〉L ake Constance 〈/L OC 〉

上例中,英文实体 Lake Constance 被错误地识别成人名,通过与中文地名 康斯坦茨湖 对齐后,有助于被修正为地名.如果更深入地分析,上例中的词对齐, 湖 与 Lake ,属于意译对齐.一般来说,人名普遍采用音译进行翻译,所以这个信息暗示了

这个英文实体 Lake Constance 不可能是人名.只

可能是地名或机构名.由此可见,实体的对齐形式有助于我们对命名实体类别的判断.

我们继续深入探讨双语命名实体翻译对内部的对齐形式,也就是意译和音译的组合方式.文献[8]

指出不同类别的实体倾向于不同的对齐形式.人名对齐主要是音译形式,地名和机构名的对齐是意译和音译形式的组合,而且在机构名对齐中,意译形式占的比重更大.针对LDC 机构发布的汉英双语命名实体语料库(LDC2005T34),我们通过其中意译词和音译词的频率统计,发现在人名翻译对、地名翻译对和机构名翻译对中,音译词所占的比重分别是100%、89 4%和12 6%,相差的幅度非常大,这启示我们可以采用双语实体翻译对中音译对齐或意译对齐的比重来辅助实体类别的判断.

综上所述,双语实体的对齐信息为实体识别提供了边界和类别的判断信息.在顺序处理系统中,实体对齐作为实体识别的后续过程,如果能有效利用双语对齐信息对实体识别的反馈作用,必然能避免过多的识别错误,提高识别的准确率,同时也提高对齐的正确率.

3 双语命名实体交互式对齐模型

通常情况下,命名实体识别过程和对齐过程是顺序进行的,没有考虑这两个过程之间的交互作用,

因此,传统的对齐模型直接基于实体识别结果,而无法修正识别结果的错误.为了引入对齐信息对实体识别的反馈辅助作用,同时提高对齐效果,我们建立整体推导框架,将传统的双语实体对齐模型扩展为交互式对齐模型.

汉英双语命名实体交互式对齐任务描述如下:给定汉英双语对齐的句子,分别识别出其中包含的汉英命名实体,并且实现它们之间的对齐.一般直接采用汉英实体识别工具,可以分别找出汉英句子包含的命名实体,中文命名实体的识别结果

S 1

=

1

, ,

s

, ,

S

和英文命名实体的识

别结果T 1

=

1

, ,

t

, ,

T

,我们

定义m k =(s

,

t

)是其中的一条实体对应,

表示

s

和t

互为翻译或部分翻译(包括意译

和音译形式).因此,直接基于识别结果的基本对齐

1690计 算 机 学 报2011年

当某一方的实体存在省略、简略等情况时,双语实体的内部词不一定一一对应.

M被定义为双语实体识别结果的笛卡尔积的子集.

M {

(

s

,

t

):s=1,2, ,S;t=1,2, ,T},

其中,我们不考虑对空情况.

但是,实体识别系统得到的识别结果通常存在许多错误,因此,我们的实体交互式对齐任务不仅实现实体识别结果的基本对齐,还要实现实体识别结果的修正,包括实体的边界和类别的修正.也就是在一个基本

对齐m k=(

s

,

t

)的基础上,通过汉英实体左

右边界的字或词的缩放,获得

s 和

t

修正结果

的候选项CNE k和ENE k,因此,一个修正后的实体翻译对定义为a k=(CN E k,E N E k),其中,CN E k和EN E k同为一种类别(ty p e k)(本文只考虑3种类别:人名、地名和机构名),因此修正后的实体对齐定义为A=〈a k,ty p e k〉K k=1,表示该汉英句子中共包含K 个实体翻译对,〈a k,ty p e k〉是第k个实体翻译对,所以汉英双语实体的交互式对齐模型定义如下:给定汉英双语的句子翻译对:ChnS和EngS,

借助识别工具得到汉英实体的识别

结果S

1

,

T

1

,我们的目标是实现它们之间的基本对齐M,

然后通过对齐信息修正识别结果,实现修正的实体

对齐A,包括对齐后实体翻译对的类别.

A*=

arg max

A

[max

M

P(A,M

|S

1

,T

1

,ChnS,EngS)]

(1)

其中,A*是最优的双语实体对齐结果.P(A,M

|

S

1

,T

1

,ChnS,Eng S)的推导如下:

P(A,M

|S

1

,T

1

,ChnS,EngS)

=P(A|M,S

1

,T

1

,ChnS,E ngS)

P(M |S

1

,T

1

,ChnS,E ngS)

a

k

A

m

k

M

P(〈a k,ty p e k〉|m k,ChnS,E ngS)

P(m k

|

s

,

t

)(2)

P(m k |

s

,

t

)代表传统的基本对齐计算

(直接基于识别结果),P(a k,ty p e k|m k,ChnS,E ngS)

是修正对齐计算,通过已有的对齐m k,得到修正的

实体翻译对a k,并确定它的类别ty p e k,体现了实体

对齐和识别之间的交互.由式(2)可见,双语实体交

互式对齐包括了基本对齐计算和修正对齐计算.基

本对齐计算体现了首先实体识别,然后实体对齐的

顺序过程.而修正对齐计算作为双语实体识别和对

齐之间的桥梁,使实体识别和对齐相辅相成,同时实

现实体识别和对齐性能的提高.

3.1 基本对齐计算

我们直接对P(m k|

s

,

t

)采用最大

熵[9]模型进行建模,在此框架下,设计一组特征函数

h f(m k,

s

,

t

),其中,f=1,2, ,F,对于每

个特征函数h f,都有相应的模型参数 f,f=1,

2, ,F.因此,依据文献[10]建立基本对齐模型:

P(m k|

s

,

t

)=

ex p F f=1 f h f(m k,s,t)

m

k

ex p F f=1 f h f(m k,s,t)

(3)

我们共采用3个特征计算基本对齐:意译特征、

音译特征、共现特征.具体概率计算根据文献[2],下

文进行简要介绍.

3.1.1 意译特征

采用IBM-1模型的概率,假设

s

包含I个

c1, ,

c i, ,

c I,

t

包含J个词

e1, ,

e j, ,

e J.意译特征表示如下:

h(m k,

s

,

t

)=

lo g P ts(

s

|

t

)+log P ts(

t

|

s

)(4)

其中,P ts(

s

|

t

)和P ts(

t

|

s

)分别

表示英-中、中-英的翻译概率.

3.1.2 音译特征

先将英文实体

t

音译为

t

,

tl

=

arg max

EN E tl

P tl(

tl

|

t

),再通过DICE系数

Dice(

p y

,

tl

)表示和中文实体拼音

p y

和英文实体音译结果

tl

的相近度.因为存在字

符直接转换为拼音的音译方式(比如中文人名翻译

成英文),所以还要考虑中文实体拼音和英文实体

t

的相似性Dice(

p y

,

t

).最后的音译

特征函数取以上两种相似性的最大值:

h(m k,

s

,

t

)=max(Dice(

py

,

tl

),

Dice(

p y

,

t

))(5)

3.1.3 共现特征

共现特征表示的是汉英实体在整个语料库中的

对应频率.

h(m k,

s

,

t

)=

1691

9期陈钰枫等:汉英双语命名实体识别与对齐的交互式方法

count(

s

,

t

)

count(*,t)+

count(

s

,

t

)

count(s,*)

(6)

其中,count(

s

,

t

)表示

s

t

在一

个句子翻译对中同时出现的次数,而

count(

s

,

*)和count(*,

t )分别表示中文实体

s

和英

文实体

t

在语料库中出现的次数.

依据以上的特征函数,根据式(3),我们使用GIS(Generalized Iterative Scaling)算法[11]来训练基本对齐模型的模型参数 f.经过适当的转换,GIS 算法可以用来处理实数值特征.我们采用由Och开发的YASM ET①来执行训练.

基本对齐计算是许多文献普遍采用的方式,在本文作为我们的对齐基准系统.通过增加更多的特征,只能使对齐本身的正确率提高,但无法修正已有的识别错误,因而不能根本上解决实体识别对实体对齐的影响.

3.2 修正对齐计算

由式(2)可以看出,在基本对齐计算后,我们再通过式P(〈a k,ty p e k〉|m k,ChnS,E ngS)进行修正对齐计算,获得修正的对齐a k及其类别ty p e k.为引入双语实体识别与对齐的结合点,我们在修正对齐中引入双语实体翻译对a k的内部词对齐L k.

P(〈a k,ty p e k〉|m,ChnS,EngS)

=P(a k|ty p e k,m k,ChnS,EngS)

P(ty p e k|m k,ChnS,E ngS)

= L

k

P(a k,L k|ty p e k,m k,ChnS,E ngS)

P(ty p e k|m k,ChnS,E ngS)

= L

k

P(L k|a k,ty p e k,m k,ChnS,E ngS)

P(a k|ty p e k,m k,ChnS,EngS)

P(ty p e k|m k,ChnS,E ngS)

L

k

P(L k|CNE k,EN E k,ty p e)

P(a k|ty p e k,m k,ChnS,EngS)P(ty p e k|m k)(7)

假设对于各个类别,上式中的P(ty p e k|m k)平均分布,因此可以被忽略.

P(a k|ty p e k,m k,ChnS,E ngS)

=P(a k,Other T ok ens|ty p e k,m k,ChnS,EngS)

=P(ChnS,Eng S|ty p e k,m k,a k,Other Tok ens)

P(a k,Other T ok ens|ty p e k,m k)/

P(ChnS,Eng S|ty p e k,m k)

=P(ChnS,Eng S|

ty p e k,m k,CN E k,EN E k,OtherT okens)

P(CN E k,EN E k|Other Tokens,ty p e k,m k)

P(Other Tok ens|ty p e k,m k)/

P(ChnS,E ngS|ty p e k,m k)(8)其中,Other Tok ens表示除实体以外在汉英句子ChnS和EngS上的标注,已知P(ChnS,E ngS| ty p e k,m k,CN E s,EN E t,OtherT okens)=1,而且上式中的P(OtherT okens|ty p e k,m k)和P(ChnS,EngS| ty p e k,m k)与每个实体翻译对的候选项〈CN E s, EN E t〉无关,所以在不会影响式(1)最后结果的情况下,我们将P(a k|ty p e k,m k,ChnS,EngS)替换为P(CNE k,EN E k|Other Tokens,ty p e k,m k),假设CN E s和EN E t相互独立,推导如下:

P(CN E k,EN E k|OtherT okens,ty p e k,m k)

=P(CNE k,EN E k|ty p e k)

=P(CNE k|ty p e k)P(EN E k|typ e k)(9)其中的P(CN E k|ty p e k)和P(EN E k|ty p e k)分别是汉英实体的类别模型,为实体识别提供了汉英单语序列上的信息,本文称其为单语序列上的实体置信度,根据文献[1]介绍的命名实体识别的隐马模型,我们可以分别计算汉英序列的实体类别概率P(CNE k|ty p e k)和P(EN E k|ty p e k),相当于引入单语实体识别的概率信息.

另一方面,式(7)中的P(L k|CN E k,EN E k, ty p e k)称为双语序列上的实体置信度,它表示汉英双语序列上实体翻译对的生成,为实体识别提供双语信息.因此,双语序列上的实体置信度体现了双语实体识别和对齐的融合,是下文介绍的重点.假定CN E k=c I1=c1 c i c I,表示该中文实体包含I个字,EN E k=e J1=e1 e j e J表示该英文实体包含J 个词.由于中文分词存在一定的错误,特别是包含音译词的实体,分词问题尤为困难,因此,我们考虑汉英实体包含的词对齐时从英文词e j出发,并且只考虑英文实体所包含的实词,忽略of,fo r等虚词.我们定义(c i,e j)表示c i和e j互为翻译,于是,实体翻译对a k的内部词对齐可以表示为L k=〈(c i,e j)〉N n=1,实际上,c i和e j的对应形式包括意译(Translation, T S)和音译(T ransliteration,T L)两种方式.因此L k进一步定义为L k={〈(c i,e j)〉N n=1, }={T S=〈(c x,e x)ts〉n1x=1,T L=〈(c y,e y)tl〉n2y=1, },表示该内部对齐包含n1个意译对应(c x,e x)ts和n2个音译对应

1692计 算 机 学 报2011年

①http://w https://www.wendangku.net/doc/3415331997.html,rm atik.rwth-aachen.de/Colleagues/

och/s oftw ar e/YASM ET.html

(c y,e y)tl,N=n1+n2.根据第2节的介绍,实体意译或音译的比重与类别密切相关,可区分度比较大.于是我们定义内部词对齐中意译对齐个数所占的比值

=n1

n1+n2来表示意译比重.这样我们在双语序列的实体置信度中又引入了意译比重 .

P(L k|CN E k,E N E k,ty p e)

P(〈c i,e j〉N n=1, |c I1,e J1,ty p e k)

N n=1P(c i|e j,ty p e k) P( |ty p e k)(10) P(c i|e j,ty p e k)在不同类别的双语实体语料库中训练获得.同样,在不同类别的双语实体库中根据频率统计可以获得P( |ty p e k).

综上所述,通过单语序列上和双语序列上的实体置信度计算,完成实体翻译对的修正对齐.修正对齐体现了双语实体识别与对齐的交互.最后,基于3 1节基本对齐计算与本节修正对齐计算的综合,从所有的实体候选翻译对中搜索最优的实体对齐结果.

3.3 搜 索

实体候选项的建立:以实体识别系统获得的汉英实体结果为基准,建立一个滑动窗,可以逐次向内缩减(中文1~4字,英文1~2词)和向外扩展(中文1~4字,英文1~4词),建立一系列汉英实体的候选项.通过组合它们,得到双语实体翻译对的候选项,根据式(2),令每个候选实体翻译对a k的分值为Scor e(a k)=log[P(〈a k,ty p e k〉|m k,ChnS,E ngS)]+

log[P(m k |

s ,

t

)](11)

然后由一种柱搜索(beam search)[12-13]算法获得最优的实体对齐A*,柱搜索算法每次保留N个最好的假设,N表示柱宽度(beam w idth),通过调整N,可以近似地获得全局最优对齐结果.每一个假设的生成过程如下:

1.针对一个汉英双语句子对,通过汉英识别系统获得

识别结果后,基于识别结果(例如,

s

,

t

)建立滑动

窗,产生实体侯选项(例如,CN E k,E N E k),再将所有可能的实体对位a k=(CN E k,E N E k)构成一个候选对位的集合Alig ned-Pairs,并初始化该双语句子的实体对齐假设H为空;

2.根据式(11)的计算,将所有实体候选实体对按降序排列;

3.选取一个和当前假设没有边界重叠的候选项a k= (CN E k,EN E k),由式(2)可以看出,在获得实体翻译对a k的同时,也获得相应的类别ty p e k,一起放入假设H中,相当于对已有假设进行扩展,得到一个新的当前假设;

4.重复步3直到实体对齐假设H不能再继续扩展为止.

每个实体对齐假设就是该汉英双语句子对的一种实体对应结果.我们采用评价函数来估计实体对齐假设.根据式(2),实体对齐假设的评价函数定义为

Scor e(H)= H k=1scor e(a k)(12)基于一定的柱宽度,对所有假设进行评价后,我们可以获得最优的实体对齐结果,然后回溯得到最优实体对齐结果中的所有实体翻译对.

4 实验设计及分析

为了验证本文提出的双语实体交互式对齐模型的有效性,我们进行了以下实验,分别测试了它对汉英文命名实体的识别和对齐的影响.我们从LDC机构发布的汉英文新闻语料库(LDC2005T06)中抽取了300对汉英文句子翻译对作为我们的测试集(抽取的限制条件为:每一个句对中的中文句子或英文句子至少包含一个实体).其中,中文句子的长度平均是58个字;英文句子平均包含24个词.通过人工标注其中的命名实体以及汉英实体间的对应,作为实体识别和对齐实验的标准答案.评估标准采用 正确率(Precision,P) , 召回率(Recall,R) 和 F值(F-sco re,F) .

4.1 汉英命名实体的识别与对齐基准系统

首先,我们分别采用我们实验室开发的多知识源融合的中文实体识别系统[14]和公开开放的基于CRF模型的英文实体识别系统(M allet工具包①)作为实体识别的基准系统.汉英实体的识别基准系统分别识别出685个中文实体和732个英文实体,其不同类别的实体识别性能如表1和表2所示.

表1 中文实体的识别基准系统

性能

P/%R/%F/%人名84 6790 2187 35

地名91 8290 2491 02

机构名85 4282 7584 06

综合87 5288 7588 13

表2 英文实体的识别基准系统

性能

P/%R/%F/%人名79 3585 9682 52

地名86 1781 6683 85

机构名83 3480 1281 70

综合83 1283 5883 34

1693

9期陈钰枫等:汉英双语命名实体识别与对齐的交互式方法

①https://www.wendangku.net/doc/3415331997.html,/index.php/M ain_Page

观察表1和表2,我们发现,在所有类别中,汉英文人名的识别正确率都是最低的,主要原因在于大量地名和机构名简称被错误识别成人名.此外,由于音译词和分词的影响,一些中文人名不能被完整识别出来.根据语料分析,虽然英文具有首字母大写标志的优势,英文实体的边界易于识别,但是其类别判断存在很多错误,因而总体而言,中文实体识别的基准系统要优于英文实体识别的基准系统.

基于识别基准系统得到的汉英文实体,我们采用基本对齐计算作为我们的对齐基准系统.其中,4个特征的训练语料来源于汉英命名实体翻译对语料(LDC2005T34)和汉英双语新闻语料(LDC2005T06),并采用GIZA++工具包[15]训练意译和翻译概率.在搜索过程中,我们采用柱宽度N=5进行搜索.

汉英实体对齐基准系统得到的对齐正确率是66 24%,由于对齐基准系统直接基于识别结果,汉英实体的识别错误在对齐过程中混合扩大,很大程度上影响对齐的效果,导致对齐正确率比较低.

4.2 汉英命名实体交互式对齐系统

基于对齐基准系统,双语实体交互式对齐系统还进行了修正对齐.修正对齐包括单语序列上的实体置信度计算(简称单语修正对齐)和双语序列上的实体置信度计算(简称双语修正对齐).我们采用汉英实体识别基准系统标注汉英双语语料(LDC2005T06),然后在该标注语料上训练得到单语序列上的实体置信度概率;双语序列上的实体置信度概率的训练基于汉英文实体语料库(LDC2005T34)中的人名、地名和机构名翻译对.表3给出对齐基准系统和交互式对齐系统在整体对齐性能上的比较.

表3 不考虑类别的对齐性能比较

模型

性能

P/%R/%F/%

对齐基准系统(基本对齐)72 1276 8374 40

修正对齐74 4579 5276 90基本对齐+单语修正对齐73 3279 1376 11

基本对齐+双语修正对齐77 1982 4479 73交互式对齐系统(基本对齐+修正对齐)79 0784 2681 21

表3比较了不同情况下的实体对齐性能,可以看出,交互式对齐系统,即基本对齐和修正对齐的结合,可以获得最好的性能.同时,引入双语修正对齐的性能要优于引入单语修正对齐的性能,可见在双语修正对齐中引入意译比重和实体类别约束的优势.

交互式对齐系统不仅获得修正后的实体翻译对,还包括汉英实体统一的实体类别,但由于对齐基准系统不能保证每个实体翻译对的类别统一,因此,我们采用以下打分方式进行不同类别的对齐结果比较:一个实体翻译对中,如果汉英实体的类别都判断正确,给1 0分;如果汉英某一个实体的类别判断错误,给0 5分;如果汉英实体的类别都判断错误,给0分,然后将所有实体翻译对的得分相加,作为类别判断的分值.测试语料中实际包含192个人名翻译对,363个地名翻译对和122个机构名翻译对.表4给出了对齐基准系统和交互式对齐系统在类别判断上的分值比较.

表4 对齐性能在类别判断上的比较

对齐基准系统交互式对齐系统人名156181

地名335 5348

机构名99 5117

交互式对齐通过单语序列上的实体置信度(见式(9))和双语序列上的实体置信度(见式(10))对实体类别ty p e k进行了重新判断.相对于实体识别结果来说,实体类别的重新判断融合了单语序列信息和双语序列信息(包括意译比重和实体类别的关系P( |ty p e k)以及实体类别的约束),对实体类别的判断更加有效.从表4我们可以看出,交互式对齐与对齐基准系统相比较在类别判断上有明显的优势,也就是在对齐的同时纠正了实体类别.使每种类别判断普遍提高了十几个分值.证明了交互式对齐对实体类别的修正作用.

交互式对齐系统中的修正对齐计算有助于修正实体的边界和类别,因而在提高实体对齐性能的同时也提高了实体识别的性能.表5和表6分别给出汉英文实体交互式对齐后的实体修正结果.实验结果表明了该交互式对齐模型辅助实体识别的有效性.

表5 双语实体交互式对齐模型修正后的中文实体

性能

P/%R/%F/%人名89 1291 9390 50

地名91 1593 4692 29

机构名87 9885 2686 60

综合89 5190 0589 78识别基准系统87 5288 9588 13

表6 双语实体交互式对齐模型修正后的英文实体

性能

P/%R/%F/%人名84 7889 2386 95

地名86 9485 7686 35

机构名85 6882 9584 29

综合85 8086 5286 16识别基准系统83 1283 5882 84

1694计 算 机 学 报2011年

根据表1和表5的中文实体的识别性能比较,我们发现中文人名、地名和机构名的识别性能(F值)通过双语交互式对齐修正后分别提高了3 15%、1 27%和1 54%.同样,比较表2和表6的英文实体的识别性能,英文人名、地名和机构名的识别性能(F值)通过双语交互式对齐修正后分别提高了3 97%、1 97%和2 08%.

由表5和表6可以很明显地观察到汉英文实体的整体识别性能都有了比较大的提高.虽然由于一些中文人名被错误地修正为地名,造成中文地名的正确率略有下降,但其F值仍有所增加.特别要指出的是,在所有类别中,汉英文人名通过交互式对齐修正后的识别性能提高得最多,主要由于中文人名的边界和英文人名的类别得到了很好的修正.此外,通过统计发现汉英文实体的识别错误通过交互式对齐的修正后,分别相对降低了15 1%和22 6%.

综上所述,交互式对齐模型和普通对齐模型最大的区别体现在:(1)它通过实体识别和对齐的交互,具有修正识别错误的能力,在提高识别性能的同时也提高了对齐性能;(2)如果单语序列的实体识别准确率比较低,将直接影响到双语实体基本对齐.基本对齐的性能也将比较低,因为基本对齐是直接基于实体识别结果的.但在交互式对齐系统中,候选项是在单语实体识别结果的边界缩放基础上建立的,而且实体类别在交互式对齐中还需要重新判断.所以单语实体识别的准确率对交互式对齐的性能没有直接的影响.通过4 1节的数据显示,汉英文实体的识别错误率还比较高,由于新词和不同领域的影响,识别问题尤为困难.在此基础上的双语实体对齐如果无法修正识别结果,即使采用更多、更好的对齐特征,也无法从根本上提高对齐性能.通过实体识别与实体对齐的结合,有效引入双语对齐信息对实体识别的辅助,使对齐过程具有修正实体识别的能力,为实体识别和对齐性能的提高开辟了新的途径.本文的双语实体交互式对齐模型是双语实体识别和对齐相结合的初探,还有待进一步的研究.

5 结束语

在自然语言处理系统中,命名实体识别是一项基本任务,也是一个难以完善解决的问题.中文实体的识别由于分词、外来词的影响,实体边界尤其难以识别;而英文实体的类别错误判断问题更为突出.命名实体的识别性能直接影响实体的对齐性能.已有的实体对齐系统融入多种特征主要用于提高对齐本身的性能,但却不能实质解决实体识别错误的影响.根据汉英文命名实体的特性分析,我们发现:一方面,如果实体识别引入双语对齐信息,可以使两种语言的特性互补,而提高识别性能;另一方面,如果实体对齐引入对实体识别结果的修正能力,可以降低识别错误的影响,而提高对齐性能.因此,本文提出一种汉英双语实体交互式对齐模型.包括基本对齐计算和修正对齐计算.其中修正对齐计算根据单语和双语序列上的实体置信度,对实体的边界和类别重新判断,实现了双语实体识别与对齐的交互.实验证明,本文提出的双语实体交互式对齐模型不仅将实体对齐性能(F值)提高了6 8(%),而且分别有效提高了汉英文实体的识别性能.这充分说明了双语命名实体识别与对齐结合的有效性.

参考文献

[1]H uang Fei,Vogel S,Waibel A.Autom atic extraction of

named entity translingual equivalence bas ed on m ult-i feature

cos t minimiz ation//Proceedings of the2003Annual C onfer-

en ce of the ACL,W orksh op on M ultilingu al and M ix ed-lan-

guage Nam ed Entity Recognition.Sap por o,Japan,2003:

184-192

[2]A-l Onaiz an Y,Knig ht K.Translating nam ed entities us ing

monolin gual and bilingual resources//Proceedings of the40th

Annu al M eeting of the As sociation for Computational Lin-

guistics(ACL).Philadelphia,PA,USA,2002:400-408 [3]Fen g Don ghui,Lv Yajuan,Zhou M ing.A n ew approach for

English-Chinese named entity align men t//Proceedin gs of the

Conference on Empirical M ethods in Natu ral Lan guage Pro-

cessing(EM NLP2004).Barcelona,2004:372-379

[4]Lee Chun-J en,Ch ang Jason S,Jan g Jyh-Sh ing R.Alignment

of bilingual n am ed entities in parallel corpora usin g statistical

models and mu ltiple know ledge sources.ACM T rans action s

on Asian L anguage Information Pr oces sing(T ALIP),2006,

5(2):121-145

[5]M oore R C.Learning translations of n amed-entity phrases

from parallel corpora//Pr oceedings of10th Conference of the

Eur op ean Ch apter of AC L.Budapes t,H ungary,2003:456-

464

[6]Kris hman Vijay,M an ning Chris toph er D.An effective tw o-

stage m odel for exploiting non-local dependen cies in n amed

entity recognition//Proceedings of the44th Annu al M eeting

of ACL.Sydney,2006:1121-1128

[7]Ji H eng,Grishman Ralph.C ollab orative entity extraction

and trans lation//Proceedin gs of the International Conference

on Recent Advan ces in Natural Langu age Process ing.

Borovets,Bulgaria,2007:231-238

1695

9期陈钰枫等:汉英双语命名实体识别与对齐的交互式方法

[8]Chen H sin-H is,Yan g Changhua,Lin Ying.L earning formu-

lation an d tran sformation rules for m ultilingual nam ed ent-i

ties//Proceedings of the ACL2003W orksh op on M ultilingual

and M ixed-language Named Entity Recognition.Sapporo,

Japan,2003:1-8

[9]Berger Adam L,Della Pietra Stephen A,Della Pietra Vin-

cent J.A max imum entropy app roach to natural language

https://www.wendangku.net/doc/3415331997.html,putational Linguis tics,1996,22(1):39-72 [10]Och Franz Jos ef,Ney H erman n.Discriminative train ing and

max imum entropy m odels for statistical mach ine transla-

tion//Proceeding s of the40th Annual M eetin g of th e ACL.

Ph ilad elphia,PA,US A,2002:295-302

[11]Darroch J N,Ratcliff D.Generaliz ed iterative scalin g for log-

linear models.Ann als of M athematical S tatistics,1972,43

(5):1470-1480[12]T illmann,Ch ristoph,Hermann Ney.Word reordering and

dynamic programm ing beam search alg orith m for statistical

machin e translation.C om putational Linguistics,2003,29

(1):97-133

[13]Koeh n,Philipp.Ph araoh:A beam search decod er for

ph ras e-based s tatistical m achine tran slation models//Pro-

ceedings of the As sociation for M achine Trans lation in the

Americas(AM T A).W as hington,DC,USA,2004:81-89 [14]W u Youz heng,Zhao Jun,Xu Bo.Chinese named en tity rec-

ognition m odel b as ed on m ultiple featu res//Proceedings of

the H LT/EM NLP.Vancouver,BC,Canada.2005:427-434 [15]Och Franz Josef,Ney H erm ann.A s ystematic comparison of

various statis tical alignment https://www.wendangku.net/doc/3415331997.html, putational Linguis-

tics,2003,29(1):19-

51

CHEN Yu-Feng,bo rn in1981,

Ph.D.,assistant researcher.H er r e-

sea rch interests focus o n natural lan-

guag e pro cessing and machine tr ansla-

tio n.

ZONG Cheng-Qing,bor n in1963,P h.D.,pr ofesso r,

P h.D.superv isor.His research interests include machine

tr anslation,tex t classificatio n,and syntactic par sing as well.

SU Keh-Yih,bor n in1955,Ph.D.,professor.H is cur-

rent research area isstat istical machine learning w ith applica-

tio n to natural lang uage processing.H e is now focusing on

develo ping a hig h quality M T system for tr anslating Eng lish/

Chinese technica l manuals.

Background

M ost ar tificial intellig ence sy stems,such as info rmation

ex tr act ion or machine translation system,adopt pipeline ar-

chitecture,in w hich stages of analy sis ar e ar rang ed sequen-

t ially,with each stag e using the results of prior stag es and

generating a sing le analysis that gets enriched by each stag e.

U nfo rtunately,each stag e also intr oduced a certain level o f

erro r to the later stage.F or example,in traditional pipe-

lined sy st ems,name entity(N E)r eco gnition is o ne o f the

first steps in the pipeline,N E err or s heav ily affect subse-

quent stages,and er ro r rates ar e o ften compounded by later

stag es,w hich is ev ident in N E alignment stag e.

In mo st pr io r wo rk,NE recog nitio n and alig nment ar e

pr ocessed sequentially,w ithout r eco ver ing N E r eco gnition

erro rs.T herefo re,the tagg ed erro rs ar e compounded fro m

stag e to stag e.It is possible to co nsider ho w inter act ions be-

tw een t he N E recog nitio n and alig nment stag e can be ex plo-i

ted t o reduce the er ro r rate.H ow ever,litt le research has

been devo ted to a joint N E alig nment mo del w ith N E reco gn-i

t ion.

T his paper establishes an alig nment der ivat ion frame-

w or k in o rder to inco rpor ate N E r ecognit ion,and then pr opo-

ses an interactiv e N E alig nment model,w hich breaks a new

path fo r N E recog nitio n and alig nment,and makes much im-

pr ovement on t he perfo rmance of N E alignment,as w ell as

N E r eco gnit ion.

T he r esear ch w or k descr ibed in t his ar ticle has been par-

t ially suppor ted by the N atio nal Natur al Science Foundation

of China under g rant N o 60575043,and N o 60736014,N a-

t ional K ey T echnolog ies R&D P ro gr am of China under g rant

No 2006BAH03B02,and N ational H ig h T echnolog y Re-

search and Develo pment Pro gr am(863P ro gr am)o f China

under g rant N o 2006A A010108-4.

1696计 算 机 学 报2011年

文献检索中英文检索报告例子

2014年4月文献检索课中英文检索作业学院:软件学院班级:软工1203 姓名:何常鸣学号: 20124722

*********外文检索式中至少有一个使用expert search进行检索***中文检索式高级界面与专家界面相同的,截专家界面;不同的检索式分别截图;外文相同的检索式quick search 与expert search界面都要截图**** 检索结果:(要求每个检索式所检出的文献不要超过50篇,列出检索结果前3篇文献信息)1. (气体) and (燃料电池)and (核反应堆or反应堆) [1]吴震宇. 车载燃料电池用空气压缩机工作性能研究及能效分析[D].浙江大学,2007.

[2]张红敏. Zr(1-x)M_xP_2O_7(M=In、Zn、Sc)的合成、导电性研究[D].苏州大学,2012. [3]王洪涛. SnP_2O_7基中温离子导体的电性能研究[D].苏州大学,2012 SU=(气体)*(燃料电池)*(核反应堆+反应堆) [1]吴震宇. 车载燃料电池用空气压缩机工作性能研究及能效分析[D].浙江大学,2007. [2]施涛,高山. 燃料电池发电技术原理及其应用[J]. 电力需求侧管理,2006,05:58-60. [3]陶国良,吴震宇. 车载燃料电池用离心压缩机的仿真和实验研究[J]. 浙江大学学报(工学版),2008,05:830-834.

3. (gas) and (flow field or stream field) and (component or constituent ) and fuel cell and nuclear reactor 共检索出文献7篇 1. Development of a tricarbide foam fuel matrix for nuclear propulsion Youchison, Dennis L. (Sandia National Laboratories, MS-1129, PO Box 5800, Albuquerque, NM 87185-1129); Lenard, Roger X.; Williams, Brian E.; Anghaie, Samim Source:American Nuclear Society Embedded Topical Meeting - 2005 Space Nuclear Conference, p 258-268, 2005, American Nuclear Society Embedded Topical Meeting - 2005 Space Nuclear Conference Database: Compendex 2. A tricarbide foam fuel matrix for nuclear thermal propulsion Youchison, Dennis L. (Sandia National Laboratories, MS-1129, PO Box 5800, Albuquerque, NM 87185-1129); Lenard, Roger X.; Williams, Brian E.; Stewart, Timothy

岗位名称的中英文对照

岗位名称的中英文对照 1.MAKETING AND SALES(市场与销售部分) Vice-President of Sales 销售副总裁 Senior Customer Manager 高级客户经理 Sales Manager 销售经理 Regional Sales Manager 地区销售经理 Procurement Manager 采购经理Procurement Agency 采购代办所Sales Assistant 销售助理 Wholesale Buyer 批发采购员 Tele-Interviewer 电话调查员 Real Estate Appraiser 房地产评估师 Marketing Consultant 市场顾问 Marketing and Sales Director 市场与销售总监 Market Research Analyst 市场调查分析员 Manufacturer’s Representative 厂家代表 Director of Subsidiary Rights 分公司权利总监 Sales Representative 销售代表 Assistant Customer Executive 客户管理助理 Marketing Intern 市场实习 Marketing Director 市场总监 Insurance Agent 保险代理人 Customer Manager 客户经理 Vice-President of Marketing 市场副总裁 Regional Customer Manager 地区客户经理 Sales Administrator 销售主管 Telemarketing Director 电话销售总监 Telemarketer 电话销售员 Sales Executive 销售执行者 Marketing Assistant 市场助理 Retail Buyer 零售采购员 Real Estate Manager 房地产经理 Real Estate Broker 房地产经纪人 Purchasing Agent 采购代理 Product Developer 产品开发 Marketing Manager 市场经理 Advertising Coordinator 广告协调员 Advertising Assistant 广告助理 Ad Copywriter(Direct Mail) 广告文撰写人 Customer Representative 客户代表 https://www.wendangku.net/doc/3415331997.html,PETER AND MATHEMA TICS(计算机部分) Manager of Network Administration 网络管理经理 MIS Manager 电脑部经理 Project Manager 项目经理

中英文对照版

中英文对照版 自检互检,确保产品零缺点! Self and mutual inspection, make sure zero defection! 杜绝不良思想,发扬优质精神! Prevent unhealthy thinking; develop high quality inspirit. 持续的质量改进,是我们永恒的目标。 Quality continuous improvement is our eternal objective. 积累点滴改进,迈向完美品质。 Accumulate every improvement is led to Perfect quality 培养优质素养,提高团队力量。 Quality-cultivation,Strengthens our team 不为失败找理由,要为成功找方法。

Do not make excuses for failure, but find a way to solve it. 客户满意,是检验我们工作的唯一标准。 Customer satisfaction is the only benchmark to inspect our works. 没有执行力,就没有竞争力。 No implementation power; no competitiveness advantage. 执行力文化,是从负责任开始的。 Implementation starts from taking responsibility 消除一切浪费,追求精益求精和不断改善。 Stop waste to pursue perfection and constant improvement 。 节约是美德,珍惜能源点滴。 Saving is our virtue, treasure every bit of resource 。 努力是将工作做完,用心是将工作做好。

搜索英文文献的方法

如何搜索英文文献 【导读】 ①:正式发表的论文一般要进入大型的期刊论文数据库里检索; ②:搜索引擎更适合搜索普通的英文资料和论文检索入口。 一、哪里去搜索 1)图书馆 包括高校的图书馆、科研单位的图书馆、地方图书馆(如:国家图书馆、上海图书馆) 图书馆一般购买了大量的期刊论文数据库,供内部人员免费使用。 有中文为主的万方、维普,有外文的ProQuest、Springer 等。 注1:图书馆一般都提供文献代检服务,不过可能要收取一定费用。 注2:通过IP 代理的方式可以访问图书馆的这些数据库,不过是非法的。 2)利用在线期刊、论文数据库 国内的有: 中国知网:国家科技图书文献中心:万方

数据:或…… 国外的有:ScienceDirect:::…… 注:当然,除了国外的部分数据库有少量文献可以免费查看全文之外,都是要付费的。 这就需要登录这些数据库的帐号和密码,或者是代理IP。 3)利用搜索引擎 一般来说,英文的用Google 来搜索要好一点,因为它收录了大量国外的网站。 而百度主要针对国内的,如果你的话题是特别中国化的,那么百度也是不错的选择。 由于正式文档一般都采用pdf,要搜索pdf 文档,只需在关键词后,加个filetype:pdf 即可 除了以网页模式之外,还可以在Google 学术里或是百度文档里搜索,二者互为补充。 注:具体参见《搜索引擎常用技巧——英文资料篇》

4)利用免费文献网站 免费和收费是相对的,有些网站是全面免费,有些是部分免费, 而有些是等论文发表过了一定期限后才免费。 HighWire Press:::更多网站>> 5)向论文作者或网友求助 直接给论文作者发电子邮件,还是有一定机会得到回复的。 另外,有些作者会把自己的论文放在个人网站上。 至于网络求助,可以进入高校的论坛或者一些学术网站。 二、如何确定英文关键词 搜索英文资料的关键,还是要找到准确描述搜索内容的“英文关键词” 大家可以去这儿查: 1)知网翻译助手:(因为是根据论文内容来确定的,词汇或表达都比较准确)2)爱词霸:(金山词霸里有不少专业词典,网上的“百科词典”里的词条也有参考价值)

专业英语的命名方法—比较系统

无机物英语命名法一单原子离子 1正离子 Cu+copper(Ⅰ) Cu2+copper(Ⅱ) 2负离子-ide Sulfide S2- Nitride N3- Oxide O2- 氟fluorine F- fluoride 氯chlorine Cl- chloride 溴bromine Br- bromide 二多原子离子 1 -ate -ite NO3-nitrate CO32- carbonate NO2-nitrite OH- hydroxide SO42-sulfate SO32- sulfite HCO3- hydrogen carbonate HSO4-hydrogen sulfate H2PO43- dihydrogen phosphate 2 Fewest Oxygen Atoms hypo—ite Fewer Oxygen Atoms —ite More Oxygen Atoms —ate Most Oxygen Atoms per —ate ClO- hypochlorite ClO2- chlorite ClO3-chlorate ClO4-perchlorate 三两种元素组成的化合物 FeO iron( II ) oxide (ferrous oxide) Fe2O3iron( III ) oxide (ferric oxide) SnCl4tin(IV) chloride PbO2lead(IV) oxide 金属氢化物一般命名规则:金属名+hydride CaH2 calcium hydride NaH sodium hydride 非金属氢化物一般命名规则: hydrogen+非金属+ide HCl hydrogen chloride H2S hydrogen sulfide (sulphide) HF hydrogen fluoride SiC silicon carbide 非金属氧化物命名:非金属名+n-oxide (l)mono- (2)di- (3)tri- (4)tetra- (5)penta- (6) hexa- (7)hepata- (8)octa- (9)nona- (10)deca-

持续改善 Kaizen 的方法和手段

持续改善Kaizen 的方法和手段 持续改善的手段 KAIZEN以标准化、5S 和消除“浪费(Muda)”,来达到企业的QCD(质量、成本和交货期)目标。 标准化、5S 以及消除“浪费”(Muda)这三种活动是企业建立起高效、成功和扁平化的工作现场(Gemba)结构的基础。因为操作它们并不需要复杂的工艺和特别宽的知识面,所以易于理解和导入。但是,如何使员工树立起自律性(self-discipline)并将它们不断推向前进却是困难之所在。 1、标准化 为了达到企业的QCD 目标,企业必须合理利用一切可用资源,对人员、信息、设备和原材料的使用,每天都需作出计划,利用关于使用这些资源的标准有助于提高计划的效率,如果在计划的执行中出现问题或偏差,企业领导就应及时找出问题的真正原因,并将现有标准修改或完善以避免问题的再次出现,标准是KAIZEN 的固定组成部分,它为进一步完善提供基础。工作领域标准化的含义就是指将工程师的工艺或设计要求转换成工人们每天必须遵守的工作指令。 2、5S 5S 代表了5 个日语词,是指整洁、有序,对任何一个加工型的企业来说,如果是一个负责任的生产商并且想成为世界一流的公司,那么5S作为基础是应该必须实施的,对每个岗位和个人都必须单独确定5S 规则,制订有关5S标准并使之遵守。 5S 的内容是: Seiri:整顿,即把不必要的东西清除出现场; Seiton:整理,即把留下的东西归类;

Seiso:清洁,即对设备及周围环境进行彻底清洁; Seiketsu:检查,即运用上述三项原则并注重自身行为; Shitsuke:素养,即自觉性。 3、消除Muda(7大浪费) Muda 在日语中是“浪费”,它另有一层深的含义,工作是由一系列的过程或步骤组成的,从原材料或信息开始,到产成品或服务结束,在每个过程中都应增值,然后进入下一过程,在每个过程中作为资源的人和设备要么使产品增值,要么无,Muda 就是指每个没有使产品增值的活动或过程,一般将可能引起Muda 的原因划分如下: 过量生产引起的Muda 库存引起的Muda 次品/返工引起的Muda 动作(行动)的Muda 生产中的Muda 等待所产生的Muda 运输过程中的Muda 4、遵循KAIZEN 五条“黄金”法则: 1) 如果发生问题,首先去现场 2) 检查发生问题的对象 3) 立刻采取暂时性的措施 4) 查找问题产生的真正原因 5) 使应对措施标准化,以避免类似问题再次发生 实施持续改善时应遵循的原则 1、丢掉对工艺原有的僵化的看法

英文文献检索

文献检索是非常麻烦的事情,一般都是通过各种数据库进行检索,但由于购买的电子数据库基本都只有1997年以后的文献,文献量比较少,而且很多领域属于落后于国外20-30年的研究,一般很难查到,即使能查到出处,但无原文。文献查找是个费时费力的事情,需要细心和耐心,反复查找,以下谈谈个人关于如何利用网络进行文献查找的一些经验。 ①搜索引擎的高级功能 搜索引擎主要https://www.wendangku.net/doc/3415331997.html,和https://www.wendangku.net/doc/3415331997.html,,https://www.wendangku.net/doc/3415331997.html,则仅在检索中文时稍好点,英文很差,用处不大。我们常用的google侧重于网页的检索,Scholar则主要针对学术类文献进行检索,格式主要是pdf,对于论文的引用也会显示,对于知道文献名和作者的情况比较容易直接找到pdf文档,一般这两个搜索引擎要联合使用。 Google的高级检索功能中有几个常用的功能: (1)锁定关键词检索:使用双引号如”停车”,则所有检索结果均包含双引号中的内容,以减少检索结果量; (2)文件类型检索:文件类型主要是.pdf和.doc文档,国外文献大部分以pdf格式发布,使用格式限制可以排除很多不必要的检索结果,如输入:停车filetype:pdf,当然其它google 识别的格式都可使用; (3)指定网址检索:如果发现某个网站有需要的文献,则可以直接指定到该网站检索,以获得需要的资料,如输入:停车site:https://www.wendangku.net/doc/3415331997.html,。 Google的详细功能请参照google的高级检索,百度在使用上相同。 ②关键词的使用 检索结果如何,和关键词的使用直接相关,所以,首先要弄清楚在英文中关键词有哪几种表达方式,分别进行检索,而对于文献综述类,可以使用:review、overview、literature review、history、development、trend等和关键词一起检索。 关键词的检索并不是一次就能确定下来的,刚开始选用几个看能否找到,如果找到一些,先初步看看那些文献,对内容有了更深一些的认识后同时也对检索关键词增加了了解,实际上是不断调整检索关键词的过程 ③参考文献的使用 检索到一些文章后,先要看看文献后的参考文献,国外文献一般都会很详细的列出,可根据参考文献相应的进行有目的的检索,如找到指定数据库的期刊,或者检索作者,作者的个人主页一般提供作者本人发表文献的下载(最好的资源),有些还提供作者的E-mal,可直接写信给作者,一般对方都会提供。 另外,利用google的强大功能,对论文题名、期刊和作者进行检索,期刊的检索经常能发现该期刊被那个数据库收录,则可直接到相应的数据库找到,检索作者则最好加关键词、年等信息以缩小检索范围,而且不要用缩写,会忽略很多信息。 如果找到某个期刊历年的电子数据库,虽然网站有自己的检索功能,但最好不要检索之后其它就放弃了,实际上很多文献不一定检索得到,需要有耐心的一期一期的去看(当然实际上这个工作量并不大,国外的期刊一般每期也就10篇左右),但如果错过了需要的文献则损失

各部门名称之中英文对照

各部门名称之中英文对照 总经理室:PO(President Office) 资讯管理室:IT (Information Technology) 资料中心:DCC(Document Control Center) 厂务室:Administration Dept. 图书室:Library 前台:(Reception Desk) 人力资源部:HR (Human Resource Department) 专案二部:PM (Project ManagementⅡ) 营运部:Marketing / Sales Dept. 财务部:Financial Dept. 研发中心:RD(Research and Development) 研发电子:RD EE 研发机构:RD ME 研发喇叭:RD Spk 研发系统:RD System 研发包装:RD Packaging 研发DQE (Design Quality Engineer) 研发JQE (Joint Quality Engineer) 品保部:QA(Quality Assurance) FQC ( Final Quality Control) IQC (Incoming Quality Control) 实验室:Testing Room 运作部:Operation Dept. 生管课:PMC(Production Management &Control) 资材课:Warehouse 报关室:Customs Office 采购部:Pur(Purchasing department) 生产一部:Production Dept.Ⅰ 电子课:PCBA Production Line SMT:(Surface Mounting Technology) 生产二部:Production Dept.Ⅱ 喇叭课:Transducer P roduction Line 音箱课:Final Assembly P roduction Line 管控中心:SPC (Statistical Process Control) 工程部:Engineering IE : Industry Engineering PE: Product Engineering 设备课: Equipment Division 企业文化规划/2011.8.5

如何快速准确查找英文文献

1、首先必须具有良好的英文基础。通过研究生考试的当然应该不成问题。 2、查找资料前做好充分的准备。老话说,磨刀不误砍柴工。要充分熟悉你想找的资料的大体方向、结构、年代、国别、关键词等等。这有一个前提就是你对你所作选题的深入思考。举个例子:你想查找衍生品方面的国外资料,首先要思考你想找关于衍生品哪方面的文章?衍生品包括哪些具体内容?关键词分别是什莫? 3、做好准备之后,你就可以开始了。一些常用的工具:(1)google (2)各种外文数据库。我们图书馆主页上也有一部分,但是很不全面。国内最齐全的在北大图书馆,但收费很贵(每小时10元,下载每兆1元)。(3)国图外文期刊、书籍。(4)各种国外的研究与专业网站。比如,NBER,OECD,BIS,ICI等等,这些网站要根据自己的研究方向长期跟踪。 4、一个捷径:先查找国内的相关论文,再去找国外资料。好处有二:一是对选题方向的熟悉,二是国内论文的外文参考文献会给你很多启发。 5、一点感想:做研究,某种意义上是体力活。查资料是个很累的活儿,相信大家都有感触。所以在这个过程中,保持体能的充沛、观察力的敏锐、态度的认真和坚持追求完美的理念异常重要。二、经济学专业文献(英文)阅读技巧 XX: 1、先认真细致地啃下一两篇经典论文,掌握英文论文的研究与写作规范后,就可以快速、大量地阅读了。速度会很快的,不妨试试!!! 2、参考文献不一定全读,但相关知识背景一定要事先有所了解,这样效率会高点,然后一篇论文分几部分来看,最后再串一次。 3、刚开始看时,不必想太多,能把文章看懂即可;再读时,可研究为什么研究这个问题,为什么做这样的假设,为什么这样设定模型;之后,结合其它相关文献理解这篇文章在文献中的意义;最后,你可以寻找它的缺陷了。 4、最重要的是多读,看惯了就好了,千万要克服看到英文就烦的心理。 5、国内文章的一个不足是,形式上开始逐渐采用洋八股,但形似而神不似,各部分之间内在联系不足,如文献回顾和假设、模型之间没有内在联系,一般来说,实证性文章如果假设找不到对应的文献回顾,可能是有缺陷的。阅读时,应该逐步理解洋八股各部分的内在联系,有助于今后的写作。 转帖:1.如何进行文献检索 我是学自然科学的,平时确实需要不少外文文献,对于自然科学来讲英文文献检索首推Elsevier,Springer等。虽然这些数据库里面文献已经不算少了。但是有时还会碰到查 不到的文献,而这些文献的数据库我们所在研究所或大学又没有买,怎么办?我基本通 过以下向个途径来得到文献。 1.首先在Google 学术搜索里进行搜索,里面一般会搜出来你要找的文献,在Google学 术搜索里通常情况会出现“每组几个”等字样,然后进入后,分别点击,里面的其中一个 就有可能会下到全文,当然这只是碰运气,不是万能的,因为我常常碰到这种情况,所 以也算是得到全文文献的一条途径吧。可以试一下。 2.如果上面的方法找不到全文,就把文章作者的名字或者文章的title在Google 里搜索(不是Google 学术搜索),用作者的名字来搜索,是因为我发现很多国外作者都喜欢把 文章的全文(PDF)直接挂在网上,一般情况下他们会把自己的文章挂在自己的个人主页(home page)上,这样可能也是为了让别的研究者更加了解自己的学术领域,顺便推销 自己吧。这样你就有可能下到你想要的文献的全文了。甚至可以下到那个作者相近的内 容的其它文章。如果文献是由多个作者写的,第一作者查不到个人主页,就接上面的方

英文文献检索的方法及全文数据库的

英文文献检索的方法及全文数 据库的应用

Elseviver SDOS(SciebceDirect)全文数据库Elsevier科学出版公司是世界著名的出版公司,已有100多年的历史。除了出版图书外,还是当今世界最大的学术期刊出版商,内容涉及生命科学,物理,医学,工程技术及社会科学,其中许多为核心期刊。近年来,该公司又合并了一些出版社,如Academic Press的170多种学术期刊数据也已加入到国内的ScienceDirect镜像站。 现在可以访问到1995年至今超过2000种期刊。主要包含如下学科:

?ScienceDirect https://www.wendangku.net/doc/3415331997.html,/ ?杂志数:1800 ?学科:23 ?SCI收录:1393 ?收录论文数:600万

?Elsevier Science是一家设在荷兰的历史悠久 的跨国科学出版公司,该公司出版的期刊是世界公认的高品位学术期刊,且大多数为核心期刊,被世界上许多著名的二次文献数据库所收录。近年来,该公司收购了许多出版公司,包括美国的Ei公司, Harcourt 公司(包括Academic Press)等。ScienceDirect全文数 据库涵盖了数学、物理、化学、天文学、医学、生命科学、商业及经济管理、计算机科学、工程技术、能源科学、环境科学、材料科学、社会科学等众多学科,并通过网络提供服务

Agricultural and Biological Sciences(138种) Biochemistry, Genetics, and Molecular Biology(156种) Business, Management and Accounting(84种) Chemistry(116种) Chemical Engineering(93种) Civil Engineering(58种) Computer Science(116种) Earth and Planetary Science(86种) Economics, Econometrics and Finance(66种)Energy and Power(53种) Engineering and Technology(184种)Environmental Science(74种) Materials Science(116种) Mathematics(60种) Medicine(270种) Physics and Astronomy(88种) Social Sciences (131种)

中英文职务名称 简单 对照表

中英文职务名称对照表 Developmental Educator 发展教育家 Head Teacher 高级教师 Foreign Language Teacher 外语教师Librarian 图书管理员 Guidance Counselor 指导顾问Music Teacher 音乐教师Library Technician 图书管理员Nanny 保姆 Physical Education Teacher 物理教师Principal 校长School Psychologist 心理咨询教师Teacher 教师 Art Instructor 艺术教师Computer Teacher 计算机教 师 College Professor 大学教授 Coach 教练员 Vocational Counselor 职业顾问Tutor 家教、辅导教师 Retail Store Manager 零售店经理 Food Service Manager 食品服务 经理 Executive Marketing Director 市场行政总监HMO Administrator 医疗保险管理 Assistant Vice-President 副总裁助理 Production Manager 生产经理 Chief Executive Officer(CEO) 首席执行官 Property Manager 房地产经理 Chief Operations Officer(COO)首席运营官 Branch Manager 部门经理Controller(International) 国际监管 Claims Examiner 主考官 Director of Operations 运营总监Controller(General) 管理员Field Assurance Coordinator 土地担保协调员General Manager 总经理 Hospital Administrator 医院管理 President 总统

常用职业类别名称中英文对照

计算机/互联网/通讯Technology/Internet 首席技术执行官CTO/VP Engineering 技术总监/经理Technical Director/Manager 信息技术经理IT Manager 信息技术主管IT Supervisor 信息技术专员IT Specialist 项目经理/主管Project Manager/Supervisor 项目执行/协调人员Project Specialist / Coordinator 系统分析员System Analyst 高级软件工程师Senior Software Engineer 软件工程师Software Engineer 系统工程师System Engineer 高级硬件工程师Senior Hardware Engineer 硬件工程师Hardware Engineer 通信技术工程师Communications Engineer ERP技术/应用顾问ERP Technical/Application Consultant 数据库工程师Database Engineer 技术支持经理Technical Support Manager 技术支持工程师Technical Support Engineer 品质经理QA Manager 信息安全工程师Information Security Engineer 软件测试工程师Software QA Engineer 硬件测试工程师Hardware QA Engineer 测试员Test Engineer 网站营运经理/主管Web Operations Manager/Supervisor 网络工程师Network Engineer 系统管理员/网管System Manager/Webmaster 网页设计/制作Web Designer/Production 技术文员/助理Technical Clerk/Assistant 其他Other 销售总监Sales Director 销售经理Sales Manager 区域销售经理Regional Sales Manager 客户经理Sales Account Manager 渠道/分销经理Channel/Distribution Manager

中国知网等文献检索的一般方法

文献检索一般方法 同学们: 可能你们目前接触到的文献并不多,但以后你的作业和设计很大一部分要求自己查阅文献,期刊,论文来解决(比如说:微生物学,微生物工程工艺原理,酶工程,白酒工艺学,啤酒工艺学,食品安全学,白酒勾兑等)。在四川理工学院我们检索文献的方式不外乎在图书馆找纸质档案和网络检索两种,因为我们通常使用的文献都要求是近三年核心期刊发表的文章,因为只有这些才能反映某个领域目前发展的现状,所以我们一般都偏向于跟新更快的网络搜索,其中又以知网和超星使用最多。下面简单介绍文献检索的一般方法,希望能给大家的学习,包括实验室学习带来一点帮助,有不明白的地方请直接联系我。 1、检索课题名称(中英文) 计算机在中学物理中的应用 The application of computer to physics in middle school 2、分析研究课题 随着计算机技术的不断发展,计算机在教育中的作用愈发突出。在中学物理教育 中,同样可以引入计算的先进技术,改进教育方法,提高教学效率。如今,计算机在 中学物理中的应用主要体现在以下几个方面: 1)计算机技术在课件制作中的应用。 2)计算机在实验仿真中的应用。 3)计算机在教学数据处理中的应用。 根据以上分析,本课题主要是根据计算机在中学物理教学中的几个应用进行相关 材料的查找。 3、检索策略 3.1 检索工具 1)利用“中国知网”查找有关硕士、博士论文。 2)利用“中国期刊全文数据库”查找相关期刊论文。 3)利用“维普科技期刊数据库”查找相关期刊论文。 4)利用“超星数字图书馆”查找相关图书。 5)利用“SpringLink”查找相关论文。

中英文翻译(修改)

建筑结构在冲击负载作用下连续倒塌分析方法 摘要:建筑物在冲击负载作用下的连续倒塌已经引起了全世界的极大关注。对于一个经济的,安全的,能够抵抗冲击负载作用下连续倒塌的建筑结构设计,连续倒塌分析是必不可少的。因为连续倒塌的灾难性特点,和为了抵抗它而潜在的建造和改造建筑物的高额费用,所以连续倒塌分析方法是绝对必要且可信的。对于工程师们而言,他们估算连续倒塌的方法不仅仅要求精确和简要,而且容易上手,立竿见影。因而,最近许多研究者都在发展可靠有效和直接的连续倒塌分析方法上花费了很多的精力。在最近的干物上,当前在文献资料中找得到的关于连续倒塌的分析方法被重新审阅。人们广泛讨论它们的适宜性、适用性和可靠性。我们也提出了最近刚刚完成的关于钢筋混凝土框架在爆破荷载下的连续倒塌新分析方法。 关键词:连续倒塌分析;建筑结构;爆炸荷载;冲击荷载 连续倒塌被定义为“由于一个基本的局部构件失效在构件之间扩散最终造成整个结构或者是不成比例的一大部分倒塌”。其含义为一个或者一组关键承重构件的失效造成周围构件的失效和部分或者是整个结构的倒塌。建筑结构的连续倒塌可能由一系列的意外和人为的因素造成,比如:错误的建造顺序,偶然过载造成的局部失效,爆炸和地震造成的关键组件的损坏。这篇论文仅仅研究了特殊荷载(如:爆炸和冲击),造成的建筑结构连续倒塌的分析。 随着最近Alfred P.Murrah联邦大楼和世界贸易中心(WTC)的倒塌,许多的研究更多的关注如何建造抵抗由于爆炸和冲击荷载造成连续倒塌的建筑。对于一个经济的,安全的,能够抵抗冲击负载作用下连续倒塌的建筑结构设计,连续倒塌分析是必不可少的。因为连续倒塌的灾难性特点,和为了抵抗它而潜在的建造和改造建筑物的高额费用,所以连续倒塌分析方法是绝对必要且可信的。对于工程师们而言,他们估算连续倒塌的方法不仅仅要求精确和简要,而且容易上手,立竿见影。因而,最近许多研究者都在发展可靠有效和直接的连续倒塌分析方法上花费了很多的精力。

有机化合物系统英文命名法

与无机物质的英文命名相比较[1],有机化合物 的命名显得更为复杂。它不仅要考虑化合物分子 中的原子组成及数目,而且要反映出其中所含的官 能团种类。为了促进大学化学化工学科双语教学 的实施,帮助学生阅读化学化工的英文文献,笔者在此对有机化合物的英文命名方法作一简要归纳和介绍。 1有机化合物的官能团分类 有机化合物种类繁多,数目庞大,而且新的有机物质还在不断地合成和发现出来。为了系统地进行研究,化学家对有机化合物作了严格、科学的分类。物质的性质与物质的结构密切相关。体现有机化合物主要结构特征的是其分子中的官能团(functional group)。官能团决定着有机化合物的性质,所以按照官能团来对有机化合物进行分类是有机化学常用的一种分类方法。根据不同的官能团,有机化合物主要可分为:烃(hydrocarbon)、醇(alcohol)、醚(ether)、醛(aldehyde)、酮(ketone)、羧酸(carboxylic acid)、酯(ester)、胺(amine)、酰胺(amide)、氨基酸(amino acid)和氰(nitrile)等。 现在国际上通常用(当然也是英文书籍、期刊中经常使用)的是国际纯粹与应用化学联合会系统命名法,简称IUPAC系统命名法。同时,出于历史、习惯或简便原因,也使用一些普通名(common name)或俗名(trivial name),甚至缩略名(abbreviated name,如TNT和DDT等)。除特别说明外,本文讲的命名法为IUPAC系统命名法。 2烃的命名 (1)烷烃(alkane):有关词头+-ane 例: CH 4CH 3 CH 2 CH 3 methane propane CH 3CH 3 CH 3 CH 2 CH 2 CH 3 ethane butane 从第5个成员戊烷(pentane)开始,烷烃的命名根据其含碳数由希腊数字派生(见表1[2])。如果希腊数字末尾带字母-a,命名对应的烷烃时,直接在其后加-ne。

英文文献检索技巧

英文文献检索技巧 文献检索是非常麻烦的事情,一般都是通过各种数据库进行检索,但由于购买的电子数据库基本都只有1997年以后的文献,文献量比较少,而且很多领域属于落后于国外20-30年的研究,一般很难查到,即使能查到出处,但无原文。文献查找是个费时费力的事情,需要细心和耐心,反复查找,以下谈谈关于如何利用网络进行文献查找的一些技巧。 ①搜索引擎的高级功能 搜索引擎主要https://www.wendangku.net/doc/3415331997.html,和https://www.wendangku.net/doc/3415331997.html,,https://www.wendangku.net/doc/3415331997.html,则仅在检索中文时稍好点,英文很差,用处不大。我们常用的google侧重于网页的检索,Scholar则主要针对学术类文献进行检索,格式主要是pdf,对于论文的引用也会显示,对于知道文献名和作者的情况比较容易直接找到pdf文档,一般这两个搜索引擎要联合使用。 Google的高级检索功能中有几个常用的功能: (1)锁定关键词检索:使用双引号如”管理”,则所有检索结果均包含双引号中的内容,以减少检索结果量; (2)文件类型检索:文件类型主要是.pdf和.doc文档,国外文献大部分以pdf格式发布,使用格式限制可以排除很多不必要的检索结果,如输入:管理filetype:pdf,当然其它google识别的格式都可使用; (3)指定网址检索:如果发现某个网站有需要的文献,则可以直接指定到该网站检索,以获得需要的资料,如输入:管理site:https://www.wendangku.net/doc/3415331997.html,。 Google的详细功能请参照google的高级检索,百度在使用上相同。 ②关键词的使用 检索结果如何,和关键词的使用直接相关,所以,首先要弄清楚在英文中关键词有哪几种表达方式,分别进行检索,而对于文献综述类,可以使用:review、overview、literature review、history、development、trend 等和关键词一起检索。 关键词的检索并不是一次就能确定下来的,刚开始选用几个看能否找到,如果找到一些,先初步看看那些文献,对内容有了更深一些的认识后同时也对检索关键词增加了了解,实际上是不断调整检索关键词的过程 ③参考文献的使用 检索到一些文章后,先要看看文献后的参考文献,国外文献一般都会很详细的列出,可根据参考文献相应的进行有目的的检索,如找到指定数据库的期刊,或者检索作者,作者的个人主页一般提供作者本人发表文献的下载(最好的资源),有些还提供作者的E-mal,可直接写信给作者,一般对方都会提供。 另外,利用google的强大功能,对论文题名、期刊和作者进行检索,期刊的检索经常能发现该期刊被那个数据库收录,则可直接到相应的数据库找到,检索作者则最好加关键词、年等信息以缩小检索范围,而且不要用缩写,会忽略很多信息。 如果找到某个期刊历年的电子数据库,虽然网站有自己的检索功能,但最好不要检索之后其它就放弃了,实际上很多文献不一定检索得到,需要有耐心的一期一期的去看(当然实际上这个工作量并不大,国外的期刊一般每期也就10篇左右),但如果错过了需要的文献则损失大了。 ④网站回溯 一般找到某个网站有需要的资料后,不要把那篇下下来就关了,通常还有很多资源呢。一种是回到该文献的上层目录,即将文献名删除,保留反斜杠回车即可,如:http://www.parknride/com/documents/prdemand.pdf,则应该再回溯到上层目录:http://www.parknride/com/documents/,有些网站没有设限制,可以看到很多相关文献,或者会找到一些有用的连接,有必要可以再往上层走,一般都会有收获。 还有一种就是很多图书类使用章节编号的,而且使用上面的方法也看不到,则可根据章节顺序编号用支持断点续传的下载软件直接进行下载,如: http://www.parknride/com/documents/ch01.pdf

有机化学系统命名中英差异

系统命名中英差异有机化学 一、普通命名法 1、适用于1~12碳的烃类命名。 2、前十个碳中文词手分别对应甲乙丙丁戊己庚辛壬癸,英文 对应meth、eth、prop、but、pent、hex、hept、oct、non、 dec、undec、dodec。 3、中文烷、烯、炔对应英文ane、ene、yne 4、从丁烷起,烃类有同分异构体,简单易构烷烃中文用正、 异、新表示,对应英文词头n(normal)、i(iso)、neo 二、系统命名法 1、先选取主链为母体,中英主链选取原则相同。 2、对主链编号,中英相同。 3、名称的排列顺序,中英模板大致相同: 编号(1,2,3)—取代基(4,5,6)—编号—取代基………— 取代基(7)—编号母体 分子中有多种取代基时,中文按优先级,较优先的基团排列在后面。英文按基团首字母在字母表的先后顺序排列。与无机物质的英文命名相比较[1],有机化合物的命名显得更为复杂。它不仅要考虑化合物分子中的原子组成及数目,而且要反映出其中所含的官能团种类。为了促进大学化学化工学科双语教学的实施,帮助学生阅读化学化工的英文文献,笔者在此对有机化合 物的英文命名方法作一简要归纳和介绍。

1有机化合物的官能团分类 有机化合物种类繁多,数目庞大,而且新的有机物质还在不断地合成和发现出来。为了系统地进行研究,化学家对有机化合物作了严格、科学的分类。物质的性质与物质的结构密切相关。体现有机化合物主要结构特征的是其分子中的官能团(functional group)。官能团决定着有机化合物的性质,所以按照官能团来对有机化合物进行分类是有机化学常用的一种分类方法。根据不同的官能团,有机化合物主要可分为:烃(hydrocarbon)、醇(alcohol)、醚(ether)、醛(aldehyde)、酮(ketone)、羧酸(carboxylic acid)、酯(ester)、胺(amine)、酰胺(amide)、氨基酸(amino acid)和氰(nitrile)等。 现在国际上通常用(当然也是英文书籍、期刊中经常使用)的是国际纯粹与应用化学联合会系统命名法,简称IUPAC系统命名法。同时,出于历史、习惯或简便原因,也使用一些普通名(common name)或俗名(trivial name),甚至缩略名(abbreviated name,如TNT和DDT等)。除特别说明外,本文讲的命名法为IUPAC 系统命名法。 2烃的命名

研究生如何检索和阅读外文文献

研究生如何检索和阅读外文文献? 阅读文献一定不要心浮气躁,要沉下心来大量阅读。在读的过程中有的文献看懂了,但是看不懂的文献也可能会居多。看懂的认真学习借鉴,看不懂的深入探索,实在不行就暂时放下,过一段时间,随着知识和能力的提高慢慢也就弄明白了一些。即使还是看不懂,但是心里知道有那么回事,为将来的继续深造做了铺垫。 千万不要只是为看文献而看文献,我们看的目的是为了能为我们自己的科研所用,所以看的过程中一定要和你自己的数据相结合,当看完一篇文献后,要好好总结,如果用自己的数据,又该怎么样解释。还有一些牛刊物上的文章,不但要学习文章里面的知识,还要学习牛人写文章的文风。好的文章肯定会有好的文风,这些都是我们将来写文章要学习的。 一、如何进行文献检索 我是学自然科学的,平时确实需要不少外文文献,对于自然科学来讲英文文献检索首推Elsevier,Springer等。虽然这些数据库里面文献已经不算少了。但是有时还会碰到查不到的文献,而这些文献的数据库我们所在研究所或大学又没有买,怎么办?我基本通过以下向个途径来得到文献。 1.首先在Google 学术搜索里进行搜索,里面一般会搜出来你要找的文献,在Google学术搜索里通常情况会出现“每组几个”等字样,然后进入后,分别点击,里面的其中一个就有可能会下到全文,当然这只是碰运气,不是万能的,因为我常常碰到这种情况,所以也算是得到全文文献的一条途径吧。可以试一下。 同时,大家有没有发现,从Google学术搜索中,还可以得到一些信息,Google学术搜索中会显示出你搜索文章的引用次数,不过这个引用次数不准确,但是从侧面反应了这篇文章的质量,经典文章的引用次数绝对很高的.同时如果你用作者进行搜索时,会按引用次数出现他写的全部的文章,就可以知道作者的哪些文章比较经典,在没有太多时间的情况下,就可以只看经典的. 2.如果上面的方法找不到全文,就把文章作者的名字或者文章的title在Google 里搜索(不是Google 学术搜索),用作者的名字来搜索,是因为我发现很多国外作者都喜欢把文章的全文(PDF)直接挂在网上,一般情况下他们会把自己的文章挂在自己的个人主页(home page)上,这样可能也是为了让别的研究者更加了解自己的学术领域,顺便推销自己吧。这样你就有可能下到你想要的文献的全文了。甚至可以下到那个作者相近的内容的其它文章。 如果文献是由多个作者写的,第一作者查不到个人主页,就接上面的方法查第二作者,以此类推。用文章的title来搜索,是因为在国外有的网站上,例如有的国外大学的图书馆可能会把本校一年或近几年的学术成果的Publication的PDF全文献挂在网上,或者在这个大学的ftp上也有可能会有这样类似的全文.这样就很可能会免费下到你想要的全文了。 3.如果上面两个方法都没有查到你要的文献,那你就直接写邮件向作者要。一般情况下作者都喜欢把自己的文献给别人,因为他把这些文献给别人,也相当于在传播他自己的学术思想。下面是本人向老外作者要文献的一个常用的模板: Dear Professor ×××,

相关文档