文档库 最新最全的文档下载
当前位置:文档库 › 蛋白质的结构、分类及预测

蛋白质的结构、分类及预测

最经典总结-组成蛋白质的氨基酸的结构及种类

考点一组成蛋白质的氨基酸及其种类(5年6考) 组成蛋白质的氨基酸的结构及种类 观察下列几种氨基酸的结构 (1)写出图中结构的名称 a.氨基; b.羧基。 (2)通过比较图中三种氨基酸,写出氨基酸的结构通式 (3)氨基酸的不同取决于R基的不同,图中三种氨基酸的R基依次为 (4)氨基酸的种类:约20种 ■助学巧记 巧记“8种必需氨基酸” 甲(甲硫氨酸)来(赖氨酸)写(缬氨酸)一(异亮氨酸)本(苯丙氨酸)亮(亮氨酸)色(色氨酸)书(苏氨酸) 注:评价蛋白质食品营养价值主要依据其必需氨基酸的种类和含量。

组成蛋白质的氨基酸的种类与结构 1.(海南卷)关于生物体内组成蛋白质的氨基酸的叙述,错误的是() A.分子量最大的氨基酸是甘氨酸 B.有些氨基酸不能在人体细胞中合成 C.氨基酸分子之间通过脱水缩合形成肽键 D.不同氨基酸之间的差异是由R基引起的 解析甘氨酸应是分子量最小的氨基酸,它的R基是最简单的氢。 答案 A 2.下图为氨基酸分子的结构通式,下列叙述正确的是() A.结构④在生物体内约有20种 B.氨基酸脱水缩合产生水,水中的氢来自于②和③ C.结构④中含有的氨基或羧基全部都参与脱水缩合 D.生物体内n个氨基酸形成一条多肽链需要n种密码子 解析①为氨基,③为羧基,④为侧链基团(R基)。构成人体氨基酸的种类约有20种,A正确;脱水缩合形成水,水中氢来自①③,B错误;R基中的氨基或羧基不参与脱水缩合,C错误;生物体内n个氨基酸形成一条多肽链需要n个密码子而不是需要n种密码子,D错误。 答案 A 解答本类题目的关键是熟记氨基酸的结构通式,如下图所示

找出氨基酸的共同体,即图中“不变部分”(连接在同一碳原子上的—NH2、—COOH和—H),剩下的部分即为R基。倘若找不到上述“不变部分”,则不属于构成蛋白质的氨基酸。

蛋白质的性质和分类

蛋白质凭借游离的氨基和羧基而具有两性特征,在等电点易生成沉淀。不同的蛋白质等电点不同,该特性常用作蛋白质的分离提纯。生成的沉淀按其有机结构和化学性质,通过pH的细微变化可复溶。蛋白质的两性特征使其成为很好的缓冲剂,并且由于其分子量大和离解度低,在维持蛋白质溶液形成的渗透压中也起着重要作用。这种缓冲和渗透作用对于维持内环境的稳定和平衡具有非常重要的意义。 在紫外线照射、加热煮沸以及用强酸、强碱、重金属盐或有机溶剂处理蛋白质时,可使其若干理化和生物学性质发生改变,这种现象称为蛋白质的变性。酶的灭活,食物蛋白经烹调加工有助于消化等,就是利用了这一特性。 (二)蛋白质的分类 简单的化学方法难于区分数量庞杂、特性各异的这类大分子化合物。通常按照其结构、形态和物理特性进行分类。不同分类间往往也有交错重迭的情况。一般可分为纤维蛋白、球状蛋白和结合蛋白三大类。 1.纤维蛋白包括胶原蛋白、弹性蛋白和角蛋白。 (1) 胶原蛋白胶原蛋白是软骨和结缔组织的主要蛋白质,一般占哺乳动物体蛋白总量的30%左右。胶原蛋白不溶于水,对动物消化酶有抗性,但在水或稀酸、稀碱中煮沸,易变成可溶的、易消化的白明胶。胶原蛋白含有大量的羟脯氨酸和少量羟赖氨酸,缺乏半胱氨酸、胱氨酸和色氨酸。 (2) 弹性蛋白弹性蛋白是弹性组织,如腱和动脉的蛋白质。弹性蛋白不能转变成白明胶。 (3) 角蛋白角蛋白是羽毛、毛发、爪、喙、蹄、角以及脑灰质、脊髓和视网膜神经的蛋白质。它们不易溶解和消化,含较多的胱氨酸(14-15%)。粉碎的羽毛和猪毛,在15-20磅蒸气压力下加热处理一小时,其消化率可提高到70-80%,胱氨酸含量则减少5-6%。 2.球状蛋白 (1) 清蛋白主要有卵清蛋白、血清清蛋白、豆清蛋白、乳清蛋白等,溶于水,加热凝固。 (2) 球蛋白球蛋白可用5-10%的NaCl溶液从动、植物组织中提取;其不溶或微溶于水,可溶于中性盐的稀溶液中,加热凝固。血清球蛋白、血浆纤维蛋白原、肌浆蛋白、豌豆的豆球蛋白等都属于此类蛋白。 (3) 谷蛋白麦谷蛋白、玉米谷蛋白、大米的米精蛋白属此类蛋白。不溶于水或中性溶液,而溶于稀酸或稀碱。 (4) 醇溶蛋白玉米醇溶蛋白、小麦和黑麦的麦醇溶蛋白、大麦的大麦醇溶蛋白属此类蛋白。不溶于水、无水乙醇或中性溶液,而溶于70-80%的乙醇。 (5) 组蛋白属碱性蛋白,溶于水。组蛋白含碱性氨基酸特别多。大多数组蛋白在活细胞中与核酸结合,如血红蛋白的珠蛋白和鲭鱼精子中的鲭组蛋白。 (6) 鱼精蛋白鱼精蛋白是低分子蛋白,含碱性氨基酸多,溶于水。例如鲑鱼精子中的鲑精蛋白、鲟鱼的鲟精蛋白、鲱鱼的鲱精蛋白等。鱼精蛋白在鱼的精子细胞中与核酸结合。 球蛋白比纤维蛋白易于消化,从营养学的角度看,氨基酸含量和比例也较纤维蛋白更理想。 3. 结合蛋白 结合蛋白是蛋白部分再结合一个非氨基酸的基团(辅基)。如核蛋白(脱氧核糖核蛋白、核糖体),磷蛋白(酪蛋白、胃蛋白酶),金属蛋白(细胞色素氧化酶、铜蓝蛋白、黄嘌呤氧化酶),脂蛋白(卵黄球蛋白、血中β1-脂蛋白),色蛋白(血红蛋白、细胞色素C、黄素蛋白、视网膜中与视紫质结合的水溶性蛋白)及糖蛋白(γ球蛋白、半乳糖蛋白、甘露糖蛋白、氨基糖蛋白)。

蛋白质结构预测和序列分析软件

蛋白质结构预测和序列分析软件 2010-05-08 20:40 转载自布丁布果 最终编辑布丁布果 4月18日 蛋白质数据库及蛋白质序列分析 第一节、蛋白质数据库介绍 一、蛋白质一级数据库 1、 SWISS-PROT 数据库 SWISS-PROT和PIR是国际上二个主要的蛋白质序列数据库,目前这二个数据库在EMBL和GenBank数据库上均建立了镜像 (mirror) 站点。 SWISS-PROT数据库包括了从EMBL翻译而来的蛋白质序列,这些序列经过检验和注释。该数据库主要由日内瓦大学医学生物化学系和欧洲生物信息学研究所(EBI)合作维护。SWISS-PROT 的序列数量呈直线增长。2、TrEMBL数据库: SWISS-PROT的数据存在一个滞后问题,即把EMBL的DNA序列准确地翻译成蛋白质序列并进行注释需要时间。一大批含有开放阅读框(ORF) 的DNA序列尚未列入SWISS-PROT。为了解决这一问题,TrEMBL(Translated EMBL) 数据库被建立了起来。TrEMBL也是一个蛋白质数据库,它包括了所有EMBL库中的蛋白质编码区序列,提供了一个非常全面的蛋白质序列数据源,但这势必导致其注释质量的下降。 3、PIR数据库: PIR数据库的数据最初是由美国国家生物医学研究基金会(National Biomedical Research Foundation, NBRF)收集的蛋白质序列,主要翻译自GenBank的DNA序列。 1988年,美国的NBRF、日本的JIPID(the Japanese International Protein Sequence Database 日本国家蛋白质信息数据库)、德国的MIPS(Munich Information Centre for Protein Sequences摹尼黑蛋白质序列信息中心)合作,共同收集和维护PIR数据库。PIR根据注释程度(质量)分为4个等级。4、 ExPASy数据库: 目前,瑞士生物信息学研究所(Swiss Institute of Bioinformatics, SIB)创建了蛋白质分析专家系统(Expert protein analysis system, ExPASy )。涵盖了上述所有的数据库。网址:https://www.wendangku.net/doc/1718722993.html, 我国的北京大学生物信息中心(https://www.wendangku.net/doc/1718722993.html,) 设立了ExPASy的镜像(Mirror)。 主要蛋白质序列数据库的网址 SWISS-PROT https://www.wendangku.net/doc/1718722993.html,/sprot 或 https://www.wendangku.net/doc/1718722993.html,/expasy_urls.html TrEMBL https://www.wendangku.net/doc/1718722993.html,/sprot PIR https://www.wendangku.net/doc/1718722993.html,/pirwww MIPS——Munich Information Centre for Protein Sequences http://mips.gsf.de/ JIPID——the Japanese International Protein Sequence Database 已经和PIR合并 ExPASy https://www.wendangku.net/doc/1718722993.html, 二、蛋白质结构数据库 1、PDB数据库:

蛋白质结构预测在线软件

蛋白质预测在线分析常用软件推荐 蛋白质预测分析网址集锦 物理性质预测: Compute PI/MW http://expaxy.hcuge.ch/ch2d/pi-tool.html Peptidemasshttp://expaxy.hcuge.ch/sprot/peptide-mass.html TGREASE ftp://https://www.wendangku.net/doc/1718722993.html,/pub/fasta/ SAPS http://ulrec3.unil.ch/software/SAPS_form.html 基于组成的蛋白质识别预测 AACompIdent http://expaxy.hcuge.ch ... htmlAACompSim http://expaxy.hcuge.ch/ch2d/aacsim.html PROPSEARCH http://www.e mbl-heidelberg.de/prs.html 二级结构和折叠类预测 nnpredict https://www.wendangku.net/doc/1718722993.html,/~nomi/nnpredict Predictprotein http://www.embl-heidel ... protein/SOPMA http://www.ibcp.fr/predict.html SSPRED http://www.embl-heidel ... prd_info.html 特殊结构或结构预测 COILS http://ulrec3.unil.ch/ ... ILS_form.html MacStripe https://www.wendangku.net/doc/1718722993.html,/ ... acstripe.html 与核酸序列一样,蛋白质序列的检索往往是进行相关分析的第一步,由于数据库和网络技校术的发展,蛋白序列的检索是十分方便,将蛋白质序列数据库下载到本地检索和通过国际互联网进行检索均是可行的。 由NCBI检索蛋白质序列 可联网到:“http://www.ncbi.nlm.ni ... gi?db=protein”进行检索。 利用SRS系统从EMBL检索蛋白质序列 联网到:https://www.wendangku.net/doc/1718722993.html,/”,可利用EMBL的SRS系统进行蛋白质序列的检索。 通过EMAIL进行序列检索 当网络不是很畅通时或并不急于得到较多数量的蛋白质序列时,可采用EMAIL方式进行序列检索。 蛋白质基本性质分析 蛋白质序列的基本性质分析是蛋白质序列分析的基本方面,一般包括蛋白质的氨基酸组成,分子质量,等电点,亲水性,和疏水性、信号肽,跨膜区及结构功能域的分析等到。蛋白质的很多功能特征可直接由分析其序列而获得。例如,疏水性图谱可通知来预测跨膜螺旋。同时,也有很多短片段被细胞用来将目的蛋白质向特定细胞器进行转移的靶标(其中最典型的

蛋白质的二级结构主要有哪些类型

1.蛋白质的二级结构主要有哪些类型,其特点如何? 答:α-右手螺旋,β-折叠,无规卷曲,U型回折(β-转角) <1>α-右手螺旋 α-螺旋为右手螺旋,每一圈含有3.6个aa残基(或肽平面),每一圈高5.4?,即每一个aa 残基上升1.5?,旋转了100度,直径为5 ?,2个二面角(ф,ψ)=(-570,-480)。维持α-右手螺旋的力量是螺旋内氢键,它产生于一个肽平面的C=O与相邻一圈的在空间上邻近的另一个肽平面的N-H之间,它的方向平行于螺旋轴,每个氢键串起的长度为3.6个肽平面或3.6个aa残基,被氢键串起来的这个环上含有13个原子,故α-右手螺旋也被称为 3.613螺旋。Pro破坏α-螺旋。 <2>β-折叠 肽链在空间的走向为锯齿折叠状,二面角(ф,ψ)=(-119℃,+113℃)。维持β-折叠的力量是折叠间的氢键,它产生于一个肽平面的C=O与相邻肽链的在空间上邻近的另一个肽平面的N-H之间,两条肽链上的肽平面互相平行,有平行式和反平行式两种, <3>U型回折:也叫β-转角,肽链在某处回折1800所形成的结构。这个结构包括的长度为 4个aa残基,其中的第三个为Gly,稳定该结构的力量是第一和第四个aa残基之间形成的氢键。 <4>无规卷曲:无固定的走向,但也不是任意变动的,它的2个二面角(ф,ψ)有个变化 范围。论 述 04 蛋 白 质 简述蛋白质一级结构的分析方法。 第一步:前期准备,第二步:肽链的端点测定,第三步:每条肽链aa顺序的测定,第四步:二硫键位置的确定。 <1>第一步:前期准备 分离纯化蛋白质:纯度要达到97%以上。 蛋白质分子量的测定:用于判断分子的大小,估计肽链的数目,有渗透压法、凝胶电泳法(聚丙烯酰胺、SDS)、凝胶过滤法、超离心法等 aa组成的测定:用于最后核对,氨基酸自动分析仪。 肽链拆分:非共价键的如氢键、离子键、疏水键、范德华力4种,可用尿素或盐酸胍等有机溶液来拆分。共价键的仅二硫键1种,可用巯基乙醇、碘代乙酸、过甲酸来拆分。 <2>第二步:肽链的端点测定 N端测定:Sanger法,DNFB→DNP-肽→水解→乙醚萃取→层析鉴定。 Edman法,PITC→PTC-肽→PTH-aa→层析鉴定。 C端测定:肼解法。 <3>第三步:每条肽链aa顺序的测定 事先要将蛋白质打断成多肽甚至寡肽,再上机分析,而且要2套以上,便于以后拼接。 常用的工具酶和特异性试剂有: 胰蛋白酶:-(Arg、Lys)↓-。产物为C端Arg、Lys的肽链。 糜蛋白酶:表示为-(Trp、Tyr、Phe)↓-。 CNBr:-Met↓-。 <4>第四步:二硫键位置的确定 包括链内和链间二硫键的位置,用对角线电泳来测,这项工作在AA序测定完毕后进行。在肽链未拆分的情况下用胃蛋白酶水解之,可以得到被二硫键连着的多肽产物。先进行第一向电泳,将产物分开。再用巯基乙醇处理,将二硫键打断。最后进行第二向电泳,条件与第一向电泳完全相同。选取偏离对角线的样品(多肽或寡肽),它们就是含二硫键的片段,上机测aa顺序,根据已测出的蛋白质的aa顺序,把这些片段进行定位,就能找到二硫键的位置。

蛋白质问题归类解析

2014年临安中学高三复习讲义(蛋白质类问题归类解析) 1.氨基酸的结构: 例1.下列各项中,哪项是构成生物体蛋白质的氨基酸 例2.谷胱甘肽(分子式C 10H 17O 6N 3S )是存在于动植物和微生物细胞中的一种重要的三肽,它是由谷氨酸(C 5H 9NO 4)、甘氨酸(C 2H 5O 2)和半胱氨酸缩合而成,则半胱氨酸可能的分子式为 A.C 3H 3NS B. C 3H 5NS C. C 3H 7O 2NS D. C 3H 3O 2NS 例3.当含有如图所示的结构片段的蛋白质在胃肠道中水解时,不可能产生的氨基酸是 2.蛋白质种类: 例4.由4种氨基酸(每种氨基酸数量不限)最多能合成不同结构的三肽有 A .4种 B .43种 C .34种 D .12种 例 5.如果有足量的三种氨基酸分别为甲、乙、丙,则它们能形成的三肽种类以及包含三种氨基酸的三肽种类最多有 A .9种,9种 B .6种,3种 C .27种,6种 D .3种,3种 例6.狼体内有a 种蛋白质,20种氨基酸;兔体内有b 种蛋白质,20种氨基酸.狼捕食兔后,狼体内的蛋白质种类和氨基酸种类最可能是多少? A.a+b ,40 B.a,20 C.大于a,20 D.小于a,20 3.肽键(水分子)数目: 例7. 人体内的抗体IgG 是一种重要的免疫球蛋白,由4条肽链构成,共有m 个氨基酸,则该蛋白质分子有肽键数 A.m 个 B. (m+1)个 C.(m-2)个 D.(m-4)个 例8.由M 个氨基酸构成的一个蛋白质分子,含有N 条肽链,其中Z 条是环状多肽,这个蛋白质完全水解共需水分子个数为 A.M-N+Z B.M-N-Z C.M-Z+N D.M+Z+N 例9.某22肽被水解成1个4肽,2个3肽,2个6肽,则这些短肽的氨基总数的最小值及肽键总数依次是 A .6 18 B .5 18 C .5 17 D .6 17 例10.免疫球蛋白lgG 的结构示意图如右,其中-S-S- 表示连接两条相邻肽链的二硫键。若该lgG 由m 个氨基酸构成,则该lgG 有肽键数 A .m 个 B .(m +1)个 C .(m-2)个 D .(m-4)个 4. 游离的氨基或羧基数目: 例11.人体内的抗体IgG 是一种重要的免疫球蛋白,由4条肽链构成,共有764个氨基酸,则该蛋白质分子中至少含有游离的氨基和羧基的个数分别是 A. 764、 764 B. 760 、760 C. 762、 762 D. 4 、4 例12. 现有1000个氨基酸,其中氨基有1020个,羧基有1050个,则由此合成的4条肽链中游离的氨基、羧基的数目分别是 -S-S -S-S -S-S

蛋白质结构预测和序列分析软件

蛋白质结构预测和序列分析软件蛋白质数据库及蛋白质序列分析 第一节、蛋白质数据库介绍 一、蛋白质一级数据库 1、 SWISS-PROT 数据库 SWISS-PROT和PIR是国际上二个主要的蛋白质序列数据 库,目前这二个数据库在EMBL和GenBank数据库上均建 立了镜像 (mirror) 站点。 SWISS-PROT数据库包括了从EMBL翻译而来的蛋白质序 列,这些序列经过检验和注释。该数据库主要由日内瓦大 学医学生物化学系和欧洲生物信息学研究所(EBI)合作维 护。SWISS-PROT的序列数量呈直线增长。 2、TrEMBL数据库: SWISS-PROT的数据存在一个滞后问题,即 进行注释需要时间。一大批含有开放阅读 了解决这一问题,TrEMBL(Translated E 白质数据库,它包括了所有EMBL库中的 质序列数据源,但这势必导致其注释质量 3、PIR数据库: PIR数据库的数据最初是由美国国家生物医学研究基金 会(National Biomedical Research Foundation, NBRF) 收集的蛋白质序列,主要翻译自GenBank的DNA序列。 1988年,美国的NBRF、日本的JIPID(the Japanese International Protein Sequence Database日本国家蛋 白质信息数据库)、德国的MIPS(Munich Information Centre for Protein Sequences摹尼黑蛋白质序列信息 中心)合作,共同收集和维护PIR数据库。PIR根据注释 程度(质量)分为4个等级。 4、 ExPASy数据库: 目前,瑞士生物信息学研究所(Swiss I 质分析专家系统(Expert protein anal 据库。 网址:https://www.wendangku.net/doc/1718722993.html, 我国的北京大学生物信息中心(www.cbi.

蛋白质结构预测在线软件

蛋白质预测分析网址集锦? 物理性质预测:? Compute PI/MW?? ?? SAPS?? 基于组成的蛋白质识别预测? AACompIdent???PROPSEARCH?? 二级结构和折叠类预测? nnpredict?? Predictprotein??? SSPRED?? 特殊结构或结构预测? COILS?? MacStripe?? 与核酸序列一样,蛋白质序列的检索往往是进行相关分析的第一步,由于数据库和网络技校术的发展,蛋白序列的检索是十分方便,将蛋白质序列数据库下载到本地检索和通过国际互联网进行检索均是可行的。? 由NCBI检索蛋白质序列? 可联网到:“”进行检索。? 利用SRS系统从EMBL检索蛋白质序列? 联网到:”,可利用EMBL的SRS系统进行蛋白质序列的检索。? 通过EMAIL进行序列检索?

当网络不是很畅通时或并不急于得到较多数量的蛋白质序列时,可采用EMAIL方式进行序列检索。? 蛋白质基本性质分析? 蛋白质序列的基本性质分析是蛋白质序列分析的基本方面,一般包括蛋白质的氨基酸组成,分子质量,等电点,亲水性,和疏水性、信号肽,跨膜区及结构功能域的分析等到。蛋白质的很多功能特征可直接由分析其序列而获得。例如,疏水性图谱可通知来预测跨膜螺旋。同时,也有很多短片段被细胞用来将目的蛋白质向特定细胞器进行转移的靶标(其中最典型的例子是在羧基端含有KDEL序列特征的蛋白质将被引向内质网。WEB中有很多此类资源用于帮助预测蛋白质的功能。? 疏水性分析? 位于ExPASy的ProtScale程序(?)可被用来计算蛋白质的疏水性图谱。该网站充许用户计算蛋白质的50余种不同属性,并为每一种氨基酸输出相应的分值。输入的数据可为蛋白质序列或SWISSPROT数据库的序列接受号。需要调整的只是计算窗口的大小(n)该参数用于估计每种氨基酸残基的平均显示尺度。? 进行蛋白质的亲/疏水性分析时,也可用一些windows下的软件如,bioedit,dnamana等。? 跨膜区分析? 有多种预测跨膜螺旋的方法,最简单的是直接,观察以20个氨基酸为单位的疏水性氨基酸残基的分布区域,但同时还有多种更加复杂的、精确的算法能够预测跨膜螺旋的具体位置和它们的膜向性。这些技术主要是基于对已知

蛋白质结构预测方法综述

蛋白质结构预测方法综述 卜东波陈翔王志勇 《计算机不能做什么?》是一本好书,其中文版序言也堪称佳构。在这篇十余页的短文中,马希文教授总结了使用计算机解决实际问题的三步曲,即首先进行形式化,将领域相关的实际问题抽象转化成一个数学问题;然后分析问题的可计算性;最后进行算法设计,分析算法的时间和空间复杂度,寻找最优算法。 蛋白质空间结构预测是很有生物学意义的问题,迄今亦有很多的工作。有意思的是,其中一些典型工作恰恰是上述三步曲的绝好示例,本文即沿着这一路线作一总结,介绍于后。 1 背景知识 生物细胞种有许多蛋白质(由20余种氨基酸所形成的长链),这些大分子对于完成生物功能是至关重要的。蛋白质的空间结构往往决定了其功能,因此,如何揭示蛋白质的结构是非常重要的工作。 生物学界常常将蛋白质的结构分为4个层次:一级结构,也就是组成蛋白质的氨基酸序列;二级结构,即骨架原子间的相互作用形成的局部结构,比如alpha螺旋,beta片层和loop区等;三级结构,即二级结构在更大范围内的堆积形成的空间结构;四级结构主要描述不同亚基之间的相互作用。 经过多年努力,结构测定的实验方法得到了很好的发展,比较常用的有核磁共振和X光晶体衍射两种。然而由于实验测定比较耗时和昂贵,对于某些不易结晶的蛋白质来说不适用。相比之下,测定蛋白质氨基酸序列则比较容易。因此如果能够从一级序列推断出空间结构则是非常有意义的工作。这也就是下面的蛋白质折叠问题: 1蛋白质折叠问题(Protein Folding Problem) 输入: 蛋白质的氨基酸序列

输出: 蛋白质的空间结构 蛋白质结构预测的可行性是有坚实依据的。因为一般而言,蛋白质的空间结构是由其一级结构确定的。生化实验表明:如果在体外无任何其他物质存在的条件下,使得蛋白质去折叠,然后复性,蛋白质将立刻重新折叠回原来的空间结构,整个过程在不到1秒种内即可完成。因此有理由认为对于大部分蛋白质而言,其空间结构信息已经完全蕴涵于氨基酸序列中。从物理学的角度讲,系统的稳定状态通常是能量最小的状态,这也是蛋白质预测工作的理论基础。 2 蛋白质结构预测方法 蛋白质结构预测的方法可以分为三种: 同源性(Homology )方法:这类方法的理论依据是如果两个蛋白质的序列比较相似,则其结构也有很大可能比较相似。有工作表明,如果序列相似性高于75%,则可以使用这种方法进行粗略的预测。这类方法的优点是准确度高,缺点是只能处理和模板库中蛋白质序列相似性较高的情况。 从头计算(Ab initio ) 方法:这类方法的依据是热力学理论,即求蛋白质能量最小的状态。生物学家和物理学家等认为从原理上讲这是影响蛋白质结构的本质因素。然而由于巨大的计算量,这种方法并不实用,目前只能计算几个氨基酸形成的结构。IBM 开发的Blue Gene 超级计算机,就是要解决这个问题。 穿线法(Threading )方法:由于Ab Initio 方法目前只有理论上的意义,Homology 方法受限于待求蛋白质必需和已知模板库中某个蛋白质有较高的序列相似性,对于其他大部分蛋白质来说,有必要寻求新的方法。Threading 就此应运而生。 以上三种方法中,Ab Initio 方法不依赖于已知结构,其余两种则需要已知结构的协助。通常将蛋白质序列和其真实三级结构组织成模板库,待预测三级结构的蛋白质序列,则称之为查询序列(query sequence)。 3 蛋白质结构预测的Threading 方法 Threading 方法有三个代表性的工作:Eisenburg 基于环境串的工作、Xu Ying 的Prospetor 和Xu Jinbo 、Li Ming 的RAPTOR 。 Threading 的方法:首先取出一条模版和查询序列作序列比对(Alignment),并将模版蛋白质与查询序列匹配上的残基的空间坐标赋给查询序列上相应的残基。比对的过程是在我们设计的一个能量函数指导下进行的。根据比对结果和得到的查询序列的空间坐标,通过我们设计的能量函数,得到一个能量值。将这个操作应用到所有的模版上,取能量值最低的那条模版产生的查询序列的空间坐标为我们的预测结果。 需要指出的是,此处的能量函数却不再是热力学意义上的能量函数。它实质上是概率的负对数,即 ,我们用统计意义上的能量来代替真实的分子能量,这两者有大致相同的形式。 p E log ?=如果沿着马希文教授的观点看上述工作 ,则更有意思:Eisenburg 指出如果仅仅停留在简单地使用每个原子的空间坐标(x,y,z)来形式化表示蛋白质空间结构,则难以进一步深入研究。Eisenburg 创造性地使用环境串表示结构,从而将结构预测问题转化成序列串和环境串之间的比对问题;其后,Xu Ying 作了进一步发展,将蛋白质序列表示成一系列核(core )组成的序列,Core 和Core 之间存在相互作用。因此结构就表示成Core 的空间坐标,以及Core 之间的相互作用。在这种表示方法的基础上,Xu Ying 开发了一种求最优匹配的动态规划算法,得到了很好的结果。但是由于其较高的复杂度,在Prospetor2上不得不作了一些简化;Xu Jinbo 和Li Ming 很漂亮地解决了这个问题,将求最优匹配的过程表示成一个整数规划问题,并且证明了一些常用

蛋白质结构预测

实习 5 :蛋白质结构预测 学号20090***** 姓名****** 专业年级生命生技**** 实验时间2012.6.21 提交报告时间2012.6.21 实验目的: 1.学会使用GOR和HNN方法预测蛋白质二级结构 2.学会使用SWISS-MODEL进行蛋白质高级结构预测 实验内容: 1.分别用GOR和HNN方法预测蛋白质序列的二级结构,并对比异同性。 2.利用SWISS-MODEL进行蛋白质的三级结构预测,并对预测结果进行解释。 作业: 1. 搜索一条你感兴趣的蛋白质序列,分别用GOR和HNN进行二级结构预测,解释预测结果,分析两个方法结果有何异同。 答:所选用蛋白质序列为>>gi|390408302|gb|AFL70986.1| gag protein, partial [Human immunodeficiency virus] (1)GOR预测结果: 图1 图1是每个氨基酸在序列中所处的状态,可以看出序列的二级结构预测结果为: 1到9位个氨基酸为无规卷曲,10到33位氨基酸为α螺旋,34到37位为β折叠,38到45位为无规卷曲,46到49位为α螺旋,50到53位为无规卷曲,54到65为α螺旋,66到72位为无规卷曲,73到95位为α螺旋,96到101位为无规卷曲,102到108为β折叠,109到115位为无规卷曲,117位为β折叠。 图2 图2为各种结构在序列中所占的比例,其中Alpha helix占53.85%,Extended strand占11.11%,Random coil占35.04%,无他二级结构。

图3 图3为各个氨基酸在序列中的状态以及二级结构在全序列中二级结构分布情况。 (2)HNN预测: 图4 图4是每个氨基酸在序列中所处的状态,可以看出序列的二级结构预测结果为: 1到6位个氨基酸为无规卷曲,7到34位氨基酸为α螺旋,35到37位为β折叠,38位为α螺旋,39到44位为无规卷曲,45到49位为α螺旋,50到55位为无规卷曲,56到65为α螺旋,66到71位为无规卷曲,72到83位为α螺旋,84到86位为无规卷曲,87到95位为α螺旋,96到102为无规卷曲,103到108位为β折叠,108到117位为无规卷曲。 图5 图5为各种结构在序列中所占的比例,其中Alpha helix占55.56%,Extended strand占7.69%,Random coil占36.75%,无他二级结构。

乳清蛋白分类

乳清蛋白的分类 乳清蛋白(whey protein)被称为蛋白之王,是从牛奶中提取的一种蛋白质,具有营养价值高、易消化吸收、含有多种活性成分等特点,是公认的人体优质蛋白质补充剂之一。乳清蛋白是采用先进工艺从牛奶分离提取出来的珍贵蛋白质,以其纯度高、吸收率高、氨基酸组成最合理等诸多优势被推为“蛋白之王”。乳清蛋白不但容易消化,而且还具有高生物价、高效化率、高蛋白质功效比和高利用率,是蛋白质中的精品等特点,是公认的人体优质蛋白质补充剂之一。牛奶的组成中87%是水,13%是乳固体。而在乳固体中27%是乳蛋白质,乳蛋白质中只有20%是乳清蛋白,其余80%都是酪蛋白,因此乳清蛋白在牛奶中的含量仅为0.7%。但是你知道吗?乳清蛋白也分等级的。它分为浓缩乳清蛋白,分离乳清蛋白以及水解乳清蛋白,下面对这些蛋白进行大致的说明。 乳清蛋白分类 纯度吸收率 浓缩乳清蛋白WPC 35~80%(一般为50%)104 含乳糖 分离乳清蛋白WPI 88~95%(一般为88%)159 再过滤,除乳糖 水解乳清蛋白WPH 96%以上167 再过滤 浓缩乳清蛋白WPC (Whey Protein Concentrate) 这类乳清蛋白的蛋白质的纯度为35~80%(一般为50%),吸收率为104,WPC常常因为包含有乳糖等杂质,所以吸收不是很理想,而且常常伴有拉肚子等症状。 分离乳清蛋白WPI ( Whey Protein Isolate ) 这类乳清蛋白的蛋白质的纯度为88~95%(一般为88%),吸收率为159,WPI是在WPC 的基础之上,通过再次过滤,干燥等技术加工,完全的去除了WPC里面的乳糖。 水解乳清蛋白WPH ( Whey Protein Hydrolysates ) 这类乳清蛋白的蛋白质的纯度一般在96%以上,其吸收率为167,在WPI分离乳清蛋白的基础之上,再次高科技技术过滤,干燥得到,自然其吸收率是最高,纯度也是最高的。水解乳清蛋白是现存增肌粉,蛋白粉中最好的蛋白质原料。

蛋白质的分类

蛋白质的分类 摘要:蛋白质的种类繁多,结构复杂,所以分类也就各异。 一、按来源分类 蛋白质按来源可以分为动物蛋白和植物蛋白,两者所含的氨基酸是不同的。动物性蛋白质主要为提取自牛奶的乳清蛋白,其所含必需氨基酸种类齐全,比例合理,但是含有胆固醇。植物性蛋白质主要来源于大豆的大豆蛋白,最多的优点就是不含胆固醇。 二、按组成成分分类 按照化学组成,蛋白质通常可以分为简单蛋白质、结合蛋白质和衍生蛋白质。简单蛋白质经水解得氨基酸和氨基酸衍生物;结合蛋白质经水解得氨基酸、非蛋白的辅基和其他(结合蛋白质的非氨基酸部分称为辅基);蛋白质经变性作用和改性修饰得到衍生蛋白质。 1—脂 如酪蛋 铜的有血蓝蛋白等。 ⑥黄素蛋白(flavoproteins):辅基为黄素腺嘌呤二核苷酸,如琥珀酸脱氢酶、D—氨基酸氧化酶等。 ⑦金属蛋白(metalioproteins):与金属直接结合的蛋白质,如铁蛋白含铁,乙醇脱氢酶含锌,黄嘌呤氧化酶含钼和铁等。 衍生蛋白质,天然蛋白质变性或者改性、修饰和分解产物。 ①一级衍生蛋白质:不溶于所有溶剂,如变性蛋白质。 ②二级衍生蛋白质:溶于水,受热不凝固,如胨、肽。 ③三级衍生蛋白质:功能改进,如磷酸化蛋白、乙酰化蛋白、琥珀酰胺蛋白。 三、按分子形状分类 根据分子形状的不同,可将蛋白质分为球状蛋白质和纤维状蛋白质两大类。以长轴和短轴之比为标准,球状蛋白

质小于5,纤维状蛋白质大于5。纤维状蛋白多为结构蛋白,是组织结构不可缺少的蛋白质,由长的氨基酸肽链连接成为纤维状或蜷曲成盘状结构,成为各种组织的支柱,如皮肤、肌腱、软骨及骨组织中的胶原蛋白;球状蛋白的形状近似于球形或椭圆形。许多具有生理活性的蛋白质,如酶、转运蛋白、蛋白类激素与免疫球蛋白、补体等均属于球蛋白。 四、按结构分类 蛋白质按其结构可分为:单体蛋白、寡聚蛋白、多聚蛋白。 单体蛋白:蛋白质由一条肽链构成,最高结构为三级结构。包括由二硫键连接的几条肽链形成的蛋白质,其最高结构也是三级。多数水解酶为单体蛋白。 寡聚蛋白:包含2个或2个以上三级结构的亚基。可以是相同亚基的聚合,也可以是不同亚基的聚合。 多聚蛋白:由数十个亚基以上,甚至数百个亚基聚合而成的超级多聚体蛋白。 五、按功能分类 1. 2. 3.

蛋白质结构预测网址

蛋白质结构预测网址 物理性质预测: Compute PI/MW Peptidemass TGREASE SAPS 基于组成的蛋白质识别预测 AACompIdent PROPSEARCH 二级结构和折叠类预测 nnpredict Predictprotein SSPRED 特殊结构或结构预测 COILS MacStripe 与核酸序列一样,蛋白质序列的检索往往是进行相关分析的第一步,由于数据库和网络技校术的发展,蛋白序列的检索是十分方便,将蛋白质序列数据库下载到本地检索和通过国际互联网进行检索均是可行的。 由NCBI检索蛋白质序列 可联网到:“”进行检索。 利用SRS系统从EMBL检索蛋白质序列 联网到:”,可利用EMBL的SRS系统进行蛋白质序列的检索。 通过EMAIL进行序列检索 当网络不是很畅通时或并不急于得到较多数量的蛋白质序列时,可采用EMAIL方式进行序列检索。 蛋白质基本性质分析 蛋白质序列的基本性质分析是蛋白质序列分析的基本方面,一般包括蛋白质的氨基酸组成,分子质量,等电点,亲水性,和疏水性、信号肽,跨膜区及结构功能域的分析等到。蛋白质的很多功能特征可直接由分析其序列而获得。例如,疏水性图谱可通知来预测跨膜螺旋。同时,也有很多短片段被细胞用来将目的蛋白质向特定细胞器进行转移的靶标(其中最典型的例子是在羧基端含有KDEL序列特征的蛋白质将被引向内质网。WEB中有很多此类资源用于帮助预测蛋白质的功能。 疏水性分析 位于ExPASy的ProtScale程序()可被用来计算蛋白质的疏水性图谱。该网站充许用户计算蛋白质的50余种不同属性,并为每一种氨基酸输出相应的分值。输入的数据可为蛋白质序列或SWISSPROT数据库的序列接受号。需要调整的只是计算窗口的大小(n)该参数用于估计每种氨基酸残基的平均显示尺度。 进行蛋白质的亲/疏水性分析时,也可用一些windows下的软件如, bioedit,dnamana等。 跨膜区分析 有多种预测跨膜螺旋的方法,最简单的是直接,观察以20个氨基酸为单位的疏水性氨基酸残基的分布区域,但同时还有多种更加复杂的、精确的算法能够预测跨膜螺旋的具体位置和它们的膜向性。这些技术主要是基于对已知跨膜螺旋的研究而得到的。自然存在的跨膜螺旋Tmbase 数据库,可通过匿名FTP获得(),参见表一

蛋白质分类

第五节蛋白质得分类、提取、分离及测定 蛋白质种类繁多,结构复杂,目前有几种分类方法,作一介绍。 一、根据分子形状分类 根据蛋白质分子外形得对称程度可将其分为两类。 1、球状蛋白质 球状蛋白质(globular proteins)分子比较对称,接近球形或椭球形。溶解度较好,能结晶。大多数蛋白质属于球状蛋白质,如血红蛋白、肌红蛋白、酶、抗体等。 2、纤维蛋白质 纤维蛋白质(fibrous proteins)分子对称性差,类似于细棒状或纤维状。溶解性质各不相同,大多数不溶于水,如胶原蛋白、角蛋白等。有些则溶于水,如肌球蛋白、血纤维蛋白原等 二、根据化学组成分类 根据化学组成可将蛋白质分为两类。 (一)简单蛋白质 简单蛋白质(simple proteins)分子中只含有氨基酸,没有其它成分。 1、清蛋白 清蛋白(albumin)又称白蛋白,分子量较小,溶于水、中性盐类、稀酸与稀碱,可被饱与硫酸铵沉淀.清蛋白在自然界分布广泛,如小麦种子中得麦清蛋白、血液中得血清清蛋白与鸡蛋中得卵清蛋白等都属于清蛋白。 2、球蛋白 球蛋白(globulins)一般不溶于水而溶于稀盐溶液、稀酸或稀碱溶液,可被半饱与得硫酸铵沉淀.球蛋白在生物界广泛存在并具有重要得生物功能。大豆种子中得豆球蛋白、血液中得血清球蛋白、肌肉中得肌球蛋白以及免疫球蛋白都属于这一类. 3、组蛋白 组蛋白(histones)可溶于水或稀酸。组蛋白就是染色体得结构蛋白,含有丰富得精氨酸与赖氨酸,所以就是一类碱性蛋白质。 4、精蛋白 精蛋白(protamines)易溶于水或稀酸,就是一类分子量较小结构简单得蛋白质。精蛋白含有较多得碱性氨基酸,缺少色氨酸与酪氨酸,所以就是一类碱性蛋白质。精蛋白存在于成熟得精细胞中,与DNA 结合在一起,如鱼精蛋白。 5、醇溶蛋白 醇溶蛋白(prolamines)不溶于水与盐溶液,溶于70%~80%得乙醇,多存在于禾本科作物得种子中,如玉米醇溶蛋白、小麦醇溶蛋白。 6、谷蛋白类 谷蛋白(glutelins)不溶于水、稀盐溶液,溶于稀酸与稀碱。谷蛋白存在于植物种子中,如水稻种子中得稻谷蛋白与小麦种子中得麦谷蛋白等。 7、硬蛋白类 硬蛋白(scleroproteins)不溶于水、盐溶液、稀酸、稀碱,主要存在于皮肤、毛

蛋白质功能-结构-相互作用预测网站工具合集

蛋白质组学 蛋白质是生物体的重要组成部分,参与几乎所有生理和细胞代谢过程。此外,与基因组学和转录组学比较,对一个细胞或组织中表达的所有蛋白质,及其修饰和相互作用的大规模研究称为蛋白质组学。 蛋白质组学通常被认为是在基因组学和转录组学之后,生物系统研究的下一步。然而,蛋白质组的研究远比基因组学复杂,这是由于蛋白质内在的复杂特点,如蛋白质各种各样的翻译后修饰所决定的。并且,研究基因组学的技术要比研究蛋白质组学的技术强得多,虽然在蛋白质组学研究中,质谱技术的研究已取得了一些进展。 尽管存在方法上的挑战,蛋白质组学正在迅速发展,并且对癌症的临床诊断和疾病治疗做出了重要贡献。几项研究鉴定出了一些蛋白质在乳腺癌、卵巢癌、前列腺癌和食道癌中表达变化。例如,通过蛋白质组学技术,人们可以在患者血液中明确鉴定出肿瘤标志物。表1列出了更多的蛋白质组学技术用于研究癌症的例子。 另外,高尔基体功能复杂。最新研究表明,它除了参与蛋白加工外,还能参与细胞分化及细胞间信号传导的过程,并在凋亡中扮演重要角色,其功能障碍也许和肿瘤的发生、发展有某种联系。根据人类基因组研究,约1000多种人类高尔基体蛋白质中仅有500~600种得到了鉴定,建立一条关于高尔基体蛋白质组成的技术路线将有助于其功能的深入研究。 蛋白质组学是一种有效的研究方法,特别是随着亚细胞器蛋白质组学技术的迅猛发展,使高尔基体的全面研究变为可能。因此研究人员希望能以胃癌细胞中的高尔基体为研究对象,通过亚细胞器蛋白质组学方法,建立胃癌细胞中高尔基体的蛋白质组方法学。 研究人员采用蔗糖密度梯度的超速离心方法分离纯化高尔基体,双向凝胶电泳(2-DE)分离高尔基体蛋白质,用ImageMaster 2D软件分析所得图谱,基质辅助激光解吸离子化飞行时间质谱(MALDI-TOF MS)鉴定蛋白质点等一系列亚细胞器蛋白质组学方法建立了胃癌细胞内高尔基体的蛋白图谱。 最后,人们根据分离出的纯度较高的高尔基体建立了分辨率和重复性均较好的双向电泳图谱,运用质谱技术鉴定出12个蛋白质,包括蛋白合成相关蛋白、膜融合蛋白、调节蛋白、凋亡相关蛋白、运输蛋白和细胞增殖分化相关蛋白。通过亚细胞器分离纯化、双向电泳的蛋白分离及MALDI-TOF MS蛋白鉴定分析,研究人员首次成功建立了胃癌细胞SGC7901中高尔基体的蛋白质组学技术路线。 3.1 蛋白质功能预测工具 也许生物信息学方法在癌症研究中最常用的就是基因功能预测方法,但是这些数据库只存储了基因组的大约一半基因的功能。为了在微阵列资料基础上完成功能性的富集分析,基因簇的功能注解是非常重要的。近几年生物学家研发了一些基因功能预测的方法,这些方法旨在超越传统的BLAST搜索来预测基因的功能。基因功能预测可以以氨基酸序列、三级结构、与之相互作用的配体、相互作用过程或基因的表达方式为基础。其中最重要的是基于氨基酸序列的分析,因为这种方法适合于微阵列分析的全部基因。 在表3中,前三项列举了三种同源搜索方法。FASTA方法虽然应用还不太广泛,但它要优于BLAST,或者至少相当。FASTA程序是第一个使用的数据库相似性搜索程序。为了达到较高的敏感程度,程序引用取代矩阵实行局部比对以获得最佳搜索。美国弗吉尼亚大学可以提供这项程序的地方版本,当然数据库搜索结果依赖于要搜索的数据库序列。如果最近的序列数据库版本在弗吉尼亚大学不能获得,那么就最好试一下京都大学(Kyoto University)的KEGG站点。PSI-BLAST(位点特异性反复BLAST)是BLAST的转化版本,PSI-BLAST的特色是每次用profile 搜索数据库后再利用搜索的结果重新构建profile,然后用新的profile再次搜索数据库,如此反复直至没有新的结果产生为止。PSI-BLAST先用带空位的BLAST搜索数据库,将获得的序列通过多序列比对来构建第一个pro自然地拓展了BLAST方法,能寻找蛋白质序列中的隐含模式,有研究表明这种方法可以有效地找到很多序列差异较大而

蛋白质结构与功能的关系

蛋白质结构与功能的关系 专业:植物学 摘要:蛋白质特定的功能都是由其特定的构象所决定的,各种蛋白质特定的构象又与其一级结构密切相关。天然蛋白质的构象一旦发生变化,必然会影响到它的生物活性。由于蛋白质的构象的变化引起蛋白质功能变化,可能导致蛋白质构象紊乱症,当然也能引起生物体对环境的适应性增强。而分子模拟技术为蛋白质的研究提供了一种崭新的手段。在理论上解决了结构预测和功能分析以及蛋白质工程实施方面所面临的难题。它在蛋白质的结构预测和模建工作中占有举足轻重的地位,实现了生物技术与计算机技术的完美结合。 关键词:蛋白质的结构、功能;折叠/功能关系;蛋白质构象紊乱症;分子模拟技术;同源建模 RNase是由124个氨基酸残基组成的单肽链,分子中 8 个Cys的-SH构成4对二硫键,形成具有一定空间构象的蛋白质分子。在蛋白质变性剂和一些还原剂存在下,酶分子中的二硫键全部被还原,酶的空间结构破坏,肽链完全伸展,酶的催化活性完全丧失。当用透析的方法除去变性剂和巯基乙醇后,发现酶大部分活性恢复,所有的二硫键准确无误地恢复原来状态。若用其他的方法改变分子中二硫键的配对方式,酶完全丧失活性。这个实验表明,蛋白质的一级结构决定它的空间结构,而特定的空间结构是蛋白质具有生物活性的保证。前体与活性蛋白质一级结构的关系,由108个氨基酸残基构成的前胰岛素原,在合成的时候完全没有活性,当切去N-端的24个氨基酸信号肽,形成84个氨基酸的胰岛素原,胰岛素原也没活性,在包装分泌时,A、B链之间的33个氨基酸残基被切除,才形成具有活性的胰岛素。 功能不同的蛋白质总是有着不同的序列;种属来源不同而功能相同的蛋白质的一级结构,可能有某些差异,但与功能相关的结构也总是相同。若一级结构变化,蛋白质的功能可能发生很大的变化。蛋白质特定的功能都是由其特定的构象所决定的,各种蛋白质特定的构象又与其一级结构密切相关。天然蛋白质的构象一旦发生变化,必然会影响到它的生物活性。由于蛋白质的构象的变化引起蛋白质功能变化,可能导致蛋白质构象紊乱症,当然也能引起生物体对环境的适应性增强。 虽然蛋白质结构与生物功能的关系比序列与功能的关系更加紧密,但结构与功能的这种关联亦若隐若现,并不能排除折叠差别悬殊的蛋白质执行相似的功能,折叠相似的蛋白质执行差别悬殊功能的现象的存在。无奈,该领域仍不得不将100多年前Fisher提出的“锁一钥

相关文档