代谢组学方法与应用许国旺张强

上传人:痛*** 文档编号:100340782 上传时间:2022-06-02 格式:DOC 页数:68 大小:411.50KB
收藏 版权申诉 举报 下载
代谢组学方法与应用许国旺张强_第1页
第1页 / 共68页
代谢组学方法与应用许国旺张强_第2页
第2页 / 共68页
代谢组学方法与应用许国旺张强_第3页
第3页 / 共68页
资源描述:

《代谢组学方法与应用许国旺张强》由会员分享,可在线阅读,更多相关《代谢组学方法与应用许国旺张强(68页珍藏版)》请在装配图网上搜索。

1、第1章绪论随着人类基因组测序工作的完成,基因功能的研究逐渐成为热点,随之出现了一系列的“组学”研究,包括研究转录过程的转录组学(transcriptomics)、研究某个生物体系中所有蛋白质及其功能的蛋白质组学(proteomics)及研究代谢产物的变化及代谢途径的代谢组学(metabolomics或metabonomics)(图1-1)。代谢组学是众多组学中的一种,是随着生命科学的发展而发展起来的。与其他组学不同,代谢组学是通过考察生物体系(细胞、组织或生物体)受刺激或扰动后(如将某个特定的基因变异或环境变化后),其代谢产物的变化或其随时间的变化,来研究生物体系的一门科学1。所谓代谢组(me

2、tabolome)是基因组的下游产物也是最终产物,是一些参与生物体新陈代谢、维持生物体正常功能和生长发育的小分子化合物的集合,主要是相对分子质量小于1000的内源性小分子。代谢组中代谢物的数量因生物物种不同而差异较大,据估计,植物王国中代谢物的数量在200000种以上,单个植物的代谢物数量在500025000,甚至简单的拟南芥(Arabidopsisthaliana)也产生约5000种代谢产物,远远多于微生物中的代谢产物(约1500种)和动物中的代谢产物(约2500种)2。实际上,在人体和动物中,由于还有共存的微生物代谢、食物及其代谢物本身的再降解,到目前为止,还不能估计出到底有多少种代谢产物

3、,浓度分布范围有79个数量级。因此对代谢组学的研究,无论从分析平台、数据处理及其生物解释等方面均面临诸多挑战。本章对代谢组学发展的历史、国内外现状、研究方法、典型应用领域及研究热点等给予了介绍。1.1代谢组学简介1.1.1代谢组学发展的时代背景生命科学是研究生命现象、生命活动的本质、特征和发生、发展规律,以及各种生物之间和生物与环境之间相互关系的科学。自从1953年Watson和Crick建立了DNA双螺旋结构模型后,生命科学研究的面貌便焕然一新。在此基础上发展的分子生物学使得生命的基本问题,如遗传、发育、疾病和进化等,都能从分子机制上得到诠释。生物学研究进入了对生命现象进行定量描述的阶段。分

4、子生物学的飞速发展极大地推动了人们从分子组成水平对生物系统进行深人的了解。基因组计划向人们展示了包括大肠杆菌、酵母、线虫、果蝇、小鼠等模式生物以及人类的所有遗传信息的组成,生命的奥秘就存在于这些序列中。技术上的突破使得基因组数据的获得已经不再是生命科学的难点。人类基因组计划的基本完成标志着后基因组时代的到来,在这一时期,基因组功能分析成为生命科学的主要任务,核心思想是以整体和联系的观点来看待生物体内的物质群,研究遗传信息如何由基因经转录向功能蛋白质传递,基因功能如何由其表达产物蛋白质以及代谢产物来体现。继基因组(genome)后、转录组(transcriptome)、蛋白质组(proteome

5、)等相继出现,并相应形成“omics”学说,如转录组学(transcriptom-ics)、蛋白质组学(proteomics)等。但是基因与功能的关系是非常复杂的,还不能用转录组、蛋白质组来表达生物体的全部功能。生物体内存在着十分完备和精细的调控系统以及复杂的新陈代谢网络,它们共同承担着生命活动所需的物质与能量的产生与调节。在这一复杂体系中,既有直接参与物质与能量代谢的糖类、脂肪及其中间代谢物,也有对新陈代谢起重要调节作用的物质。这些物质在体内形成相互关联的代谢网络,基因突变、饮食、环境因素等都会引起这一网络中某个或某些代谢途径的变化,这类物质的变化可以反映机体的状态。起调节作用的代谢物,从生

6、理功能上来说包括神经递质、激素和细胞信号转导分子等,从化学组成上来说包括多肽、氨基酸及其衍生物、胺类物质、脂类物质和金属离子等,这些调节物质绝大部分都是小分子物质,在植物与微生物中还存在着大量的次生代谢产物。这些分子广泛分布于体内,对多种生理活动都具有普遍和多样的调节作用,仅微量存在就能够发挥很强的生物效应。不同活性的分子或协同、或拮抗、或修饰而相互影响,在生物学效应以及信号转导和基因表达调控上形成复杂的网络,承担着维持机体稳态的重要使命,是神经内分泌和免疫网络调节的物质基础和自稳态调节的最重要成分。转录组、蛋白质组的研究很难涵盖这些非常活跃而且非常重要的生命活性物质,然而对这类物质的生理和病

7、理生理学意义如果不能充分认识,就不可能真正阐明生命功能活动的本质。传统研究方法是以生理学和药理学实验方法为主,缺乏高通量的研究技术,难以建立生物小分子物质复杂体系的研究模式。在这种情况下,代谢组(metabolome)和代谢组学(metabolomics或metabonomics)应运而生了,并成为系统生物学的一个重要突破口3,代谢处于生命活动调控的末端,因此代谢组学比基因组学、蛋白质组学更接近表型。从广义的代谢组学的意义上来说,代谢组学的历史是相当长的,很早以前人们就已经对生物样品中的某些靶标化合物进行分析以了解生命机体的状态。目前代谢组学所采用的一些技术平台,如NMR和色谱技术以及质谱技术

8、也有比较长的应用历史。严格意义上的代谢组学(对限定条件下的特定生物样品中所有代谢组分的定性和定量)从提出到现在只有短短数年的时间。现在一般认为代谢组学源于代谢轮廓(metabolicprofiling)分析,在代谢轮廓分析中体现了代谢组学的“尽可能多地分析生物样本中的代谢产物”这一理念的萌芽。在这里,我们对从代谢轮廓分析发展到代谢组学这一过程4(图1-2)做一简单的介绍。早在20世纪70年代初,Baylor医学院就发表了有关代谢轮廓分析方面的论文,在他们的工作中采用了GC-MS的方法对多种类固醇、有机酸以及尿中药物的代谢物进行了分析,并将这种多组分分析的方法称为代谢轮廓分析,开创了对复杂样品进

9、行代谢轮廓分析的先河。此后代谢轮廓分析广泛应用于血、尿等生物样本中代谢物的定性与定量分析,以对疾病进行筛选和诊断。在临床上使用GC-MS的方法来诊断疾病的方法一直沿用到今天。紧接着,人们把重点主要放在分析的自动化上,并将GC的方法用于其他类型化合物的分析。进入20世纪80年代,人们开始使用高效液相色谱和核磁共振的技术来进行代谢轮廓的分析,如1982年,荷兰应用科学研究所(TNO)的vanderGreef5在国际上首先采用质谱对尿中代谢指纹进行研究。1983年,Sadler、Buckingham和Nicholson发表了第一个有关全血和血浆的1H-NMR谱6。在1986年,色谱杂志Journal

10、 of Chromatography发表了一期有关代谢轮廊(metabolic profiling)分析的专辑。进入90年代,代谢轮廓分析技术一直平稳发展,每年都有1015篇的论文发表,不过这一时期人们的目标更多地集中于某些特定的标靶化合物上。在90年代初,Sauter等人用基于GC-MS代谢轮廓分析的方法研究了不同除草剂对大麦的影响,这种用代谢轮廓分析来研究各种因素对生物功能的影响的研究思路随即被人们认可。1997年,Steven Oliver研究小组提出了通过对代谢产物的数量和定性来评估酵母基因的遗传功能及其冗余度,并率先提出了代谢组的概念7。1999年,J.Nicholson等提出met

11、abonomics的概念8,并在疾病诊断、药物筛选等方面做了大量卓有成效的工作1,911。接着,德国的Max-Planck-Institut的科学家们开始了植物代谢组学的研究12,使代谢组学得到了极大的充实。代谢组学的特点为:(1)关注内源化合物。(2)对生物体系中的小分子化合物进行定性定量研究。(3)上述化合物的上调和下调指示了与疾病、毒性、基因修饰或环境因子的影响。(4)上述内源性化合物的知识可以被用于疾病诊断和药物筛选。与转录组学和蛋白质组学比较,代谢组学有以下优点13:(1)基因和蛋白质表达的微小变化会在代谢物上得到放大,从而使检测更容易。(2)代谢组学的研究不需建立全基因组测序及大量

12、表达序列标签(EST)的数据库。(3)代谢物的种类要远小于基因和蛋白质的数目(每个组织中大约为13数量级,即使在最小的细菌基因组中也有几千个基因)。(4)研究中采用的技术更通用,这是因为给定的代谢物在每个组织中都是一样的 缘故。代谢组学是近几年才发展的一门新兴的技术,如何对这种技术进行命名曾经有争 议,国际上存在metabolomics和metabonomics两个词汇,一般认为,metabolomics是通过考察生物体系受刺激或扰动后(如将某个特定的基因变异或环境变化后)代谢产物 的变化或其随时间的变化,来研究生物体系的代谢途径的一种技术。而metabonomics 是生物体对病理生理刺激或

13、基因修饰产生的代谢物质的质和量的动态变化的研究。前者 一般以细胞作研究对象,后者则更注重动物的体液和组织。在植物、微生物领域一般用metabolomics,在药物研究和疾病诊断中,一般用metabonomics。现在这两个定义已经模糊化6,没有特别的区分。1.1.2代谢组学研究现状目前,代谢组学正日益成为生命科学研究的重点之一,在世界范围越来越多的科学工作者已加入到代谢组学的研究中。这可以从以下几个方面体现。1.1.2.1 有关代谢组学的文献数量增长迅速,学术活动活跃“Web of knowledge”是检索科学文献最好的网站之一,在该网站以metabolomics or metabonomi

14、cs 和 metabolic profiling 为主题词进行检索,可得图 1-3。以 metabolomics or metabonomics 检索可得 1950 篇,以 metabolic profiling 检索可得 4581 篇 (2008 年 1 月 5 日)。类似地,从 “Web of knowledge” 使用 proteomics 和 metabolome 分别检索到总文献9361篇和1000篇(图1-4),发现引用次数分别为112 566和8355,平均每篇引用分别为12. 02和8.35,h指数分别为113和39。从中可知,尽管代谢组 学比较年轻,是新兴技术,文献的总量不多

15、,但与蛋白质组学相比,它们具有非常类似的发展趋势。代谢组学的学术活动也在蓬勃进行,2001年12月在美国举行了题为“Metabolic Profiling: Pathways in Discovery”的专题会议,一年后(2002年11月)在加利福尼亚州召开的系统组学国际会议也特别强调了代谢组学。有关植物代谢组学方面的会议更多,2002年4月、2003年4月、2004年6月及2006年7月分别在荷兰、德国、美国和英国举行了第一届、第二届、第三届和第四届植物代谢组学国际会议,会议就分析技术 的发展、代谢数据的生物信息和数据统计分析、标准化及数据库、代谢组学在解决生物技术问题中的作用和发展农作物等

16、方面进行了广泛的探讨。2008年7月,国际植物代谢组学会议将在日本的横滨召开。为与代谢组学的迅猛发展相适应,国际代谢组学学会(http:/metabolomicssociety.org/)应运而生,并创刊了专业杂志Metabolomics( First International Conference of the Metabolomics Society)。在取得成功的基础上,2006 年和 2007 年分别在美国和英国召开了第二届、第三届代谢组学学会的国际会议。这些会议的召开加速了代谢组学的发展。国内在这一领域也紧跟国际前沿,中国科学院大连化学物理研究所在2001年学科 规划时就将代谢组学

17、列为中国科学院知识创新工程(二期)重要方向予以支持。自 2003年较全面地介绍代谢组学的综述发表后14,又陆续有许多综述性的文章发表,内容涉及代谢组学的技术平台以及在医药、疾病、植物学等诸多方面的应用1518。2003 年9月,中国科学院生物局在上海召开了 “植物、微生物的代谢组学、代谢工程”学术 研讨会。2004年10月1011日在上海威斯汀大饭店,中国科学院大连化学物理研究 所和美国Waters公司合作举办的代谢组学高层研讨会及技术报告会隆重举行,英国伦敦帝国理工学院的Jeremy Nicholson教授受邀首次访问中国。此次研讨会的成功召开,进一步拉近了中国代谢组学与国际的距离,也标志着

18、中国科学院大连化学物理研究所和美国Waters公司“代谢组学联合实验室”的正式运行。2004年11月,中国科学院启 动了知识创新方向性项目“植物、微生物代谢组学的初步研究”。2004年12月18日, 天津药物研究院与天津大学共同主办的“代谢物组学与药物研究高层研讨会”在天津大学化工学院举行,就“代谢物组学与重大疾病药物治疗相关基础和应用研究”进行了深入探讨。2005年4月56日,Waters公司首届制药技术论坛在上海虹桥宾馆召开, Jeremy Nicholson教授和许国旺研究员等做了关于代谢组学、新药发现和研究等方面的报告,探寻代谢组学脉动对制药业的深层影响及其对中草药开发方向的揭示19。

19、在这期间,国内众多科研机构也纷纷加入代谢组学研究的行列。2005年,许国旺受Springer Link邀请,正式成为Metabolomics杂志编委。在“大连化学物理研究所科学论坛 (DICP SYMPOSIUM)专项基金”资助下,中国科学院大连化学物理研究所分别在 2005年4月和2006年9月组织了“现代分离/分析化学和代谢组学”和“分析生物化学和中医药代谢组学”科学论坛,邀请了数十位来自英国、美国、德国、荷兰、日本、 比利时、中国、中国香港、中国澳门等国家和地区的著名专家和学者参加。在国家有关部门和单位的配合下,2006年9月1314日在中国科学院大连化学物理研究所召开了为期2天的主题为

20、“医学代谢组学”的第284次香山科学会议,国内数家相关研究机构、大专院校和国外多个从事代谢组学研究的团体近50余位专家学者应邀出席。由中国工程院医药卫生学部等主办的2007年“环渤海医药发展前沿论坛”暨“代谢组学与中药研究”调研汇报会于2007年12月2122日在天津举行,在刘昌孝、张伯礼和杨胜利三位院士的组织下,中药代谢组学研究的部分优势单位(中国科学院大连化学物理 研究所、天津药物研究院、上海交通大学、中国药科大学、浙江大学、中国科学院武汉 物理与数学研究所、天津中医药大学、沈阳药科大学等)的专家就代谢组学的技术平台、生物信息学、中药安全性、中药资源和质量、中药方剂作用机制和中药作用物质基

21、础等报告最新的研究进展。所有这些学术研讨会,一方面提供了与国内外一流科学家交流的机会,另一方面也使得我国的研究队伍不断扩大和加强。1.1.2.2 代谢组学在各国的科研战略上得到了重视美国Global Information Inc. 的市场调查报告显示,20022007年代谢组学技术 工业的市场年增长率将达到46%20。2003年,美国国立卫生研究院(National Institutes of Health,NIH)在其中长期发展规划 (NIH Roadmap)中21,设立代谢组学专题,提出了要建立专门收集小分子信息并从事高通量筛选的研究中心,发展代谢组学技术平台,更快、更多地发现具有生物活

22、性的小分子的构想。其下属的The National Institute of General Medical Sciences已在2003年批给加州大学3500万美元的一个5年计划做鼠巨噬细胞的类脂组学(lipidomics)研究。与此类似,日本政府也专门设立了“Construction of Basic Techniques for Lipidomics and Their Application” 国家项目,建立类脂的代谢途径数据库。2005年1月,加拿大启动7 “人类代谢组项目”(http:/www. metabolomics. ca/),希望从组织和体液中识别、定量和分离出浓度大于1m

23、ol/L 的所有代谢物。到2006年底,已定性出800个代谢产物。预期有1400个代谢产物可被定性、定量,其信息可放到公共数据库中,并可制备出单体保存到一80的冰箱中。至2008年1月5日,该项目已从数千种书籍、杂志文献和电子数据库中收集了2500个内源性代谢产物,建立了人类代谢组数据库(http:/www.hmdb. ca/)22。库中每种代谢产物都有其相应的化学、临床、分子生物学和生化数据,据说是目前世界上最全的关于人类代谢物和人类代谢的数据库。我国政府也十分重视代谢组学的研究,科技部早在2003年就将代谢组学平台技术的建立列入了国家“863”计划,并交给大连化学物理研究所所承担。在“十一

24、五”期间,科技部先后在国家重大研究计划“蛋白质科学”、国家重点基础研究发展规划 (“973”)、国家高技术研究发展计划(“863”计划)和“十一五”科技支撑项目、食品 安全等方面支持了代谢组学的研究。国家自然科学基金委员会化学科学部连续多年将 “组学分析中的新原理、新方法和新技术”列为重点项目支持方向。代谢组学有着巨大的理论价值和应用前景,企业界对此也非常关注,西方国家先后成立了多个关于代谢组学研究的研究中心或公司,如德国MAX-PLANCK-INSTITUT 的分子植物生理所、英国的Metabometrix Ltd、荷兰的Platform Plant Metabolomics(PPM)、美国

25、的 The Metabolomics Group、加拿大的Phenomenome Discoveries Inc. 等。PFIZER等六个大制药公司与英国帝国理工学院的科学家们一起组织了一个为期3年的关于药物毒性研究的研究小组(COMET 1),拟在药物的发现(discovery)到开发(development)阶段用代谢组学的方法来评价药物的毒性(详见第13章)。在第一期取 得成功的基础上,第二期项目(COMET 2)也于2006年3月正式启动,目标是研究标准毒物的分子机制,进而建立具预测性的构效关系专家系统。以代谢组学为核心的系统生物学技术建立的BG MEDICINE公司(http:/ww

26、w. bg- D. Anderson Cancer Center合作以识别新的、专一性好的、敏感的用于监测乳腺癌患者治疗效果的血中蛋白质和小分子标志物。并从ACS Biomarker B. V获得授权来开发和商品化基于生物标志物的分子诊断测试方法以预兆充血性心力衰竭(congestive heart failure)。与 Multiple Sclerosis Research Center of New York (MSRCNY)合作以发现针对疾病和市场上现有药物疗效、安全性的新标 志物。正在与FDA及7个制药公司合作以发现肝毒的生物标志物。Metabolon 与美国传染病军队医学研究所(U.

27、S. Army Medical Research Institute of Infectious Diseases,USAMRIID)签署协议23,军队将使用Metabolon 的代谢组学技术平台来研究接种AVA炭疽热疫苗(anthrax vaccine)的人的生化轮廓(biochemical profile)。 AVA 疫苗是 FDA 许可的唯一接种人的炭疽热疫苗。 这也是第一个对接种疫苗的人的大规模代谢组学研究,这种生化轮廓将帮助USAMRIID较好地了解疫苗的安全性、有效性及其作用机制。所有这些说明,代谢组学得到了学术界、政府和工业界的极大重视。1.1.3 代谢组学与系统生物学在几种常见

28、的组学研究中,基因组学主要研究生物系统的基因结构组成,即DNA的序列及表达。蛋白质组学研究由生物系统表达的蛋白质及由外部刺激引起的差异。代谢组学是研究生物体系(细胞、组织或生物体)受外部刺激所产生的所有代谢产物的变化,可以认为代谢组学是基因组学和蛋白质组学的延伸。随着这些组学研究的深入,科学家们逐渐认识到:基因组的变化不一定能够得到表达,从而并不对系统产生实质影响。某些蛋白质的浓度会由于外部条件的变化而升高,但由于这个蛋白质可能不具备活性,从而也不对系统产生影响。同时,由于基因或蛋白质的功能补偿作用,某个基因或蛋白质的缺失会由于其他基因或蛋白质的存在而得到补偿,最后反应的净结果为零。而小分子的

29、产生和代谢才是这一系列事件的最终结果,它能够更准确地反映生物体系的状态24。因此,系统生物学的研究应涵盖基因组学、转录组学、蛋白质组学和代谢组学,任何单一组学的研究对生物问题的理解都是不全面的。系统生物学是在细胞、组织、器官和生物体整体水平研究结构和功能各异的各种分子及其相互作用,并通过计算生物学来定量描述和预测生物功能、表型和行为的科学2528。系统生物学从基因组序列开始,完成从生命密码到生命过程的研究。如果将生命体看成一个在基因调控下的无数的相互关联的生化反应所组成的一个新陈代谢网络,那么系统生物学将要鉴别每一个反应节点的各种分子及其相互作用,从局部到整体,最终完成整个生命活动的路线图。系

30、统生物学的主要技术平台为基因组学、转录组学、蛋白质组学、代谢组学、相互作用组学和表型组学等,这些“组学”分别在DNA、mRNA、蛋白质和代谢产物水平检测和鉴别各种分子并研究其功能以及各种分子之间的相互关系。进而发现生化反应的途径和网络,构建生物学模块,并在研究模块相互作用的基础上绘制生物体的相互作用图谱。代谢组学与其他组学结合对阐明生命的奥秘具有重要意义。1.2代谢组学的研究方法代谢组学研究一般包括样品采集和制备、代谢组数据的采集、数据预处理、多变量数据分析、标志物识别和途径分析等步骤(图1-5)29。生物样品可以是尿液、血液、组织、细胞和培养液等,采集后首先进行生物反应灭活、预处理,然后运用

31、核磁共振、质谱或色谱等检测其中代谢物的种类、含量、状态及其变化,得到代谢轮廓或代谢指纹。而后使用多变量数据分析方法对获得的多维复杂数据进行降维和信息挖掘,识别出有显著变化的代谢标志物,并研究所涉及的代谢途径和变化规律,以阐述生物体对相应刺激的响应机制,达到分型和发现生物标志物的目的29,30。根据研究的对象和目的不同,Oliver Fiehn将对生物体系的代谢产物分析分为四个层次12。(1)代谢物耙标分析(metabolite target analysis):对某个或某几个特定组分的分析。在这个层次中,需要采取一定的预处理技术,除掉干扰物,以提高检测的灵敏度。(2)代谢轮廓分析(metabo

32、lic profiling analysis):对少数所预设的一些代谢产物的定量分析。如某一类结构、性质相关的化合物(如氨基酸、顺二醇类)、某一代谢途径的所有中间产物或多条代谢途径的标志性组分。进行代谢轮廓分析时,可以充分利用这一类化合物的特有的理化性质,在样品的预处理和检测过程中,采用特定的技术来完成。(3)代谢组学(metabonomics,metabolomics):限定条件下特定生物样品中所有内源性代谢组分的定性和定量。进行代谢组学研究时,样品的预处理和检测技术必须满足对所有的代谢组分具有高灵敏度、高选择性、高通量的要求,而且基体干扰要小。代谢组学涉及的数据量非常大,因此需要有能对其数

33、据进行解析的化学计量学技术。(4)代谢指纹分析(metabolic fingerprinting analysis):不具体鉴定单一组分,而是通过比较代谢物指纹图谱的差异对样品进行快速分类(如表型的快速鉴定)。严格地说,只有第三层次才是真正意义上的代谢组学研究。目前,代谢组学的最终目标还是不可完成的任务,因为还没有发展出一种真正的代谢组学技术可以涵盖所有的代谢物而不管分子的大小和性质。但是,它和代谢轮廓(谱)分析有着显著的差别,在具体的实验中,代谢组学研究会设法解析所有的可见峰,因此代谢组学研究的特征也可以表述为它会设法分析尽可能多的代谢组分。1.2.1样品米集与制备样品的采集与制备是代谢组学

34、研究的初始步骤也是最重要的步骤之一,代谢组学研究要求严格的实验设计。首先需要采集足够数量的代表性样本,减少生物样品个体差异对分析结果的影响。实验设计中对样品收集的时间、部位、种类、样本群体等应给予充分考虑。在研究人类样本时,还需考虑饮食、性别、年龄、昼夜和地域等诸多因素的影响。此外,在分析过程中要有严格的质量控制,需要考察如样本的重复性、分析精度、空白等。这方面的知识详见第2、14、15章。根据研究对象、目的和采用的分析技术不同,所需的样品提取和预处理方法各异。如采用NMR的技术平台,只需对样品做较少的预处理即可分析。对体液的分析,大多数情况下,只要用缓冲液或水控制pH和减少黏度即可。采用MS

35、进行“全”成分分析时,样品处理方法相对简单,但不存在一种普适性的标准化方法,依据的还是“相似相洁原则”,脱蛋白后代谢产物通常用水或有机溶剂(如甲醇、己烷等)分别提取31,获得水提取物和有机溶剂提取物,从而把非极性相和极性相分开,以便进行分析。对于代谢轮廓分析或靶标分析,还需要做较为复杂的预处理,如常用固相微萃取、固相萃取、亲和色谱等预处理方法。用气相色谱或气相色谱-质谱联用时,常常需要进行衍生化,以增加样品的挥发性。由于特定的提取条件往往仅适合某些类化合物,目前尚无一种能够适合所有代谢产物的提取方法。应该根据不同的化合物选择不同的提取方法,并对提取条件进行优化。具体方法可见第11、14、15章

36、。由于代谢组学一次分析很多样品,样品不可能一天采集完成,因此,样品保存问题也应注意,最好是保存在80。COMET项目表明6,尿样保存在40冰箱中,至少9个月内没有发现变化。但在18个月后,发现TCA循环中的中间产物有轻微的变化。而血浆在80下保存6个月,在NMR谱上没有发现明显的变化。1.1.2 代谢组数据的采集完成样本的采集和预处理后,样品中的代谢产物需通过合适的方法进行测定。代谢组学分析方法要求具有高灵敏度、高通量和无偏向性的特点,与原有的各种组学技术只分析特定类型的化合物不同,代谢组学所分析的对象的大小、数量、官能团、挥发性、带电性、电迁移率、极性以及其他物理化学参数的差异很大。由于代谢

37、产物和生物体系的复杂性,至今为止,尚无一个能满足上述所有要求的代谢组学分析技术,现有的分析技术都有各自的优势和适用范围3236。最好采用联用技术和多个方法的综合分析。色谱37、质谱32、NMRM、毛细管电泳39,40、红外光谱41,42、电化学检测43等分离分析手段及其组合都出现在代谢组学的研究中。其中色谱-质谱联用方法兼备色谱的高分离度、高通量及质谱的普适性、高灵敏度和特异性,NMR特别是1H-NMR以其对含氢代谢产物的普适性而成为最主要的分析工具。NMR(见第6章):NMR是当前代谢组学研究中的主要技术,NMR的优势在于能够对样品实现无创性、无偏向的检测,具有良好的客观性和重现性,样品不需

38、要繁琐处理,具有较高的通量和较低的单位样品检测成本。此外,1H-NMR对含氢化合物均有响应,能完成样品中大多数化合物的检测,满足代谢组学中的对尽可能多的化合物进行检测的目标。NMR虽然可对复杂样品如尿液、血液等进行非破坏性分析,与质谱法相比,它的缺点是检测灵敏度相对较低(采用现有成熟的超低温探头技术,其检测灵敏度在纳克级水平)、动态范围有限,很难同时测定生物体系中共存的浓度相差较大的代谢产物;同时,购置仪器所需的投资也较大。为了提高NMR技术的灵敏度,研究者们采用了增加场强、使用低温探头和微探头的方法。针对分辨率的问题,使用了多维核磁共振技术和液相色谱-核磁共振联用(liquidchromat

39、ography-nuclearmagneticresonance,LC-NMR)。Daykin等44在研究中采用色谱技术,利用LC-NMR联用对心血管疾病患者血中的脂蛋白代谢产物进行了检测。Nicholson研究小组45,46采用近年来新发展的魔角旋转(magic angle spinning,MAS)技术,让样品与磁场方向成54.17旋转,从而克服了由于偶极耦合(dipolar coupling)引起的线展宽、化学位移的各向异性。应用MAS技术,研究者能够获得高质量的NMR谱图,样品中仅加入少量的D2O 而不必进行预处理,样品量只需约10mg。基于NMR技术的代谢组学方法已广泛地应用于药物毒

40、性4749、基因功能50,51以及疾病的临床诊断9,51,52。质谱(见第25章):相对于NMR灵敏度低、检测动态范围窄等弱点,MS具有较高的灵敏度和专属性,可以实现对多个化合物的同时快速分析与鉴定。随着质谱及其联用技术的发展,越来越多的研究者将色谱-质谱联用技术用于代谢组学的研究32,53,54。GC-MS方法的主要优点包括较高的分辨率和检测灵敏度,并且有可供参考、比较的标准谱图库,可以用于代谢产物定性。但是GC不能直接得到体系中难挥发的大多数代谢组分的信息,对于挥发性较低的代谢产物需要衍生化处理,预处理过程繁琐。GC-MS常用于植物和微生物代谢指纹分析5356,如Fiehn等12采用GC/

41、MS研究拟南芥(Ar-abidopsis)的基因型及其表型的关系,Styczynski等55对大肠杆菌的代谢产物进行了详细的分析。LC-MS避免了GC-MS中繁杂的样品前处理,由于其较高的灵敏度和较宽的动态范围,已被越来越多地用于代谢组学研究5759。它非常适合于生物样本中复杂代谢产物的检测和潜在标志物的鉴定。LC-MS的代谢组学研究通常采用反相填料、梯度洗脱程序。但对于体液样品特别是尿样,含有大量的亲水性代谢产物,这些代谢产物在反相色谱上不保留或保留很弱。最近研究者们使用亲水反应色谱(hydrophilic interaction chromatography,HILIC)60:解决亲水性物

42、质的弱保留问题。新的分析技术如超高效液相色谱/高分辨飞行时间质谱技术61,62、毛细管液相色谱-质谱联用技术63、傅里叶变换离子回旋共振技术64,65等也被用于代谢组学研究以提高代谢产物的检测灵敏度和通量。为解决通常液相色谱只能分离疏水性代谢物(反相色谱)或亲水性代谢物(亲水性色谱,HILIC)的问题,我们专门发展了一个柱切换二维液相系统6668,采用2根液相色谱柱(反相色谱柱和亲水作用色谱柱),通过阀切换实现了一次进样同时检测亲水和疏水代谢产物,解决了复杂生物样品中亲水性和疏水性代谢产物的同时检测问题。1.2.3数据分析平台代谢组学得到的是大量、多维的信息。为了充分挖掘所获得数据中的潜在信息

43、,对数据的分析需要应用一系列的化学计量学方法。在代谢组学研究中,大多数是从检测到的代谢产物信息中进行两类(如基因突变前后的响应)或多类(如不同表型间代谢产物)的判别分类12,69,以及生物标志物的发现59,70,71。数据分析过程中应用的主要手段为模式识别技术,包括非监督(unsupervised)学习方法和有监督(supervised)学习方法(见第7章)。非监督学习方法用于从原始谱图信息或预处理后的信息中对样本进行归类,并采用相应的可视化技术直观地表达出来,不需要有关样品分类的任何背景信息。该方法将得到的分类信息和这些样本的原始信息(如药物的作用位点或疾病的种类等)进行比较,建立代谢产物与

44、这些原始信息的联系,筛选与原始信息相关的标志物,进而考察其中的代谢途径。用于这个目的的方法没有可供学习利用的训练样本,所以称为非监督(unsupervised)学习方法。主要有主成分分析(principalcomponents analysis,PCA)59,72、非线性映射73、簇类分析74等。有监督学习方法用于建立类别间的数学模型,使各类样品间达到最大的分离,并利用建立的多参数模型对未知的样本进行预测。在这类方法中,由于建立模型时有可供学习利用的训练样本,所以称为有监督学习。这种方法经常需要建立用来确认样品归类(防止过拟合)的确认集(validation set)和用来测试模型性能的测试集

45、(test set)。应用于该领域的主要是基于PCA、偏最小二乘法(partial least squares,PLS)、神经网络的改进方法,常用的有类模拟软独立建模10,75和偏最小二乘法-判别分析(PLS-discriminant analysis, PLSDA)75,76、正交(O)-PLS77,78。作为非线性的模式识别方法,人工神经元网络(neutral network,ANN)技术79也得到广泛应用。PCA和PLS-DA是代谢组学研究中最常用的模式识别方法。这两种方法通常以得分图(score plot)获得对样品分类的信息,载荷图(loading plot)获得对分类有贡献变量及其

46、贡献大小,从而用于发现可作为生物标志物的变量。此外,在数据处理和分析的各阶段,对数据的质量控制和模型的有效性验证也需引起足够的重视8082。应该强调,由上述分析仪器导出的元数据(metadata),不能直接用于模式识别分析83,还需对数据进行预处理,将元数据转变为适合于多变量分析(主要是模式识别)的数据形式,使相同的代谢产物在生成的数据矩阵中由同一个变量表示,所有的样品具有相同的变量数。最后用于模式识别的数据为二维矩阵数据形式,行代表样品或实验数目,列表示相应的单个测定指标(通常为代谢物的信号强度等)。仪器的微小波动及样品pH和基体的变化会引起NMR中化学位移的改变,色谱-质谱方法中流动相组成

47、、柱温的微小变化、梯度的重现性及其柱表面的状态变化常导致保留时间的差异。在模式识别前,需对谱图实行峰匹配(或称峰对齐),使各样本的数据得到正确的比较。主要的数据预处理包括滤噪、重叠峰解析(deconvolution)、峰对齐、峰匹配、标准化和归一化等。在实际操作中,并不是这些步骤都需要进行,而是根据实际情况,只做其中几种预处理(表1-1)。相比之下,HPLC的保留时间重复性比GC要差一些,峰匹配要相对困难。我们发展的“多区域可变保留值窗口”的峰对齐算法90,不仅可用于HPLC,也可用于GC代谢组学的峰匹配99。关于这方面的详情,有兴趣的读者可参看第25章的内容,也可查看表1-1中的文献。1.2

48、.4代谢组学数据库代谢组学分析离不开各种代谢途径和生物化学数据库。与基因组学和蛋白质组学已有较完善的数据库供搜索、使用相比,目前代谢组学研究尚未有类似的功能完备的数据库100。一些生化数据库101105可供未知代谢物的结构鉴定或用于已知代谢物的生物功能解释,如连接图数据库(Connections Map DB)、京都基因与基因组百科全书(KEGG)、METLIN、HumanCyc、EcoCycmetacyc、BRENDALIGAND、Meta-Cyc、UMBBD、WIT2、EMP项目,IRIS、AraCyc、PathDB、生物化学途径(Ex-PASy)、互联网主要代谢途径(main metab

49、olic pathways on Internet,MMP)、Duke 博士植物化学和民族植物学数据库、Arizona大学天然产物数据库等,其中IRIS、Ara-Cyc分别为水稻和拟南芥的有关数据库。表1-2给出了其中的一些网址,可供读者参考。理想的代谢组学数据库应包括各种生物体的代谢组信息以及代谢物的定量数据,如人类代谢组数据库(http:/www.hmdb.ca)22中的那样。但实际上,这方面的信息非常缺乏。一些公共数据库对各种生物样本中代谢物的结构鉴定也非常有用,如Pubmed化合物库、ChemSpider数据库等(表1-2),后者包含有1650万个化合物的结构信息,可供网上检索。1.3

50、 代谢组学的应用代谢组学自从出现以来,引起了各国科学家的极大兴趣,广泛地应用于各个领域6,如疾病诊断、药物开发、植物代谢组学、营养科学106,107和微生物代谢组学等方面的研究中。详细的情况请见后面各章,这里只做简单归纳。1.3.1 药物研发药物研发领域,尤其是西方的药物研发主要沿用靶向研发策略,“致使90%的药物仅对30%50%的患者有效”,即50%70%的患者不但未从所接受的药物治疗中受益,反而要承担其所带来的副作用。鉴定出有效的具有生理和临床意义的标志物作为廉价、快捷的筛选对特定人群有效或有毒药物的方法,已成为大家的共识。事实上,由于药物开发成本的提高,新药发现-开发环节中的消耗变成了制

51、药工业所面临的巨大挑战之一。任何能快速、经济、有效地预测药物对特定人群的潜在毒性的工具,毫无疑问地都会被重点关注。代谢组学在疾病动物模型(包括转基因动物)的确证、药物筛选、药效及毒性评价、作用机制和临床评价等方面有着广泛的应用101104(详见第13章)。Nicholson研究小组104,105,108,109利用基于NMR的代谢组学技术,在药物毒性评价方面开展了深人的工作。他们的研究表明采用代谢组学方法可判断毒性影响的组织器官及其位点,推测药物相关作用机制,确定与毒性相关的潜在生物标志物;并在此基础上可建立供毒性预测的专家系统以及毒物影响动物内源性代谢物随时间的变化轨迹。在COMET研究项目

52、中,对147种典型药物的肝肾毒性进行了研究。通过检测正常和受毒大鼠和小鼠的体液、组织中代谢物的NMR谱,结合已知毒性物质的病理效应建立了第1个大鼠肝脏和肾脏毒性的专家系统。该专家系统分为3个独立的级别可实现正常/异常的判别、对未知标本进行毒性或疾病的识别以及病理学的生物标志物识别。目前COMET计划的目标是研究标准有毒药物的分子机制,进而建立可预测性的构效关系110,111。最近Mally等EM对1H-NMR代谢组学方法用于肾功能损伤标志物的可行性进行了研究。他们采用FeNTA或溴化钾引起的两种肾功能损伤小鼠模型,研究了4-羟基-2(E)-壬醛基-巯基尿酸作为肾功能损伤标志物的可行性。结果表明

53、1H-NMR代谢组学方法可以用来指示肾功能损伤,但对氧化应激无特异性;HNE-MA和其他的磷脂过氧化标志物有很好的相关性,标志物的类型与病理条件有关,尚未发现普适性的氧化应激标志物。1. 3. 2疾病研究由于机体的病理变化,代谢产物也产生了某种相应的变化。对这些由疾病引起的代谢产物的响应进行分析,即代谢组学分析,能够帮助人们更好地理解病变过程及机体内物质的代谢途径,还有助于疾病的生物标志物的发现和辅助临床诊断的目的。如Brin-die等应用1H-NMR技术以36例严重心血管疾病患者和30例心血管动脉硬化患者的血清和血浆为研究对象进行了代谢组学分析,结合PCA、SIMCA、PLDA、OSC-PL

54、S等模式识别技术实现了对心血管疾病及其严重程度的判别,得到了高于90%的灵敏度及专一性9。代谢组学在疾病研究中的应用主要包括病变标志物的发现、疾病的诊断、治疗和预后的判断113,114(详见第911章)。最广泛的应用是发现与疾病诊断、治疗相关的代谢标志物(群),通过代谢物谱分析得到的相关标志物是疾病的分型、诊断、治疗的基础。目前已有较多文献报道代谢组学在疾病研究的应用,如新生儿代谢紊乱115,116、冠心病117、膀胱炎118、高血压119和精神系统疾病120等。作者课题组将所建立的代谢组学方法应用于重大疾病(如肿瘤、2型糖尿病、重型肝炎等)的病变标志物研究中,建立了基于正相液相色谱/电喷雾线

55、性离子阱质谱方法,用于体液中磷脂的代谢轮廓谱分析121,122。将该方法用于2型糖尿病和健康人进行分类研究,识别出4种可能的磷脂分子生物标志物研究了n-3型多烯脂肪酸二十碳五烯酸(EPA)和二十二碳六烯酸(DHA)对人类JurkatE-6-lT细胞中膜脂筏和可溶膜区域中几种主要磷脂组成的影响。结果表明,EPA或DHA能够使脂酰链为n-3多不饱和脂肪酸(PUFA)的磷脂含量显著增加,揭示了PUFA免疫抑制作用的分子机制123124。作者课题组还建立了基于固相萃取(SPE)-HPLC的体液中核苷代谢轮廓分析方法125127,并将该方法应用于肿瘤的研究中,建立了正常人和癌症患者尿中核苷的排放水平和模

56、式;比较了不同癌种之间排放水平的差异,检测癌症的敏感性均显著高于目前已临床应用的肿瘤标志物。同时在区分良恶性肿瘤、监测手术和化疗效果以及预测肿瘤复发等方面都有较好的价值127(详见第10章)。同时将基于液相色谱质谱联用(LC-MS)方法的代谢组学平台应用于肝病的研究中,实现了不同肝病患者与正常人进 行有效区分,肝癌诊断中肝炎和肝硬化患者的假阳性率仅为7.4%37应用于慢性乙型肝炎的急性发作样本,诊断正确率为100%;并鉴定出1个传统标志物和4个新的标志物58。1.3.3 植物代谢组学植物代谢组学128的很多研究集中在细胞代谢组学这个相对独立的分支。主要是通过研究植物细胞中的代谢组在基因变异或环

57、境因素变化后的相应变化,去研究基因型和表型的关系及揭示一些沉默基因的功能,进一步了解植物的代谢途径129,130(详见第14章)。植物代谢组学研究大多集中在代谢轮廓或代谢物指纹图谱(metabolite fingerprinting)上。根据对象的不同,植物代谢组学的研究主要包括:某些特定种类(specie)植物的代谢物组学研究。这类研究通常以某一植物为对象,选择某个器官或组织,对其中的代谢物进行定性和定量分析。不同基因型(genotype)植物的代谢组学表型研究。一般需要两个或两个以上的同种植物(包括正常对照和基因修饰植物),然后应用代谢组学对所研究的不同基因型的植物进行比较和鉴别131,1

58、32。某些生态型(ecotype)植物的代谢组学。这类研究通常选择不同生态环境下的同种植物,研究生长环境对植物代谢物产生的影响。受外界刺激后的植物自身免疫应答。植物代谢组学研究最具代表性的是Fiehri等133135的工作,他们利用GC/MS技术通过对不同表型萌芦韧皮部(cucurbita maxima phloem)的433种代谢产物进行代谢组学分析,结合化学计量学方法(PCA、ANN和HCA)对这些植物的表型进行了分类,找到了4种在分类中起着相当重要的代谢物质:苹果酸(malicacid)和柠檬酸、葡萄糖和果糖。与线粒体和叶绿体中的基因型结果一致。随着植物细胞代谢组学的迅速发展,人们已经开

59、始利用这一技术的成果。Meta-nomics公司的成立就是一个典型的代表,他们的目标是寻找植物代谢过程中的关键基因,如能够让植物耐寒的基因。其思想就是遵循代谢组学的方法,在改变植物的基因后,进行植物的代谢分析或记录代谢产物,从而更迅速地掌握有关植物代谢途径的信息。目前所发现的次生代谢产物大约有80%来自植物。植物次生代谢产物包含很多功能组分,可用作药物(如青蒿素、紫杉醇、三萜皂苷等)、杀虫剂、染料、香精香料等。尽管植物能合成数十万种低分子质量的有机化合物(次生代谢产物),很多具有利用价值,但植物细胞的巨大合成能力并没有被很好地利用,更重要的是重要次生代谢产物的含量很低,如我国科学家首先自青蒿中

60、分离得到的对脑疟等恶性疟疾有突出疗效的青蒿素,在青蒿中的含量低于1%,与人们的期望相差甚远。到目前为止,植物的次生代谢网络没有被很好地表征,与生物合成相关的功能基因组图还远未完成。而这些对突破植物或植物细胞培养低产率的瓶颈十分重要。为此,我们与中国科学院北京植物研究所合作,开展了青蒿中萜类物质的代谢途径的研究。建立了基于全二维气相色谱-飞行时间质谱联用技术(GCGC-TOFMS)的青蒿挥发油分离分析方法,对青蒿中挥发油的成分进行分析,结果表明挥发油主要由烷烃、单萜、单萜含氧衍生物、倍半萜、倍半萜含氧衍生物5部分组成136。用全二维气相色谱与飞行时间质谱联用技术可从青蒿挥发油中鉴定出300多个化

61、合物,并鉴定出了青蒿素代谢途径中的重要中间产物。采用GCGC-TOFMS方法对转不同基因青蒿样品进行分析与定性,初步鉴定了将近100种萜类物质并找出普通植株与转基因植株在代谢产物上的差异。利用气相色谱火焰离子化检测器(GC-FID)和GC/MS方法为主要手段,对不同生长阶段的青蒿代谢指纹谱进行了研究137,青蒿的5个生长时期(幼苗期、成苗期、现蕾前期、现蕾期和盛花期)可以得到很好的区分,并证实了青蒿素产生途径中瓶颈的存在。1.3.4微生物代谢组学第一篇微生物代谢组学文献报道了基于GC-MS技术,通过分析脂肪酸、氨基酸和糖类并结合化学计量学方法监测肠系膜明串珠菌发酵生产葡聚糖过程中的微生物污染1

62、38。目前,代谢组学技术已应用于微生物表型分类139、突变体筛选140、代谢途径及微生物代谢工程141,142、发酵工艺的监控和优化143,144及微生物降解环境污染物145,146等方面147(详见第15章)。Buchholz等将快速取样技术和其他分析技术结合,实现了细胞内大量代谢物的快速、高频率定量,使之能够用于发酵过程的动态检测。该技术将帮助研究各种因素对发酵的影响,从而提高生物工程的产量。Dalliige等采用液相色谱与串联质谱联用对发酵过程中的氨基酸实现了监测,通过分析认为其中的一个子集可反映发酵的状态。Grivet等148对NMR这一技术用于微生物代谢组学研究做了较为详尽的综述;I

63、shii等149对微生物细胞中的计算机模拟做了很详细的综述,这里就不再赘述了。我们在研究不同基因修饰下胞内和胞外代谢物的变化规律与特点,比较不同底物、不同菌株胞内代谢物指纹谱的差异的基础上,考察了环境对微生物代谢的影响150,得到不同条件下嗜碱乳酸菌胞内氨基酸变化与发酵液中乳酸产量的关系。研究铜绿假单胞菌和大肠埃希菌在不同抗生素作用下三羧酸(tricarboxylicacid, TCA)循环和糖酵解途径中主要有机酸类代谢产物代谢池的变化,发现在铜绿假单胞菌中喹诺酮类抗生素对TCA代谢物的影响与-内酰胺类表现为负相关,这种相关性在抗菌活性上反映为具有正协同作用。对野生株、ack和sdh基因修饰株

64、大肠杆菌产琥珀酸情况进行分析发现,以葡萄糖和果糖为碳源时,ack株的生物量明显低于其他两株,而且同样条件下,果糖为唯一碳源的情况下,生物量高于葡萄糖为碳源的情况。通过对胞内代谢通量的分析发现,ack株的代谢通量改变较为显著。1.3.5 代谢组学与中医药现代化中医药学是我国医学科学的特色,也是中华民族优秀传统文化的重要组成部分。由于受我国科学技术整体水平的限制,中药研究水平较低、中药产业科技含量差、作用的物质基础研究有限、作用机制缺乏科学研究、药材资源数量和质量的制约因素多、认识中药毒性和不良反应还存在误区。这些因素严重地影响了中药在世界范围内的广泛使用和国际地位。正是基于此,国家提出了使用现代科学技术来研究中药中的药物作用的物质学基础、中药的质量控制、中药的毒性研究等,即中药现代化的研究。代谢组学的核心是研究外源性物质对生物体所产生的整体性效应。用它研究药物对机体所形成的内源性代谢组的系统作用时,其研究方法与中医治疗疾病的整体观念相一致151,从此意义来看,立题运用代谢组学研究中药,对认识中药的药效作用的物质基础、产生毒副作用的物质基础,认识正确用药剂量和疗程、防止毒性反应都非常有意义,也是系统

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!