毕业论文抗结核病药物的3DQSAR定量结构性质关系研究

上传人:痛*** 文档编号:71158684 上传时间:2022-04-06 格式:DOC 页数:71 大小:2.08MB
收藏 版权申诉 举报 下载
毕业论文抗结核病药物的3DQSAR定量结构性质关系研究_第1页
第1页 / 共71页
毕业论文抗结核病药物的3DQSAR定量结构性质关系研究_第2页
第2页 / 共71页
毕业论文抗结核病药物的3DQSAR定量结构性质关系研究_第3页
第3页 / 共71页
资源描述:

《毕业论文抗结核病药物的3DQSAR定量结构性质关系研究》由会员分享,可在线阅读,更多相关《毕业论文抗结核病药物的3DQSAR定量结构性质关系研究(71页珍藏版)》请在装配图网上搜索。

1、抗结核病药物的3D-QSAR定量结构性质关系研究摘 要采用三维全息原子场作用矢量(3D-HoVAIF)和基于虚拟蛋白质受体原子探针的分子表面随机采样分析(RaSMS)对25个查耳酮类抗结核病药物进行定量构效关系(QSAR)研究。运用多元线性回归(Multiple linear regression, MLR)及偏最小二乘回归(partial least square regression, PLS)建模,同时采用内部及外部双重验证的办法对所得模型稳定性能进行了深入分析和检验。采用3D-HoVAIF 的MLR及PLS建模的复相关系数(Rcum2)、留一法(leave-one-out, LOO)交

2、互校验(cross-validation, CV)复相关系数(QLOO2)和外部样本校验复相关系数(Qext2)分别为0.984、0.920、0.808和0.998、0.975、0.903;采用RaSMS分别为 0.975、0.914、0.764和0.926、0.905、0.829。结果表明,3D-HoVAIF和RaSMS都有较好表征抗结核药物分子结构信息,因而能建立具有良好稳定性和预测能力的QSAR模型。关键词:体外抗菌活性,抗结核病药物,三维全息原子场作用矢量,比较分子/虚拟受体相互作用分析法,定量构效关系Anti-TB drugs by 3D-QSAR Quantitative Stru

3、cture-Property Relationship StudyABSTRACTA newly developed three-dimensional holographic vector of atomic interaction field (3D-HoVAIF) and Protein-based virtual surface receptor molecule atom probe analysis of random sampling (RaSMS) were used to describe the chemical structures of 25 Chalcone as a

4、ntituberculosis agents. Here quantitative structure activity relationship (QSAR) models were built by Multiple linear regression (MLR) and partial least square regression (PLS). The estimation stability and generalization ability of these models were strictly analyzed by both internal and external v

5、alidations. When use 3D-HoVAIF, the correlation coefficient (R2) of established MLR and PLS, leave-one-out (LOO) cross-validation (CV), predicted values versus experimental ones of external samples were 0.998、0.975、0.903 and 0.926、0.785、0.785, respectively. When use (RaSMS), the results were 0951、0.

6、914、0.829 and 0.928、0.905、0.764. The results indicated that results of PLS here had favorable estimation stability and good prediction capabilities. Satisfactory results showed that 3D-HoVAIF and RaSMS could preferably express information related to biological activity of anti-tuberculosis drug.KEY

7、WORDS: in vitro antibacterial activity, anti-tuberculosis drug, three-dimensional holographic vector of atomic interaction field, quantitative (3D-HoVAIF), Protein-based virtual surface receptor molecule atom probe analysis of random sampling (RaSMS), structure-activity relationship (QSAR)目 录摘 要IABS

8、TRACTII1 引 言11.1 结核病和抗结核病药物简介11.1.1 结核病简介11.1.2 抗菌活性11.1.3 抗结核病药物的发展历史11.1.4 抗结合药物回顾21.1.5 抗结核新药研究开发的现状21.2计量化学简介41.3 计算机辅助药物分子设计的基本理论与方法51.3.1 计算机药物辅助设计的基本理论51.3.2 常用的计算机辅助药物设计方法51.4 定量构效关系研究51.4.1 定量构效关系研究的基本理论51.4.2 定量构效关系研究的发展61.4.3 定量构效关系研究的意义71.4.4 定量构效关系的研究现状72 原理与方法92.1 三维全息原子场作用矢量(3D-HoVAIF

9、)的基本概念及相关计算92.2 基于虚拟蛋白质受体原子探针的分子表面随机采样分析(RaSMS)的基本概念及相关计算162.2.1 蛋白质受体原子探针162.2.2 虚拟受体可及表面172.2.3 药物分子中常见原子分类182.2.4 探针原子与药物配体的作用模式182.2.5 RaSMS实现过程192.3 多元线性回归原理202.4 偏最小二乘法原理213 模型的建立与检验233.1 数据采集233.2 变量筛选243.3 多元线性回归建模253.3.1模型的建立253.3.2 模型的检验273.4 偏最小二乘建模283.4.1 模型的建立283.4.2 模型的检验314 结论34致 谢35参

10、 考 文 献361 引 言1.1 结核病和抗结核病药物简介1.1.1 结核病简介结核病(tuberculosis, TB)是结核分枝杆菌(Mycobacterium tuberculosis, MTB)引起的感染性疾病,可侵犯全身各器官,以肺结核最为多见。它是一种发展缓慢、如果不加治疗能导致长期健康不良及死亡的疾病。结核病在过去被称为“痨病”。它是由于感染结核杆菌而引起的一种慢性传染病。它传染性强,散播面广,而且不分地域、季节均可能发生。结核病主要是通过空气传播的呼吸道传染病,此外还可以通过消化道、皮肤、胎盘和生殖器等途径传染。对人类来说,普遍对结核菌易感,但感染后是否发病决定于结核菌的毒力、

11、数量以及人体抵抗力。尤其是人体的抵抗力减退,就容易发生结核病1。全球有1/3人口感染了结核杆菌,其中99%的结核病死亡者分布在发展中国家。患病率高、死亡率高、耐药率高、年递降率低是结核病近年的疫情特征。100多年以来,虽有不少抗结核病药物被发现,但每年仍有30万人死于结核病,其中主要是1455岁的青年和中年人。近几年,结核发病率有上升趋势。据专家预测,如不采取有力措施,未来10年内全球将有3000万人死于结核病。全球每年有1%的人被结核杆菌感染,现有活动性肺结核病人2000万,每10秒钟就有1人死于结核病,每4秒钟就有1人患上结核病。我国现有活动性肺结核病人600万,每年因结核病死亡25万人。

12、1.1.2 抗菌活性抗菌活性是指抗菌药抑制或杀灭病原微生物的能力。可用体外抑菌试验和体内实验治疗法测定。体外抑菌实验对临床用药具有重要参考意义。能够抑制培养基内细菌生长的最低浓度为最小抑菌浓度(minimal inhibitory concentration, MIC)。以杀灭细菌为评定标准时,使活菌总数减少99%或99.5%以上,称为最小杀菌浓度(minimal bactericidal concentration, MBC)。在一批实验中能抑制50%或90%受试菌所需MIC,分别称为MIC50及MIC90。抗菌药的抑菌作用和杀菌作用是相对,有些抗菌药在低浓度时呈抑菌作用,而高浓度呈杀菌作用

13、。1.1.3 抗结核病药物的发展历史最早出现的有效抗结核药物当数链霉素(SM)。它发现于20世纪40年代,当时单用SM治疗肺结核23个月后就可使临床症状和X线影像得以改善,并可暂获痰菌阴转。对氨水杨酸(PAS)被应用于临床后发现,SM加PAS的治疗效果优于单一用药,而且可以防止结核分支杆菌产生耐药性。发明异烟肼(INH)后,有人单用INH和联用INH+PAS或SM进行对比治疗试验,再一次证明了联合用药的优势。于是在此基础上产生了著名的结核病“标准”化疗方案,即SM+INH+PAS,疗程一年半至两年,并可根据药源和患者的耐受性将PAS替换为乙胺丁醇(EMB)或氨硫脲(TB1),俗称“老三化”。2

14、0世纪70年代随着利福平(RFP)在临床上的应用以及对吡嗪酰胺(PZA)的重新认识,在经过大量的实验后,短程化疗成为结核病治疗的最大热点,并取得了令人瞩目的成就。1.1.4 抗结合药物回顾自1944年发现链霉素,20世纪5060年代发现异烟肼与利福平以来,相继有多种抗结核药问世。根据抗菌作用强弱可分为:1)具有杀菌作用的药物。如异烟肼、利福平、链霉素、卡那霉素、卷曲霉素、乙硫异烟胺、吡嗪酰胺等。2)具有一定杀菌作用的药物。如氧氟沙星、左氧氟沙星等喹诺酮类抗菌药。3)具有抑菌作用的药物。如乙胺丁醇、环丝氨酸、对氨基水杨酸等。按临床应用可分为一线与二线抗结核药。前者有异烟肼(NH)、利福平(RFP

15、)、链霉素(SM)、吡嗪酰胺(PZA)、乙胺丁醇(EB);后者有乙硫异烟胺(ETH)、卡那霉素(KM)、环丝氨酸(CS)、卷曲霉素(CPM)、氨硫脲(TBL)、对氨基水杨酸(PAS)、氧氟沙星(OFLX)2。1.1.5 抗结核新药研究开发的现状近年来抗结核药物的研究开发获得进一步的发展,发现了一些有苗头的新化合物,开发的前景也很广阔。1) 利福霉素类利福喷丁于1998年在美国获得批准用于治疗结核病。利福布丁获准用于HIV合并结核病不能应用利福平的患者。苯并口恶嗪利福霉素(rifalazil, KRM-1648, RLZ)比利福平具有更强的杀菌作用,对结核分枝杆菌的MIC比利福平强64倍,而半衰

16、期长60h,在小鼠结核病治疗实验中RLZ加吡嗪酰胺的联合灭菌效果可与异烟肼与利福平的联合治疗效果相比拟,而在停药后复发率更低。现进入期临床研究。但利福霉素类药物存在交叉耐药性,且有动物实验结果表明它们均对MDR-TB无效。2) 氟喹诺酮类(FQs)研究发现本类中第三代、第四代氟喹诺酮类药物中有不少具有较强的抗结核分枝杆菌活性,对非结核分枝杆菌亦有作用,目前环丙沙星、氧氟沙星、左氧氟沙星等成为治疗MDR-TB的主要选择药物。莫西沙星(moxiflox acin) ( MIC 0. 25 Lg/ ml)3、加替沙星(gatiflox acin) (0. 25Lg/ml)4和加仑诺沙星(gareno

17、x acin)等第四代FQs显示更强的抗结核活性,具有一定的开发潜力。3) 新大环内酯类药物(克拉霉素、阿奇霉素、罗红霉素)这类药物是红霉素的衍生物,抗分枝杆菌的作用机制是菌体内核糖体的SOS亚基可逆性结合,干扰蛋白质的合成。其中罗红霉素抗结核分枝杆菌作用最强。与利福平和异烟肼有协同作用。此类药物有良好的药动学特征,口服易吸收,组织穿透性好,组织细胞内浓度高于血药浓度,并有中等长的半衰期,新大环内酯类药物主要用于非结核分枝杆菌感染和耐多药结核病的治疗。4) 恶唑烷酮类本类属于新型的合成抗菌剂,具有广谱的抗分枝杆菌作用,作用机制是通过与50S核糖体亚单位相结合抑制细菌蛋白质的合成,目前正从中开发

18、抗革兰阳性耐药菌和抗分枝杆菌的新药。其中PNU-100480在治疗小鼠结核感染中证实其疗效,剂量100 mg/kg时与异烟肼25 mg/kg的效果相当,此外在合并的实验中发现其作用与异烟肼或利福平在不同实验中的活性5。另一药利奈唑酮(Linezolid)在小鼠实验治疗中比PNU-100480和异烟肼稍差,已试用于耐药结核病的治疗并取得明显的疗效6,但因有血液学毒性等及价格昂贵等问题而受限。5) 硝基咪唑并吡喃类源于20世纪70年代印度研究者的发现,CGI-17341对耐药结核分枝杆菌的MIC为0.10.3 Lg/ml,体外抗结核活性近于异烟肼、利福平,动物实验结果亦然,与其他抗结核药物无交叉耐

19、药,是有希望的抗结核药,正处于期临床研究阶段。本类中筛选出硝基咪唑并吡喃有效化合物PA-824对敏感结核分枝杆菌和单耐利福平结核分之杆菌的MIC是0.0150.25 Lg/ml,多耐药结核分枝杆菌对PA-824同样敏感,与现有的抗结核药物无交叉耐药性7。体外实验发现PA-824在低氧环境下培养的非复制期结核分枝杆菌模型中有作用,其活性类似于甲硝唑,明显强于CGI-17341和异烟肼(异烟肼对此模型中的结核分枝杆菌无作用)。应用结核分枝杆菌报告荧光素酶表达的菌株的短期小鼠感染模型对50种以上的NAPs化合物的体内活性测定时发现,虽然PA-824的体外抗结核活性不是最强的, 但在口服25 mg/k

20、g剂量下具有最强的体内活性,说明PA-824具有较NAPs中其他化合物良好的药动学特征。急性动物毒性实验LD50是1000 mg/kg,500 mg/kg连续口服28d,未出现明显不良反应。PA-824对多耐药结核分枝杆菌、非复制持留性结核分枝杆菌均具有抗菌活性,说明NAPs可能具有新的作用机制8。本类中筛选出的有效化合物为PA-824,它对药物敏感的结核分枝杆菌及耐利福平的结核分枝杆菌的MIC为0.015-0.25 mg/ml,对耐多药结核分枝杆菌也敏感。它对缺氧条件下培养的结核分枝杆菌有杀菌活性。治疗豚鼠气雾感染结核时,40 mg/kg每日一次连用30d时,其疗效与异烟肼治疗相当。硝基咪唑

21、并吡喃类已证明对持留状态和休眠状态的结核分枝杆菌有效,这类化合物的出现对改善非复制菌群的作用带来极大的希望,提示有可能成为缩短疗程的有效药物。6) 吩噻嗪类氯法齐明(氯苯吩嗪,clofazimine, CFM)是一种用于麻风病的药物,近年来开始试用于耐药结核病的治疗。CFM是一种吩嗪染料,通过与分枝杆菌的DNA结合抑制转录而产生抑制分枝杆菌生长的效果。硫利达嗪(thioridazine)9是抗精神病药,服药后耐受性较好,氯丙嗪对敏感菌及耐药菌均有效在体外减慢结核分枝杆菌的生长。此类药物对人体结核病的治疗作用尚有待进一步研究。7) 脂肪酸和分枝菌酸合成的抑制剂是抗结核药物开发的一个新领域。硫内酯

22、霉素(thio lactomy cin, TLM)在试管内小鼠巨噬细胞模型中显示,TLM有杀灭细胞内结核分枝杆菌作用并呈剂量依赖性。辛磺酰基乙酰胺(N-octanesulfony lacetamide, OSA)对耐异烟肼和多耐药结核分枝杆菌的MIC分别为6.25和12.5 Lg/ ml。8) 硫乙酰霉素10Glax o-Smithkline公司抗结核药项目执行董事Duncan博士称,公司正与美国国立卫生研究所(NIH)合作开发一种天然抗结核药物硫乙酰霉素,这种低分子量化合物在体内和体外均具有抗结核能力,对耐药结核分枝杆菌亦有作用,该研制始于2001年,进入临床应用可能尚需数年11。1.2计量

23、化学简介又称化学统计学,数学、统计学、计算机科学与化学结合而形成的化学分支学科。它应用数学、统计学和其他方法和手段(包括计算机)选择最优试验设计和测量方法,并通过对测量数据的处理和解析,最大限度地获取有关物质系统的成分、结构及其他相关信息。化学计量学是瑞典Umea大学S.沃尔德(S.Wold)在1971年首先提出来的。1974年美国B.R.科瓦斯基和沃尔德共同倡议成立了化学计量学学会。化学计量学在80年代有了较大的发展,各种新的化学计量学算法的基础及应用研究取得了长足的进展,成为化学与分析化学发展的重要前沿领域。它的兴起有力地推动了化学和分析化学的发展,为分析化学工作者优化试验设计和测量方法、

24、科学处理和解析数据并从中提取有用信息,开拓了新的思路,提供了新的手段。 化学计量学的研究对象是有关化学量测的基础理论和方法学。它所研究的内容包括:统计学和统计方法;分析信息理论;采样;试验优化与设计;分析校正理论;分析信号检测和分析信号处理;化学模式识别;图像分析;构效关系研究;人工智能和专家系统;人工神经元网络与自适应化学模式识别;库检索等。其任务是研究有关化学测量的理论与方法学,应用数学、统计学与信息理论、计算机科学的方法和手段,科学地设计化学实验,选择最优的测量方法,最有效地获取体系有用的特征数据,并通过解析测量数据最大限度地从中提取有关物质的定性、定量、形态、结构等信息。它是一门正在发

25、展的新兴学科,其主要研究内容包括统计学与统计方法、校正理论、模型估计和参数估计、实验设计和优化方法、分析信号处理、化学模式识别、定量构效关系、人工智能和专家系统、软件和库检索等。1.3 计算机辅助药物分子设计的基本理论与方法1.3.1 计算机药物辅助设计的基本理论随着生命科学和信息科学的快速发展,21世纪创新药物研究以全新的面貌出现。以化学、生物学、数学和计算机科学为基础的计算机辅助药物分子设计12(computer-aideddrug design, CADD)在药物研发中起着重要的作用,是药物研究的主要技术之一,已成为国际上十分活跃的科学研究领域。计算机辅助药物设计以计算机为工具,根据前人

26、积累的有关生物活性物质结构与功能的资料,以及受体在生物体内的作用靶点,采用各种理论计算方法和分子图形模拟技术,设计出具有特定药效的药物分子。计算机辅助药物设计方法可以用于研究配体和受体复合物的构型和立体化学特征、药物与受体的结合模式和特异性、药物分子的活性基团和药效团模型等,为改进现有的生物活性物质的结构并设计出新的药物分子提供理论指导和思路13。1.3.2 常用的计算机辅助药物设计方法计算机辅助药物设计是基于对药物和受体间相互作用的理解和研究。根据生物大分子(受体)是否已知把计算机辅助药物设计方法分为两类14,一类是基于配体的药物设计,另一类是基于受体结构的药物设计。基于配体的药物设计方法主

27、要是针对未知受体结构的药物分子的设计,主要包括定量构效关系方法15、药效基团模型方法以及类药性分析方法这三种方法。基于受体结构的药物设计是通过各种计算化学和分子图形学的方法来研究受体与配体的结合模式和特征,探讨影响配体与受体结合的关键分子间作用;结合系统能量和分项能量的分析计算以发现选择性作用于靶点的配体分子。基于受体结构的药物设计包括活性位点分析法、数据库搜寻法和全新药物设计。1.4 定量构效关系研究1.4.1 定量构效关系研究的基本理论狭义的构效关系(structure activity relationships, SAR)是指药物的结构发生变化时生物活性的定性变化经验。定量构效关系(q

28、uantitative strucher activity relationships, QSAR)是由SAR发展而来的,它采用数学模式来描述药物的生物活性与结构间的定量依赖关系16,是适应合理设计生物活性分子的需要而发展起来的17。定量构效关系18-19是指利用理论计算和统计分析工具来研究系列化合物结构(包括二维分子结构、三维分子结构和电子结构)与其生物效应(如药物的活性、毒性、药效学性质、药物代谢动力学参数和生物利用度等)之间的定量关系,即采用数字模型,借助理化参数或结构参数来描述有机小分子化合物(药物、抑制剂等)与有机大分子化合物(酶、辅酶或有机大分子)或组织之间(受体、细胞、动物等)的

29、相互作用关系。1.4.2 定量构效关系研究的发展1868年,CrumBrown和Fraser发表了QSAR方面的第一个方程巾=f(c),该方程表明20,化合物的生理活性由可用化学结构C的函数表示,但并未建立明确的函数模型。最早的可以实施的定量构效关系方法是美国波蒙拿学院的Hansch在1962年提出的Hansch方程。其最初的形式为方程(1-1), lglC=algP+b+cEs+constant (1-1)即活性与疏水参数lgP、电性参数和立体参数Es相关。随后,Hansch和日本访问学者藤田稔夫等人一同改进了Hansch方程的数学模型,引入了指示变量、抛物线模型和双线性模型等修正,得到方程

30、(1-2),使得方程的预测能力有所提高21。 lglC=a(lgP)2+blgP+c+dEs+constant (1-2)Free等人几乎与Hansch方法发表的同时发表了FreeWilson方法,其直接以分子结构作为变量对生物的生理活性进行回归分析。Hansch方法、FreeWilson方法等方法均是将分子作为一个整体考虑其性质,并不能反应分子的三维结构与生理活性之间的关系,因而被称为二维定量构效关系(2D QSAR)。20世纪80年代在QSAR研究中出现了考虑生物活性分子与受体结合的三维结构性质的研究方法,称为三维定量构效关系(3D-QSAR)。如在1979年Crippent22等提出距离

31、几何学的3D-QSAR、1980年Hopfinger23-24等提出分子形状分析方法和1988年Cramer25等提出了比较分子场方法(CoMFA)等。比较分子场方法一经提出便席卷整个药物设计领域,成为了应用最广泛的基于定量构效关系的药物设计方法;1990年出现了新的三维定量构效关系方法,如在比较分子场方法基础上改进的比较分子相似性方法(CoMSLA)以及在距离几何学的3D-QSAR基础上发展的虚拟受体方法等,这些方法都成功得到了一些3D-QSAR模型,为设计高活性生物分子提供了很多有益的提示。1997年Hopfinger等提出了4D-QSAR的概念,此方法首次采用遗传算法选择分子动力学产生的

32、构象来产生最佳的构效关系模型。用每个格点对用的原子占有率来作为偏最小二乘回归的变量,根据原子的不同特征定义了七种不同种类的原子模型。4D-QSAR方法考虑了药物分子的整个构象空间,考察了多种原子叠合方式,因此在概念上比传统的CoMFA方法有一定的进步。在QSAR研究过程中考虑影响生物活性的因素不断增加, QSAR向着更高的维数发展,接着又有了5D-QSAR、6D-QSAR概念的提出,它们各有特色,但还没被普遍承认,有待进一步的研究和考证26。1.4.3 定量构效关系研究的意义化学及其相关学科的发展至今已呈现出从描述性向推理性、从宏观状态研究到微观结构理论发展的趋势。人们在长期实践过程中认识到,

33、分子结构与其性质密切相关。分子结构一经确定,其性质也随之而定。分子的性质包括内在性质(如电荷分布)、化学性质(如pKa)和生物性质(如活性)等各种性质。结构-性质相关(Structure-property relationship, SPR )主要是研究它们之间的规律。其中研究分子结构特征与相应生物活性之间关系,即所谓构效关系(Structure-activity relationship, SAR),定量构效关系(Quantitative Structure Activity Relationship, QSAR) 被大量地应用于药物科学研究,其数学模型对于有机化学品的药物活性评价与预测具有

34、广阔的应用前景。由于该方法具有简单、方便、使用参数不依赖于实验等优点,从而被广泛应用于预测抗结核病药物的各种药物活性的研究中18-21。定量构效关系(Quantitative structure-activity relationship, QSAR)由SAR发展而来,其是采用数学模型来描述分子生物学活性与结构间的定量相关关系22。其内容涵盖定量结构活性相关(QSAR)、定量结构性质相关(QSPR)、定量结构谱学性质相关(QSSR)、定量结构色谱保留指数相关(QSRR)、定量结构热力学函数相关(QSTR)、定量结构药代动力学相关(QSKR)、定量结构亲和相关(QSAFR)等诸多方面。随着研究的

35、不断深入和扩展,如今QSAR 研究已经成为环境化学、计算化学、药学、生物学、生物信息学等多学科领域的一个前沿课题。定量构效关系发展迅速,自提出至今短短40余年的时间随着计算机技术和分子学的快速发展,定量构效关系已经从经典的二维定量构效关系发展到具有直观性的三维定量构效关系27,再到可以模拟化合物分子的全部构象的四维定量构效关系,直至可以模拟诱导契合的五维定量构效关系,因此,QSAR和QSRR的研究受到了环境化学、农业化学以及药物化学家的关注,也成为了色谱科学的一个新的研究分支领域,依据化合物结构和保留值之间的定量保留关系可以对一个新溶质的保留值进行预测。1.4.4 定量构效关系的研究现状目前,

36、有关定量构效关系方面的研究呈现出以下几个特点28-30:1) 综合性:主要研究化合物分子结构与物化性质或生物活性之间的定量函数关系,覆盖了化学、物理学、生命科学等学科的一个交叉学科领域。同时定量构效关系研究发展至今,越来越多地借助于数理统计方法和计算机技术的最新发展,所以要求研究者必须熟悉化学、物理学、生物学、数理统计和计算机等相关知识。2) 理论性:早期的QSAR研究往往比较注重定量构效关系模型的预测功能,即实用性;而最近的定量构效关系研究则更注意定量模型的因果关系,即理论性。人们总是期望一个成功的数学模型,能从本质上揭示和解释影响物质某种性质的本质因素,揭示和描述生物活性的作用机制,从而达

37、到提高有用生物活性,控制有害生物毒性的目的。3) 智能化:化合物的物化性质和生物活性受到诸多因素的影响,化合物的结构因素也是多种多样的,包括电子结构、立体结构和理化参数等。其中某些因素对特定的性质影响较大,而另一些因素则影响较小,其间的关系复杂多样。当化合物结构范围较宽时,要在化合物结构与某种性质之间建立满意的数学模型必须借助于多变量分析方法和计算机的自适应优化建模功能。因此主成分分析、偏最小二乘、判别分析、聚类分析、模拟退火、人工神经网络、遗传算法等方法被越来越多地应用于定量构效关系研究,并辅以计算机的智能化技术,促使定量构效关系研究向智能化方向发展。4) 程序化:一个定量构效关系模型的建立

38、往往是建立在对大量化合物的生物活性数据及结构参数分析基础之上,同时还需从诸多结构参数中筛选出对化合物特定性质具有显著影响的变量。从参数的计算到相关分析,工作十分繁杂而且容易出错。近期发展起来的CASE(Computer automated structure evaluation)系统使得化合物参数的计算,重要变量的筛选,乃至模式分析和模型建立完全程序化。这样的专家系统,不仅大大方便了模型的建立过程,同时也为那些不熟悉化学、物理或生物学知识却需要使用构效关系模型的科研工作者提供了极大的方便。5) 实用化:(a)为化学品危险性评价提供一种简便实用的途径。通过实验的方法对化合物进行全面危险性评价不

39、仅需要大量的资金投入,而且历时较长。通过QSAR研究可为化学品的暴露水平和生物效应作出预测和评价,可大大节省人力物力的投入。(b)指导合成高效低毒的新化合物。通过定量构效关系研究可发现并确定对化合物活性起关键作用的结构因素,从而指导高效低毒化合物的目标分子设计。(c)建立化学品性质及毒性数据库。建立化学品性质及毒性的定量构效关系模型有助于从已经测定的数据中最大限度地获取有用信息。此类模型的建立不仅使得数据库具有预测功能,而且可以发现数据中偏离模型“可疑数据”。而这些“可疑数据”或“异常样本”的发现往往又可以帮助和启示人们寻找一些更为有意义的规律。2 原理与方法2.1 三维全息原子场作用矢量(3

40、D-HoVAIF)的基本概念及相关计算在分子电性距离矢量31-33的基础上,本实验室提出一种有效的3D分子结构描述子:三维全息原子场作用矢量(3D-HoVAIF)。该法从分子立体结构的两个空间不变量原子相对距离和原子自身性质出发,基于三种常见的与生物活性直接相关的原子间非键作用方式(静电、立体和疏水作用),在不借助任何实验参数及毋需样本构象重叠的前提下得到了用于表征分子结构特征的多维矢量描述子。有机分子中常见原子有氢、碳、氮、磷、氧、硫、氟、氯、溴、碘,它们分别属于元素周期表的5个主族(IA、IVA、VA、VIA、VIIA),按其所处元素周期表划分为5大类,为了更好地表达分子细微结构特征,并考

41、虑到同一族原子处于不同杂化状态时化学性质也有较大差异,继而在上述分类的基础上再进一步把不同主族中的原子按其杂化状态细分为10类,这样一个分子内部不同类别原子之间的相互作用情况就有55种(表2-1)。表2-1 3D-HoVAIF中的10类原子及它们的55种相互作用情况序号.原子类型HC(sp3)C(sp2)C(sp)N(sp3), P(sp3)N(sp2), P(sp2)N(sp), P(sp)O(sp3), S(sp3)O(sp2), S(sp2)F, Cl, Br, I1H1-11-21-31-41-51-61-71-81-91-102C(sp3)2-22-32-42-52-62-72-82

42、-92-103C(sp2)3-33-43-53-63-73-83-93-104C(sp)4-44-54-64-74-84-94-105N(sp3), P(sp3)5-55-65-75-85-95-106N(sp2), P(sp2)6-66-76-86-96-107N(sp), P(sp)7-77-87-97-108O(sp3), S(sp3)8-88-98-109O(sp2), S(sp2)9-99-1010F, Cl, Br, I10-10本文3D-HoVAIF采用静电、立体和疏水三种势能来表达不同的作用形式,这样对于一个有机化合物分子将有355=165对原子作用项来表征分子结构信息。虽然3

43、D-HoVAIF中的原子相互作用方式不是配基与靶点的直接作用,但是在大多数受体未知的情况下3D-HoVAIF描述子中包含了丰富的药物分子势能分布信息。1)静电作用场静电作用(electrostatic interaction)是一类重要的非键形式,经典的点电荷作用方式可用库仑(Coulomb)定理(式2-1)来表述。 (1m10, mn10) (2-1)式(1)中rij是原子间Euclid距离,单位为nm;e为单位电荷电量1.602189210-19 C;0为真空中的介电常数8.8541878210-12 C2/Jm;Z为原子净电荷数,以电子为单位;m和n为原子所属种类。通过该式计算分子中所有

44、原子间的静电作用势,并按所属类型将其分别计入55个静电作用项中。2)立体作用场立体作用(steric interaction)是空间原子间存在的非偶极-偶极或偶极诱导作用,这里采用Lennard-Jones方程来描述这种作用方式(式2-2)。(1m10, mn10) (2-2) 式(2)中ij为原子对势能阱深,取文献值33-34(表2-2);D为经验推导的原子间作用能校正常数,取0.01;Rij*=(ChRii*+ ChRjj*)/2,为校正后的原子对van der Waals半径,校正因子Ch当sp3杂化时取1.00, sp2杂化取0.95, sp杂化取0.90。表2-2 Lennard-J

45、ones中原子势阱参数原子ei(kJ/mol)0.5H0.3985C, S,其它0.5555C(sp2)0.3966N1.3142O0.87893)疏水作用场疏水作用(hydrophobic interaction)是影响药物分子与生物体结合的重要因素,使用Kellogg等提出的hint方法24-27来定义计算两原子间疏水作用表达式(式2-3)。 (1m10, mn10) (2-3)式(3)中S为原子溶剂可及面积(Solvent Accessible Surface Area of Atom, SASA),是以水分子(范德瓦尔斯半径为0.14 nm)为探针在原子表面滚动其球心形成的表面面积28

46、(表2-3);为原子疏水性常数,取文献值;T是作用形式的二值判别函数,以表明不同类型原子疏水作用的熵效应变化方向。表2-3 有机分子中常见原子的范德瓦耳斯半径和溶剂可及面积原子范德华半径 (10-1nm)SASA(10-2nm2)H1.2084.85C1.85132.73N1.54108.62P1.90136.85O1.4098.52S1.85132.73F1.3594.34Cl1.81129.49Br1.95141.03I2.15158.37表2-4 原子疏水/溶解常数序号.原子类型ASP1COOH-8.80E-042ACOOH(A has electrons)7.06E-033SH7.05

47、E-034C.arN.amH1.81E-035XN.amH-7.08E-036N.amH9.49E-047XN.amH-7.85E-038N.amH-6.59E-039N+H-1.92E-0210C.arNH-5.01E-0311XNH (N is affected)-1.22E-0212NH (N is affected)-3.15E-0313XNH-7.90E-0314NH-8.41E-0315C.arOH-2.18E-0316XOH (N is affected)-4.46E-0317OH (N is affected)-2.11E-0218XOH-4.81E-0319OH-8.92E-

48、0320XC.arH6.52E-0321C.arH (C.ar is hydrophobic carbonc)5.89E-0322C.arH7.88E-0323XAH (A has electrons)6.14E-0324AH (A has electrons and is hydrophobic carbon)9.41E-0325AH (A has electrons)2.98E-0326OH (charged O)-2.80E-0327XCH (C is affected)3.39E-0328CH (C is affected and is hydrophobic carbon)1.01E

49、-0229CH (C is affected)4.52E-0330XCH2.93E-0331CH (C is hydrophobic carbon)1.23E-0232CH6.77E-0333SO-3.92E-0234PO2.02E-0235XO (O is affected)2.88E-0236XO-9.03E-0337C.arO1.15E-0238RO (O is affected and is in acid)3.16E-0339RO (O is affected)2.30E-0240RO-1.82E-0241O-(charged O, “O.co2” in Tripos force f

50、ield)-1.81E-0242NC=O (C is affected)-2.56E-0243OC=O (C is affected)3.92E-0344C=O (C is affected)-6.56E-0345S=O (S is affected)-5.41E-0346P=O-3.73E-0247N=O(N is affected)6.60E-0348NC=O-1.40E-0249OC=O-1.05E-0250C=O-1.20E-0251S=O-8.90E-0352N=O1.36E-0353S.o2Cnde54PCnde55C.arCXnde56AC (A has electrons)nd

51、e57XCnde58C.arC (C is hydrophobic carbon)nde59C.arCnde60RC (R has electrons and C is hydrophobic carbon)nde61RC(R has electrons) nde62RC(C is hydrophobic carbon)-0.2063RC-0.1064O-CCN+nde65O-CCN(C in amino acid)nde66C-(charged C, “C.cat” in Tripos force field)nde67X(2) C=X2.77E-0268NC=O(C is affected

52、)5.57E-0269OC=O(C is affected)-3.23E-0270C=O(C is affected)6.89E-0371NC=O-8.63E-0372OC=O2.24E-0273C=O8.04E-0274XC=N-3.97E-0275RC=N-1.76E-0276X(2)C=C-3.98E-0377NC=C-1.22E-0278OC=C-4.29E-0379C=C(C is hydrophobic carbon)1.28E-0280C=C2.59E-0281XC or X=C or XC7.75E-0282RC1.89E-0383N.arC.arN2.24E-0284N.ar

53、 C.arO3.37E-0285N.arC.ar-9.39E-0386C.arN-7.99E-0387C.arO5.64E-0388C.arS.o2-9.75E-0289RC.ar (C.ar is hydrophobic carbon)3.62E-0290RC.ar2.13E-0291SN8.81E-0392PN-1.60E-0293NX (N is affected)-1.71E-0294NR (N is affected)8.00E-0395NX 5.29E-0296NR 2.22E-0297S(P)N.pl3dnde98N.2 (or N.am) ON.pl30.5499XN.pl3-

54、0.15100RN.pl37.16E-02101C.arN.pl3=O-1.57E-02102N.pl3=O-4.28E-02103N-(charged N, “N.4” in Tripos force field)-4.26E-02104XN=O (N is affected)-8.11E-02105XN=O-2.16E-02106N=O -9.44E-04107XN=N (N is affected)-1.91E-02108XN=N-5.30E-02109N=N (N is affected)1.30E-02110N=N4.69E-03111N=C (N is affected)3.05E

55、-03112N=C-1.51E-02113AN-1.95E-02114XN.am (N.am is affected)0.39115XN.am1.99E-02116RN.am (N.am is affected)7.53E-02117RN.am0.11118N.ar1.30E-02119AS.3 (S.3 is affected)1.64E-02120AS.31.04E-02121ASOA-7.71E-02122ASO2A0.53123APnde124S=P2.02E-02125S=A1.15E-03126AF (A has electrons)1.01E-02127AF1.28E-02128

56、ACl(A has electrons)1.53E-02129ACl1.30E-02130ABr (A has electrons)1.59E-02131ABr1.52E-02132AI (A has electrons)1.69E-02133AI1.50E-02表2-5 Hint用于计算原子疏水作用公式中的二值判别函数T值原子类型H (非极的)H (极化)C (非极的)极化(N, O,等)H (非极的)+1-1+1-1H (极化)-1-1-1+1C (非极的)+1-1+1-1极化(N, O,等)-1+1-1-12.2 基于虚拟蛋白质受体原子探针的分子表面随机采样分析(RaSMS)的基本概念及

57、相关计算2.2.1 蛋白质受体原子探针由于大多数药物直接作用靶标是具有一定生物活性功能的肽和蛋白质分子,因此RaSMS法使用20种标准天然氨基酸中的各类原子作为探针。考虑到具有不同杂化状态的原子往往因所处基团和区域不同而使其对活性贡献表现出一定的差异,进而以此得到8个探针原子(表2-1)。为了反映这些探针的性质,我们分别给其赋予了平均电荷指数、范德瓦耳斯指数和平均疏水指数的概念。平均电荷指数(Mean Charge Index, MCI):探针原子电性特征取其出现于氨基酸中的平均电荷数(以电子为单位)。具体计算如下:首先使用Chemoffice 8.0自带数据库生成20个天然氨基酸的初始分子立

58、体结构;并利用分子模拟软件HyperChem 7.5进行分子力学(采用MM+力场)构象优化;其结果进一步应用Gaussian 98W量子化学计算软件在密度泛函(Density Function Theory, DFT)水平基于广义梯度近似法最终优化得到分子三维结构,并采用Mulliken布居分析法30以单点(single-point)形式计算出原子的净电荷数量(由于采用的基函数不正交,DFT对Mulliken电荷进行了修正);利用C语言自编程序Mean.EXE计算每种探针原子在氨基酸中出现的平均电荷数作为其MCI值。其中,DFT所采用的泛函类型为B3LYP,在进行几何结构优化时选用的分子轨道基

59、函数为双重分裂基组并在每个重原子上加入了d轨道极化函数,而单点计算所采用的轨道基组是在几何优化基组的基础上再向氢原子加入p轨道极化函数得到。范德瓦耳斯指数(van der Waals Index, VWI):通常文献给出的是孤立原子van der Waals半径,但实际原子由于其所处分子的化学微环境和自身杂化状态不同该半径有所变化,因此本文对其进行了调整,即使用经校正后的原子van der Waals半径作为探针原子的范德瓦耳斯指数(单位为),VWI=ChRVDW*。其校正因子Ch参见文献,当sp3杂化时取1.00, sp2杂化取0.95, sp杂化取0.90。另外,各类原子的标准van der Waals半径取自Bondi等人的报告(附表1)。平均疏水指数(Mean Hydrophobic Index, MHI):类似于MCI, MHI取每类探针的疏水性在天然氨基酸中出现的平均值(单位为kJ/2)。表2-1 8个探针原子在20种天然氨基酸中出现的频数及其MCI, VWI和MHI取值NoProbeFrequencyMCIVWIMHI1H1970.2271.200-6.384E-32C(sp3)59-0.2201.700-8.527E-1

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!