LogPLogD对有机化合物的QSAR的研究.doc

上传人：仙*** 文档编号：38523267 上传时间：2021-11-08 格式：DOC 页数：14 大小：257.50KB

收藏版权申诉举报下载

第1页 / 共14页

第2页 / 共14页

第3页 / 共14页

下载文档到电脑，查找使用更方便

10 积分

下载资源

资源描述：

《LogPLogD对有机化合物的QSAR的研究.doc》由会员分享，可在线阅读，更多相关《LogPLogD对有机化合物的QSAR的研究.doc（14页珍藏版）》请在装配图网上搜索。

1、 LogP,LogD对有机化合物的QSAR的研究摘要：自从20世纪60年代QSAR/QSPR研究兴起以来, 人们研究有机化合物的脂水分配系数和溶解度的计算方法已经有近半个世纪. 目前存在众多方法用于计算有机化合物的脂水分配系数和溶解度. 相对而言, 脂水分配系数的计算方法更为成熟一些, 应用范围更广, 效果也更好.关键词：脂水分配系数; logP/logD; QSAR1. 基本概念1.1 脂水分配系数的定义有机化合物的脂水分配系数(P)通常是指化合物在正辛醇和水两相间的分配系数, 以其对数值来表示其大小，标记为其中Coct 和Cw分别为化合物在正辛醇和水两相间达到平衡时的浓度. logP在

2、许多QSAR研究中都是用于衡量有机化合物疏水性的重要参数. 当今各大制药公司都已经将logP列为活性化合物必测的标准参数之一. 通常P给出的是中性化合物在两相间的分配系数. 对于可电离的化合物, 情况则变得相当复杂, 这时使用分配率D(distributionrate)来表示溶质在两相间总的分配系数. 例如, 对于可电离的溶质HA可有:其中HA, A-分别代表溶质的中性状态和离子状态的浓度. D是与溶质的酸碱解离常数pKa 以及溶液的pH值相关的参数. 假设溶质HA是仅在水相电离的一元酸, 则有: 然而, 如果溶质分子含有不止一个电离中心而且在正辛醇相中也是可以电离的, 此时溶质在溶液中的存在

3、形式就变得相当复杂, 像公式(4)这样的简单关系就已经不再成立. 对于含多个可电离基团的复杂溶质分子, D的具体表达式可描述为:这里表示溶质在溶液中的第i 种离子形式, 根据电离平衡关系, 其在两相间的浓度与溶液pH值以及可电离基团的pKa 都密切相关.1.2、QSAR研究的兴起有机化合物的定量结构一活性相关(Quantitative StructureActivity Relationship)最初是作为定量药物设计的一个研究分支领域而发展起来的。早在l9世纪，人们对化学结构有了初步口识后，就有人设法建立化合物的生物活性与结构的关系。后来发现，当时归纳的所谓通用规则并不存在。到了20世纪初

4、，人们普遍认为化合物的生物效应主要取决于它们的物理性质，如溶解度、表面张力、分配系数等 Hansch（1962)和FreeWilson( 1964)运用统计方法并借助计算机建立起结构活性关系表达式标志着QSAR时代的开始，从此成为一个相当活跃的前沿领域。 QSAR之所以有如此令人振奋的发展，一方面是化学品评价的需要。据美国化学文摘(CA)统计，化学物质已达近千万种而且已有约十万种化学物质进入了人类环境。那么这些进入人类环境的化学物质中，哪些对环境中的生物和人类有危害，危害的程度如何怎样控制和减少危害都需要对这些化学物质进行理化性质和生物活性实验。但是，据估计仅每个化学物质的急性皮肤毒性、双周

5、吸入毒性和二年饮食毒性三个指标的测试费用即达29005000万美元。所以，要对所有化合物进行毒理学、生态学的全面测试，财力上不可能，人力上也无法傲到。必须找到一种行之有效的方法进行定量计算或近似估计，QSAR则可做到这一点。2. 现有主要的logP计算方法简介脂水分配系数的概念最早是由Hansch和Fujita提出的, 同时他们也发展出了第一种logP计算方法. 随后Rekker等提出了第一种片段加合法模型. Broto 等进一步完善了Rekker模型中的片段划分策略, 发展出第一种原子加合法模型. 一直以来研究者们对改进和发展新的logP预测方法有着浓厚的兴趣, 更多的logP预测模型相继

6、出现, 方法的准确度也不断提高. 现有的logP预测方法主要可以分成两大类: 片段加合法和基于描述符的方法.2.1 片段加合法在过去几十年里, 许多基于片段加合法的logP计算模型相继被提出, 有些还实现了商业化. 目前国际上比较流行的此类方法主要有:，以及各种方法的基本信息总结于表2中. 这些方法的主要区别在于片段划分规则以及矫正项的设计.2.1.1 CLOGP CLOGP是由Hansch和Leo最早发展起来的一种预测化合物logP的模型, 也是目前应用最广泛的logP预测方法之一. 在CLOGP模型中最基本片段的贡献值是由一些具有logP精确实验值的简单化合物(如甲烷等)推导而来的. 然

7、后其余片段的贡献值在前面的基础上由复杂化合物的logP实验数据推导而来. 最值得注意的是此方法在定义片段的规则中使用了“孤立碳原子”的概念. 这里一个孤立碳原子是指不与杂原子相连的碳原子, 或者与杂原子相连, 但是不是通过双键或叁键相连的碳原子. 在较早期的CLOGP版本中使用了200种类型的片段和25种矫正项. 从最早被Chou和Jurs推广应用到后来商业化的几十年中, CLOGP在学术界以及工业界得到了广泛的使用, 一直以来被作为有机化合物脂水分配系数计算方法的标准.2.1.2 ACD/LogP ACD/LogP由ACD/Labs公司研发, 也是目前最常用的计算有机化合物logP值的商业软

8、件之一.ACD/LogP算法考虑基本原子类型、特征结构片段以及加入不同片段之间的相互作用矫正项.ACD/LogP所使用的片段分类规则与CLOGP有所不同, 定义的特征结构片段超过1200个. 分子内相互作用矫正项依据相互作用的末端基团类型及相互作用体系的片段长度和类别进行划分, 包括超过2400对基团的相互作用. 以上每一项的贡献值通过对ACD/Labs内部数据库(18400个化合物)的logP实验值进行统计分析获得. ACD/LogP的计算方法可用下述方程表示: 其中fi 表示提问分子第i 种片段的贡献, Qj 表示提问分子第j种特殊片段的贡献,和分别表示提问分子被k个数目的脂肪类、乙烯基类

9、和芳香类原子分隔的第i种和第j种片段的相互作用矫正项贡献值. ACD/LogP的基本计算步骤如下: (1)结构分割和计算f值, 缺失的片段使用原子加合法计算; (2)计算值, 没有相互作用的片段使用类似于Hammett 方程的方式计算; (3)加合所有f 和值. 目前ACD/Labs还发展了计算可电离化合物logD值的功能, 但是其具体算法未见公开报道.2.1.3 KOWWIN KOWWIN是由Meylan和Howard发展的基于原子类型和特征片段加合法估算有机化合物logP值的模型. 模型中使用的13062个化合物的logP实验数据中有9500个来自CLOGP方法所使用训练集中较为可靠的数据

10、. 这些数据划分为一个训练集, 包含2473个简单的有机分子; 另一部分作为测试集, 包含10589个简单、中等以及复杂的分子. 在建立KOWWIN模型的过程中, 使用两步多元线性回归分析来给出片段以及矫正项的贡献值.首先不考虑矫正项, 仅采用简单化合物作为训练集通过回归分析得出每种特征片段的贡献值. 其后再使用包含复杂化合物的训练集, 在前一步结果的基础上, 以仅由特征片段的贡献值估算的logP值与实验值的差值进行回归分析, 得出每种矫正项的贡献值. 目前最新版本的KOWWIN方法使用150种原子类型和特征片段以及250种矫正项. 模型可表达为:其中分别是提问分子中第k种原子或片段对logP

11、的贡献值和数目; Fj, Nj 分别是提问分子中第j 种矫正项对logP的贡献值和出现次数. 0.229是多元线性回归得出的常数. 最近Meylan等提出一种改进策略. 他们在KOWWIN方法中应用了“experimental valueadjusted(EVA)”算法, 其基本思想是: 对于提问分子, 可以使用一个logP实验值已知的类似物作为参考分子. 但是由于在他们的方法中参考分子必须由用户自己指定, 使用起来很不方便.2.2 基于描述符的方法当溶质分子在正辛醇和水两相间平衡时, 根据热力学循环可以得出以下关系式:上式中代表溶质分子在两相之间迁移的自由能变化, 和分别表示溶质在正辛醇相

12、及水相中的溶剂化能. 理论预测在溶液中的自由能变化相当难, 因此一般都是从形成这一过程的物理化学影响因素归纳出一些描述符来经验地估算logP.自Rogers 等提出第一个基于描述符的logP计算模型至今, 此类方法已有多种见诸报道, 见表三，使用的描述符主要包括经验描述符、拓扑描述符以及代表分子3D结构的描述符. 根据描述符的来源, 这些方法又可分为多种类型.2.2.1 BLOGP早期出现的一种基于描述符的方法是Bodor等发展的BLOGP方法. 这种方法使用原子部分电荷、偶极矩和描述分子大小的参数等作为描述符.该种方法在建立模型时首先需要优化训练集中化合物的三维结构, 然后再使用AM1法计算

13、各描述符的取值, 最后采用线性回归方法来获得每个描述符对脂水分配系数的贡献值. 其早期报道的结果仅适用于含有C、H、O、N原子的化合物, 具体的计算公式如下:其中各描述符分别为: S表示分子的表面积; O为分子椭圆度; 是指烷烃指示变量(分子为烷烃数值为1,否则为0); MW为分子量; D为偶极矩估算值QON是分子中氮氧原子电荷绝对值的加合; QN是所有N原子上电荷平方和的均方根; QO是所有O原子上电荷平方和的均方根. 该模型样本数n为118费舍指数F为115,实验值与预测值之间的相关系数r为0.9388,标准误差SE为0.296,自由度dof大小为104.与片段加合法相比, 此种方法使用的

14、描述符数量大大减少. 但是BLOGP方法的计算效果不是很好, 可以适用的化合物非常有限. 另外, BLOG方法所采用的计算公式物理意义不明确, 为了提高统计结果引入了非线性项, 这种做法并不值得推荐2.2.2 MLOGP 在目前计算logP的方法中有一系列方法是基于分子结构的拓扑描述符. 使用拓扑描述符的一大优点是计算速度快, 对于处理较大的数据集非常有效. MLOGP是较早出现的此类方法, 由Moriguch等提出. 在MLOGP模型中亲脂基团数目(CX,分子中碳原子和卤素原子的总数)和亲水基团数(NO分子中所有氮氧原子数之和)是两个最基本的描述符. 单独使用CX和NO描述符就可使所研究的1

15、230个化合物中73%的估算值处于可信范围内. 此外再结合其它11个矫正项, 估算值的可信范围可覆盖达91%.这些参数描述邻位作用、分子不饱和度、两性特征以及其他官能团信息. MLOGP模型的具体计算公式如下:其中参数PRX用来描述氮氧原子的邻近效应; UB为不饱和键总数; HB描述分子内氢键的影响; POL为芳环上的极性取代基数目; AMP描述分子的两性特征; ALK为描述烷烃、烯烃、环烷烃或环烯烃的参数; RNG描述分子中所含的环结构; QN为关于季胺的参数; NO2为分子中所含硝基的数目; NCS为硫氰基和异硫氰基的数目; BLM描述分子中存在的-内酰胺结构. 该模型采用的样本数n为12

16、30,结果显示实验值与预测值之间的相关系数r为0.952,标准偏差s为0.411,费舍指数F0(13, 1216) 达到900.4,表示在MLOGP研究范围内, 使用公式(17)计算logP有相当高的精度. MLOGP方法也可用于估算有机化合物的水溶解度, 目前此方法已被应用于某些软件的ADMET性质计算模块中.2.2.3 SLIPPER 考虑到分子尺度和氢键强度对分子logP的重要性, Raevsky等发展的SLIPPER方法使用极化率琢和氢键受体强度移Ca 两个描述符来估算2850个简单化合物的logP值, 基本计算方法如下:但是使用以上公式计算多官能团化合物时碰到了问题, 主要是分子间相

17、互作用存在影响. 于是Raevsky等使用结构相似的化合物的有关信息来矫正logP,即:这里N表示相似邻近化合物数目, 和分别是第j 个类似化合物的logP实验值、极化率和氢键受体强度总和. 发展该模型所使用的训练集包括10937个已知logP实验值的化合物. SLIPPER同时也采用了类似的方法可以用于估算溶解度logS.2.2.4 ALOGPS ALOGPS方法由Tetko等提出, 是目前基于描述符的logP计算方法中的代表工作. 该方法使用电子状态拓扑指数作为描述符. 电子状态拓扑指数考虑原子的价层电子状态和化学拓扑环境, 已被成功地用于建立研究有机化合物的物理化学性质以及生物活性等多种

18、QSAR模型. 自从第一个ALOGPS模型在1999年提出以来, 该方法已经进行了多次改进. 第一个ALOGPS模型建立时使用了32种原子类型的描述符, 使用了345种类药化合物作为训练集, 使用线性回归和神经网络方法给出了相似的预测结果(相关系数q2=0.83-0.84,均方根误差RMSELOO=0.69-0.72单位).第二次改进对描述符进行了拓展以便能够更好地描述氮、氧原子周围的化学环境, 另外还加入了如分子量等其他描述符. 训练集也拓展为1754个化合物. 最新版的ALOGPS方法使用PHYSPROP数据库中的12908个化合物作为训练集, 75种描述符,使用神经网络系统, 从所用

19、化合物中随机选择50%作为训练集, logP的平均预测精度可达0.35单位.最近ALOGPS方法也被拓展用于预测化合物的logD3.总结与展望自从20世纪60年代QSAR/QSPR研究兴起以来, 人们研究有机化合物的脂水分配系数和溶解度的计算方法已经有近半个世纪. 目前存在众多方法用于计算有机化合物的脂水分配系数和溶解度. 相对而言, 脂水分配系数的计算方法更为成熟一些, 应用范围更广, 效果也更好. 这是由于溶质的溶解过程相对于溶质在正辛醇与水两种液相间的分配是更为复杂的物理化学过程, 它不仅包含溶质-溶剂相互作用, 还包含溶质分子间的相互作用. 对于固体溶质还需考虑相变过程, 这也是计算

20、溶解度所面临的主要挑战之一. 目前溶解度的计算方法对于结构比较简单的有机化合物效果较好, 对于结构比较复杂的、多官能团的化合物则较不适用. 对有机化合物脂水分配系数的计算实际上在一定程度上也存在这一现象. 对于有机化合物脂水分配系数和溶解度的计算, 近年来较少出现在方法上有较大创新而且效果比较好的模型, 主要仍是过去一些具有影响力的模型的持续改进工作. 笔者认为无论是片段加合法还是基于描述符的方法, 继续向前发展似乎难有重大突破. 未来这种重大突破应该来自于对溶质在溶液中行为的基于第一性原理的基础研究. 近年来计算机的计算能力得到了大大提升, 相比之下各种基础理论的发展似乎显得滞后了. 希望这

21、种基础研究可以探讨影响溶质在溶液中行为的关键因素, 从而对经验方法的发展也有所指导.此类研究也应该特别关注有机化合物脂水分配系数和溶解度实验数据的质量问题. 所谓“巧妇难为无米之炊”, 高质量的数据对于发展和检验高质量的计算方法的重要性是不言而喻的. 在此方面需要提倡推广规范化的实验测量方法, 并且需要对现有的实验数据进行认真的复核. 另外一个需要关注的问题是: 目前公开报道的各种方法基本都是使用各自编辑的测试集, 自说自话,各种方法的性能因此很难进行横向比较. 为了公正地比较各种方法的准确度,特别需要建立标准的测试集. 这样的测试集最好包含有相当数量的、具有可靠实验数据的化合物, 入选化合物

22、的化学结构应该具有多样性和代表性. 这是一件目前应该做而且也是可以做到的事情.参考文献：卡米尔乔治维尔穆特. 创新药物化学M1第2版1广州:广东世界图书出版公司, 2005:447- 4791 王连生(WangLS) ,韩朔睽(Han SK) ,孔令仁(KongLR) ,等. 分子结构、形式与活性M1北京:化学工业出版社,1997:26- 401 陈凯先(Chen KX) ,蒋华良(JiangHL) ,嵇汝运(Ji RY) 1计算机辅助药物设计原理、方法及应用M1上海:上海科技出版社, 2000:151 PALLAS软件参考文件(版本号3151112, CompuDrug公司)1 Rekke

23、r RF, DeKort HM. The hydrophobic fragmental constantJ. EurJMedChem, 1979, 14:479- 488. RobinMartin, Sanjivanjit K. Bhal. ACD/Labs freeware shortstart tutorial EB/OL. (200723225) 2007210220. http: /www. acdlabs. com/download/docs/logp shor start tutorial. pdf.Anonymous. Molinspiration application tutorial EB/OL.(200721021) 2007210222. www. molinspiration. com. WishartDS, KnoxC, GuoAC, et al1, DrugBank: a comprehen2sive resource for in silico drug discovery and exploration J .NucleicAcids Res, 2006, D668- D6721 孙振球(SunZQ)1医学统计学M1北京:人民卫生出版社,2002:342- 3461

展开阅读全文

温馨提示:
1: 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

备案号:蜀ICP备2024067431号-1 川公网安备51140202000466号

本站为文档C2C交易模式，即用户上传的文档直接被用户下载，本站只是中间服务平台，本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私，请立即通知装配图网，我们立即给予删除！

LogPLogD对有机化合物的QSAR的研究.doc

最新文档

相关资源

相关搜索