完整word版,BLAST相关术语及参数详解

上传人:sa****i 文档编号:70752560 上传时间:2022-04-06 格式:DOC 页数:3 大小:96.50KB
收藏 版权申诉 举报 下载
完整word版,BLAST相关术语及参数详解_第1页
第1页 / 共3页
完整word版,BLAST相关术语及参数详解_第2页
第2页 / 共3页
完整word版,BLAST相关术语及参数详解_第3页
第3页 / 共3页
资源描述:

《完整word版,BLAST相关术语及参数详解》由会员分享,可在线阅读,更多相关《完整word版,BLAST相关术语及参数详解(3页珍藏版)》请在装配图网上搜索。

1、Alignment:序列比对。将两个或多个序列排在一起,以达到最大一致性的过程(对于氨基酸序列是比较它们的保守性),这样可以评估序列间的相似性和同源性。Algorithm:算法。在计算机程序中包含的一种固定过程。Bit score:二进制。二进制值S源于统计性质被数量化的打分系统中产生的原始比对分数 S。由于二进制值相对于打分系统已经被标准化,它们常用于比较不同搜索之间的比对分数。BLOSUM: 模块替换矩阵。在替换矩阵中,每个位置的打分是在相关蛋白局部比对模块中观察到的替换的频率而获得的。每个矩阵被修改成一个特殊的进化距离。例如,在BLOSUM62 矩阵中,是使用一致性不超过 62% 的序列

2、进行配对来获得打分值的。一致性大于 62% 的序列在配对时用单个序列表示,以避免过于强调密切相关的家族成员。Conservation:保守。指氨基酸或DNA (普遍性较小)序列某个特殊位置上的改变,并不影响原始序列的物理化学性质。Domain:结构域。 蛋白质在折叠时与其他部分相独立的一个不连续的部分,它有着自己独特的功能。DUST:一个低复杂性区段过滤程序。E value: E值。期望值。在一个数据库中所搜索到的打分值等于或大于S 的不同比对的个数。 E 值越低,表明该打分值的显著性越好。Filtering:过滤,也叫掩蔽(masking)。指对那么经常产生乱真的高分数的核苷酸或氨基酸序列区

3、域进行隐藏的过程。Gap:空位。在两条序列比对过程中需要在检测序列或目标序列中引入空位,以表示插入或删除。为了避免在比对时出现太多的空位,可以在收入空位的同时,从比对的打分值中减去一个固定值(空位值)。在多余的核苷酸或氨基酸周围引入空位时,也要对比对的打分值进行罚分。Global Alignment:整体联配。对两个核苷酸或蛋白质序列的全长进行的比对。H:相对熵值。目标残基和底物残基频率的相对熵记作H 。H 可以衡量某个位置(这个位置可以通过概率来区分比对)上由于偶然因素而得到的平均信息(用字节表示)。H 值越高,短的比对就越可以通过概率来区分;H 值越低,需要的比对长度越长。Homology

4、:同源性。由共同的祖先所遗传得到的相似性。HSP: High-scoring segment pair,高打分值片段。在一个给定的搜索中,没有空位的局部比对能得到最高的比对打分值。Identity:一致性。两个(核苷酸或氨基酸)序列比对时不变部分的长度。K: K 值。用来计算 BLAST 程序中打分函数的一个统计参数。它可以看作搜索空间大小的一个自然衡量尺度。K 值通常用于将原始比对值S 转换为二进制值S。Lambda:值。用来计算BLAST 程序中打分函数的一个统计参数;它可以看作打分系统的一个自然衡量尺度。值通常用于将原始比对值S 转换为二进制值S。Local Alignment:局部联配

5、。对两个核苷酸或蛋白质序列的一部分所进行的比对。Low Complexity Region( LCR ) : 低复杂性区域。指组分(包括均聚物、短周期重复片段)区域和有许多单个或多个残基的区域。 SEG 程序用来筛选或过滤氨基酸序列中低复杂性区域。 DUST 程序用来筛选或过滤核苷酸序列中的低复杂性区域。Masking: 掩蔽。也叫过滤( filtering ),指为了提高对序列相似性搜索是时的敏感性,而从序列中移除重复的或低复杂性区域的过程。Motif:模体或序列模式。 蛋白质序列中短的保守区域。它们是结构域中保守性很高的部分。Multiple Sequence Alignment:多序列比

6、对。三个或三个以上的多个序列之间的比对,如果序列在同一列有相同结构位置的残基和(或)祖传的残基,则会在该位置插入空位。ClustalW是一种最为广泛使用的多序列比对程序之一。Optimal alignment:最佳联配。两个序列之间有最高打分值的排列。Orthologous:直系同源。指不同种类的同源序列,它们是在物种形成事件中从一个祖先序列独立进化形成的;可能有相似功能,也可能没有。P value: P值。在比对时,获得某个打分值或更高的打分值的可能性。通过数据库中具有相同长度或组分的随机序列之间的比对,可以得到高打分值的片段的预期分布,将它与观察到的比对打分值S 相连,就可以计算出P 值。

7、显著性最高的P 值应该接近于零。P 值和E 值用不同的方法来表示比对的显著性。PAM: Percent Accepted Mutation,可接受点突变。一个用于衡量蛋白质序列的进化突变程度的单位。 一个 PAM 的进化距离表示蛋白质序列中平均1% 的氨基酸残基发生突变的概率。 PAM ( x )替换矩阵是一个查找表,其中每个氨基酸残基的替换打分值是基于进化趋异程度为x 的紧密相关蛋白的替换频率而计算的。Paralogous:共生同源。指在单个种类中由于基因复制事件而产生的同源序列。Profile:表达谱。一种罗列了蛋白质序列的每个位置上每个氨基酸出现频率的表格。这些频率是通过包含指定结构域的

8、序列进行多次比对而得到的。参见PSSM 。PSSM: Position-specific scoring matrix,特定位点记分矩阵。PSSM给出了在目标序列中寻找特定的相配对的氨基酸的对数比分值。参见Profile 。Query: 检测。输入序列(或其他搜索项)与数据库中的所有条目进行的比较。Raw Score:初值。指通过计算替换和空位所得打分值之和而得到的联配值S。替换打分值以查找表的形式表示。空位打分值是通过计算空位开放罚分G 和空位拓展罚分 L 求和而得到的。对于长度为n 的空位,空位罚分值是G+Ln 。空位罚分 G 与 L 的选择完全是根据经验,通常 G 选择一个较高的数值(1

9、015), L 选择一个较低的数值(12 )。参见PAM 、 BLOSUM 。Similarity:相似性。 指核苷酸或蛋白质序列的相关程度。两个序列之间的相似性是基于相同和(或)保守序列所占的百分比的。在BLAST 中,相似性指一个正定的打分值矩阵。SEG: 一种过滤氨基酸序列中低复杂性区域的程序,在比较中被过滤掉的氨基酸用“ X表”示。在 BLAST2.0的 blastp 子程序中, SEG 过滤是默认执行的。Substitution:替换。在指定的位置不相同的氨基酸进行联配。如果联配的残基有相似的物理化学性质,那么替换是保守的。Substitution Matrix:替换矩阵。替换矩阵中

10、的值与氨基酸对中的第i 个氨基酸突变为第j 个氨基酸的概率成比例。构建这样的矩阵需要组装一个大的、含有不同的成对排列的氨基酸样本。如果样本足够大,其统计性显著,那么得到的替换矩阵可以反映经过某一阶段进化后的突变概率的真实值。Unitary Matrix:酉矩阵,幺正矩阵。也称为单位矩阵。是一个只有在字符相同时才能得到正打分值的打分系统。Subsequence; Descriptions: Alignments: Query Number:用来设定查询序列中进行比对的子序列。对核苷酸或者蛋白质序列的描述。比对结果。查询序列的个数。Job ID:是在进行BLAST 比对的过程中程序自动生成的流水号,用来唯一标识一次比对过程。利用Job ID可以快速找回你曾经进行过的比对结果。Query ID:查询序列的 ID 。Subject ID:与查询序列比对的序列的 ID 。Length:比对序列的长度。Identities:一致性。指两个(核苷酸或氨基酸)序列比对时不变部分的长度。Q.start:查询序列的起始位置。Q.end: 查询序列的终止位置。Q.Length:查询序列的长度。S.start:与查询序列相比对的序列的起始位置。S.end: 与查询序列相比对的序列的终止位置。S.Length:与查询序列相比对的序列的长度。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!