链特异性测序介绍

上传人:m**** 文档编号:198284063 上传时间:2023-04-07 格式:DOCX 页数:19 大小:298.55KB
收藏 版权申诉 举报 下载
链特异性测序介绍_第1页
第1页 / 共19页
链特异性测序介绍_第2页
第2页 / 共19页
链特异性测序介绍_第3页
第3页 / 共19页
资源描述:

《链特异性测序介绍》由会员分享,可在线阅读,更多相关《链特异性测序介绍(19页珍藏版)》请在装配图网上搜索。

1、链特异性测序(ssRNA-Seq)链特异性建库,mRNA-Seq library(Strand-Specific) construction。与之相应的测序称为链 特异性测序(ssRNA-Seq),是转录组测序新增的一项个性化服务内容。使用ssRNA-Seq可以确定转录本来自正链还是负链。以便更加准确的获得基因的结构以 及基因表达信息。并且,可以更好的发现新的基因。(研究表明:很多基因组区域具有正负链的转录本,反义转录是真核基因的一个特征,是一种重要的调控方式。对于原核以及低等真核生物的compact基因组,常常具有重叠基因。)1. 建库技术路线对常规的RNA-Seq建库方法进行一个简单处理。

2、重点是在合成第二条cDNA链时,替换 dTTP为dUTP,加上接头后降解第二条链。First-strand synthesis wilh normal dNTP sSeco nd-sirs nd synthesis with dTTP “: dUTPPraampl 帀亡前 on sequencing from #Ad1Figure 1. Flowchart of the ssRNA-Seq procedure. RNA is shown in red, DNA in green. Arrows are inthe 5 to 3 direction.2. 信息分析结果(华大)总结1) 链特异性结

3、果与非链特异性结果相比,在与基因组和参考基因的比对结果中链特异的结 果均相近或稍高于非链特异结果,显示非链特异测序的结果也是比较准确的。HBRR链特异数据比对到基因组上的比例为72.3%,非链特异的为71.3%.UHRR链特异数据比 对到基因组上的比例为70.2%,非链特异的为68.1%。HBRR链特异比对到参考基因的比例 42.5%,非链特异为 40.4%。 UHRR 链特异比对到参考基因的比例 61.8%,非链特异为 51.4%。2) 从目前的结果看链特异建库所得的read的随机分布情况稍差于正常建库,但仍处于可 接受的水平。3) 检测到的基因数方面来说链特异的结果检测得到的基因稍少,但是

4、从理论上说更准确。4) 定量分析方面,链特异结果与qPCR和非链特异结果相比相关性都很高,说明链特异的 结果是准确可信的。5) 在基因结构优化方面链特异的结果描述更加吻合已知的基因注释结果。6) 在可变剪切位点发现上,链特异发现的位点数目稍少,但是发现已知位点所占比例的更 大。HBRR样品链特异方法发现135840个junction,已知占73.5%,非链特异发现146257 个junction,已知占72.3%UHRR样品链特异方法发现152183个junction,已知占69.3%。 非链特异发现168462个junction,已知占68.1%。刀 综上所述,从本次测序数据来看,链特异建库

5、虽然在read的随机性分布上略差,但是 其所得结果其他指标都是比较优秀的,其结果是准确可信的。信息分析结果详见附页链特异转录组分析小结1. 原始数据概括:表一原始数据基本信息SampleTotal ReadsTotal Nucleotides (ntQ20 percentageN percentageGC percentageHBRR(Raw)30447827548060886089.05%0.01%48.5%HBRR(Clean)29740560535330080089.01%0.01%48.54%UHRR(Raw)34917301628511418088.57%0.01%49.92%UHR

6、R(Clean)34298181617367258088.56%0.01%49.95%2. 测序随机性评价:0.00.2D.40.6D.a1.000T-Relative Position in Gene(5!- 3s)图一 A HBRR样品链特异结果的read分布情况0.00.20.40.60.81.0DnpealQi402qEnNRelative Position in Gene(5 3!)图一 B HBRR样品非链特异结果的read分布情况81 20+胃 90+HL UOP 啊CErjo JqlunNRelative Position in Gene(5h- 3d)图二A UHRR样品链特

7、异结果的read分布情况0.00.20.40.6fl.S1.0ilnpls 心O:一口2qLunNRelative Position in Gene(5 3)图二B UHRR样品非链特异结果的read分布情况从上图可以看出,链特异5端reads数较少,随机性不够好(采用的是参考序列 hg18 中的转录本序列),结合两样品正常转录组随机性分布图,随机性分布可能与样品有关。3. 比对基本情况:在hgl8的转录本序列中位于正链的转录本有15998个占51%,位于 负链的转录本有15401个占49%。总体gene 20690个,其中正链 10636个,负链10261 个,在正链负链中均存在的基因有20

8、7个。样品的 read 具体匹配状况如下:表二 HBRR 链特异分析及非链特异分析比对基本情况MethodClean reads numberMapped Reads(Gene)Mapped Reads(Genome)Strand59481120Total25011380 (42%)31344994 (52.7%)specific(+)Perfect match17375378(29.2%)20739782 (34.9%)=2bp mismatch7636002(12.8%)10605212(17.9%)StrandTotal324973(0.5%)17010510(2 8.6%)specif

9、ic(-)59481120Perfect match173664(0.3%)11629931(19.6%)=2bp mismatch 151309 (0.2%)5380579 (9%)Non-StraTotal17336776(40.4%)30534775(71.3%)nd42814906Perfect match10821850(25.3%)18478262(43.2%)specific=2bp mismatch6514926(15.2%)12056513(28.1%)表三UHRR链特异分析及非链特异分析比对基本情况MethodClean reads numberMapped Reads(G

10、ene)Mapped Reads(Genome)StrandTotal38565224 (56.2%)31113869(45.4%)specific(+)68596362Perfect match25878921(37.8%)19564636(2 8.5%)=2bp mismatch12686303(18.4%)11549233(16.8%)StrandTotal383860 (0.56%)22874533(33.3%)specific(-)68596362Perfect match191463(0.28%)14484450(21.3%)=2bp mismatch192397 (0.28%)8

11、390083(12%)Non-StraTotal29094455(51.4%)38516447(68.1%)nd56597170Perfect match18183069(32.8%)23027611(40.7%)specific=2bp mismatch10911386(19.3%)15488836(27.4%)链特异分析的情况下能区分出在非链特异的情况中出现的readl比对到gene的正链,read2比对到负链的数据(红色部分), 仅保留真实来自该基因的数据(蓝色部分)。在后续分析reads与基 因组比对的数据时,我们将比对到基因组正负链上的情况分开,对每 条链单独进行识别。4. 检测到的

12、基因数:HBRR :Strand specific: 17298No strand specific: 17604UHRR :Strand specific:17768No strand specific: 18098在检测基因的数量上链特异能检测到的基因数量略少于非链特 异数据,原因是非链特异建库得到的 read 能够明确定位到 gene 的正 负链上,避免了在非链特异的情况中出现的 read1 比对到 gene 的正 链,read2比对到负链的错误数据,从而相比非链特异减少了比对后 的数据量,使得发现基因的数量略少。5.基因的RPKM相关性:0102D3040qPGR图三A链特异HBRR表

13、达量与qPCR的相关性5.1链特异数据与qPCR的相关性5p*armHn r = 0. &5S07374Sz*genenum = 906sp&arman r = 0.S 698091434 J5945 genenum = 927oID40qPCR图四A链特异UHRR表达量与qPCR的相关性图五A链特异HBRR表达量/UHRR表达量与qPCR的相对定量相关性 通过以上三图可以发现链特异建库与qPCR定量分析之间的Spearman 相关系数0.85,说明链特异的结果定量分析准确。5.2非链特异与qPCR的相关性分析spearman r = 0 3706404292 M147gemenum - 91

14、4Q10203040qPCR图三B非链特异HBRR表达量与qPCR的相关性spear-man t - 0.885B2141094837-*genenum = 938010203040qPCR图四B非链特异UHRR表达量与qPCR的相关性spearmatn r - 0,93348635563793 gertefiunn 三 8? 了IIIII-15-10-5D5qPCR图五B非链特异HBRR表达量/UHRR表达量与qPCR的相对定量相关性通过以上三图可以发现非链特异建库与qPCR定量分析之间的Spearman 相关系数0.85,且均稍大于链特异的结果,说明非链特异的结果定量分析也是准确的。5.3

15、 链特异与非链特异的相关性分析HlrHiTxblmHsnspearme nr= 0 .$40251186434051 g 站*num = 16161图六 链特异HBRR表达量与非链特异HBRR表达量相关性S HBRR.;UHRRsi-蛊 HnNBp sarmai r = 0 .S B30 7 6Q58142S6 2 口pr-iOjnii im = 1 TTfi 11e-021e+0D1e+021e+04S_UHRR图七 链特异UHRR表达量与非链特异UHRR表达量相关性图八 链特异 UHRR,HBRR 表达量与非链特异数据的相对定量相关性根据5.3链特异与非链特异数据之间的绝对定量和相对定量的

16、数 据相关性分析可知样品链特异与非链特异的相关性很高,说明链特异 的分析的结果同非链特异结果相比同样是可信的。表四定量分析相关系数(spearman)比较表绝对定量相对定量HBRRUHRRHBRR/UHRR链特异0.8580.8690.935与 qPCR非链特异0.870.8860.933SS-NS0.9880.9840.94建库方法比较6. 基因结构优化图九HBRR某基因链特异与非链特建库所得数据基因结构优化比较图图九显示的是chr20染色体负链上的一条基因分别用不同分析方 法得到的TAR区分布图,可以发现链特异的分析方法得到的TAR区 更合理,显示的的chr20染色体负链上的某基因,其负链

17、上的TAR 结果能够充分的吻合和延伸已有的注释结果,即链特异结果可以较准 确的区分read和注释基因。总体来说较之非链特异性分析的结果, 链特异性分析的结果更合理。但是仍然有一些基因结构无法识别,有可能是由于测序是在该组 织中一些基因不表达或表达量太低检测不到造成。另外存在很多比对 到内含子上的TAR,显示这些可能是未成熟的mRNA中含有的内含 子未进行剪切的原因。7. Junction 位点检测:链特异的数据使用 tophat 方法检测到的 junction 位点HBRR 共 135840 个:正链:69037(50.8%)负链:66803(49.2%)其中,已知位点有 99868 个(73

18、.5%),未知的有 35972 个(26.5%), 与非链特异交集104039 个 51270(-)+52769(+)。UHRR 共 152183 个:正链:76755(50.4%)负链: 75428(49.6%)其中,已知位点有105406 个(69.3%),未知的有46777个(30.7%), 与非链特异交集1 18437 个(57929(-)+60508(+)。非链特异的数据使用 tophat 方法检测到的 junction 位点:HBRR 共 146257 个正链: 73777(50.4%)负链: 72480(49.6%)已知: 105733(72.3%) 未知: 40524(27.7

19、%)UHRR 共 168462 个正链: 85143(50.5%)负链: 83319(49.5%)已知: 114702(68%) 未知: 53760(32%)表五 样品 HBRR 发现的可变剪切的数目比较链特异非链特曰 异类型HBRR 正链HBRR负链SUMHBRR链特异与非链特 异的交集A3SS26952437513258652278A5SS21982258445649461871RetainedInt80373715402335926ronSkippedExon13961464286030831361表六 样品 UHRR 发现的可变剪切的数目比较链特异非链 特异类型UHRR 正链UHRR

20、负链SUMUHRR链特异与非链特异 的交集A3SS41193685780492333577A5SS34443347679181183190RetainedInt15001482298236381734ronSkippedExon215621114267475019798. 小结8.1 链特异性结果与非链特异性结果相比,在与基因组和参考基因 的比对结果中链特异的结果均相近或稍高于非链特异结果,显示非链 特异测序的结果也是比较准确的HBRR链特异数据比对到基因组上 的比例为72.3%,非链特异的为71.3%.UHRR链特异数据比对到基因 组上的比例为70.2%,非链特异的为68.1%。HBRR链特

21、异比对到参 考基因的比例42.5%,非链特异为40.4%。UHRR链特异比对到参考 基因的比例61.8%,非链特异为51.4%。8.2 从目前的结果看链特异建库所得的 read 的随机分布情况稍差于 正常建库,但仍处于可接受的水平。8.3 检测到的基因数方面来说链特异的结果检测得到的基因稍少, 但是从理论上说更准确。8.4 定量分析方面,链特异结果与 qPCR 和非链特异结果相比相关性 都很高,说明链特异的结果是准确可信的。8.5 在基因结构优化方面链特异的结果描述更加吻合已知的基因注 释结果。8.6 在可变剪切位点发现上,链特异发现的位点数目稍少,但是发 现已知位点所占比例的更大。HBRR样品链特异方法发现135840个 junction,已知占73.5%,非链特异发现146257个junction,已知占 72.3%UHRR样品链特异方法发现152183个junction,已知占69.3%。 非链特异发现168462个junction,已知占68.1%。综上所述,从本次测序数据来看,链特异建库虽然在read的随机性 分布上略差,但是其所得结果其他指标都是比较优秀的,其结果是准 确可信的。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!