如何分析转录组测序结果分析测序中的snp数据

NGS数据分析解决方案及其应用
&&&&&&&路思达生物信息沙龙旨在促进生物信息及相关领域的学术交流与信息共享,推动新技术与新方法的应用,加强生物信息相关科研人员之间的交流与合作,促进生物信息学科发展,更好地服务于科研与产业。
&&&&&&&当前,新一代测序技术(Next
Generation Sequencing, NGS)飞速发展。海量数据的产出已经成为现实。数据的质量控制、分析、注释与挖掘成为限制科研产出速度的瓶颈。为此,在2015年1月,北京路思达生物信息科技有限公司推出两场免费的生物信息沙龙,联合Qiagen为广大科研工作者介绍完整的、高质量的NGS 数据分析解决方案及其应用。
&&&&&&&如果您还没有工具对测序公司提供的数据进行质量评估;如果您还为没有可以写代码的生物信息工程师而发愁;如果您有基因组、转录组等数据需要分析、注释;如果您发现了大量的SNP需要进一步筛选……这些问题,您在本次沙龙活动中都将找到解决方案。我们将一步步带您熟悉从软件基础知识到复杂的数据质量控制、分析、注释以及数据挖掘,解答您在生物信息分析中所遇到的问题。
&&&&&&&本期活动免费,名额有限,请您及早注册,以确认信息为准。我们期待您的光临!
&&&&时 间:日(周二) 09:00-16:30
&&&&地 点:上海天平宾馆(上海市徐汇区天平路185号)
&&&&时 间:日(周四) 09:00-16:30
&&&&地 点:北京凯瑞大酒店(北京市海淀区羊坊店西路)
&&&&由于北京站场地有限,现名额已满,不再接受报名。如有需要,您可以申请参加上海站活动。为感谢各位老师对本次活
&&&&动的大力支持,我们会在春节后再次组织系列沙龙活动,您可以提交信息,我们会在下次活动前优先与您联系。
Qiagen NGS分析整体解决方案概述
概述NGS常见问题与瓶颈以及如何应对繁复的各类样品,获得最佳检测效果。
CLC Genomics Workbench 基因组分析
Resequencing实现从序列比对到突变检出、筛选注释及比较基因组的完整分析,De novo分析实现高效的基因组组装。
CLC Genomics Workbench 转录组分析
Transcriptome analysis实现样本基因表达量RPKM分析和组间差异表达的统计和可发表图谱的产出。
MGFM与Blast2GO模块介绍
MGFM是迄今唯一一款通过图形化操作就可以实现单碱基序列查看并完成基因组组装的商业化软件。
Blast2GO让您只需点选就能完成序列比对到GO功能注释,以及直接获得发表文章所需的图形化结果输出。
CLC Cancer Research Workbench介绍
CLC Cancer Research
Workbench是全球第一款全面、友好和可自定义的专注于癌症信息学的解决方案。它不仅提供了发现预后因子、发现亚克隆体细胞突变、检测遗传性状、寻找药物反应的生物标志物、确定新的致癌因子在内的全套工具以实现全面的癌症数据分析。而且提供灵活、癌症专用、即用型且方便修改的分析工作流程。而直观的软件界面使您可以轻松地自定义工作流程或创建新的工作流程。此外,您还可与您的合作者和同事方便地分享工作流程。
Ingenuity Pathway Analysis介绍
IPA是一款基于网络的软件应用程序,可对RNA-Seq、microRNA和SNP微阵列、代谢组学、蛋白组学等基因表达实验,以及生成基因和化学物质列表的小规模实验的数据进行分析、整合和理解。下游效应分析(Downstream Effects Analysis)可以预测细胞学功能、疾病进程以及受分析数据集的模式影响的其他表型。上游调节分析(Upstream Regulator Analysis)则可发现与数据集合中的目标直接关联的调节因子(包括转录因子、细胞因子、激酶等),它们的激活或抑制可能导致了所观察到的变化。该软件凭以Ingenuity Knowledge Base的独特的结构和海量的内容,得以揭示重要的生物分子、生物学通道以及蕴含复杂组学数据的网络。
Ingenuity Variant Analysis介绍
Ingenuity Variant
Analysis的主要应用是对二代测序(NGS)技术生成的人类测序数据进行分析和解释。Ingenuity Variant Analysis集成了强大的分析工具以及Ingenuity
Knowledge Base中无可比拟的丰富信息,能够在人类全基因组、外显子组和基因测序板中快速鉴定出最有说服力的疾病变异。该工具基于已发表的疾病生物学证据和知识来制定筛选标准,仅需数小时即可完成数百例样本的分析。
测序样本制备及文库构建解决方案介绍
Qiagen是全球知名的核酸样品制备专家。自2012年Qiagen宣布正式进入二代测序市场以后,利用样品制备的技术优势开发了一系列疑难样品的NGS解决方案,如单细胞测序技术、宏基因组学测序中宿主DNA去除技术、独特的抗体捕获式rRNA去除技术、基于多重PCR的靶标捕获技术能等。此外Qiagen还推出了一管式DNA文库建库方案及自动化系统,大大节省了样品制备的工作量和成本。
&&&&&&&Qiagen
&&&&&&&北京路思达生物信息科技有限公司
&&&&&&&张海琼
&&&&&&&电 话:
&&&&&&&E-mail:
注册报名表
联系电话 *
研究方向 *
场次选择 *
本网页由北京路思达生物信息科技有限公司委托基于重测序数据的群体SNP位点检测及基因型判断--《华南理工大学》2013年硕士论文
基于重测序数据的群体SNP位点检测及基因型判断
【摘要】:随着测序技术的持续革新,新一代测序技术的产生降低了测序成本并提高了测序通量,使得针对几百上千的样品进行DNA测序成为可能。其次当前模式作物和重要经济物种的基因组大多已经被测序,越来越多的科研人员转向重测序研究。再次近几年很多研究人员已经在相关杂志发表了很多个体重测序的研究了,个体重测序研究已经相当深入,很难有质的飞跃和重要的发现。最好对一个好的群体的研究对后期的更深入的研究十分有意义,如对重组自交系群体进行测序,可以快速构建遗传图谱,寻找重组热点和定位数量性状位点的精细范围;再如而对栽培群体和野生群体测序,通过全基因组的多态性比较,则可以快速寻找到受人工驯化受到选择的区域和相关基因。基于上面以及其它种种原因,群体重测序的研究越来越受到重视了,其中群体SNP检测和基因型判断则显得尤其重要,目前检测群体SNP的方法并不成熟,大多由个体SNP的基因型整合构成群体SNP的基因型,不仅带入了不少假阳SNP和位点基因型判断不准,而且很多群体中稀有SNP并没有被检测出来,这些都会后期生物意义的探究造成一定的干扰。本论文主要研究是在群体样品过多,测序大数据过大,计算机资源有限情况下,提供了用于群体SNP位点检测及判断基因型的新算法和新模型,使之更高效更准确检测出群体SNP位点以及判断出各个体在该位点的基因型。主要的研究结果如下:
(1)在研究群体SNP的检测模型,最终实现了两种检测模型,即最大似然法模型和贝叶斯二项混合模型。并基于这两种检测模型的理论,在Linux平台实现其检测的功能,开发对应的软件GLFmuti和PopSNP,通过和现在的软件比较和发展趋势,新开发的软件检测结果大有提高并将得到广泛应用。
(2)为了减少机器误差以及减少各种人为操作不当,提高群体SNP的检测的准确度,本论文同时为前期过滤和比对各过程等过程提供相应的分析工具。
(3)本论文在检测群体SNP和判断基因型的同时,同时开发其它变异检测功能,并最终从原始数据到变异检测的每一个分析步骤都提供相应功能模块,最终设计提供出一套标准的分析流程,实现相关分析标准化。
【关键词】:
【学位授予单位】:华南理工大学【学位级别】:硕士【学位授予年份】:2013【分类号】:Q75【目录】:
摘要5-7ABSTRACT7-9英文缩写词表9-11目录11-14第一章 绪论14-20 1.1 研究背影14-15
1.1.1 测序背影14
1.1.2 重测序背影14-15 1.2 研究意义15-17
1.2.1 研究现状15-16
1.2.2 当前技术16-17
1.2.3 研究趋势17 1.3 本题课的研究内容及意义17-20
1.3.1 本题课的研究目的和意义17-19
1.3.2 课题的研究内容19-20第二章 基础知识介绍20-24 2.1 引言20 2.2 重要概念20 2.3 数据格式20-22 2.4 专业名词22-23 2.5 本章小结23-24第三章 检测步骤和方法设计24-26 3.1 引言24 3.2 步骤和方法设计24-25 3.3 讨论25 3.4 本章小结25-26第四章 重测序数据质控26-33 4.1 引言26 4.2 测序数据质控26-29
4.2.1 测序数据统计26-27
4.2.2 测序数据过滤27-28
4.2.3 模块功能实现28-29 4.3 参考基因组预处理29-31
4.3.1 基因组预处理29-30
4.3.2 模块功能实现30-31 4.4 讨论31 4.5 本章小结31-33第五章 短序列比对33-39 5.1 引言33 5.2 测序数据比对33-34
5.2.1 软件介绍33
5.2.2 比对参数33-34 5.3 比对结果处理34-38
5.3.1 比对结果处理34-35
5.3.2 模块功能实现35-38 5.4 讨论38 5.5 本章小结38-39第六章 群体 SNP 检测和碱基型判断39-59 6.1 引言39 6.2 贝叶斯理论估算个体碱基型39-43 6.3 最大似然法检测群体 SNP43-48
6.3.1 贝叶斯理论判断个体的碱基型44
6.3.2 最大似然法推算群体泛基因组44-45
6.3.3 功能实现45-47
6.3.4 SNP 过滤和碱基型的判断47-48
6.3.5 方法的优缺点48 6.4 贝叶斯二项式混合模型检测群体 SNP48-52
6.4.1 模型构建49-51
6.4.2 功能实现51-52
6.4.3 SNP 过滤和碱基型的获取52
6.4.4 方法的优缺点52 6.5 各方法之间比较52-56
6.5.1 碱基型准确度比较53-55
6.5.2 群体 SNP 准确性的比较55-56 6.6 讨论56-57 6.7 本章小结57-59第七章 检测变异工具包设计59-65 7.1 引言59 7.2 功能扩充59-60 7.3 工具包封装60-61 7.4 流程构建61-63 7.5 流程比较63 7.6 流程特点63-64 7.7 讨论64 7.8 本章小结64-65结论与展望65-69 1 结论65-66 2 创新66-67 3 展望67-69参考文献69-73附录73-74攻读学位期间取得的研究成果74-75致谢75-76附件76
欢迎:、、)
支持CAJ、PDF文件格式
【参考文献】
中国期刊全文数据库
滕晓坤;肖华胜;;[J];中国科学(C辑:生命科学);2008年10期
周晓光;任鲁风;李运涛;张猛;俞育德;于军;;[J];中国科学:生命科学;2010年01期
岳桂东;高强;罗龙海;王军一;许姣卉;尹烨;;[J];中国科学:生命科学;2012年02期
莫惠栋,姜长鉴;[J];遗传学报;2001年06期
晏慧君;黄兴奇;程在全;;[J];云南农业大学学报;2006年01期
中国博士学位论文全文数据库
李冬冬;[D];国防科学技术大学;2004年
【共引文献】
中国期刊全文数据库
刘星;仇雪梅;高祥刚;赫崇波;;[J];现代农业科技;2008年16期
李晓颖;曹雪;杨光;王晨;沈玉英;房经贵;;[J];北京林业大学学报;2010年S2期
金虎;严善春;刘关君;;[J];东北林业大学学报;2010年06期
付杨;高翔;敖曼;王钦美;王丽;;[J];东北师大学报(自然科学版);2008年03期
何薇;李言;丁雷;李勇;梁利群;;[J];大连水产学院学报;2009年03期
蒙涛;丁峰;褚武英;周瑞雪;宾石玉;胡松年;张建社;;[J];淡水渔业;2009年04期
蔡铁城;曾建斌;陈顺辉;陈华;贺小彦;张冲;庄伟建;;[J];福建农林大学学报(自然科学版);2012年01期
邹志华;张子平;王艺磊;陈锦民;贾锡伟;王淑红;林鹏;;[J];福建水产;2007年04期
汤在祥;陈志军;王学枫;徐辰武;;[J];分子植物育种;2006年02期
董清华;冯永庆;秦岭;王有年;沈元月;;[J];分子植物育种;2007年01期
中国博士学位论文全文数据库
王猛;[D];中南林业科技大学;2010年
付伟;[D];北京协和医学院;2011年
翟焕趁;[D];福建农林大学;2011年
吴绍华;[D];四川农业大学;2011年
王智文;[D];天津大学;2011年
高文瑞;[D];南京农业大学;2008年
李玮;[D];西北农林科技大学;2011年
萧恺昌;[D];复旦大学;2011年
黄河;[D];北京林业大学;2012年
刘芳;[D];中国农业科学院;2003年
【二级参考文献】
中国期刊全文数据库
樊红;[J];国外医学.遗传学分册;2002年01期
姜长鉴,莫惠栋;[J];中国科学C辑:生命科学;1998年06期
谢卡斌,张建伟,向勇,冯旗,韩斌,储昭晖,王石平,张启发,熊立仲;[J];中国科学C辑:生命科学;2005年01期
莫惠栋;[J];江苏农业研究;2001年01期
储昭晖,彭开蔓,张利达,周斌,魏君,王石平;[J];科学通报;2002年21期
刘建喜,林爱星,李雪辉,陈新荣,陈永福;[J];农业生物技术学报;2001年03期
李晶泉,袁晓东,汤敏谦;[J];遗传;2001年02期
顾世梁,蒯建敏,徐辰武,姜长鉴;[J];扬州大学学报(自然科学版);1999年02期
金小宝,王婷婷,朱家勇;[J];中国人兽共患病杂志;2005年01期
【相似文献】
中国期刊全文数据库
任鲁风;于军;;[J];生命科学;2012年12期
曹婷;张立岭;侯冠彧;周汉林;施力光;荀文娟;;[J];家畜生态学报;2013年01期
张晓丹;武海萍;周国华;;[J];分析化学;2006年04期
;[J];科技创业;2010年06期
;[J];生物医学工程与临床;2011年02期
占爱瑶;罗培高;;[J];生物技术通讯;2011年04期
Kevin D李升伟;;[J];生物技术世界;2011年06期
李亦学;李轩;;[J];中国科技投资;2012年07期
周怀军;;[J];中国家禽;2012年23期
张春兰;;[J];潍坊学院学报;2012年06期
中国重要会议论文全文数据库
何彪;涂长春;;[A];中国畜牧兽医学会家畜传染病学分会第八届全国会员代表大会暨第十五次学术研讨会论文集[C];2013年
李晓峰;刘公社;;[A];中国草学会牧草育种委员会第七届代表大会论文集[C];2009年
张卉;秦利涛;吴东;王红丹;廖世秀;;[A];第九届全国遗传病诊断与产前诊断学术交流会暨产前诊断和医学遗传学新技术研讨会论文集[C];2014年
倪培相;;[A];2010年中国科学院微生物研究所博士后学术年会暨第二届博谊论坛论文摘要集[C];2011年
王楷宬;陈贵钱;蒋文明;刘硕;侯广宇;于建敏;李金平;庄青叶;陈继明;;[A];中国畜牧兽医学会家禽学分会第九次代表会议暨第十六次全国家禽学术讨论会论文集[C];2013年
卢大儒;;[A];第九届全国遗传病诊断与产前诊断学术交流会暨产前诊断和医学遗传学新技术研讨会论文集[C];2014年
王艳;梁静;吴虹林;刘欣;封志纯;;[A];第九届全国遗传病诊断与产前诊断学术交流会暨产前诊断和医学遗传学新技术研讨会论文集[C];2014年
董艳玲;易玉婷;王延洲;胡华梅;胡华;章容;易鑫;姚宏;;[A];第九届全国遗传病诊断与产前诊断学术交流会暨产前诊断和医学遗传学新技术研讨会论文集[C];2014年
魏晓明;;[A];第十二次全国医学遗传学学术会议论文汇编[C];2014年
李彤彤;李爱华;;[A];2013年湖北省暨武汉微生物学会会员代表大会暨学术年会论文摘要集[C];2013年
中国重要报纸全文数据库
罗国金;[N];解放军报;2014年
许琦敏;[N];文汇报;2009年
刘传书;[N];科技日报;2012年
刘传书;[N];科技日报;2012年
贾少强 通讯员
王静思;[N];深圳商报;2010年
刘海英;[N];科技日报;2009年
刘传书;[N];科技日报;2008年
张思;[N];中国医药报;2008年
深圳特区报记者
谭大跃 实习生
记录整理;[N];深圳特区报;2010年
贾少强 通讯员
刘佳;[N];深圳商报;2012年
中国博士学位论文全文数据库
平捷;[D];上海交通大学;2012年
谢为博;[D];华中农业大学;2010年
林强;[D];中国科学院北京基因组研究所;2011年
周彦;[D];东北师范大学;2013年
萧恺昌;[D];复旦大学;2011年
李粤;[D];苏州大学;2012年
李飞飞;[D];中国科学院北京基因组研究所;2013年
吴金雨;[D];中国科学技术大学;2014年
翟志源;[D];山东大学;2013年
中国硕士学位论文全文数据库
孙明辉;[D];吉林大学;2011年
苏浩翔;[D];北京协和医学院;2014年
华蔚颖;[D];上海交通大学;2010年
黄适;[D];上海师范大学;2011年
毕鹏程;[D];哈尔滨工业大学;2012年
陈传艺;[D];福建农林大学;2012年
何伟明;[D];华南理工大学;2013年
周东艳;[D];南昌大学;2014年
孟令芝;[D];山西农业大学;2014年
禹海英;[D];中国科学院北京基因组研究所;2012年
&快捷付款方式
&订购知网充值卡
400-819-9993
《中国学术期刊(光盘版)》电子杂志社有限公司
同方知网数字出版技术股份有限公司
地址:北京清华大学 84-48信箱 大众知识服务
出版物经营许可证 新出发京批字第直0595号
订购热线:400-819-82499
服务热线:010--
在线咨询:
传真:010-
京公网安备75号生物秀人才网[]
打造生物医药领域人才求职与企业招聘的专业平台
欢迎加入最专业的生命科学交流社区,结交业内好友,体验更多功能。
才可以下载或查看,没有帐号?
现在越来越多的人在做转录组测序及相关分析研究,我们这个论坛是论坛,应该在这方面多交流。今天发这个帖子,希望大家把自己的经验分享,有问题一起交流。
& && & 做转录组基本都是在华大做,我做的是同一组织不同生长阶段转录组分析(包括差异基因表达分析),但分析数据过程中会遇到很多问题,期待大家一起交流学习。
& && & 1、不同的unigene,nr注释到同一种蛋白上(物种也一样),问题出来了,到底以哪一个unigene为准,比如评价表达量(RPKM)高低,怎么评价?或许这里边存在着剪接形式的不同,可能这几个unigene来源于同一个mRNA,但以目前的数据说话,到底我这个组织中这种蛋白含量是多少?似乎很难判断。如果来源于同一个mRNA,为什么组装的时候没有把他们拼接成一个unigene?
& && & 2、差异分析中pathway中,比如一个基因发生了上调或下调,虽然标记的是显著上调或下调,但当在annotation总表中进行查找时,就会出现问题1中一样的问题,其实有很多unigene注释上了同样的蛋白(即pathway中的元素),但长度最长,匹配度最高的那个unigene,根本就不存在显著性差异,这时,怎么办??
& && & 先说两个吧,说的比较乱,有兴趣的朋友顶一下,我们在进行深入交流。
& && & 欢迎大家参与,谢谢。
签到天数: 14 天[LV.3]偶尔看看II
生物秀举人
生物秀人才网[]
打造生物医药领域人才求职与企业招聘的专业平台
我也有同问,不同剪接体在qPCR中的表达有差异么?那怎么去研究这个基因不同剪接体的情况?
签到天数: 3 天[LV.2]偶尔看看I
生物秀人才网[]
打造生物医药领域人才求职与企业招聘的专业平台
可变剪切位点需要同基因组进行比较,如果没有基因组,研究起来会比较难吧,个人意见而已。
签到天数: 3 天[LV.2]偶尔看看I
做这方面工作的人不多还是大家不愿意讨论啊,如果感兴趣的,还请不吝赐教啊,呵呵~
该用户从未签到
可能过一阵也会做,不过在这方面的认识还是比较肤浅
该用户从未签到
我做的就是转录组分析的,RNA-Seq:转录组测序技术,
但是我目前做的只是停留在基因表达这一块,没有对结构进行分析比如可变剪切,SNP,组装啊什么的,
现在做的是基因表达,差异基因筛选,GO和PATHWAY富集分析。有这方面研究的同事可以进一步交流。
签到天数: 3 天[LV.2]偶尔看看I
好的 呵呵 已经加你了
该用户从未签到
你好,我现在也马上要做转录组分析,差异基因筛选,想消除基因长度对结果的影响,该怎么做呢。
该用户从未签到
本帖最后由 果农 于
13:56 编辑
你好,我现在正在做转录组分析,数据已经返回,但是我看着是一头雾水啊,请师兄指教啊~
该用户从未签到
我也刚做转录组,华大的454测序。
对于你的第一个问题,我个人认为,这两个unigene应该在拼接时会拼接成一个contig,你可以根据contig的比对结果来确定它的注释。你第二个问题应该是和第一个类似,所以建议你用拼接后的结果进行分析。
更新你的简历,加入生物秀人才库,高薪工作基因编辑峰会支持人类胚胎研究(胚胎、基因细胞治疗:生物医药产业下一个风口(细胞治聚焦“基因剪刀”奠基人的科研历程生物秀论坛手机版全新改版,更快速度,更好体
12345678910
murongxiaoxiao大叔级摄影爱好者,喜欢分享绝对零度积极有责任心,热心公益事业yiii红米达人,爱拍照的北京女孩第二代测序中的数据分析-基因组_图文_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
第二代测序中的数据分析-基因组
上传于|0|0|暂无简介
阅读已结束,如果下载本文需要使用1下载券
想免费下载本文?
定制HR最喜欢的简历
下载文档到电脑,查找使用更方便
还剩32页未读,继续阅读
定制HR最喜欢的简历
你可能喜欢  生物通报道:作为生命科学领域的“圈内人”,如果你还不知晓近期基因组测序的飞速发展,那你就实在太out了。。。随着新一代测序技术的不断改进,新测序仪不断涌现,测序价格也越来越低,应用当然也越来越广。近两年,新一代测序技术广泛应用于全基因组测序,疾病关键基因的测定,以及宏基因组学。
然而由于这一领域的发展速度飞快,因此一些新接触的实验人员可能会感到茫然无措:虽然这些研究人员都具有实体测序实验操作经验,但是如何处理获得的庞大数据是一个巨大挑战。幸运的是,目前已经有了一些免费的,或者说是低成本的多元化工具,以及活跃的用户群,可以帮助我们解决其中的一些问题。
生物通谈到了硬件,数据分析需要什么样的IT设备,以及没有这些设备该怎么办?这回我们谈谈软件。
我该使用什么程序?
同样,这要看情况。你想要开展什么分析?你能使用UNIX吗?你会编程吗?
目前已有数百个用于新一代测序的生物信息学工具,从商业化的产品到略有瑕疵的免费软件。在 (/wiki/Software)上列出并介绍了超过360个软件。
对于新手来说,不幸的是,这些工具极少有着漂亮的图形用户界面。凯撒西储大学的Mark Adams谈到:“目前有相当多不错的免费软件可用于分析,但几乎所有免费软件和最新软件都是基于UNIX命令行的。”在大多数情况下,这些程序基本上是数据过滤器和文件转换器。它们接收一种形式的数据,处理它,并以另一种形式导出。
简单来说,大部分基因组中心自己写代码,指导原始序列数据通过这些步骤,将一个程序的输出结果导入另一个程序,清理,采集质量标准,与参考基因组比对,以及其他。
这样的软件流水线可能听起来无比复杂,但是在面对包含数百万条记录的数据文件时,你别无选择。因此,你们小组至少应有一人要有相当不错的UNIX技能。Wellcome Trust Sanger研究院的博士后Daniel MacArthur认为:“基本的UNIX命令行语法将让你利用此类型数据走得更远。”
我该如何查看原始数据?
通常来说,别这么做。你也不需要这么做。数据太多了,而你从中获得的将很少;相反,你要查看处理过的数据,SNP检出列表及其他。但MacArthur博士认为也有例外。他说,在投身验证研究之前,还是值得花时间去仔细检查那些支持变异体检出的真实序列读取。
MacArthur博士谈到:“对于那些刚刚开始涉及分析的研究人员来说,我的唯一忠告是――利用一切机会以尽可能多的方式来查看数据,因为你可能会上当。”比如,单核苷酸变异检出是相对可靠的。然而,插入和缺失(indel)却可能有问题:一些插入缺失读取被抛弃,因为它们看上去不能与参考序列正确比对;其他的则被称为SNP簇。他说:“诸如此类,只要你查看这些读取,你就能发现有一些确实错了。”
你可以利用基因组浏览器(如Integrative Genomics Viewer)来查看原始数据,它将重叠读取显示成参考基因组上的“堆积”。MacArthur博士认为Integrative Genomics Viewer是一个很好的工具,直观,易用。
如果想查看原始数据,你可以使用UNIX命令行工具,来确定你的数据格式是否正确,以便导入各种分析程序。
我能从哪里寻求帮助?
对于新一代生物信息学这个复杂且日新月异的学科来说,幸运的是,从来就不缺帮助,无论是用户组、在线论坛或网页教程。工具开发者通常还会回复电子邮件咨询,其他经验丰富的研究人员也是如此。这里推荐一个好的出发点:,目前有6400名活跃的会员。
“那儿有很多人,他们有很多专业知识,因此别逞强,什么事都自己扛。利用你周围的知识。重新发明轮子是没有意义的。”华盛顿大学基因组中心的David Dooling如是说。
一些精选的免费数据分析工具:
我来说两句(0)
[Ctrl+Enter]
相关文章:
加载相关文章......
今日文章:
加载今日文章......
生物通快讯
加载中......
加载中......
加载中......
加载中......
技术大讲堂
加载中......
加载中......
加载中......
加载中......
加载中......
加载中......
版权所有 生物通
Copyright&
, All Rights Reserved
联系信箱:

我要回帖

更多关于 转录组测序数据分析 的文章

 

随机推荐