没有合适的资源?快使用搜索试试~ 我知道了~
guo-cheng#Learning-notes-2021#从头学习转录组之FastQC数据质控报告的详细解读1


试读
需积分: 0 2 下载量 152 浏览量
更新于2022-07-25
收藏 7KB MD 举报
2. Per base sequence quility:每个测序read上各碱基质量
3. Per sequence quility scores:每条序列质
# 从头学习转录组之**FastQC数据质控报告的详细解读**
接下来将会更新几期转录组分析的内容,包括无参转录组,有参转录组。感兴趣可以关注一下。
1. **Basic Statistics(基本信息)**

- Encoding: 测序平台编号,现在Sanger/ Illumina 1.8以上都是Phred 33编码
- Total sequences: reads数量
- Sequence length: 测序长度
- **%GC: GC含量:** 需要**重点关注**,可以帮助区别物种以及污染等,动物40%-60%都可以。
**2. Per base sequence quility**:每个测序read上各碱基质量

- 横轴:测序序列的1-40个碱基;正常为100,200或者250bp
- 纵轴:质量得分,score = -10 * log10(error),例如错误率error为1%,那么算出的score就是20
- **箱线图boxplot**:对每一个碱基的质量的统计。箱子上面的须(up bar)为90%分位数,下面的须(down bar)为10%分位数,箱子中的红线为中位数即50%分位数,箱子顶(upside)为75%分位数,箱子低(downside)为25%分位数。这个boxplot的意义:一是看数据是否具有对称性;二是看数据分布差异,这里主要利用了第二点。bar的跨度越大,说明数据越不稳定。
- 蓝色的线将各个碱基的质量平均值连接起来
- **解释一下:图中蓝线的走势为何先高后低?**因为目前采用的边合成边测序使用的是化学方法促使链由5'向3'延伸,也就是利用了DNA聚合酶。刚开始测序,合成反应还不是很稳定,但是酶的质量还很好,所以会在高质量区域内有一定的波动(这里的1-30bp),后来稳定了,但是随着时间的推移,酶的活力逐渐下降,特异性也变差,所以越往后出错几率越大。
- 一般能用的数据都要求至少Q20,也就是下四分位(10%分位数)的质量值要大于20。
- 二代测序,最好是达到**Q20的碱基要在95%以上(最差不低于90%)�
点击阅读更多
资源推荐
资源评论
2022-07-25 上传
2024-10-29 上传

143 浏览量
127 浏览量
199 浏览量
2021-07-24 上传
191 浏览量
2025-01-03 上传
158 浏览量
2021-06-13 上传
2018-12-13 上传
145 浏览量
2012-04-19 上传
124 浏览量
200 浏览量
2021-10-18 上传

176 浏览量
2021-05-24 上传
120 浏览量
163 浏览量

192 浏览量

2021-09-25 上传
146 浏览量
198 浏览量
159 浏览量
2021-09-24 上传
184 浏览量
资源评论


西西里的小裁缝
- 粉丝: 35
上传资源 快速赚钱
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


最新资源
- CADCAM软件在机械制造业中的作用及发展方向.doc
- 世界上主要发达国家或地区电子商务发展情况.doc
- XX供电公司工程项目管理行为规范考评表.doc
- plc在电梯系统中的应用的大学本科方案设计书.doc
- 互联网+的变电检修人数据解决对策.docx
- 全国大学生电子商务竞赛团体赛全流程.doc
- 基于大数据技术的情感分析系统的设计和实现.docx
- 单片机和超声波模式测距系统设计.doc
- 如何在Excel单元格中调整行距.docx
- 新媒体时代高校网络文化建设品牌培育路径研究.docx
- 网络安全期末复习题.doc
- 图形与界面设计illustrator课程教案.doc
- 民用机场建设招投标信息化管理.doc
- 安卓软件工程师IT必须掌握BF-TECH-3.0-C模块.doc
- 装饰工程项目管理的难点与对策15800.doc
- 计算机辅助设计在机械领域的应用分析.docx
安全验证
文档复制为VIP权益,开通VIP直接复制
