文章目录
1. 前言
在Ribo-seq或small RNA测序数据分析中,rRNA和小RNA(smRNA,如tRNA、snRNA等)污染是影响下游分析准确性的主要因素之一。通过统计rRNA和smRNA的比对率,可以评估样品的纯度和实验质量。本文将详细介绍如何自动化统计rRNA/smRNA比对率,并生成可视化报告。
2. 分析原理
- rRNA/smRNA污染:高比例的rRNA/smRNA序列会占用测序资源,降低有效数据量。
- 比对率定义:rRNA/smRNA比对率 = 比对到rRNA/smRNA参考的reads数 / 总reads数 × 100%
- 分析流程:
- 用Bowtie2等工具将clean reads比对到rRNA/smRNA参考序列
- 统计比对结果,提取总reads数和比对reads数
- 计算比对率,输出汇总表格和可视化图
rRNA和smallRNA参考序列的数据来源
在进行rRNA和smallRNA污染过滤时,首先需要准备高质量的rRNA和smallRNA参考序列。常见的数据来源如下: