一、准备材料
- 基因组fasta(如:genome.fa)
- RiboCode生成的GTF文件(如:ribocode.gtf,含ORF的exon注释)
二、提取外显子区间为BED文件
RiboCode的GTF文件每个ORF有多条exon
记录。我们需要把这些exon条目提取出来,转为BED格式。
1. 提取GTF中exon为BED
这里我们使用RiboCode生成的GTF格式:
NC_000001.11 RiboCode exon 17233 17310 . - . orf_id "WASH7P_17310_16745_98"; ...
Python脚本示例:
# gtf_to_bed.py
with open(