用k-mer分析进行基因组调查(genome survey):(三)用KMC进行k-mer频数统计

本文介绍了如何使用KMC进行k-mer频数统计,作为基因组调查的第一步。KMC是一个由波兰Silesian University of Technology开发的工具,用于从FASTQ/FASTA文件中计算k-mers。文章详细阐述了KMC的安装、运行参数,并推荐了结合GenomeScope进行基因组特征评估。通过KMC生成的sample.histo文件,可以使用GenomeScope1.0(二倍体物种)和GenomeScope2.0(多倍体物种)进行分析,以预测基因组大小、杂合度和重复率。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

(全文约1300字)

【推荐】用Smudgeplot评估物种倍性后,用组合jellyfish+GenomeScope1.0做二倍体物种的基因组调查,用组合KMC+GenomeScope2.0做多倍体物种的基因组调查。

1. k-mer进行基因组调查的软件概况

k-mer进行基因组调查分为k-mer频数统计基因组特征评估两步。

  • KMC可以实现第一步k-mer频数统计。
  • KMC的结果sample.histo可以用在GenomeScope上,实现第二步基因组特征评估。

2. KMC 简介

  • KMC是一个用来从FASTQ/FASTA文件中计算k-mers的基于KMC二进制数据库的程序。
  • KMC是波兰的Silesian University of Technology的算法和软件学院的REFRESH Bioinformatics Group开发的工具。
  • 2017年发布了第三个版本,KMC3。
  • KMC是主要基于C语言的程序。

3. KMC 安装

  1. 版本

    有两个版本的KMC,一般使用第一个版本,Smudgeplot评估物种倍性时用到了第二个版本。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值