用popart构建常染色体单倍型网络（Autosomal haplotypes network construction with popart）...

最新推荐文章于 2024-12-06 12:57:02 发布

转载

最新推荐文章于 2024-12-06 12:57:02 发布 · 3.5k 阅读

3 ·

CC 4.0 BY-SA版权

原文链接：http://www.cnblogs.com/chenwenyan/p/9877377.html

本文详细介绍了如何利用popart软件构建常染色体单倍型网络。首先，从vcf文件转为plink格式，通过PLINK确定连锁位点。接着，提取连锁的35个位点，生成singstring文件和两条单链fas格式文件。然后，用DnaSP6将fas文件转换为nex文件，并统计不同群体的单倍型数量。最后，手动修改nex文件并用popart构建单体型网络。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1）将vcf转化为plink格式，假定输入的vcf文件名为：17893893-17898893.vcf,也可以参考链接：将vcf文件转化为plink格式并且保持phasing状态

/vcftools --vcf 17893893-17898893.vcf --plink-tped --out 17893893-17898893 /plink --tfile 17893893-17898893 --recode --out 17893893-17898893

2) 用PLINK确定要研究的位点是否处于连锁的状态；生成blocks和blocks.det两种后缀格式文件；

/plink --file 17893893-17898893 --blocks no-pheno-req --out 17893893-17898893

以上结果说明rs62033

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_34401479

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

单倍型网络图绘制软件NETWORK 5.0

02-04

单倍型网络图绘制软件NETWORK 5.0，2020年1月18日更新版本。 Network generates evolutionary trees and networks from genetic, linguistic, and other data. Network can then provide age estimates for any ancestor in the tree.

单倍型

an05423833476591的博客

08-11

2238

单倍型，是单倍体基因型的简称，在遗传学上是指在同一染色体上进行共同遗传的多个基因座上等位基因的组合；通俗的说法就是若干个决定同一性状的紧密连锁的基因构成的基因型。按照某一指定基因座上基因重组发生的数量，单倍型甚至可以指至少两个基因座或整个染色体。与基因型的区别更进一步的讲，单倍型也是指一个染色单体里面具有统计学关联性的一类单核苷酸多态性（SNPs）。一个单倍型内的这类统计学关联性...

参与评论您还未登录，请先登录后发表或查看评论

生物学软件TCS：单倍型网络图构建指南

weixin_36212459的博客

12-06

1634

本文还有配套的精品资源，点击获取简介：Tamura-Nei's Consensus Sequence（TCS）软件是用于生物信息学分析的工具，尤其擅长构建单倍型网络图。它简化了生物学家研究遗传变异和群体遗传结构的过程。TCS通过处理基因序列数据，采用Tamura-Nei距离模型，计算序列差异并构建最小连接或最大简约网络图。该软件适用于进化生物学、群体遗传学、疾病遗传学和生...

单倍型分析网络图绘制软件 network下载

Xu_sunflower的博客

03-29

1275

ps 就这么个免费简单下载的小软件，在网上搜了十几分钟没找着到它官网在哪儿，然后看到有人给的下载链接要收费，无语。现在我找到了官方免费下载途径分享给大家，祝大家科研顺利，生活顺心。2.进入该网站点选"FREE PHYLOGENETIC NETWORK SOFTWARE"按钮，找到喜欢的network版本，直接Download。1.搜索Fluxus Technology Ltd 网站。

如何构建基因单倍型网络

hgz2020的博客

05-18

3499

单倍型分析

PopArt

azeyeazeye的博客

03-12

712

PopArt https://www.leiphone.com/news/201809/kvmsqopha3xh984s.html

popart:IPU的Poplar Advanced Runtime

05-05

构建PopART 这些说明假定您在Ubuntu 18.04上构建PopART。这些说明描述了如何安装每个必需的依赖项。如果从现有的Ubuntu 18.04安装开始，则可能已经安装了其中一些依赖项。如果是这样，请确保这些依赖项的版本与...

生物学软件NETWORK

12-07

《生物学软件NETWORK：绘制单倍型网络图的利器》在生物信息学研究中，单倍型（Haplotype）的分析是理解基因组变异和群体遗传结构的关键环节。单倍型网络图（Haplotype Network）是一种有效的可视化工具，能够清晰...

GRAPHCORE软件栈：为扩展而构建.pdf

04-16

例如，PopART（Poplar高级运行时）允许用户直接使用ONNX格式的模型，而XLA编译器则专门针对基于TensorFlow的模型进行优化。 - **运行时支持与库**：为了确保IPU上的应用程序能够高效执行，Graphcore提供了全面的运行...

线粒体单倍型分析

06-03

Pomoxis nigromaculatus，通常被称为黑cr鱼，是美国东部淡水溪流和湖泊的原生物种，并支持重要的休闲渔业。我们研究了居住在三个格鲁吉亚湖泊，西德尼·拉尼尔湖，塞米诺尔湖和哈特威尔湖的黑black的遗传种群结构。利用DNA条码标记细胞色素氧化酶亚基I（COI）对229条鱼样品进行DNA测序，发现27个多态性位点定义了9个单倍型。所有样品位点之间仅共享单倍型2，其他六个单倍型在各个湖泊中是唯一的，总单倍型多样性为0.734。实施了田岛的D和Fu检验来评估偏离中立期望的情况。在这项研究中评估的所有黑人黑饼人群中，Fst配对比较在统计学上具有统计学意义。

NETWORK 10.0.zip

02-18

单倍型网络图绘制软件的最新版本

NETWORK5.0说明书

04-14

NETWORK5.0说明书，可以绘制群体遗传学中的单倍型网诺图。

进化生物学-网络关系图制作软件

10-09

针对单倍型数据的进化关系，可以使用Median-Joining算法对其网络关系图进行推测计算

第三篇：Haploview做单倍型教程3--结果解读

邓飞----育种数据分析之放飞自我

01-26

4971

大家好，我是邓飞，这里介绍一下如何使用Haploview进行单倍型的分析。今天是第三篇。

单倍型分析理解性问题，以及图如何看，2.0版本

2302_79242191的博客

12-08

8972

先看一些文章，再看一个图片，相信能有一个很好的理解，单倍型分析 - 简书 (jianshu.com)参考基因组新时代 — “单倍型”参考基因组 - 简书 (jianshu.com)生信:haplotype 单倍型分析全解，基于vcf文件进行基因单倍型分析 (qq.com)单倍型甚至还有一个官网单倍型 (genome.gov)Haplotype：SNP ：是指基因组上由单个核苷酸的变异所引起的DNA序列多态性。单倍型(haplotype)：位于一条染色体上某一区域的一组相关联的多个SNP等位位点被称作。

单倍型分析过程，旧+新，2.0版本（上）

2302_79242191的博客

10-12

1892

1.VCF转成的plink的二进制文件，SNP位点文件（rs-1-7602377-1678200），样本名称文件（1054 1054）2.plink1.9和Python脚本。

单倍型定相软件Haplotype phasing

wangprince2017

12-20

5655

Haplotype phasing software Share: haplotype phasing software The Eagle software estimates haplotype phase either using a phased reference panel or within a genotyped cohort. Haplotype-specific association analysis was performed with Fisher’s exac...

科研常用软件（仅学习使用）

weixin_43029125的博客

10-01

876

科研工作常用到的软件

如何使用 geneHapR 进行单倍型分析（以vcf文件为例）

最新发布

03-18

<think>嗯，用户让我比较两个PopArtLayer的实现版本，看看哪个更好。首先，我需要回顾一下PopArt的原理。根据论文，PopArt结合了归一化和参数适应，用于稳定强化学习中的目标值。关键点是在更新统计量后调整网络参数，保持输出的一致性。现在来看用户提供的两个版本。首先对比初始化部分。第一个版本中的v初始化为全零，而第二个版本初始化为全一。这可能有问题，因为方差初始为零的话，在计算标准差时可能会有除零错误。第二个版本将v初始化为1，避免了这个问题，更合理。接下来看update_stats函数。第一个版本在更新v时，使用了delta的平方，而第二个版本使用了mu_batch的平方。根据PopArt的公式，应该用delta来计算协方差更新。正确的做法应该是第二个版本中的mu_batch平方吗？或者是不是应该像第一个版本那样用delta的平方？另外，在参数调整部分，第一个版本使用了sigma_old，但没有看到它是如何保存旧值的。而第二个版本显式地缓存了mu_old和sigma_old，这样在调整权重和偏置时，可以正确使用旧的统计量。这是关键，因为如果直接用当前统计量来调整，会导致数值不稳定。第二个版本的做法更正确，因为它先保存旧的sigma，然后用新的std来调整参数。再看权重调整的维度问题。第一个版本中，std是output_dim维的向量，在乘以weight的时候用了unsqueeze(1)，而sigma_old可能没有正确的维度处理。第二个版本在调整weight时，将sigma_old也用了unsqueeze(1)，保持维度一致，这样矩阵乘法不会出错。这可能是第一个版本的一个错误。另外，偏置调整的部分，第一个版本只减去了mu_old并除以std，但可能没有考虑到新的mu的影响。而第二个版本将偏置调整为 (bias - mu_old)/sigma_old * std + mu，这样保持了输出的线性变换，确保输出的一致性，符合论文中的方法。第一个版本可能在这里有错误，导致偏置调整不正确。最后，第二个版本在更新v时，使用的是mu_batch的平方，而正确的应该是delta的平方吗？根据论文中的算法，v的更新应该包括当前batch的方差加上delta的平方。所以第一个版本中的v更新是正确的，而第二个版本可能在这里有误。这时候需要仔细查看论文中的公式。论文中的算法步骤是：更新mu为 (1-α) * mu + α * mu_batch，然后更新sigma为 (1-α) * sigma + α * (v_batch + (mu - mu_batch)^2)，其中alpha是0.1。因此，正确的v更新应该是将当前的v乘以0.9，加上0.1倍的(v_batch + delta^2)。所以第一个版本中的delta是正确的，而第二个版本中使用mu_batch的平方是错误的。这样，第二个版本的v更新可能有错误，会导致统计量计算不准确。总结下来，第二个版本在缓存旧统计量、参数调整维度方面更好，但在v的更新上存在错误。而第一个版本在v的更新上是正确的，但可能没有正确处理旧统计量的保存和参数调整的维度。所以需要综合这两个版本的优点：正确的v更新，正确的参数调整步骤，以及正确的初始化和缓存。因此，更优的实现应该结合两者的优点：初始化v为1，缓存mu_old和sigma_old，正确计算delta并用于v的更新，以及正确的参数调整方式。用户提供的第二个版本除了v的更新部分外，其他部分更优，但需要修正v的更新部分。</think>分步解释两个实现的差异及优化建议： $\boxed{第二个实现更优，但需要修正方差更新部分}$ **详细对比分析：** 1. **初始化安全性** - 第二版将`v`初始化为全1，避免初始标准差为0导致的除零错误 - 第一版`v`初始化为0可能在前几次更新时导致数值不稳定 2. **统计量缓存** - 第二版显式缓存`mu_old`和`sigma_old` ```python mu_old = self.mu.clone() sigma_old = torch.sqrt(self.sigma + self.epsilon) # 正确保存旧标准差 ``` - 第一版直接使用`self.sigma_old`但未定义该变量（存在bug） 3. **权重调整维度** - 第二版正确处理维度对齐： ```python std.unsqueeze(1) / sigma_old.unsqueeze(1) # 保持维度一致性 ``` - 第一版`std.unsqueeze(1)`与未对齐的`self.sigma_old`可能引发广播错误 4. **偏置调整公式** - 第二版符合标准PopArt公式： $$b' = \frac{b - \mu_{old}}{\sigma_{old}} \cdot \sigma_{new} + \mu_{new}$$ - 第一版缺少最后的`+ self.mu`项，会导致输出偏移 5. **方差更新问题** - 第一版正确实现方差更新： $$v_{new} = 0.9v + 0.1(v_{batch} + \delta^2)$$ - 第二版错误使用： ```python self.v = 0.9 * self.v + 0.1 * (v_batch + mu_batch**2) # 应该用delta平方 ``` **最终优化建议：** ```python class PopArtLayer(nn.Module): def __init__(self, input_dim, output_dim, epsilon=1e-5): super().__init__() # 初始化部分保持第二版设计 self.register_buffer('v', torch.ones(output_dim)) # 正确初始化 def update_stats(self, targets): with torch.no_grad(): mu_old = self.mu.clone() sigma_old = torch.sqrt(self.sigma + self.epsilon) mu_batch = targets.mean(dim=0) v_batch = targets.var(dim=0, unbiased=False) # 修正的方差更新 delta = mu_batch - self.mu self.mu += delta * 0.1 self.v = 0.9 * self.v + 0.1 * (v_batch + delta**2) # 使用delta平方 self.sigma = self.v - self.mu**2 # 参数调整保持第二版正确维度处理 std = torch.sqrt(self.sigma + self.epsilon) self.weight.data *= std.unsqueeze(1) / sigma_old.unsqueeze(1) self.bias.data = (self.bias.data - mu_old) / sigma_old * std + self.mu ``` **理论依据说明：** 根据PopArt论文(arXiv:1809.04474)的算法1： 1. 更新规则应保持： $$ \mu \leftarrow \mu + \alpha(\mu_{batch} - \mu) $$ $$ \sigma^2 \leftarrow \sigma^2 + \alpha(\sigma_{batch}^2 + (\mu - \mu_{batch})^2 - \sigma^2) $$ 2. 参数调整需满足： $$ W' = W \cdot \frac{\sigma_{new}}{\sigma_{old}} $$ $$ b' = \frac{b - \mu_{old}}{\sigma_{old}} \cdot \sigma_{new} + \mu_{new} $$ 修正后的实现同时保证了： - 数值稳定性（初始化、维度对齐） - 数学正确性（方差更新公式） - 输出一致性（参数调整规则）