PCA主成分分析之R语言

最新推荐文章于 2024-06-23 23:31:48 发布

生信学习小达人

最新推荐文章于 2024-06-23 23:31:48 发布

阅读量889

点赞数 17

CC 4.0 BY-SA版权

分类专栏： R 文章标签： r语言开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hgz2020/article/details/138970847

本文介绍了如何在R语言中进行PCA主成分分析，包括使用Plink和GCTA软件进行PCA计算，以及PCA的应用，如数据初始化、结果可视化（碎石图、样品聚类、变量贡献展示等）。内容涵盖了PCA的理论与实践操作，适用于生物信息学领域的SNP数据分析。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

简介

主成分分析(PCA)是一种线性降维方法，通过线性变换简化数据集，提取关键信息对数据进行区分。群体重测序项目往往能得到百万乃至千万级别的SNP，基于SNP进行PCA的软件有很多，主流是下面三种：

Plink: PLINK 1.9
GCTA: GCTA | Yang Lab
EIGENSOFT: https://github.com/DReichLab/EIG

前面两个软件使用起来相对简单一些，EIGENSOFT运行需要一些配置，相对麻烦一点。

数据准备

我这里使用我以前一篇文章提到的数据rename.id.maf0.05.geno0.1.vcf，已经进行了过滤。

PCA

这里使用plink以及GCTA进行分析，分析之前都需要数据处理一下：

将vcf数据转换为

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。