自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

专注生信领域

多组学数据分析、数理统计、机器学习、SCI科研绘图

  • 博客(689)
  • 收藏
  • 关注

原创 数据分析:转录组差异分析方法总结(DESeq2+limma+edgeR+t-test/wilcox-test)

本文详细探讨了转录组数据分析中常用的差异分析R包(如DESeq2、limma和edgeR)及其与t-test/wilcox-rank-sum test的结合使用。文章首先介绍了如何下载和导入测试数据,并批量安装所需的R包。接着,讨论了基因表达count矩阵的标准化方法(如FPKM、TPM等),以及如何通过PCA、tSNE、UMAP和热图等方法进行基因整体水平分布的可视化。随后,文章分别展示了DESeq2、limma和edgeR的差异分析实现及结果解析,并探讨了结合t-test或wilcox-rank-sum

2023-07-17 11:01:18 23211 2

原创 【科研绘图系列】R语言绘制论文组图(multiple plots)

这段代码是用于分析和可视化博茨瓦纳婴儿微生物组研究(Botswana Infant Microbiome Study)中呼吸道病毒和细菌定植数据的R脚本。代码的主要目的是生成论文中的Figure 3,包括五个子图(a、b、c、d、e),并保存相关的数据和图表。

2025-06-09 00:30:00 107

原创 【科研绘图系列】R语言绘制论文组图(multiple plots)

这段R代码是一个完整的分析和可视化流程,用于处理博茨瓦纳婴儿微生物组研究中的呼吸道病毒和细菌定植数据。代码的主要功能包括数据加载、预处理、图表生成和保存。通过精心设计的颜色方案和布局,生成的图表清晰地展示了不同病原体之间的关系和定植密度。最终的Figure 2由三个子图组成,分别展示了呼吸道病毒感染对细菌定植的影响、肺炎链球菌的定植密度以及四种细菌病原体的共定植情况。

2025-06-09 00:15:00 15

原创 【科研绘图系列】R语言绘制论文组图(multiple plots)

这段R代码是一个完整的分析和可视化流程,用于处理博茨瓦纳婴儿微生物组研究中的呼吸道病毒和细菌数据。代码的主要功能包括数据加载、预处理、图表生成和保存。通过精心设计的颜色方案和布局,生成的图表清晰地展示了不同检测方法的样本数量、呼吸道病毒的检测比例以及细菌病原体的定植率。最终的Figure 1由三个子图组成,分别展示了样本数量、病毒检测比例和细菌定植率,为研究提供了直观的数据支持。此外,代码还保存了相关的数据文件,便于后续的分析和验证。

2025-06-07 12:25:18 196

原创 【数据分析】探索婴儿年龄变化对微生物群落(呼吸道病毒和细菌病原体)结构的影响

本教程基于博茨瓦纳婴儿微生物组研究项目,详细介绍了如何使用 R 语言进行呼吸道病毒与细菌病原体的分析。该研究旨在探索婴儿鼻咽部微生物群落结构随年龄的变化、呼吸道病毒感染对微生物群落的影响,以及微生物特征对病原体定植的预测能力。通过一系列复杂的数据处理、统计建模和机器学习方法,本教程将逐步展示如何从原始数据中提取有价值的信息,揭示微生物组与呼吸道健康之间的潜在联系。教程内容涵盖了数据预处理、混合效应逻辑回归模型、随机森林模型以及 Maaslin2 分析等多个方面,旨在为微生物组研究者提供一个完整的分析流程示例

2025-06-07 11:08:05 227

原创 【数据分析】R版IntelliGenes用于生物标志物发现的可解释机器学习

IntelliGenesR:基于多组学数据的可解释疾病预测工具 IntelliGenesR是IntelliGenes流程的R实现,通过整合转录组与临床数据,进行疾病预测和生物标志物发现。其核心流程包括: 特征选择:使用Pearson、卡方、ANOVA和递归特征消除(RFE)筛选差异基因。 模型训练:支持随机森林、SVM等7种分类器,输出性能指标(如ROC曲线、F1分数)。 I-Genes评分:结合SHAP值和HHI指数量化基因重要性,提供可解释的生物标志物排名。

2025-06-06 14:17:18 1015

原创 【数据分析】基于adonis2与pairwise.adonis2的群组差异分析教程

本教程介绍基于距离矩阵的群落多样性分析方法,重点应用adonis2和pairwise.adonis2进行群组差异检验。通过导入距离矩阵和元数据,预处理后执行全局(adonis2)和成对(pairwise.adonis2)PERMANOVA分析,评估群组间差异显著性。adonis2提供整体群组效应,而pairwise.adonis2进一步识别具体差异群组对,并支持p值校正(如FDR)。分析结果以表格输出(Adonis-ALL.xls和Adonis-Pairwise.xls),适用于生态学、微生物组等

2025-06-05 09:02:23 363

原创 【科研绘图系列】R语言绘制和弦图(Chord diagram plot)

本文基于R语言构建了代谢物与环境元素相关性分析及和弦图可视化流程。通过psych和circlize等包,计算Spearman相关性(FDR校正p值),筛选显著关系(Padj<0.05)并提取前50个高相关组合。数据预处理包括去除零值行和转置矩阵。和弦图使用自定义颜色方案(代谢物:#65bd71,环境元素:#1d7811),按相关系数方向(正/负)染色链接,并优化布局与注释。最终输出PDF格式可视化结果,清晰展示跨数据集复杂关联。代码与示例数据已公开,适用于生物、生态等领域的关系网络分析。

2025-06-05 08:48:39 232

原创 【科研绘图系列】R语言绘制论文组合图(muitple plots)

这篇文章提供了一套完整的跨平台和跨仪器的蛋白质组学数据比较分析流程,涵盖了数据预处理、特征选择、模型训练和结果可视化。通过具体的代码示例和图形展示,读者可以清晰地了解如何使用R语言进行这些分析。文章中的图形设计精美,通过自定义颜色、主题和标签,使图形更加直观和易于理解。此外,文章还提供了数据下载链接和提取码,方便读者获取数据并复现结果。总体而言,这篇文章不仅展示了R语言在数据分析中的强大功能,还为科研人员提供了一个实用的分析模板。

2025-06-03 00:30:00 49

原创 【科研绘图系列】R语言绘制论文组合图形(mulitple plots)

这篇文章提供了一套完整的跨平台和跨仪器的蛋白质组学数据比较分析流程,涵盖了数据预处理、特征选择、模型训练和结果可视化。通过具体的代码示例和图形展示,读者可以清晰地了解如何使用R语言进行这些分析。文章中的图形设计精美,通过自定义颜色、主题和标签,使图形更加直观和易于理解。此外,文章还提供了数据下载链接和提取码,方便读者获取数据并复现结果。

2025-06-03 00:30:00 31

原创 【科研绘图系列】R语言绘制论文比较图(comparison plot)

这篇文章提供了一套完整的数据分析和可视化流程,涵盖了数据预处理、特征选择、模型训练和结果可视化。通过具体的代码示例和图形展示,读者可以清晰地了解如何使用R语言进行这些分析。文章中的图形设计精美,通过自定义颜色、主题和标签,使图形更加直观和易于理解。此外,文章还提供了数据下载链接和提取码,方便读者获取数据并复现结果。总体而言,这篇文章不仅展示了R语言在数据分析中的强大功能,还为科研人员提供了一个实用的分析模板。

2025-06-02 00:45:00 162

原创 【科研绘图系列】R语言绘制四个论文组合图形(multiple plots)

这篇文章提供了一套完整的数据分析和可视化流程,涵盖了工作流性能分类、特征重要性分析、线性模型交互效应检查以及频繁模式挖掘。通过具体的代码示例和图形展示,读者可以清晰地了解如何使用R语言进行这些分析。文章中的图形设计精美,通过自定义颜色、主题和标签,使图形更加直观和易于理解。此外,文章还提供了数据下载链接和提取码,方便读者获取数据并复现结果。总体而言,这篇文章不仅展示了R语言在数据分析中的强大功能,还为科研人员提供了一个实用的分析模板。

2025-06-02 00:15:00 243

原创 【科研绘图系列】R语言绘制论文组合图形(multiple plots)

这篇文章提供了一套完整的R语言科研绘图流程,从数据的导入、预处理到图形的绘制,每一步都详细说明了所使用的代码和方法。通过具体的代码示例和图形展示,读者可以清晰地了解如何使用R语言进行数据可视化。文章中的图形设计精美,通过自定义颜色、主题和标签,使图形更加直观和易于理解。此外,文章还提供了数据下载链接和提取码,方便读者获取数据并复现结果。总体而言,这篇文章不仅展示了R语言在科研绘图中的强大功能,还为科研人员提供了一个实用的绘图模板。

2025-06-01 11:13:58 290

原创 代谢组数据分析(二十六):LC-MS/MS代谢组学和脂质组学数据的分析流程

本教程概述了LC-MS/MS在代谢组学和脂质组学数据分析中的应用流程。首先介绍了样本的采集、提取和LC-MS/MS分析,随后详细阐述了质谱数据的预处理、峰值识别、特征注释,以及数据标准化和统计分析的重要性。特别强调了使用XCMS和CAMERA进行数据对齐和加合物识别,以及利用MultiABLER和LipidFinder进行数据过滤、插补和标准化处理。此外,还介绍了如何应用EigenMS算法进行数据标准化,以及如何使用Limma包进行差异分析。整个流程旨在提高数据质量,确保分析结果的准确性和可靠性,为后续的生

2025-06-01 10:47:59 388

原创 【数据分析】基于Cox模型的R语言实现生存分析与生物标志物风险评估

本研究采用R语言分析生存数据与多种生物标志物的关联性。通过Cox比例风险模型评估了SSC4D、UPB1等生物标志物对心力衰竭、糖尿病等疾病风险的影响。研究流程包括:数据预处理(变量重编码、缺失值处理、年龄离散化)、生存分析(含限制性立方样条和协变量调整)、结果可视化(密度曲线和风险比曲线绘制)。分析中控制了年龄、性别、种族等混杂因素,并使用ANOVA检验生物标志物的显著性。最终结果以PDF图像形式保存,包含关键统计指标和可视化图表。该研究方法为探索生物标志物与疾病风险的关联提供了标准化分析框架。

2025-05-31 11:01:44 470

原创 【科研绘图系列】R语言绘制词云图(wordcloud plot)

本文介绍使用R语言绘制词云图的方法。首先通过devtools从GitHub安装wordcloud2包,加载tidyverse、openxlsx等必要库。教程提供了示例数据下载链接,并演示如何导入Excel数据。核心代码通过循环处理不同分类数据,计算词频后按分位数区间着色,最终用wordcloud2生成五边形词云图并保存为HTML文件。

2025-05-31 01:00:00 47

原创 【科研绘图系列】R语言绘制雷达图(Radar plot)

这篇文章介绍了使用R语言绘制雷达图(Radar plot)的方法。主要内容包括加载tidyverse和ggthemes包,从百度网盘下载数据,导入数据后通过数据预处理(归一化、因子转换等)准备绘图。图中展示了不同食物喜好组(如broccoli_like、pizza_like等)在17类食品消费中的标准化对比,采用了多色系区分组别,并使用coord_radar()实现雷达图坐标。

2025-05-30 01:00:00 153

原创 【科研绘图系列】R语言绘制GO term 富集分析图(enrichment barplot)

本文介绍了使用R语言绘制GO富集分析条形图的方法。通过加载ggplot2等R包,对GO term数据进行预处理,包括p值转换、文本截断和排序筛选。文章提供了两个代码示例,分别针对不同数据集(dataC.xlsx和dataD.xlsx)进行分析,均采用分组(BP/CC/MF)展示前10个显著GO term。通过自定义绘图函数调整柱状图高度、坐标轴刻度和颜色方案,并使用patchwork包将三个子图合并为整体可视化结果。最终生成的图像清晰展示了不同GO类别中富集项的显著性水平

2025-05-30 00:15:00 329

原创 【科研绘图系列】R语言绘制森林图(forest plot)

本文介绍使用R语言绘制森林图(forest plot)的方法。首先加载必要的R包(grid、forestploter、openxlsx、stringr),导入并预处理数据,包括提取置信区间上下限、计算标准误、格式化显示文本等。然后通过自定义主题(tm)设置图形样式,使用forest()函数绘制森林图,可调整估计值、置信区间、参考线等参数。

2025-05-29 19:41:59 385

原创 代谢组数据分析(二十五):代谢组与蛋白质组数据分析的异同

蛋白质组学和代谢组学是系统生物学的重要分支,分别研究生物体内蛋白质和小分子代谢物的组成与功能。蛋白质组(动态性强、复杂度高)反映基因表达的功能执行者,而代谢组(动态性强、受环境影响大)更接近生理表型终点。蛋白质组分析主要通过质谱技术(如LC-MS/MS)进行鉴定(数据库比对)和定量(标记/无标记法),应用于疾病机制、生物标志物发现等。代谢组分析则依赖色谱-质谱联用技术(LC-MS/GC-MS)或核磁共振(NMR),用于代谢物鉴定(数据库比对)和定量(相对/绝对定量),在疾病诊断

2025-05-29 09:41:05 363

原创 【科研绘图系列】R语言绘制气泡图(bubble plot)

本文介绍使用R语言绘制气泡图的方法,包含数据预处理、可视化代码和输出设置。通过加载ggplot2等R包,对两个数据集进行因子化预处理后,分别绘制正负相关气泡图:红色表示正相关,蓝色表示负相关,气泡大小反映效应值。采用分面(facet)按食物类别展示数据,并自定义颜色映射和主题样式。最终通过patchwork包垂直拼接两图,输出PDF格式结果。教程附带百度网盘数据下载链接(提取码h7yt),适用于macOS系统下的R 4.4.3环境。

2025-05-27 00:15:00 375

原创 【科研绘图系列】R语言绘制柱状图(bar plot)

本文介绍了使用R语言绘制柱状图的方法。首先加载了ggplot2、Cairo和ggpubr等绘图包,然后导入包含不同食物组与疾病关联数据的数据框。通过数据预处理设置了柱状图颜色方案,并使用自定义函数bar_error绘制带有误差线的柱状图,该图展示了不同食物组与心血管疾病(CVD)、高脂饮食(HF)和2型糖尿病(T2D)的关联程度。文章详细说明了绘图参数设置,包括误差线处理方式、坐标轴调整和图形保存选项。最终输出一张清晰展示数据分布特征的柱状图,并提供了完整的R系统环境信息。

2025-05-26 19:36:53 249

原创 单细胞数据分析(五):三种整合单细胞数据(Harmony、fastMNN、SCTransform)的完整流程

单细胞数据整合方法比较:Harmony、fastMNN与SCTransform的性能评估 本文以23万细胞乳腺癌数据集为例,系统比较了三种单细胞数据整合方法。预处理阶段发现原始数据存在细胞数量差异(236169 vs 236363),需进一步验证。质量评估显示多数样本的基因数、转录本数和线粒体基因比例合理,但存在批次差异。内存需求分析表明:Harmony最节省资源(推荐64GB),fastMNN中等(64-128GB),SCTransform最耗内存(128GB+)。研究采用降采样策略(每个数据集500细胞

2025-05-26 11:23:30 733

原创 【文献分享】human_kidney_multiomics提供了数据和代码

本研究通过整合snRNA-seq、ATAC-seq和高通量单细胞分子成像技术,构建了人类肾脏疾病的空间多组学图谱。研究发现,在损伤肾脏中,HAVCR1+VCAM1+近端肾小管细胞获得促炎表型,上调趋化因子、促纤维化因子及黏附分子基因。这些炎症细胞特异性定位于纤维化微环境,并通过旁分泌信号介导白细胞募集和肌成纤维细胞活化。表观遗传分析显示HNF4α缺失及NF-κβ/AP-1激活驱动该炎症表型。动物实验证实,靶向抑制AP-1或清除衰老细胞可改善肾脏炎症和纤维化,提示这些炎症性肾小管细胞是慢性肾病治疗的潜在靶点。

2025-05-25 15:49:26 958

原创 【文献分享】A comprehensive single-cell breast提供了代码和数据

【文献分享】A comprehensive single-cell breast提供了代码和数据

2025-05-23 08:40:25 756

原创 【文献分享】A single-cell and spatially resolved atlas of human breast cancers提供数据和代码

【文献分享】A single-cell and spatially resolved atlas of human breast cancers提供数据和代码

2025-05-23 08:37:48 976

原创 【工具】grcMalaria用于处理和分析“斑点疟疾基因报告卡”的R软件包

【工具】grcMalaria用于处理和分析“斑点疟疾基因报告卡”的R软件包

2025-05-21 08:24:24 625

原创 【工具】metaTP:一种集成了自动化工作流程的元转录组数据分析工具包

【工具】metaTP:一种集成了自动化工作流程的元转录组数据分析工具包

2025-05-15 15:00:11 812

原创 【工具】PathNetDRP一种基于通路和蛋白质-蛋白质相互作用的新型生物标志物发现框架

【工具】PathNetDRP一种基于通路和蛋白质-蛋白质相互作用的新型生物标志物发现框架

2025-05-15 14:50:40 693

原创 【数据分析】从TCGA下载所有癌症的多组学数据

本文介绍了一个基于R语言的自动化脚本,用于从TCGA(The Cancer Genome Atlas)数据库下载多组学数据。该脚本利用TCGAbiolinks包,支持下载7种组学数据类型,包括转录组、DNA甲基化、拷贝数变异、miRNA表达、蛋白质表达、临床数据和体细胞突变。数据按癌症类型和组学类型分类存储,便于后续分析。脚本还包含错误处理机制,确保部分下载失败不会影响整体流程,并提供了并行化选项以加快下载速度。该脚本适用于生物信息学研究人员和癌症基因组学分析团队,能够显著减少数据收集和整理的负担,使研究人

2025-05-14 11:31:34 262

原创 R语言机器学习算法实战系列(二十五)随机森林算法多标签分组分类器及模型可解释性

本教程详细介绍了如何使用R语言构建和解释随机森林多分类模型。流程包括数据预处理、模型训练、超参数调优、性能评估及可解释性分析。通过tidymodels框架,教程展示了如何标准化数据、使用交叉验证优化参数(如mtry和min_n),并评估模型性能(如准确率、召回率、F1分数)。此外,教程还利用DALEX框架进行模型解释,包括全局解释(如变量重要性、部分依赖图)和本地解释(如SHAP值、预测分解)。最后,教程提供了可视化工具(如混淆矩阵、ROC曲线)和结果汇总,帮助用户深入理解模型表现。该流程适用于多种多分类场

2025-05-14 10:22:04 380

原创 【工具】MNMO从基于多组学数据的多层网络中发现驱动基因

【工具】MNMO从基于多组学数据的多层网络中发现驱动基因

2025-05-05 13:10:35 701

原创 【工具】adverSCarial评估单细胞 RNA 测序分类器抵御对抗性攻击的脆弱性

【工具】adverSCarial评估单细胞 RNA 测序分类器抵御对抗性攻击的脆弱性

2025-05-05 13:06:23 893

原创 【文献分享】Adaptive mechanisms提供了代码和数据

【文献分享】Adaptive mechanisms提供了代码和数据

2025-05-05 10:04:17 773

原创 【文献分享】The dynamics of leadership提供了代码和数据

【文献分享】The dynamics of leadership提供了代码和数据

2025-05-04 09:13:00 821

原创 【工具】LIVE多组学数据与临床变量进行可解释的整合以预测疾病结果

【工具】LIVE多组学数据与临床变量进行可解释的整合以预测疾病结果

2025-05-04 02:15:00 911

原创 【文献分享】Network-based提供了数据和代码

【文献分享】Network-based提供了数据和代码

2025-05-03 10:28:05 917

原创 【科研绘图系列】R语言绘制世界地图(map plot)

【科研绘图系列】R语言绘制世界地图(map plot)

2025-05-03 10:20:22 454 1

原创 【文献分享】Modelling the species-area提供数据和代码

【文献分享】Modelling the species-area提供数据和代码

2025-04-30 18:19:08 1295

原创 【工具】Gencube从主要数据库集中检索和整合多组学资源

【工具】Gencube从主要数据库集中检索和整合多组学资源

2025-04-30 08:26:30 659

### 【生物信息学】基于R语言的STAMP图绘制:宏基因组数据分析与可视化

内容概要:本文介绍了如何使用R语言绘制STAMP图(STAMP Plot),这是一种用于宏基因组数据分析的统计图表。STAMP图能够展示不同组别间的效应大小、置信区间及统计显著性。文中详细描述了数据准备、T检验结果生成、画图数据准备以及最终图表的绘制过程。具体步骤包括加载必要的R包、导入和预处理数据、进行T检验以生成p值,并使用ggplot2库绘制STAMP图的三个主要部分:左侧的组间均值条形图、中间的组间差异检验结果图(T检验结果)和右侧的T检验p值图。最后,通过patchwork包将这三个图形拼接成一个完整的STAMP图。 适合人群:具备一定R语言编程基础,对生物信息学和宏基因组数据分析感兴趣的科研工作者。 使用场景及目标:①理解宏基因组数据分析中STAMP图的作用及其组成部分;②掌握如何用R语言实现STAMP图的绘制,包括数据预处理、统计分析和可视化。 其他说明:此文档仅限于个人自学使用,禁止商业或二次转载。文中使用的示例数据来自著名的鸢尾花数据集(iris),并且提供了详细的代码解释,帮助读者更好地理解和实践。此外,文档还提及了如何调整图表的主题和样式,以确保最终输出与STAMP软件的结果一致。

2025-04-20

### 数据科学R语言基础图形合集:科研绘图指南与实现

内容概要:本文档是关于R语言的基础图形合集,详细介绍了多种常见图形的绘制方法及其应用场景。文档首先强调了图形可视化在数据分析中的重要性,指出R语言作为统计学家为解决统计问题而开发的语言,在数据可视化方面具有显著优势。随后,文档依次讲解了散点图、直方图、箱线图、面积图、热图、相关图、折线图、韦恩图、火山图、饼图、密度曲线图、边界散点图、边缘箱图/直方图、拟合散点图、相关系数图、水平发散型文本、水平棒棒糖图、去棒棒糖图、时间序列图、堆叠面积图、分层树形图、聚类图、气泡图、小提琴图、核密度图、柱状图、连接散点图、二维密度图、条形图、雷达图、词云、平行坐标图、棒棒糖图、循环条形图、分组堆积图、矩形树图、圆圈图、系统树图、圆形图、分组线条图、面积图、面积堆积图、Streamgraph等多种图形的绘制方式,并提供了相应的代码示例。 适用人群:适用于具有一定编程基础的数据分析师、科研人员以及对R语言感兴趣的自学者。 使用场景及目标:①帮助读者理解不同类型图形的特点及适用场景;②通过实际案例和代码示例,指导读者如何利用R语言进行数据可视化;③提升读者的数据分析能力,使其能够根据具体问题选择合适的可视化工具和技术。 其他说明:本文档仅用于自学,禁止任何形式的商业或二次转载,如需引用部分内容,请联系作者获取授权。文档内容丰富详实,不仅涵盖了图形绘制的基本语法,还深入探讨了图形设计的原则和技巧,旨在帮助读者掌握R语言图形可视化的精髓。

2025-04-20

科研绘图R语言ggpubr包在数据可视化中的应用:多种图表类型与统计分析整合

内容概要:本文档介绍了R语言中的ggpubr包,该包作为ggplot2的一个扩展工具,旨在简化科研绘图过程并提供更直观的绘图方式。文档详细讲解了ggpubr包的安装方法、数据准备以及多种类型的图表绘制,包括密度图、柱状图、箱线图、小提琴图、点图、有序条形图、偏差图、棒棒糖图、散点图、气泡图、连线图和二维密度图等。特别强调了stat_compare_means函数的应用,它可以进行假设检验并将结果直接展示在图形上,极大地方便了科研人员和数据分析师的工作。 适合人群:具备一定R语言基础并希望提高科研绘图能力的研究人员、数据分析师和学生。 使用场景及目标:①学习如何利用ggpubr包快速高效地创建高质量的科研图表;②掌握不同类型图表的绘制方法及其应用场景;③理解如何通过图形直观展示数据差异及统计检验结果,提升数据分析和报告的质量。 其他说明:文档禁止商业或二次转载,仅供自学使用。在学习过程中,建议读者跟随示例代码进行实践操作,同时结合实际研究需求调整参数,以达到最佳的绘图效果。此外,文档提供了多种图表组合的方式,如边沿图、混合图表等高级技巧,帮助用户创建更加复杂和美观的可视化作品。

2025-04-20

科研绘图基于ggplot2的箱线图绘制:带有出现率百分比的多组别数据分布比较及可视化

内容概要:本文介绍了如何使用ggplot2包绘制带有出现率百分比的箱线图,并展示了三种不同风格的箱线图:普通ggplot2风格、prism风格以及网格状箱线图。首先,箱线图能提供数据的中位数、四分位数、异常值、最小值和最大值及偏斜性等信息,非常适合比较不同组别的数据分布。文章以鸢尾花数据集为例,详细讲解了绘制箱线图的具体步骤,包括加载R包、导入数据、处理数据并计算每个分组中Sepal.Length指标的出现率。接着,通过ggplot2的函数逐步构建箱线图,如geom_boxplot()、stat_boxplot()、geom_point()等,最后对图表进行美化,如调整坐标轴、添加文本标签、设置点大小比例尺等。此外,还介绍了如何使用ggprism包实现prism风格的箱线图,以及patternplot包创建网格状箱线图,以满足不同场景下的可视化需求。 适合人群:具备一定R语言基础,从事生物信息学或数据分析的研究人员。 使用场景及目标:①科研工作者需要展示不同组别数据分布特征时;②希望将R绘图与Prism软件中的数据可视化风格统一;③需要创建网格状箱线图来直观比较多个组别或条件下的数据分布。 阅读建议:由于涉及到较多R代码细节,在阅读过程中应结合实际操作练习,理解每个函数的作用及其参数配置,同时注意代码中的注释说明。

2025-04-20

科研绘图领域:tidyplots包替代ggplot2实现高效美观的论文图表制作

内容概要:本文介绍了R语言中的新工具——tidyplots,它是新一代的科研绘图包,旨在简化科研用图表的创建流程,提供了一套更加简洁直观且高效的语法。与传统的ggplot2相比,在生成用于科学研究和学术出版物级别的图形方面,tidyplots拥有更高的灵活性。文中不仅详细解释了如何安装此软件包(包括正式发布版本与开发者分支),而且列举了很多具体的实例来展示不同的绘图方法及其效果,如添加均值线段图、堆叠柱状图等各类高级操作,并探讨了几种常见的颜色搭配技巧。 适合人群:对于希望通过R编程快速生成高质量统计图的研究工作者来说是非常实用的内容,特别有助于那些从事自然科学领域研究并且需要频繁进行数据分析汇报的人群。 使用场景及目标:当研究人员想要利用R环境绘制精准、精美的数据分布特征图时,可以考虑采用这个强大而灵活的新款作图工具代替旧有选项。无论是在撰写期刊文章还是参与研讨会演示过程中,都能借助tidyplots构建符合行业标准的专业图表,提高成果展示的效果和说服力。 其他说明:推荐感兴趣的读者进一步访问官方提供的帮助文档,了解更多细节和技术内幕。此外还附上了几个关键链接以便于后续查阅资料以及

2025-03-25

科研绘图系列:R与Python在数据可视化中的应用及代码比较

内容概要:本文详细比较了R和Python在绘制散点图、箱线图、条形图和热图时的实现方式和代码细节。R因其强大的统计功能和丰富的图形库,在数据分析和可视化方面具有明显优势;而Python凭借其通用性和灵活的数据可视化库,同样适用于科学计算和数据可视化任务。通过具体实例展示了两种语言的各自特点,如R的ggplot2与Python的matplotlib/seaborn库的应用,并利用reticulate包实现了两者的协作,便于不同工具间的数据流动。 适合人群:对数据可视化感兴趣的科研人员、学生以及数据科学家;有一定编程基础并希望深入了解R和Python绘图能力的专业人士。 使用场景及目标:用于科学研究和技术报告中的图表制作;学习不同编程语言的数据可视化技术和最佳实践;探索如何结合R和Python的优势进行高效的数据展示。 其他说明:文中附有详细的代码片段及其解释,有助于读者理解和实践两种语言的具体用法;注意本文禁止商业二次修改,仅限个人自学使用,确保尊重作者权利的同时保障资料的质量与权威性。

2025-03-25

【科研绘图系列】R语言绘制SCI论文图合集

【科研绘图系列】R语言绘制SCI论文图合集 R语言绘制SCI论文,提供完整的数据和代码,方便大家学习

2025-02-19

在R语言中,安装R包是数据分析过程中不可或缺的一部分 当你需要执行特定的统计测试、可视化或其他任务时,你可能会发现相应的功能已经被封装在一个或多个R包中

在R语言中,安装R包是数据分析过程中不可或缺的一部分。当你需要执行特定的统计测试、可视化或其他任务时,你可能会发现相应的功能已经被封装在一个或多个R包中。然而,对于新手或需要一次性安装多个R包的用户来说,这个过程可能会有些繁琐。为了大规模安装所需要的R包,你可以使用几种不同的方法。

2025-01-23

数据分析:随机森林random forest在二分类中的应用

数据分析:随机森林random forest在二分类中的应用

2024-11-19

科研人员如何在国内高速下载测序数据SRA

科研人员如何在国内高速下载测序数据SRA

2024-11-19

科研绘图系列:R语言绘制气泡图(bubble plot)

科研绘图系列:R语言绘制气泡图(bubble plot)

2024-11-19

数据分析:广义估计方程和混合线性模型的R和python语言实现教程

数据分析:广义估计方程和混合线性模型的R和python语言实现教程

2024-11-19

数据分析:RT-qPCR分析详解及R语言绘图结果图

数据分析:RT-qPCR分析详解及R语言绘图结果图

2024-11-19

数据分析:R语言详解方差分析ANOVA的计算步骤

数据分析:R语言详解方差分析ANOVA的计算步骤

2024-11-19

科研绘图系列:R语言ggheatmapper热图实操教程

科研绘图系列:R语言ggheatmapper热图实操教程

2024-11-19

科研绘图系列:Python语言绘制SCI论文图表案例

科研绘图系列:Python语言绘制SCI论文图表案例

2024-11-19

文献分享:MongolianHCC文章提供了基因组分析的代码

文献分享:MongolianHCC文章提供了基因组分析的代码

2024-11-19

数据分析:转录组差异分析总结(DESeq2+limma+edgeR+t-test/wilcox-test

本文要点由以下几点构成: 1. 下载以及导入测试数据(批量安装R包); 2. 基因表达count矩阵的标准化方法(F(R)PKM/TPM); 3. 基因整体水平分布(PCA/tSNE/UMAP;heatmap); 4. *DESeq2*差异分析实现以及结果解析; 5. *limma*差异分析实现以及结果解析; 6. *edgeR*差异分析实现以及结果解析; 7. 结合*t-test*或*wilcox-rank-sum-test*方法的差异分析实现以及结果解析(是否符合正态分布选择检验方法); 8. 不同方法的结果比较(volcano plot+heatmap+venn); 9. 总结。

2024-11-19

数据分析:基因突变瀑布图统计以及可视化

数据分析:基因突变瀑布图统计以及可视化

2024-11-19

科研绘图系列:R语言雨云图展示更多数据分布信息

雨云图(Raincloud Plot)是一种结合了箱线图(Boxplot)、抖动图(Jitter Plot)和核密度估计(Kernel Density Estimation, KDE)或小提琴图(Violin Plot)的复合图形,用于多角度展示数据的分布特征,特别是组间数据的分布和差异。在R语言中,我们可以使用ggplot2包和gghalves包等来实现雨云图的绘制。

2024-11-18

科研绘图系列:箱线图加百分比点图展示组间差异

在展示组组间差异的时候,可以选择箱线图(boxplot),但同时也可以加上圆圈暂时指标在组间的出现率,从而在一张图上展示了多种信息。本文旨在通过R代码实现上述的可视化结果图。

2024-11-16

使用ggplot2桑基图画图

R语言的ggplot2画桑基图,包含数据和完整代码,方便大家学习

2024-04-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除