- 博客(689)
- 收藏
- 关注

原创 数据分析:转录组差异分析方法总结(DESeq2+limma+edgeR+t-test/wilcox-test)
本文详细探讨了转录组数据分析中常用的差异分析R包(如DESeq2、limma和edgeR)及其与t-test/wilcox-rank-sum test的结合使用。文章首先介绍了如何下载和导入测试数据,并批量安装所需的R包。接着,讨论了基因表达count矩阵的标准化方法(如FPKM、TPM等),以及如何通过PCA、tSNE、UMAP和热图等方法进行基因整体水平分布的可视化。随后,文章分别展示了DESeq2、limma和edgeR的差异分析实现及结果解析,并探讨了结合t-test或wilcox-rank-sum
2023-07-17 11:01:18
23211
2
原创 【科研绘图系列】R语言绘制论文组图(multiple plots)
这段代码是用于分析和可视化博茨瓦纳婴儿微生物组研究(Botswana Infant Microbiome Study)中呼吸道病毒和细菌定植数据的R脚本。代码的主要目的是生成论文中的Figure 3,包括五个子图(a、b、c、d、e),并保存相关的数据和图表。
2025-06-09 00:30:00
107
原创 【科研绘图系列】R语言绘制论文组图(multiple plots)
这段R代码是一个完整的分析和可视化流程,用于处理博茨瓦纳婴儿微生物组研究中的呼吸道病毒和细菌定植数据。代码的主要功能包括数据加载、预处理、图表生成和保存。通过精心设计的颜色方案和布局,生成的图表清晰地展示了不同病原体之间的关系和定植密度。最终的Figure 2由三个子图组成,分别展示了呼吸道病毒感染对细菌定植的影响、肺炎链球菌的定植密度以及四种细菌病原体的共定植情况。
2025-06-09 00:15:00
15
原创 【科研绘图系列】R语言绘制论文组图(multiple plots)
这段R代码是一个完整的分析和可视化流程,用于处理博茨瓦纳婴儿微生物组研究中的呼吸道病毒和细菌数据。代码的主要功能包括数据加载、预处理、图表生成和保存。通过精心设计的颜色方案和布局,生成的图表清晰地展示了不同检测方法的样本数量、呼吸道病毒的检测比例以及细菌病原体的定植率。最终的Figure 1由三个子图组成,分别展示了样本数量、病毒检测比例和细菌定植率,为研究提供了直观的数据支持。此外,代码还保存了相关的数据文件,便于后续的分析和验证。
2025-06-07 12:25:18
196
原创 【数据分析】探索婴儿年龄变化对微生物群落(呼吸道病毒和细菌病原体)结构的影响
本教程基于博茨瓦纳婴儿微生物组研究项目,详细介绍了如何使用 R 语言进行呼吸道病毒与细菌病原体的分析。该研究旨在探索婴儿鼻咽部微生物群落结构随年龄的变化、呼吸道病毒感染对微生物群落的影响,以及微生物特征对病原体定植的预测能力。通过一系列复杂的数据处理、统计建模和机器学习方法,本教程将逐步展示如何从原始数据中提取有价值的信息,揭示微生物组与呼吸道健康之间的潜在联系。教程内容涵盖了数据预处理、混合效应逻辑回归模型、随机森林模型以及 Maaslin2 分析等多个方面,旨在为微生物组研究者提供一个完整的分析流程示例
2025-06-07 11:08:05
227
原创 【数据分析】R版IntelliGenes用于生物标志物发现的可解释机器学习
IntelliGenesR:基于多组学数据的可解释疾病预测工具 IntelliGenesR是IntelliGenes流程的R实现,通过整合转录组与临床数据,进行疾病预测和生物标志物发现。其核心流程包括: 特征选择:使用Pearson、卡方、ANOVA和递归特征消除(RFE)筛选差异基因。 模型训练:支持随机森林、SVM等7种分类器,输出性能指标(如ROC曲线、F1分数)。 I-Genes评分:结合SHAP值和HHI指数量化基因重要性,提供可解释的生物标志物排名。
2025-06-06 14:17:18
1015
原创 【数据分析】基于adonis2与pairwise.adonis2的群组差异分析教程
本教程介绍基于距离矩阵的群落多样性分析方法,重点应用adonis2和pairwise.adonis2进行群组差异检验。通过导入距离矩阵和元数据,预处理后执行全局(adonis2)和成对(pairwise.adonis2)PERMANOVA分析,评估群组间差异显著性。adonis2提供整体群组效应,而pairwise.adonis2进一步识别具体差异群组对,并支持p值校正(如FDR)。分析结果以表格输出(Adonis-ALL.xls和Adonis-Pairwise.xls),适用于生态学、微生物组等
2025-06-05 09:02:23
363
原创 【科研绘图系列】R语言绘制和弦图(Chord diagram plot)
本文基于R语言构建了代谢物与环境元素相关性分析及和弦图可视化流程。通过psych和circlize等包,计算Spearman相关性(FDR校正p值),筛选显著关系(Padj<0.05)并提取前50个高相关组合。数据预处理包括去除零值行和转置矩阵。和弦图使用自定义颜色方案(代谢物:#65bd71,环境元素:#1d7811),按相关系数方向(正/负)染色链接,并优化布局与注释。最终输出PDF格式可视化结果,清晰展示跨数据集复杂关联。代码与示例数据已公开,适用于生物、生态等领域的关系网络分析。
2025-06-05 08:48:39
232
原创 【科研绘图系列】R语言绘制论文组合图(muitple plots)
这篇文章提供了一套完整的跨平台和跨仪器的蛋白质组学数据比较分析流程,涵盖了数据预处理、特征选择、模型训练和结果可视化。通过具体的代码示例和图形展示,读者可以清晰地了解如何使用R语言进行这些分析。文章中的图形设计精美,通过自定义颜色、主题和标签,使图形更加直观和易于理解。此外,文章还提供了数据下载链接和提取码,方便读者获取数据并复现结果。总体而言,这篇文章不仅展示了R语言在数据分析中的强大功能,还为科研人员提供了一个实用的分析模板。
2025-06-03 00:30:00
49
原创 【科研绘图系列】R语言绘制论文组合图形(mulitple plots)
这篇文章提供了一套完整的跨平台和跨仪器的蛋白质组学数据比较分析流程,涵盖了数据预处理、特征选择、模型训练和结果可视化。通过具体的代码示例和图形展示,读者可以清晰地了解如何使用R语言进行这些分析。文章中的图形设计精美,通过自定义颜色、主题和标签,使图形更加直观和易于理解。此外,文章还提供了数据下载链接和提取码,方便读者获取数据并复现结果。
2025-06-03 00:30:00
31
原创 【科研绘图系列】R语言绘制论文比较图(comparison plot)
这篇文章提供了一套完整的数据分析和可视化流程,涵盖了数据预处理、特征选择、模型训练和结果可视化。通过具体的代码示例和图形展示,读者可以清晰地了解如何使用R语言进行这些分析。文章中的图形设计精美,通过自定义颜色、主题和标签,使图形更加直观和易于理解。此外,文章还提供了数据下载链接和提取码,方便读者获取数据并复现结果。总体而言,这篇文章不仅展示了R语言在数据分析中的强大功能,还为科研人员提供了一个实用的分析模板。
2025-06-02 00:45:00
162
原创 【科研绘图系列】R语言绘制四个论文组合图形(multiple plots)
这篇文章提供了一套完整的数据分析和可视化流程,涵盖了工作流性能分类、特征重要性分析、线性模型交互效应检查以及频繁模式挖掘。通过具体的代码示例和图形展示,读者可以清晰地了解如何使用R语言进行这些分析。文章中的图形设计精美,通过自定义颜色、主题和标签,使图形更加直观和易于理解。此外,文章还提供了数据下载链接和提取码,方便读者获取数据并复现结果。总体而言,这篇文章不仅展示了R语言在数据分析中的强大功能,还为科研人员提供了一个实用的分析模板。
2025-06-02 00:15:00
243
原创 【科研绘图系列】R语言绘制论文组合图形(multiple plots)
这篇文章提供了一套完整的R语言科研绘图流程,从数据的导入、预处理到图形的绘制,每一步都详细说明了所使用的代码和方法。通过具体的代码示例和图形展示,读者可以清晰地了解如何使用R语言进行数据可视化。文章中的图形设计精美,通过自定义颜色、主题和标签,使图形更加直观和易于理解。此外,文章还提供了数据下载链接和提取码,方便读者获取数据并复现结果。总体而言,这篇文章不仅展示了R语言在科研绘图中的强大功能,还为科研人员提供了一个实用的绘图模板。
2025-06-01 11:13:58
290
原创 代谢组数据分析(二十六):LC-MS/MS代谢组学和脂质组学数据的分析流程
本教程概述了LC-MS/MS在代谢组学和脂质组学数据分析中的应用流程。首先介绍了样本的采集、提取和LC-MS/MS分析,随后详细阐述了质谱数据的预处理、峰值识别、特征注释,以及数据标准化和统计分析的重要性。特别强调了使用XCMS和CAMERA进行数据对齐和加合物识别,以及利用MultiABLER和LipidFinder进行数据过滤、插补和标准化处理。此外,还介绍了如何应用EigenMS算法进行数据标准化,以及如何使用Limma包进行差异分析。整个流程旨在提高数据质量,确保分析结果的准确性和可靠性,为后续的生
2025-06-01 10:47:59
388
原创 【数据分析】基于Cox模型的R语言实现生存分析与生物标志物风险评估
本研究采用R语言分析生存数据与多种生物标志物的关联性。通过Cox比例风险模型评估了SSC4D、UPB1等生物标志物对心力衰竭、糖尿病等疾病风险的影响。研究流程包括:数据预处理(变量重编码、缺失值处理、年龄离散化)、生存分析(含限制性立方样条和协变量调整)、结果可视化(密度曲线和风险比曲线绘制)。分析中控制了年龄、性别、种族等混杂因素,并使用ANOVA检验生物标志物的显著性。最终结果以PDF图像形式保存,包含关键统计指标和可视化图表。该研究方法为探索生物标志物与疾病风险的关联提供了标准化分析框架。
2025-05-31 11:01:44
470
原创 【科研绘图系列】R语言绘制词云图(wordcloud plot)
本文介绍使用R语言绘制词云图的方法。首先通过devtools从GitHub安装wordcloud2包,加载tidyverse、openxlsx等必要库。教程提供了示例数据下载链接,并演示如何导入Excel数据。核心代码通过循环处理不同分类数据,计算词频后按分位数区间着色,最终用wordcloud2生成五边形词云图并保存为HTML文件。
2025-05-31 01:00:00
47
原创 【科研绘图系列】R语言绘制雷达图(Radar plot)
这篇文章介绍了使用R语言绘制雷达图(Radar plot)的方法。主要内容包括加载tidyverse和ggthemes包,从百度网盘下载数据,导入数据后通过数据预处理(归一化、因子转换等)准备绘图。图中展示了不同食物喜好组(如broccoli_like、pizza_like等)在17类食品消费中的标准化对比,采用了多色系区分组别,并使用coord_radar()实现雷达图坐标。
2025-05-30 01:00:00
153
原创 【科研绘图系列】R语言绘制GO term 富集分析图(enrichment barplot)
本文介绍了使用R语言绘制GO富集分析条形图的方法。通过加载ggplot2等R包,对GO term数据进行预处理,包括p值转换、文本截断和排序筛选。文章提供了两个代码示例,分别针对不同数据集(dataC.xlsx和dataD.xlsx)进行分析,均采用分组(BP/CC/MF)展示前10个显著GO term。通过自定义绘图函数调整柱状图高度、坐标轴刻度和颜色方案,并使用patchwork包将三个子图合并为整体可视化结果。最终生成的图像清晰展示了不同GO类别中富集项的显著性水平
2025-05-30 00:15:00
329
原创 【科研绘图系列】R语言绘制森林图(forest plot)
本文介绍使用R语言绘制森林图(forest plot)的方法。首先加载必要的R包(grid、forestploter、openxlsx、stringr),导入并预处理数据,包括提取置信区间上下限、计算标准误、格式化显示文本等。然后通过自定义主题(tm)设置图形样式,使用forest()函数绘制森林图,可调整估计值、置信区间、参考线等参数。
2025-05-29 19:41:59
385
原创 代谢组数据分析(二十五):代谢组与蛋白质组数据分析的异同
蛋白质组学和代谢组学是系统生物学的重要分支,分别研究生物体内蛋白质和小分子代谢物的组成与功能。蛋白质组(动态性强、复杂度高)反映基因表达的功能执行者,而代谢组(动态性强、受环境影响大)更接近生理表型终点。蛋白质组分析主要通过质谱技术(如LC-MS/MS)进行鉴定(数据库比对)和定量(标记/无标记法),应用于疾病机制、生物标志物发现等。代谢组分析则依赖色谱-质谱联用技术(LC-MS/GC-MS)或核磁共振(NMR),用于代谢物鉴定(数据库比对)和定量(相对/绝对定量),在疾病诊断
2025-05-29 09:41:05
363
原创 【科研绘图系列】R语言绘制气泡图(bubble plot)
本文介绍使用R语言绘制气泡图的方法,包含数据预处理、可视化代码和输出设置。通过加载ggplot2等R包,对两个数据集进行因子化预处理后,分别绘制正负相关气泡图:红色表示正相关,蓝色表示负相关,气泡大小反映效应值。采用分面(facet)按食物类别展示数据,并自定义颜色映射和主题样式。最终通过patchwork包垂直拼接两图,输出PDF格式结果。教程附带百度网盘数据下载链接(提取码h7yt),适用于macOS系统下的R 4.4.3环境。
2025-05-27 00:15:00
375
原创 【科研绘图系列】R语言绘制柱状图(bar plot)
本文介绍了使用R语言绘制柱状图的方法。首先加载了ggplot2、Cairo和ggpubr等绘图包,然后导入包含不同食物组与疾病关联数据的数据框。通过数据预处理设置了柱状图颜色方案,并使用自定义函数bar_error绘制带有误差线的柱状图,该图展示了不同食物组与心血管疾病(CVD)、高脂饮食(HF)和2型糖尿病(T2D)的关联程度。文章详细说明了绘图参数设置,包括误差线处理方式、坐标轴调整和图形保存选项。最终输出一张清晰展示数据分布特征的柱状图,并提供了完整的R系统环境信息。
2025-05-26 19:36:53
249
原创 单细胞数据分析(五):三种整合单细胞数据(Harmony、fastMNN、SCTransform)的完整流程
单细胞数据整合方法比较:Harmony、fastMNN与SCTransform的性能评估 本文以23万细胞乳腺癌数据集为例,系统比较了三种单细胞数据整合方法。预处理阶段发现原始数据存在细胞数量差异(236169 vs 236363),需进一步验证。质量评估显示多数样本的基因数、转录本数和线粒体基因比例合理,但存在批次差异。内存需求分析表明:Harmony最节省资源(推荐64GB),fastMNN中等(64-128GB),SCTransform最耗内存(128GB+)。研究采用降采样策略(每个数据集500细胞
2025-05-26 11:23:30
733
原创 【文献分享】human_kidney_multiomics提供了数据和代码
本研究通过整合snRNA-seq、ATAC-seq和高通量单细胞分子成像技术,构建了人类肾脏疾病的空间多组学图谱。研究发现,在损伤肾脏中,HAVCR1+VCAM1+近端肾小管细胞获得促炎表型,上调趋化因子、促纤维化因子及黏附分子基因。这些炎症细胞特异性定位于纤维化微环境,并通过旁分泌信号介导白细胞募集和肌成纤维细胞活化。表观遗传分析显示HNF4α缺失及NF-κβ/AP-1激活驱动该炎症表型。动物实验证实,靶向抑制AP-1或清除衰老细胞可改善肾脏炎症和纤维化,提示这些炎症性肾小管细胞是慢性肾病治疗的潜在靶点。
2025-05-25 15:49:26
958
原创 【文献分享】A comprehensive single-cell breast提供了代码和数据
【文献分享】A comprehensive single-cell breast提供了代码和数据
2025-05-23 08:40:25
756
原创 【文献分享】A single-cell and spatially resolved atlas of human breast cancers提供数据和代码
【文献分享】A single-cell and spatially resolved atlas of human breast cancers提供数据和代码
2025-05-23 08:37:48
976
原创 【工具】grcMalaria用于处理和分析“斑点疟疾基因报告卡”的R软件包
【工具】grcMalaria用于处理和分析“斑点疟疾基因报告卡”的R软件包
2025-05-21 08:24:24
625
原创 【工具】PathNetDRP一种基于通路和蛋白质-蛋白质相互作用的新型生物标志物发现框架
【工具】PathNetDRP一种基于通路和蛋白质-蛋白质相互作用的新型生物标志物发现框架
2025-05-15 14:50:40
693
原创 【数据分析】从TCGA下载所有癌症的多组学数据
本文介绍了一个基于R语言的自动化脚本,用于从TCGA(The Cancer Genome Atlas)数据库下载多组学数据。该脚本利用TCGAbiolinks包,支持下载7种组学数据类型,包括转录组、DNA甲基化、拷贝数变异、miRNA表达、蛋白质表达、临床数据和体细胞突变。数据按癌症类型和组学类型分类存储,便于后续分析。脚本还包含错误处理机制,确保部分下载失败不会影响整体流程,并提供了并行化选项以加快下载速度。该脚本适用于生物信息学研究人员和癌症基因组学分析团队,能够显著减少数据收集和整理的负担,使研究人
2025-05-14 11:31:34
262
原创 R语言机器学习算法实战系列(二十五)随机森林算法多标签分组分类器及模型可解释性
本教程详细介绍了如何使用R语言构建和解释随机森林多分类模型。流程包括数据预处理、模型训练、超参数调优、性能评估及可解释性分析。通过tidymodels框架,教程展示了如何标准化数据、使用交叉验证优化参数(如mtry和min_n),并评估模型性能(如准确率、召回率、F1分数)。此外,教程还利用DALEX框架进行模型解释,包括全局解释(如变量重要性、部分依赖图)和本地解释(如SHAP值、预测分解)。最后,教程提供了可视化工具(如混淆矩阵、ROC曲线)和结果汇总,帮助用户深入理解模型表现。该流程适用于多种多分类场
2025-05-14 10:22:04
380
原创 【工具】adverSCarial评估单细胞 RNA 测序分类器抵御对抗性攻击的脆弱性
【工具】adverSCarial评估单细胞 RNA 测序分类器抵御对抗性攻击的脆弱性
2025-05-05 13:06:23
893
原创 【文献分享】The dynamics of leadership提供了代码和数据
【文献分享】The dynamics of leadership提供了代码和数据
2025-05-04 09:13:00
821
原创 【文献分享】Modelling the species-area提供数据和代码
【文献分享】Modelling the species-area提供数据和代码
2025-04-30 18:19:08
1295
### 【生物信息学】基于R语言的STAMP图绘制:宏基因组数据分析与可视化
2025-04-20
### 数据科学R语言基础图形合集:科研绘图指南与实现
2025-04-20
科研绘图R语言ggpubr包在数据可视化中的应用:多种图表类型与统计分析整合
2025-04-20
科研绘图基于ggplot2的箱线图绘制:带有出现率百分比的多组别数据分布比较及可视化
2025-04-20
科研绘图领域:tidyplots包替代ggplot2实现高效美观的论文图表制作
2025-03-25
科研绘图系列:R与Python在数据可视化中的应用及代码比较
2025-03-25
在R语言中,安装R包是数据分析过程中不可或缺的一部分 当你需要执行特定的统计测试、可视化或其他任务时,你可能会发现相应的功能已经被封装在一个或多个R包中
2025-01-23
数据分析:转录组差异分析总结(DESeq2+limma+edgeR+t-test/wilcox-test
2024-11-19
科研绘图系列:R语言雨云图展示更多数据分布信息
2024-11-18
科研绘图系列:箱线图加百分比点图展示组间差异
2024-11-16
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人