400-820-8531
News center
新闻中心
首页 > 新闻中心 > 干货分享 > 3分钟搞定相关性分析,Nature级图表轻松复现!

3分钟搞定相关性分析,Nature级图表轻松复现!

发布时间:2025-12-19

上一期小编带大家解锁了用百墨云工具绘制论文级火山图的实用技能,今天咱们继续深挖高分文章里的 “高频分析利器”—— 相关性分析。同样以发表在《Nature Genetics》的非小细胞肺癌经典研究为例,该研究就巧妙借助相关性分析,直观揭示了癌细胞状态对肿瘤微环境(TME)细胞组成的调控作用,为研究结论提供了关键的数据支撑。

作者将肿瘤区域的IFNγ和NRF2靶基因模块评分,与邻近免疫细胞比例进行Pearson相关性分析,发现IFNγ模块分数与免疫细胞浸润显著正相关,而NRF2靶基因模块则显著负相关。这一结果为"癌细胞状态塑造免疫微环境"提供了关键统计学证据。

如何快速完成这样的分析?

百墨云工具

3分钟掌握相关性分析~

BIOPROFILE

三步定位「相关性分析」工具

1打开我们的百墨云工具(https://www.omickits.com/open/tool)

2在搜索栏中输入关键词 “相关性”

3组学类型栏目中选择联合分析。

今天重点介绍高频工具 "相关性分析流程" ——它提供从计算到可视化的完整解决方案,一键生成详细分析报告。

BIOPROFILE

参数详解

照着填真的行

任务名

默认即可(服务器后台任务编号)。

项目编号

自定义命名,避免特殊字符和空格。

输入文件1&2

只需提供物质名称及样本表达量(要求样本名一致)。示例:使用百溪云流程的蛋白分析结果,以Uniprot ID作为标识符

组学名称

如"Metabonomics,Microbiomics"(用于报告和可视化,不要有空格)

相关性系数阈值

设定显著相关性的标注范围。

相关性系数

选择Spearman或Pearson算法。

相关性系数网络图是否使用物质全称

选择"是"显示全称,"否"显示组学前缀

是:

否:

设置完毕,点击分析即可!

高频问题

这个环节我们来看一下大家提出关于相关性分析云工具的一些问题

Q报错怎么办?

A常见原因有三:

物质名称重复(第一列需唯一),重复时可加后缀区分,如_1、_2。

工作表名与分组不匹配:若分组文件第二列为A/B,输入文件需命名为A.vs.B,多组比较用A_B_C

缺失值/0值过多:部分可视化对缺失值敏感,建议提前过滤。

Q数据量少能分析吗?

A推荐使用 "相关性系数&P值计算" 工具,数据量过小可能导致“相关性分析流程”可视化步骤报错。

Q“相关性系数&P值计算” 单独计算后如何可视化?

A百墨云工具提供该结果的下游可视化工具,直接导入计算结果文件即可生成图表:

Q一个流程与一个单独工具结果有差异吗?

A内核算法一致,结果完全相同。"相关性系数&P值计算" 工具仅处理每张表的第一个sheet。这里也演示一下操作:

留言互动

1你在进行相关性分析的时候遇见哪些问题?

2想看看有什么高级玩法?

3或者有其他感兴趣的可视化内容?

评论区告诉我你的疑问和需求,下期专门安排教程!

参考文献

Yan, Y., Sun, D., Hu, J. et al. Multi-omic profiling highlights factors associated with resistance to immuno-chemotherapy in non-small-cell lung cancer. Nat Genet 57, 126–139 (2025). https://doi.org/10.1038/s41588-024-01998-y

Chen Peng (2023). MetaNet: Network Analysis for Omics Data. R package, https://github.com/Asa12138/MetaNet.