引言Introduction

PPI 网络作图是生信文章里最常见,也最容易拉开差距的一步。很多人会导入基因后直接出图,结果网络太散、信息太弱、Hub 基因不清楚。真正影响图质量的,不只是“能不能画出来”,而是“能不能讲清楚生物学意义”。 STRING与Cytoscape结合绘制PPI网络的流程示意图,左侧为基因列表,右侧为蛋白互作网络图

1. 先把输入基因筛干净,避免“垃圾进,垃圾出”

1.1 只用高可信差异基因,减少噪音

做 PPI 网络作图 前,第一步不是打开软件,而是整理输入基因。上游知识库中强调,通常先取显著差异基因,再进入 STRING 构网。这样做的核心原因很简单。输入集合越干净,网络越集中,后续 Hub 基因越有解释价值。

如果基因列表过长、阈值过宽,网络会出现大量游离节点。图看起来“很热闹”,但实际上信息密度低。对论文来说,这种图很难支撑结论。建议优先保留已经经过统计筛选的基因,再进入下一步分析。

1.2 统一基因命名,避免映射失败

PPI 网络作图 最常见的问题之一,是基因名无法正确识别。尤其是 SYMBOL、旧命名、别名混用时,STRING 可能会出现漏配。实际操作中,应先统一命名格式,再导入数据库。

一个实用原则是,在导入前先确认物种、基因符号和重复项。 上游流程里明确提到,STRING 中要选择 Homo sapiens。物种选错,整个网络都会偏离研究目标。对于医学生和科研人员来说,这一步虽然基础,但直接决定结果是否可靠。

1.3 控制基因数量,保持网络可解释

并不是基因越多越好。PPI 网络作图 的目的,是突出关键模块和核心节点,而不是展示一个“很大”的网络。建议优先围绕一个明确问题筛选输入基因。这样更容易得到结构清晰、可发表的图。

如果差异基因过多,可以先做分层处理。例如按上调、下调分别构网,或者只取最显著的一部分。这样后续在 STRING 和 Cytoscape 中更容易识别核心模块。

2. 用 STRING 构建网络,先保证结果真实可靠

2.1 按标准流程导入 STRING

根据知识库,PPI 网络作图 常用 STRING 数据库完成第一步构建。操作流程比较固定。进入官网后,选择 Multiple proteins,把基因列表粘贴到 List of Name 中,再选择物种 Homo sapiens,点击 SEARCH。等待映射完成后,再进入下一步。

这个过程的关键不是快,而是完整。基因未完全加载就直接继续,容易漏掉节点。 知识库中特别提醒,输入基因较多时,不要过早点击 continue,而应等页面更新完成后再进入下一步。

2.2 调整交互阈值,控制网络严谨度

STRING 的强项在于可直接按交互得分筛选网络。上游资料中提到,可修改交互数目后点击 UPDATE,再下载 string_interactions.tsv。对于论文图来说,这一步非常重要。阈值过低,网络会过于松散。阈值过高,网络可能过于稀疏。

因此,PPI 网络作图 时要在“覆盖率”和“特异性”之间做平衡。 如果研究目的是找关键机制,建议优先保留更高置信度的互作。这样后续找 Hub 基因、关键模块时,结果会更稳。

2.3 导出标准文件,方便后续二次美化

STRING 不只是构网工具,也是后续图形处理的输入来源。知识库明确给出两类导出文件。一类是 text output,用于后续导入 Cytoscape。另一类是高清网络图,可作为初步展示图。

这里要注意,STRING 生成的是“基础网络”,真正适合论文发表的高质量图,通常还要经过 Cytoscape 重构。 所以不要把 STRING 当成终点,而要把它看成数据入口。

3. 在 Cytoscape 中美化网络,并筛出核心节点

3.1 导入网络和注释文件,建立可视化层级

PPI 网络作图 的第二个关键环节,是用 Cytoscape 做精修。知识库给出的做法是,先通过 File – Import – Network from File 导入 STRING 下载的 tsv 文件,再通过 File – Import – Table from File 导入基因注释文件。

这一点很重要。因为只有把表达信息、logFC、P 值等属性接进去,网络图才不只是“关系图”,而是能体现生物学变化的结果图。没有属性层,网络图的解释力会明显下降。

3.2 用颜色、大小和布局讲清楚层次

Cytoscape 的优势,在于可以把复杂关系变成可读图形。知识库中提到,可以按 logFC 设置颜色,按 P 值或连接度设置节点大小,再通过布局进行重排。常见做法包括圆形布局、按 degree 排列等。

建议遵循一个清晰原则。

  • 颜色表示表达变化。
  • 大小表示连接度或统计权重。
  • 线条粗细表示互作强度。

这样读者一眼就能看懂谁是核心,谁是辅助节点。对论文审稿人来说,这种图的专业度远高于默认输出图。

3.3 用 MCODE 或 CytoHubba 找 Hub 基因

真正高质量的 PPI 网络作图,不止是漂亮,还要能回答“谁最重要”。知识库中提到,Cytoscape 可以借助 MCODE 筛选关键模块,也可以用 CytoHubba 做 Hub 基因分析。

这类方法的价值在于,它把“主观判断”变成“算法筛选”。例如:

  1. 先分析当前网络。
  2. 再按 degree 或其他算法排序。
  3. 输出关键节点或模块。

Hub 基因不是随便挑出来的,而是连接度高、在网络中更关键的节点。 这种结果更适合写进论文结果部分,也更容易与后续实验验证衔接。

4. 3大关键技巧,决定PPI图能不能发

4.1 技巧一,先筛基因,再画网络

这是最基础,也最容易被忽略的一点。输入不严谨,后面所有步骤都会被拖累。PPI 网络作图 的第一原则,就是保证基因集来源清楚、筛选标准明确。

4.2 技巧二,STRING 负责“构网”,Cytoscape 负责“讲故事”

STRING 的作用是建立互作事实,Cytoscape 的作用是让结果更清楚、更适合论文表达。两者分工不同。不要试图只靠一个软件完成全部工作。先用 STRING 保证可信度,再用 Cytoscape 提升表达力,才是标准流程。

4.3 技巧三,图要服务结论,不要只追求复杂

很多初学者会把图做得很密,但论文真正需要的是“能读懂”。PPI 网络作图 的最终目标,是支持机制推断,突出关键模块和 Hub 基因。网络不在于大,而在于准。

如果你正在做生信文章、机制图或毕业论文,建议把这三步固定成模板:基因筛选、STRING 构网、Cytoscape 精修。这样效率更高,结果也更稳定。

总结Conclusion

PPI 网络作图 并不难,难的是做出“有结论价值”的图。核心逻辑很清晰。先筛好输入基因,再用 STRING 构建互作网络,最后用 Cytoscape 完成可视化和 Hub 基因筛选。只要这三步做到位,网络图就不只是展示图,而是能直接服务论文结果的证据图。

如果你希望把 PPI 网络作图 做得更规范、更适合发表,可以直接使用解螺旋 的生信课程和实操方法,少走弯路,快速建立标准化分析流程。Cytoscape美化后的PPI网络成图,突出Hub基因、关键模块和颜色分层,适合论文结果展示