构建蛋白-蛋白互作网络图时最重要的参数是什么？

最重要的是物种、网络类型和互作阈值；这些设置会直接影响结果的准确性和图的清晰度。

蛋白-蛋白互作网络图可以直接说明因果关系吗？

不可以。它主要展示证据支持下的关联关系，不能直接等同于因果关系。

蛋白-蛋白互作网络图：如何精准构建与解析？

Q: 蛋白-蛋白互作网络图是什么？

它是把蛋白之间的相互作用用节点和连线可视化的图，用于分析通路、筛选关键蛋白和解释机制。

作者：Dr.Chuang

2026-05-15｜原创

引言Introduction

蛋白-蛋白互作网络图是解析通路、筛选关键基因和解释机制的常用工具。但很多人常遇到同样问题：数据太多、节点太乱、证据来源不清，最终图做出来却难以解释。本文围绕蛋白-蛋白互作网络图 ，讲清如何构建、如何筛选、如何解读。
科研人员在电脑前查看STRING蛋白互作网络图，旁边展示节点、连线和证据图例的简洁示意图

1. 蛋白-蛋白互作网络图是什么

1.1 核心概念

蛋白质是生命活动的直接执行者。细胞中的信号传递、代谢调控、转录调控，很多都依赖蛋白之间的相互作用。蛋白-蛋白互作网络图 就是把这些相互作用用节点和连线的形式可视化。

从研究角度看，互作分为两类。

物理互作 ，指蛋白之间直接结合。
功能互作 ，指蛋白或其编码基因在功能层面存在关联。

前者更接近分子机制，后者更适合从系统层面理解表型变化。

1.2 为什么它重要

蛋白-蛋白互作网络图 的价值在于，它不只展示“谁和谁有关”，还帮助研究者判断“哪些关系更可信”。STRING这类数据库会对互作证据进行整合，并给出可靠度评分。对于医学生、医生和科研人员来说，这类图常用于：

解释疾病相关基因的作用网络。
筛选潜在枢纽蛋白。
配合GO、KEGG做功能富集。
为后续实验设计提供候选靶点。

如果没有网络图，单个基因列表很难转化为机制结论。

2. 如何精准构建蛋白-蛋白互作网络图

2.1 先明确输入对象

构建前要先想清楚你手里是什么数据。常见输入包括单个蛋白、多个蛋白，或者蛋白序列。STRING支持按基因名检索，也支持按序列检索。

如果你只知道基因符号，可用 protein by name。
如果你只有蛋白序列，可用 protein by sequence。
物种一定要选对。 人类常用 Homo sapiens，小鼠常用 Mus musculus。若不确定，部分数据库支持 auto-detect，但确认步骤会更多。

2.2 以STRING为例完成检索

STRING是构建蛋白-蛋白互作网络图 最常用的数据库之一。它整合了实验、数据库、文本挖掘、共表达、基因邻近、基因融合、同源性等证据，并将结果可视化。

单蛋白检索时，一般流程如下：

进入 STRING。
选择 Protein by name。
输入目标蛋白，如 TP53。
选择物种。
点击 Search，再选择目标条目。
进入结果页查看网络图。

如果是多个蛋白，则可进入 Multiple proteins，纵向输入基因列表，或上传文件。多个蛋白分析更适合通路研究和差异基因筛选。

2.3 参数设置决定图的质量

很多人把图做乱，不是数据问题，而是参数没设好。STRING 的 Settings 很关键。

建议重点看这几个选项：

Network type 。选择 full network 时，显示物理和功能互作。只看直接结合时，可选物理互作。
Meaning of network edges 。evidence 用不同颜色区分证据来源。confidence 用线条粗细体现可靠性。
Minimum required interaction score 。分数越高，图越保守。高阈值适合强调可信互作。
Max number of interactors to show 。控制展示节点数量，避免图太拥挤。

原则很简单。先保真，再美观。

3. 如何解析蛋白-蛋白互作网络图

3.1 看懂节点、连线和颜色

在网络图中，每个节点代表一个蛋白。节点上的字母通常对应基因符号。输入蛋白一般会被单独标记。部分节点内部带有结构缩略图，表示该蛋白的三维结构已知。

连线则表示互作关系。不同颜色对应不同证据来源。根据STRING课程内容，常见含义包括：

数据库证据。
实验证据。
文本挖掘。
基因共表达。
基因邻近。
基因融合。
蛋白同源。

证据来源越明确，越适合进入后续验证。

3.2 先找枢纽蛋白，再看子网络

一张蛋白-蛋白互作网络图 信息很多，不能只看整体。更有效的方法是先找中心节点，也就是高连接度蛋白。它们往往是枢纽蛋白，可能在通路中占核心位置。

接下来可以进一步做子网络分析。STRING支持 Clusters 功能，用于挖掘局部模块。
在课程案例里，也提到可借助 Cytoscape 配合 MCODE 或 cytoHubba 继续筛选 HUB 基因。
从全网到模块，是从描述性结果走向机制解释的关键一步。

3.3 结合富集分析提高解释力

单靠网络图，还不能直接回答“这批蛋白在干什么”。因此需要结合功能富集分析。STRING 的 Analysis 选项可直接展示 GO 和 KEGG 相关结果，并按 FDR 排序。

实操中建议这样理解：

先看网络是否形成明显模块。
再看模块对应的富集条目。
最后把关键蛋白放回生物学背景中解释。

例如在疾病研究中，若模块富集到炎症、凋亡、代谢或细胞周期相关条目，往往更容易形成有说服力的机制链条。

4. 常见误区与优化策略

4.1 不要把“相关”当成“因果”

蛋白-蛋白互作网络图展示的是证据支持下的关联，不等于直接因果关系。 这是最常见的误读。尤其是文本挖掘、共表达、同源推断这类证据，更适合做假设生成，而不是直接下结论。

因此，写论文或做汇报时，要区分：

已验证互作。
预测互作。
功能相关。

4.2 不要忽视物种和命名问题

同名蛋白、别名蛋白、跨物种同源蛋白，都会影响结果。检索前应尽量统一基因符号，并确认物种。尤其在肿瘤、免疫和模式动物研究中，这一步很容易出错。

此外，输入过多蛋白时，图容易膨胀。解决方法包括：

提高 interaction score。
限制 interactors 数量。
隐藏无互作节点。
先导出数据，再用 Cytoscape 精修。

4.3 导出后再做二次整理

很多高质量图不是直接生成的，而是导出后处理的。STRING 支持多种导出格式，适合接入 Cytoscape 进行二次编辑。
在 Cytoscape 中，你可以进一步调整颜色、形状、标签和布局，让蛋白-蛋白互作网络图 更适合论文展示。

对于发表级图件，结构清晰比元素堆叠更重要。

5. 适合医学生、医生和科研人员的实用流程

5.1 推荐工作流

如果你是初学者，可以按下面流程做：

准备差异基因或候选蛋白列表。
在 STRING 中构建蛋白-蛋白互作网络图 。
调整阈值，保留高可信互作。
识别核心节点和模块。
做 GO、KEGG 富集分析。
导入 Cytoscape 精修并出图。

这个流程的优势是清晰、可复现，也方便写进方法学部分。

5.2 如何提升论文可用性

一个能发表的网络图，必须同时满足清晰度、证据链和生物学解释。
建议你在图注或正文中说明：

数据来源。
物种。
阈值设置。
是否纳入预测证据。
是否进行了模块分析。

这样不仅提升可重复性，也更符合 E-E-A-T 对专业性和可信度的要求。

总结Conclusion

蛋白-蛋白互作网络图不是简单的可视化图，而是从基因列表走向机制解释的重要桥梁。 只要把输入对象、物种、阈值和证据来源设置清楚，再结合模块分析与功能富集，就能显著提升图的解释力和论文价值。
一张整洁的论文级PPI网络图示意，旁边配有STRING、Cytoscape、GO/KEGG分析流程图，突出科研应用场景

如果你希望更快完成从检索到出图的全流程，可以借助解螺旋 的数据库教程和实操资源，按标准步骤构建高质量的蛋白-蛋白互作网络图 ，减少试错，提高效率。