引言Introduction
蛋白-蛋白互作网络图是解析通路、筛选关键基因和解释机制的常用工具。但很多人常遇到同样问题:数据太多、节点太乱、证据来源不清,最终图做出来却难以解释。本文围绕蛋白-蛋白互作网络图 ,讲清如何构建、如何筛选、如何解读。

1. 蛋白-蛋白互作网络图是什么
1.1 核心概念
蛋白质是生命活动的直接执行者。细胞中的信号传递、代谢调控、转录调控,很多都依赖蛋白之间的相互作用。蛋白-蛋白互作网络图 就是把这些相互作用用节点和连线的形式可视化。
从研究角度看,互作分为两类。
- 物理互作 ,指蛋白之间直接结合。
- 功能互作 ,指蛋白或其编码基因在功能层面存在关联。
前者更接近分子机制,后者更适合从系统层面理解表型变化。
1.2 为什么它重要
蛋白-蛋白互作网络图 的价值在于,它不只展示“谁和谁有关”,还帮助研究者判断“哪些关系更可信”。STRING这类数据库会对互作证据进行整合,并给出可靠度评分。对于医学生、医生和科研人员来说,这类图常用于:
- 解释疾病相关基因的作用网络。
- 筛选潜在枢纽蛋白。
- 配合GO、KEGG做功能富集。
- 为后续实验设计提供候选靶点。
如果没有网络图,单个基因列表很难转化为机制结论。
2. 如何精准构建蛋白-蛋白互作网络图
2.1 先明确输入对象
构建前要先想清楚你手里是什么数据。常见输入包括单个蛋白、多个蛋白,或者蛋白序列。STRING支持按基因名检索,也支持按序列检索。
如果你只知道基因符号,可用 protein by name。
如果你只有蛋白序列,可用 protein by sequence。
物种一定要选对。 人类常用 Homo sapiens,小鼠常用 Mus musculus。若不确定,部分数据库支持 auto-detect,但确认步骤会更多。
2.2 以STRING为例完成检索
STRING是构建蛋白-蛋白互作网络图 最常用的数据库之一。它整合了实验、数据库、文本挖掘、共表达、基因邻近、基因融合、同源性等证据,并将结果可视化。
单蛋白检索时,一般流程如下:
- 进入 STRING。
- 选择 Protein by name。
- 输入目标蛋白,如 TP53。
- 选择物种。
- 点击 Search,再选择目标条目。
- 进入结果页查看网络图。
如果是多个蛋白,则可进入 Multiple proteins,纵向输入基因列表,或上传文件。多个蛋白分析更适合通路研究和差异基因筛选。
2.3 参数设置决定图的质量
很多人把图做乱,不是数据问题,而是参数没设好。STRING 的 Settings 很关键。
建议重点看这几个选项:
- Network type 。选择 full network 时,显示物理和功能互作。只看直接结合时,可选物理互作。
- Meaning of network edges 。evidence 用不同颜色区分证据来源。confidence 用线条粗细体现可靠性。
- Minimum required interaction score 。分数越高,图越保守。高阈值适合强调可信互作。
- Max number of interactors to show 。控制展示节点数量,避免图太拥挤。
原则很简单。先保真,再美观。
3. 如何解析蛋白-蛋白互作网络图
3.1 看懂节点、连线和颜色
在网络图中,每个节点代表一个蛋白。节点上的字母通常对应基因符号。输入蛋白一般会被单独标记。部分节点内部带有结构缩略图,表示该蛋白的三维结构已知。
连线则表示互作关系。不同颜色对应不同证据来源。根据STRING课程内容,常见含义包括:
- 数据库证据。
- 实验证据。
- 文本挖掘。
- 基因共表达。
- 基因邻近。
- 基因融合。
- 蛋白同源。
证据来源越明确,越适合进入后续验证。
3.2 先找枢纽蛋白,再看子网络
一张蛋白-蛋白互作网络图 信息很多,不能只看整体。更有效的方法是先找中心节点,也就是高连接度蛋白。它们往往是枢纽蛋白,可能在通路中占核心位置。
接下来可以进一步做子网络分析。STRING支持 Clusters 功能,用于挖掘局部模块。
在课程案例里,也提到可借助 Cytoscape 配合 MCODE 或 cytoHubba 继续筛选 HUB 基因。
从全网到模块,是从描述性结果走向机制解释的关键一步。
3.3 结合富集分析提高解释力
单靠网络图,还不能直接回答“这批蛋白在干什么”。因此需要结合功能富集分析。STRING 的 Analysis 选项可直接展示 GO 和 KEGG 相关结果,并按 FDR 排序。
实操中建议这样理解:
- 先看网络是否形成明显模块。
- 再看模块对应的富集条目。
- 最后把关键蛋白放回生物学背景中解释。
例如在疾病研究中,若模块富集到炎症、凋亡、代谢或细胞周期相关条目,往往更容易形成有说服力的机制链条。
4. 常见误区与优化策略
4.1 不要把“相关”当成“因果”
蛋白-蛋白互作网络图展示的是证据支持下的关联,不等于直接因果关系。 这是最常见的误读。尤其是文本挖掘、共表达、同源推断这类证据,更适合做假设生成,而不是直接下结论。
因此,写论文或做汇报时,要区分:
- 已验证互作。
- 预测互作。
- 功能相关。
4.2 不要忽视物种和命名问题
同名蛋白、别名蛋白、跨物种同源蛋白,都会影响结果。检索前应尽量统一基因符号,并确认物种。尤其在肿瘤、免疫和模式动物研究中,这一步很容易出错。
此外,输入过多蛋白时,图容易膨胀。解决方法包括:
- 提高 interaction score。
- 限制 interactors 数量。
- 隐藏无互作节点。
- 先导出数据,再用 Cytoscape 精修。
4.3 导出后再做二次整理
很多高质量图不是直接生成的,而是导出后处理的。STRING 支持多种导出格式,适合接入 Cytoscape 进行二次编辑。
在 Cytoscape 中,你可以进一步调整颜色、形状、标签和布局,让蛋白-蛋白互作网络图 更适合论文展示。
对于发表级图件,结构清晰比元素堆叠更重要。
5. 适合医学生、医生和科研人员的实用流程
5.1 推荐工作流
如果你是初学者,可以按下面流程做:
- 准备差异基因或候选蛋白列表。
- 在 STRING 中构建蛋白-蛋白互作网络图 。
- 调整阈值,保留高可信互作。
- 识别核心节点和模块。
- 做 GO、KEGG 富集分析。
- 导入 Cytoscape 精修并出图。
这个流程的优势是清晰、可复现,也方便写进方法学部分。
5.2 如何提升论文可用性
一个能发表的网络图,必须同时满足清晰度、证据链和生物学解释。
建议你在图注或正文中说明:
- 数据来源。
- 物种。
- 阈值设置。
- 是否纳入预测证据。
- 是否进行了模块分析。
这样不仅提升可重复性,也更符合 E-E-A-T 对专业性和可信度的要求。
总结Conclusion
蛋白-蛋白互作网络图不是简单的可视化图,而是从基因列表走向机制解释的重要桥梁。 只要把输入对象、物种、阈值和证据来源设置清楚,再结合模块分析与功能富集,就能显著提升图的解释力和论文价值。

如果你希望更快完成从检索到出图的全流程,可以借助解螺旋 的数据库教程和实操资源,按标准步骤构建高质量的蛋白-蛋白互作网络图 ,减少试错,提高效率。
- 引言Introduction
- 1. 蛋白-蛋白互作网络图是什么
- 2. 如何精准构建蛋白-蛋白互作网络图
- 3. 如何解析蛋白-蛋白互作网络图
- 4. 常见误区与优化策略
- 5. 适合医学生、医生和科研人员的实用流程
- 总结Conclusion






