PPI网络构建步骤的第一步是什么？

先整理并标准化输入基因列表，通常从差异分析结果中筛选显著基因并提取SYMBOL列。

STRING构建PPI网络时常用的参数阈值是多少？

通常可先设置confidence > 0.4，作为基础分析和初筛的起点。

为什么要用Cytoscape进一步处理STRING导出的PPI结果？

Cytoscape可用于网络美化、属性映射、Hub基因筛选和模块分析，使图更适合论文发表。

PPI网络构建步骤实战：如何快速做出高质量网络？

作者：Dr.Chuang

2026-05-15｜原创

引言Introduction

PPI网络构建步骤看似简单，真正难点在于数据整理、参数选择和图形呈现。很多初学者能跑出网络，却做不出可发表的高质量图。本文用STRING和Cytoscape的标准流程，拆解PPI网络构建步骤，帮助医学生、医生和科研人员少走弯路。
STRING数据库与Cytoscape联合构建PPI网络的流程示意图，包含基因列表、互作连线和Hub基因高亮展示。

1. 明确PPI网络的输入数据

1.1 先准备差异基因列表

PPI网络构建步骤的起点，不是直接开软件，而是先整理输入数据。常见做法是从差异分析或整合分析结果中，筛选出显著基因，再提取SYMBOL列用于后续分析。

核心原则是，输入必须干净、统一、可追溯。
如果基因命名混乱，后面的STRING检索和Cytoscape导入都会出问题。

在实操中，建议先确认三点：

基因符号是否标准化。
是否已经完成显著性筛选。
是否保留了原始结果文件，方便回溯。

1.2 网络图至少要有两列

在Cytoscape里，任何复杂网络都可以看成节点和边的组合。
因此，基础数据至少要包含两列。

第一列是源节点，常写作node1。
第二列是靶节点，常写作node2。

同一行代表两个蛋白之间存在互作关系。
如果还要叠加表达量、上调下调、Combined Score等信息，可以额外准备属性表。

1.3 先想清楚你要展示什么

PPI网络构建步骤并不只是“画图”。
你需要先明确目的。

常见目标有三类：

找核心基因。
找关键模块。
给文章中的机制部分提供支撑。

如果目标是筛Hub基因，后面就要重点考虑Degree等网络指标。
如果目标是模块筛选，就要提前准备MCODE分析思路。

2. 用STRING快速构建PPI网络

2.1 STRING是最常用的起点

在现有流程中，STRING是构建PPI网络最常用、也最方便的数据库之一。
它适合先做初筛，再导出结果给Cytoscape二次美化。

标准做法是：

打开STRING网站。
进入Multiple proteins分析页面。
粘贴基因列表。
物种选择人。
提交后生成互作网络。

这一步的关键不是“跑出来”，而是“跑得准”。

2.2 参数设置决定网络质量

在PPI网络构建步骤中，参数设置很重要。
知识库中的常用做法是设置 confidence > 0.4。

这个阈值的意义在于：

太低，网络会过于松散。
太高，可能丢失部分潜在互作。

0.4通常可作为基础分析的起点。
后续是否提高阈值，要根据研究问题和图形稠密度决定。

2.3 处理孤立节点，让图更干净

STRING默认生成的网络中，常会出现一些游离点。
这些点不一定有助于文章表达，反而会让图面变乱。

可根据需要：

隐藏未连接节点。
去除离散点。
再更新网络视图。

这样做的目的，是提升可读性，而不是改变核心生物学结论。

2.4 导出高清图和文本结果

完成基础网络后，建议导出两类文件。

高清位图，用于文章展示。
text output表格，用于导入Cytoscape。

这一步很重要。
因为STRING负责“快速构建”，Cytoscape负责“深度优化”。
两者配合，通常更适合发表级图表。

3. 用Cytoscape完成网络美化与核心基因筛选

3.1 导入STRING结果文件

Cytoscape是PPI网络构建步骤里最重要的美化和分析工具。
它能把STRING导出的互作表格重新构建成更适合论文的网络图。

操作顺序很清晰：

打开Cytoscape。
选择File。
点击Import。
选择Table from File或Network from File。
导入STRING下载的tsv文件。

导入时要确认：

node1和node2对应正确。
节点颜色设置无误。
网络结构已经完整生成。

3.2 用Style统一视觉规则

初步网络生成后，不要急着导出。
先进入Style进行美化。

常见调整包括：

节点大小。
节点颜色。
连线粗细。
标签显示方式。

网络图的目标不是花哨，而是让重点一眼可见。
如果表达数据更重要，可以让节点颜色映射表达量。
如果互作强度更重要，可以让线条粗细映射Combined Score。

3.3 用NetworkAnalyzer读取网络指标

在Cytoscape中，可通过NetworkAnalyzer进行网络分析。
知识库中强调，常用的可视化逻辑包括：

Degree越大，节点越大、越亮。
Degree越小，节点越小、越暗。
Combined_Score越大，连线越粗。
Combined_Score越小，连线越细。

这类规则能把“统计意义”转化为“视觉重点”。
对读者来说，核心基因会更直观。

3.4 用圆形布局突出Hub基因

完成参数设定后，可使用Attribute circle layout-degree。
也就是按Degree值排列成圆圈。

这样做的好处很直接：

最高连接度的基因更容易被识别。
网络层次更清楚。
文章中的图注更容易写。

在课程案例中，权重最大的基因是MYC。
这说明网络的中心性特征可以通过布局和参数设置更清晰地呈现。

4. 用MCODE筛选关键模块

4.1 关键模块比单个节点更有解释力

PPI网络构建步骤不仅要找单个Hub基因，也可以找功能模块。
在疾病机制研究中，模块往往比单个节点更接近真实生物过程。

MCODE插件就是常用工具。
它可以在当前网络中识别高密度连接区域。

4.2 标准筛选流程

知识库中的常用流程是：

安装MCODE插件。
打开Analyze Current Network。
查看评分排序结果。
选择评分靠前的模块。
点击Create Cluster Network。

这样得到的模块图，往往更适合放进结果部分。
它可以帮助你从“全局网络”过渡到“局部机制”。

4.3 什么时候适合用模块分析

如果你的研究已经有明确方向，模块分析会更有价值。
例如：

炎症相关基因簇。
代谢相关基因簇。
细胞周期相关基因簇。

模块的价值在于，它能把分散的互作关系，收束成可解释的生物学单元。

5. 提高PPI网络质量的实战建议

5.1 先标准化，再可视化

很多低质量网络，不是因为数据库不行，而是前处理不到位。
所以建议按这个顺序做：

标准化基因名。
筛选显著基因。
STRING构网。
Cytoscape美化。
MCODE或Hub分析。

顺序错了，后面再怎么修图也难救。

5.2 保持图的简洁度

发表级PPI图有一个共同点。
就是重点突出，信息不过载。

可控制以下内容：

不显示无意义孤点。
不堆叠过多标签。
不滥用颜色。
保留最能说明问题的节点和模块。

5.3 让图服务于结论

PPI网络构建步骤的最终目标，不是做出一张“复杂的图”，而是支持论文结论。
因此，每张图都要回答问题：

哪些基因处于核心位置。
哪些模块可能参与疾病过程。
哪些节点最值得后续验证。

如果图不能回答问题，它就只是装饰。

总结Conclusion

PPI网络构建步骤的核心可以概括为三句话。
先整理好输入基因，再用STRING快速构网，最后用Cytoscape做美化、分析和Hub筛选。
高质量PPI图的关键，不在于软件本身，而在于数据规范、参数选择和图形表达。

如果你正在写论文、做课题或准备结果图，可以直接按本文流程执行。
想进一步节省时间，提升图表规范性，也可以结合解螺旋的产品与课程资源，把PPI网络构建步骤做得更快、更稳、更接近发表标准。

一张完成优化后的发表级PPI网络图，突出Hub基因、关键模块和清晰图例，旁边配有STRING到Cytoscape的工作流简图。