引言Introduction

PPI网络构建步骤看似简单,真正难点在于数据整理、参数选择和图形呈现。很多初学者能跑出网络,却做不出可发表的高质量图。本文用STRING和Cytoscape的标准流程,拆解PPI网络构建步骤,帮助医学生、医生和科研人员少走弯路。
STRING数据库与Cytoscape联合构建PPI网络的流程示意图,包含基因列表、互作连线和Hub基因高亮展示。

1. 明确PPI网络的输入数据

1.1 先准备差异基因列表

PPI网络构建步骤的起点,不是直接开软件,而是先整理输入数据。常见做法是从差异分析或整合分析结果中,筛选出显著基因,再提取SYMBOL列用于后续分析。

核心原则是,输入必须干净、统一、可追溯。
如果基因命名混乱,后面的STRING检索和Cytoscape导入都会出问题。

在实操中,建议先确认三点:

  • 基因符号是否标准化。
  • 是否已经完成显著性筛选。
  • 是否保留了原始结果文件,方便回溯。

1.2 网络图至少要有两列

在Cytoscape里,任何复杂网络都可以看成节点和边的组合。
因此,基础数据至少要包含两列。

  • 第一列是源节点,常写作node1。
  • 第二列是靶节点,常写作node2。

同一行代表两个蛋白之间存在互作关系。
如果还要叠加表达量、上调下调、Combined Score等信息,可以额外准备属性表。

1.3 先想清楚你要展示什么

PPI网络构建步骤并不只是“画图”。
你需要先明确目的。

常见目标有三类:

  • 找核心基因。
  • 找关键模块。
  • 给文章中的机制部分提供支撑。

如果目标是筛Hub基因,后面就要重点考虑Degree等网络指标。
如果目标是模块筛选,就要提前准备MCODE分析思路。

2. 用STRING快速构建PPI网络

2.1 STRING是最常用的起点

在现有流程中,STRING是构建PPI网络最常用、也最方便的数据库之一。
它适合先做初筛,再导出结果给Cytoscape二次美化。

标准做法是:

  1. 打开STRING网站。
  2. 进入Multiple proteins分析页面。
  3. 粘贴基因列表。
  4. 物种选择人。
  5. 提交后生成互作网络。

这一步的关键不是“跑出来”,而是“跑得准”。

2.2 参数设置决定网络质量

在PPI网络构建步骤中,参数设置很重要。
知识库中的常用做法是设置 confidence > 0.4。

这个阈值的意义在于:

  • 太低,网络会过于松散。
  • 太高,可能丢失部分潜在互作。

0.4通常可作为基础分析的起点。
后续是否提高阈值,要根据研究问题和图形稠密度决定。

2.3 处理孤立节点,让图更干净

STRING默认生成的网络中,常会出现一些游离点。
这些点不一定有助于文章表达,反而会让图面变乱。

可根据需要:

  • 隐藏未连接节点。
  • 去除离散点。
  • 再更新网络视图。

这样做的目的,是提升可读性,而不是改变核心生物学结论。

2.4 导出高清图和文本结果

完成基础网络后,建议导出两类文件。

  • 高清位图,用于文章展示。
  • text output表格,用于导入Cytoscape。

这一步很重要。
因为STRING负责“快速构建”,Cytoscape负责“深度优化”。
两者配合,通常更适合发表级图表。

3. 用Cytoscape完成网络美化与核心基因筛选

3.1 导入STRING结果文件

Cytoscape是PPI网络构建步骤里最重要的美化和分析工具。
它能把STRING导出的互作表格重新构建成更适合论文的网络图。

操作顺序很清晰:

  1. 打开Cytoscape。
  2. 选择File。
  3. 点击Import。
  4. 选择Table from File或Network from File。
  5. 导入STRING下载的tsv文件。

导入时要确认:

  • node1和node2对应正确。
  • 节点颜色设置无误。
  • 网络结构已经完整生成。

3.2 用Style统一视觉规则

初步网络生成后,不要急着导出。
先进入Style进行美化。

常见调整包括:

  • 节点大小。
  • 节点颜色。
  • 连线粗细。
  • 标签显示方式。

网络图的目标不是花哨,而是让重点一眼可见。
如果表达数据更重要,可以让节点颜色映射表达量。
如果互作强度更重要,可以让线条粗细映射Combined Score。

3.3 用NetworkAnalyzer读取网络指标

在Cytoscape中,可通过NetworkAnalyzer进行网络分析。
知识库中强调,常用的可视化逻辑包括:

  • Degree越大,节点越大、越亮。
  • Degree越小,节点越小、越暗。
  • Combined_Score越大,连线越粗。
  • Combined_Score越小,连线越细。

这类规则能把“统计意义”转化为“视觉重点”。
对读者来说,核心基因会更直观。

3.4 用圆形布局突出Hub基因

完成参数设定后,可使用Attribute circle layout-degree。
也就是按Degree值排列成圆圈。

这样做的好处很直接:

  • 最高连接度的基因更容易被识别。
  • 网络层次更清楚。
  • 文章中的图注更容易写。

在课程案例中,权重最大的基因是MYC。
这说明网络的中心性特征可以通过布局和参数设置更清晰地呈现。

4. 用MCODE筛选关键模块

4.1 关键模块比单个节点更有解释力

PPI网络构建步骤不仅要找单个Hub基因,也可以找功能模块。
在疾病机制研究中,模块往往比单个节点更接近真实生物过程。

MCODE插件就是常用工具。
它可以在当前网络中识别高密度连接区域。

4.2 标准筛选流程

知识库中的常用流程是:

  1. 安装MCODE插件。
  2. 打开Analyze Current Network。
  3. 查看评分排序结果。
  4. 选择评分靠前的模块。
  5. 点击Create Cluster Network。

这样得到的模块图,往往更适合放进结果部分。
它可以帮助你从“全局网络”过渡到“局部机制”。

4.3 什么时候适合用模块分析

如果你的研究已经有明确方向,模块分析会更有价值。
例如:

  • 炎症相关基因簇。
  • 代谢相关基因簇。
  • 细胞周期相关基因簇。

模块的价值在于,它能把分散的互作关系,收束成可解释的生物学单元。

5. 提高PPI网络质量的实战建议

5.1 先标准化,再可视化

很多低质量网络,不是因为数据库不行,而是前处理不到位。
所以建议按这个顺序做:

  1. 标准化基因名。
  2. 筛选显著基因。
  3. STRING构网。
  4. Cytoscape美化。
  5. MCODE或Hub分析。

顺序错了,后面再怎么修图也难救。

5.2 保持图的简洁度

发表级PPI图有一个共同点。
就是重点突出,信息不过载。

可控制以下内容:

  • 不显示无意义孤点。
  • 不堆叠过多标签。
  • 不滥用颜色。
  • 保留最能说明问题的节点和模块。

5.3 让图服务于结论

PPI网络构建步骤的最终目标,不是做出一张“复杂的图”,而是支持论文结论。
因此,每张图都要回答问题:

  • 哪些基因处于核心位置。
  • 哪些模块可能参与疾病过程。
  • 哪些节点最值得后续验证。

如果图不能回答问题,它就只是装饰。

总结Conclusion

PPI网络构建步骤的核心可以概括为三句话。
先整理好输入基因,再用STRING快速构网,最后用Cytoscape做美化、分析和Hub筛选。
高质量PPI图的关键,不在于软件本身,而在于数据规范、参数选择和图形表达。

如果你正在写论文、做课题或准备结果图,可以直接按本文流程执行。
想进一步节省时间,提升图表规范性,也可以结合解螺旋的产品与课程资源,把PPI网络构建步骤做得更快、更稳、更接近发表标准。

一张完成优化后的发表级PPI网络图,突出Hub基因、关键模块和清晰图例,旁边配有STRING到Cytoscape的工作流简图。