PPI网络分析前，为什么要先筛选和标准化输入基因？

因为输入基因的质量会直接影响网络是否完整、是否过密或过稀，以及Hub基因筛选是否可靠；标准化 SYMBOL、去重并确认物种可减少映射失败和节点缺失。

STRING构建PPI网络时，confidence阈值怎么选更合适？

一般0.4适合初筛，0.7更适合高可信互作分析；阈值过低会让网络过密，过高则可能导致核心模块被切碎。

筛选PPI网络中的Hub基因时，为什么不能只看Degree或单一插件结果？

因为Degree高只说明连接多，不一定代表生物学上关键；更稳妥的方法是结合MCODE找模块、CytoHubba做多算法交叉验证，再结合文献和表型证据判断。

PPI网络分析结果解读，4个实战技巧

作者：Dr.Chuang

2026-05-15｜原创

引言Introduction

PPI 网络分析是解读差异基因或蛋白互作关系的常用方法，但很多人画完网络后，不知道下一步该看什么、怎么筛Hub基因、如何提高结果可信度。本文结合 STRING 和 Cytoscape 的实操流程，拆解 PPI 网络分析 的4个关键技巧，帮助你把网络图真正转化为可解释、可发表的结果。
一张包含STRING网络和Cytoscape界面的科研示意图，突出“基因输入到网络解读”的流程感。

1.PPI网络分析前，先把输入数据选对

1.1 先明确数据来源，再筛基因

做 PPI 网络分析 前，第一步不是打开软件，而是整理输入基因。课程中使用的是 RRA 整合后得到的显著基因文件，常见做法是从 all_signi_result.tsv 中提取 SYMBOL 列，再导入 STRING。

关键点是先控制输入质量。 如果基因列表过长，噪音会明显增加；如果阈值过宽，网络会变得松散，Hub 识别也会失真。课程实操中还提到，若用于 STRING 构网，基因数量通常需要进一步筛选，避免超过数据库处理范围。

1.2 输入格式要标准化

在 PPI 网络分析 中，STRING 和 Cytoscape 都依赖规范化的基因名。最稳妥的方式是只保留标准 SYMBOL，并去重处理。若存在别名、重复项或物种混杂，后续会出现映射失败、节点缺失或网络断裂。

建议执行这3步：

保留标准基因符号。
去除重复项。
确认物种为 Homo sapiens。

这一步看似基础，却直接决定网络是否完整。

2.用STRING构建网络时，阈值比“能不能画出来”更重要

2.1 先理解confidence的意义

在 STRING 中进行 PPI 网络分析 时，课程示例使用了 confidence > 0.4。这代表你在构网前设定了最基本的互作可信度门槛。阈值过低，网络会过密，容易混入弱证据关系。阈值过高，网络可能过稀，核心模块被切碎。

实战上，0.4适合初筛，0.7更适合强调高可信互作。 如果你的目标是发表级图形或核心模块筛选，建议优先采用更严格阈值，再根据结果决定是否下调。

2.2 隐藏孤立节点，提升网络可读性

课程中明确提到一个常用技巧：隐藏未连接的点，去除离散节点。 这一步非常重要。因为孤立节点通常没有互作边，保留它们只会让图形拥挤，干扰主网络结构判断。

在结果解读时，你应重点观察：

节点是否形成明显模块。
是否存在高连接度中心节点。
是否出现多个相互分离的小网络。

如果网络大部分是离散点，说明输入基因之间的已知互作较少，或者筛选阈值需要调整。

2.3 导出时保留表格和高清图

STRING 不只是画图工具。课程中还强调了导出结果表格和高清图片。对论文写作来说，这一步很关键。因为后续你可能需要：

回溯每条边的证据来源。
在 Cytoscape 中二次美化。
补充补充材料中的网络表格。

PPI 网络分析的结果不是一张图，而是一组可追溯的数据。

3.把STRING导入Cytoscape后，重点看三件事

3.1 看节点大小和颜色

课程流程里，STRING 导出的 tsv 文件会被导入 Cytoscape，作为 Network from File。随后再导入属性表，用 Fill color、Shape 等样式进行可视化。

这里的核心不是“美化”，而是“编码信息”。常见做法包括：

用颜色表示上调或下调。
用节点大小表示 Degree 或权重。
用形状区分不同分组。

当一个网络同时承载表达量和拓扑信息时，解读效率会明显提高。

3.2 看Degree，而不是只看连线多不多

在 PPI 网络分析 中，Degree 是最常用的中心性指标之一。课程中提到可通过 NetworkAnalyzer 对网络进行分析，再用 Degree 和 Combined_Score 设置可视化规则。

Degree 高，通常意味着该节点与更多蛋白发生互作，具有更强的网络枢纽属性。 但要注意，Degree 高不等于生物学上一定关键，它只是提示你该节点值得优先验证。

建议优先关注以下几类节点：

高Degree节点。
连接多个模块的桥接节点。
与差异倍数变化一致的节点。

3.3 看布局是否能帮助你发现模块

课程中使用了 Attribute circle layout-degree 进行布局。这个技巧的价值在于，它能把高连接度节点放到更醒目的位置，帮助你快速识别核心区域。

布局的目的不是好看，而是让结构特征可视化。 如果布局后核心节点仍然难以辨认，说明你还需要进一步筛选模块或重设样式参数。

4.筛Hub基因，不要只靠单一插件或单一算法

4.1 MCODE适合找局部高密度模块

课程中明确演示了 MCODE 插件的使用。MCODE 的价值在于，它能在整体网络中寻找局部高密度子网络。对于 PPI 网络分析 来说，这类模块往往更接近功能单元。

适合用MCODE的场景包括：

网络较大，节点较多。
你希望优先找到功能模块。
你要为后续富集分析挑选候选集合。

一般流程是分析当前网络，查看多个 module，再选择得分较高的模块导出。模块不是越多越好，优先看得分高且结构稳定的部分。

4.2 CytoHubba更适合做Hub排序

课程内容还提到 CytoHubba 插件可用多种算法筛选 Hub 基因。它的优势在于方法多，适合交叉验证。不同算法得到的 Hub 可能不完全一致，因此不要只依赖单一排名。

更稳妥的做法是交叉比较多个算法结果，再选稳定重复出现的核心基因。 这样得到的候选 Hub 更可靠，也更符合科研审稿对稳健性的要求。

4.3 MYC这类高权重节点要结合背景解释

课程中提到一个典型结果：通过网络布局和权重分析，能识别出权重较大的基因，如 MYC。这里要注意，识别到高权重基因只是起点，不是结论。

你还需要进一步回答：

它是否在你的疾病模型中已知相关。
它是否与表型、预后或通路富集一致。
它是否能被外部数据库或文献支持。

Hub 基因的价值，来自网络证据和生物学证据的叠加。

5.结果解读时，最容易被忽略的一个原则

5.1 PPI网络只能说明“已知互作潜力”

做 PPI 网络分析 时，很多人会把网络互作直接等同于真实调控。实际上，STRING 依据的是已知和预测相互作用，包含实验、数据库、共表达和文本挖掘等多来源证据。它适合提出假设，但不能替代功能验证。

所以，网络结果应该服务于后续实验，而不是替代实验。

5.2 结果表达要从“图”回到“机制”

一篇高质量结果解读，通常要回答这3个问题：

网络是否形成核心模块。
哪些节点是潜在Hub。
这些Hub是否能解释你的生物学主题。

如果只是简单描述“某些基因连接很多”，价值很有限。更好的写法是把网络结果与差异表达、富集分析、预后分析串起来，形成完整证据链。这也是 ** PPI 网络分析 最有价值的地方。**

5.3 让结果更快落地的工具选择

如果你希望减少重复操作，把 STRING、Cytoscape、模块筛选和图形导出串成标准流程，解螺旋 这类生信实战体系会更适合科研场景。它能帮助你更快完成数据整理、网络构建和Hub筛选，少走很多返工弯路。

对于医学生、医生和科研人员来说，真正省时间的不是“会画图”，而是“能稳定产出可解释结果”。

总结Conclusion

PPI 网络分析的核心，不是把网络图画出来，而是把网络结果解释清楚。 你需要先选对输入基因，再设置合理阈值，随后用 Cytoscape 观察 Degree、模块和布局，最后借助 MCODE 和 CytoHubba 筛出稳定的核心节点。这样得到的结果，才更接近可发表、可验证的科研结论。

如果你正在做差异基因、预后模型或通路机制研究，建议直接按标准流程推进。想减少试错、提升结果质量，可以结合解螺旋 的生信实战课程与工具体系，把 PPI 网络分析做得更快、更稳、更专业。
一张总结型科研流程图，展示“差异基因筛选-STRING构网-Cytoscape分析-Hub基因筛选-实验验证”的闭环路径。