引言Introduction
PPI 网络作图是生信文章里最常见,也最容易拉开差距的一步。很多人会导入基因后直接出图,结果网络太散、信息太弱、Hub 基因不清楚。真正影响图质量的,不只是“能不能画出来”,而是“能不能讲清楚生物学意义”。 
1. 先把输入基因筛干净,避免“垃圾进,垃圾出”
1.1 只用高可信差异基因,减少噪音
做 PPI 网络作图 前,第一步不是打开软件,而是整理输入基因。上游知识库中强调,通常先取显著差异基因,再进入 STRING 构网。这样做的核心原因很简单。输入集合越干净,网络越集中,后续 Hub 基因越有解释价值。
如果基因列表过长、阈值过宽,网络会出现大量游离节点。图看起来“很热闹”,但实际上信息密度低。对论文来说,这种图很难支撑结论。建议优先保留已经经过统计筛选的基因,再进入下一步分析。
1.2 统一基因命名,避免映射失败
PPI 网络作图 最常见的问题之一,是基因名无法正确识别。尤其是 SYMBOL、旧命名、别名混用时,STRING 可能会出现漏配。实际操作中,应先统一命名格式,再导入数据库。
一个实用原则是,在导入前先确认物种、基因符号和重复项。 上游流程里明确提到,STRING 中要选择 Homo sapiens。物种选错,整个网络都会偏离研究目标。对于医学生和科研人员来说,这一步虽然基础,但直接决定结果是否可靠。
1.3 控制基因数量,保持网络可解释
并不是基因越多越好。PPI 网络作图 的目的,是突出关键模块和核心节点,而不是展示一个“很大”的网络。建议优先围绕一个明确问题筛选输入基因。这样更容易得到结构清晰、可发表的图。
如果差异基因过多,可以先做分层处理。例如按上调、下调分别构网,或者只取最显著的一部分。这样后续在 STRING 和 Cytoscape 中更容易识别核心模块。
2. 用 STRING 构建网络,先保证结果真实可靠
2.1 按标准流程导入 STRING
根据知识库,PPI 网络作图 常用 STRING 数据库完成第一步构建。操作流程比较固定。进入官网后,选择 Multiple proteins,把基因列表粘贴到 List of Name 中,再选择物种 Homo sapiens,点击 SEARCH。等待映射完成后,再进入下一步。
这个过程的关键不是快,而是完整。基因未完全加载就直接继续,容易漏掉节点。 知识库中特别提醒,输入基因较多时,不要过早点击 continue,而应等页面更新完成后再进入下一步。
2.2 调整交互阈值,控制网络严谨度
STRING 的强项在于可直接按交互得分筛选网络。上游资料中提到,可修改交互数目后点击 UPDATE,再下载 string_interactions.tsv。对于论文图来说,这一步非常重要。阈值过低,网络会过于松散。阈值过高,网络可能过于稀疏。
因此,PPI 网络作图 时要在“覆盖率”和“特异性”之间做平衡。 如果研究目的是找关键机制,建议优先保留更高置信度的互作。这样后续找 Hub 基因、关键模块时,结果会更稳。
2.3 导出标准文件,方便后续二次美化
STRING 不只是构网工具,也是后续图形处理的输入来源。知识库明确给出两类导出文件。一类是 text output,用于后续导入 Cytoscape。另一类是高清网络图,可作为初步展示图。
这里要注意,STRING 生成的是“基础网络”,真正适合论文发表的高质量图,通常还要经过 Cytoscape 重构。 所以不要把 STRING 当成终点,而要把它看成数据入口。
3. 在 Cytoscape 中美化网络,并筛出核心节点
3.1 导入网络和注释文件,建立可视化层级
PPI 网络作图 的第二个关键环节,是用 Cytoscape 做精修。知识库给出的做法是,先通过 File – Import – Network from File 导入 STRING 下载的 tsv 文件,再通过 File – Import – Table from File 导入基因注释文件。
这一点很重要。因为只有把表达信息、logFC、P 值等属性接进去,网络图才不只是“关系图”,而是能体现生物学变化的结果图。没有属性层,网络图的解释力会明显下降。
3.2 用颜色、大小和布局讲清楚层次
Cytoscape 的优势,在于可以把复杂关系变成可读图形。知识库中提到,可以按 logFC 设置颜色,按 P 值或连接度设置节点大小,再通过布局进行重排。常见做法包括圆形布局、按 degree 排列等。
建议遵循一个清晰原则。
- 颜色表示表达变化。
- 大小表示连接度或统计权重。
- 线条粗细表示互作强度。
这样读者一眼就能看懂谁是核心,谁是辅助节点。对论文审稿人来说,这种图的专业度远高于默认输出图。
3.3 用 MCODE 或 CytoHubba 找 Hub 基因
真正高质量的 PPI 网络作图,不止是漂亮,还要能回答“谁最重要”。知识库中提到,Cytoscape 可以借助 MCODE 筛选关键模块,也可以用 CytoHubba 做 Hub 基因分析。
这类方法的价值在于,它把“主观判断”变成“算法筛选”。例如:
- 先分析当前网络。
- 再按 degree 或其他算法排序。
- 输出关键节点或模块。
Hub 基因不是随便挑出来的,而是连接度高、在网络中更关键的节点。 这种结果更适合写进论文结果部分,也更容易与后续实验验证衔接。
4. 3大关键技巧,决定PPI图能不能发
4.1 技巧一,先筛基因,再画网络
这是最基础,也最容易被忽略的一点。输入不严谨,后面所有步骤都会被拖累。PPI 网络作图 的第一原则,就是保证基因集来源清楚、筛选标准明确。
4.2 技巧二,STRING 负责“构网”,Cytoscape 负责“讲故事”
STRING 的作用是建立互作事实,Cytoscape 的作用是让结果更清楚、更适合论文表达。两者分工不同。不要试图只靠一个软件完成全部工作。先用 STRING 保证可信度,再用 Cytoscape 提升表达力,才是标准流程。
4.3 技巧三,图要服务结论,不要只追求复杂
很多初学者会把图做得很密,但论文真正需要的是“能读懂”。PPI 网络作图 的最终目标,是支持机制推断,突出关键模块和 Hub 基因。网络不在于大,而在于准。
如果你正在做生信文章、机制图或毕业论文,建议把这三步固定成模板:基因筛选、STRING 构网、Cytoscape 精修。这样效率更高,结果也更稳定。
总结Conclusion
PPI 网络作图 并不难,难的是做出“有结论价值”的图。核心逻辑很清晰。先筛好输入基因,再用 STRING 构建互作网络,最后用 Cytoscape 完成可视化和 Hub 基因筛选。只要这三步做到位,网络图就不只是展示图,而是能直接服务论文结果的证据图。
如果你希望把 PPI 网络作图 做得更规范、更适合发表,可以直接使用解螺旋 的生信课程和实操方法,少走弯路,快速建立标准化分析流程。
- 引言Introduction
- 1. 先把输入基因筛干净,避免“垃圾进,垃圾出”
- 2. 用 STRING 构建网络,先保证结果真实可靠
- 3. 在 Cytoscape 中美化网络,并筛出核心节点
- 4. 3大关键技巧,决定PPI图能不能发
- 总结Conclusion






