引言Introduction

做蛋白表达分析时,很多人会卡在“去哪查、怎么看、怎么引用”。proteinatlas数据库 正是面向这一痛点的权威工具。它整合蛋白质组学、转录组学和系统生物学数据,能快速查看蛋白在组织、细胞和肿瘤中的表达情况。
科研人员在电脑前检索Human Protein Atlas数据库,屏幕展示组织图谱、蛋白检索和表达热图界面

1. 认识ProteinAtlas数据库的核心价值

1.1 它是什么

proteinatlas数据库 ,即 Human Protein Atlas,简称 HPA。它最早于 2005 年发布,由斯德哥尔摩皇家理工学院、乌普萨拉大学等机构合作建设。到 2020 年 11 月 19 日,网站已发布 20.0 版本,收录了 26941 个抗体信息和 17165 个蛋白信息。

它的核心价值很明确。它不是单一的基因检索库,而是一个样本数据库。
你可以查正常组织、肿瘤组织、细胞表达,也可以查看肿瘤患者生存曲线。

1.2 适合哪些人用

对医学生来说,它适合做基础认知。对医生和科研人员来说,它更适合用于:

  • 候选标志物的表达验证
  • 正常组织与肿瘤组织对比
  • 亚细胞定位分析
  • 预后相关性初筛
  • 论文图表补充证据

如果你的研究涉及蛋白是否表达、表达在哪里、在肿瘤中是否异常,proteinatlas数据库几乎是必查工具。

2. 第一步:先看懂主页和图谱入口

2.1 主页上有哪些关键信息

进入 proteinatlas数据库首页后,先看三个位置。右上角是菜单、帮助和新闻。中间是检索框,可直接输入蛋白名。下方是图谱导航栏。

这些入口对应的功能很清楚:

  • 组织图谱
  • 细胞图谱
  • 病理学图谱
  • 脑组织图谱
  • 血液图谱
  • 代谢图谱

这一步的重点不是乱点,而是先确认你要解决的问题属于哪一类图谱。

2.2 如何选择图谱

如果你关注正常器官分布,优先看组织图谱。
如果你关注亚细胞定位,优先看细胞图谱。
如果你关注肿瘤表达和预后,优先看病理学图谱。

例如,HPA 提供每一种蛋白在 64 个细胞系、48 种人类正常组织和 20 种肿瘤组织中的表达情况。这个覆盖面,足够支持多数初筛工作。

3. 第二步:掌握蛋白检索和结果页阅读

3.1 简单检索怎么做

在检索框输入基因名,例如 RBM3,点击 Search,就能进入结果列表。列表通常包含:

  • 基因名
  • 基因描述
  • 证据等级
  • 组织图谱
  • 细胞类型
  • 病理学图谱
  • 脑组织图谱
  • 血液图谱
  • 细胞图谱

这一步的关键,是先看证据等级,再看表达结果。
HPA 中常见的证据等级包括 Enhanced、Supported、Approved 和 Uncertain,从高到低不同圆形标识有所区别。读图时不要只盯着表达强弱,要先判断数据可靠性。

3.2 结果页怎么判断是否值得继续看

点击感兴趣的条目,会进入 SUMMARY 页面。这里是总览页,适合快速判断该蛋白是否值得深入分析。

建议你按这个顺序读:

  1. 先看总览结论。
  2. 再看组织表达是否有明显特异性。
  3. 再看病理学图谱是否存在肿瘤相关变化。
  4. 最后看对应图片和原始证据。

如果一个蛋白在正常组织和肿瘤组织中的差异清晰,且证据等级较高,它才更适合作为后续验证候选。

4. 第三步:用高级检索提高筛选效率

4.1 为什么需要高级检索

当你面对一批候选蛋白时,简单搜索效率不够。此时就要用 Fields 进入高级检索。你可以进一步限定条件,比如按可信度筛选。

教程中给出的示例是按 Reliability score tissue 选择 Enhanced,再点击 add 和 search。
这类操作的意义很直接。它能把低可信度结果先筛掉,让你把时间用在更有价值的蛋白上。

4.2 适合哪些场景

高级检索特别适合以下场景:

  • 做高通量筛选后的候选验证
  • 需要限定组织来源
  • 需要限定证据等级
  • 需要做文献前的快速排查

对于科研人员来说,这一步往往决定后续效率。因为 proteinatlas数据库的数据量大,会筛选,才算真正会用。

5. 第四步:把数据库信息转成可用证据

5.1 怎么用于科研写作

HPA 的价值不仅在“查到”,更在“能写进文章”。常见用法包括:

  • 作为候选蛋白表达证据
  • 作为正常与肿瘤对照参考
  • 作为亚细胞定位支持
  • 作为生存分析的初步依据

例如,教程中提到 CBX1 在肝癌与正常肝脏组织中的免疫组化结果对比,可用于辅助判断其在肝癌研究中的表达特点。MMP9 的病理学图谱还可进一步查看生存曲线。这类信息对论文结果部分很有帮助。

5.2 引用时要注意什么

使用 HPA 数据库发表文章时,要注意标明网址 www.proteinatlas.org ,并引用相关文献。常见参考包括:

  • Thul et al., 2017, Science
  • Uhlen et al., 2015, Science
  • Uhlen et al., 2017, Science

这是学术规范,不是可选项。
如果你在论文、综述或课题标书中使用了 HPA 数据,规范引用能提升可信度,也能避免学术表达上的瑕疵。

总结Conclusion

掌握 proteinatlas数据库,其实就是掌握四件事:先认清图谱入口,再学会基础检索,接着用高级检索提高效率,最后把结果转化为可引用证据。对医学生、医生和科研人员来说,这套流程足够支持大多数蛋白表达分析场景。
论文写作场景中,屏幕展示Human Protein Atlas结果页、引用文献格式和肿瘤组织表达图,旁边放有实验记录本

如果你希望更快上手 HPA 的检索逻辑、结果解读和论文引用,欢迎关注解螺旋的数据库实操内容。 我们会持续提供更适合科研场景的工具型教程,帮助你少走弯路,更快把数据库证据转成高质量研究结果。