引言Introduction
HPA数据库怎么用 ,很多人第一步就卡在检索入口、图谱切换和证据等级判断上。对医学生、医生和科研人员来说,真正难的不是“有没有数据”,而是“怎么快速找到可用数据,并正确用于论文”。
HPA数据库以人类蛋白表达为核心,整合蛋白质组学、转录组学和系统生物学数据,覆盖正常组织、肿瘤组织、细胞系等信息。如果你想查蛋白表达、组织定位、肿瘤生存曲线,这篇就是实用路线图。
1.HPA数据库是什么,适合谁用
1.1 核心定位:从“查基因”到“看蛋白”
HPA数据库,全称 Human Protein Atlas。它不是单纯的基因检索库,而是一个以“蛋白表达地图”为核心的样本数据库。根据课程资料,它收录了正常组织、肿瘤组织与细胞的蛋白表达情况,也提供肿瘤患者生存曲线。
截至资料中给出的版本信息,HPA数据库提供了 26941 个抗体信息与 17165 个蛋白信息,并覆盖 64 个细胞系、48 种人类正常组织和 20 种肿瘤组织。这意味着它特别适合做表达定位、组织分布和肿瘤相关验证。
1.2 3类用户最常见的使用场景
对不同用户,HPA数据库的价值不一样。
- 医学生 :快速理解某个蛋白主要在哪些组织表达。
- 医生 :辅助判断肿瘤相关标志物的组织表达和预后信息。
- 科研人员 :用于论文图补充、靶点筛选、表达验证和结果交叉印证。
HPA数据库的优势在于界面清晰,结果可视化强,适合从“候选基因”快速推进到“是否值得深入研究”。
2.HPA数据库怎么用:先掌握首页和检索逻辑
2.1 首页有哪些关键入口
打开 HPA数据库首页后,最先要看的是右上角的三个入口。分别是菜单、帮助和新闻。菜单栏里可以查看不同子数据库和相关介绍。帮助适合新手快速确认功能。新闻则用于了解更新内容。
首页中间是检索框。输入基因名后点击 Search,就能进入结果页。如果要缩小范围或提高命中精度,可以点击 Fields 做高级检索。
首页下方还有 6 个图谱导航栏,分别是:
- 组织图谱。
- 单细胞图谱。
- 病理学图谱。
- 脑组织图谱。
- 血液图谱。
- 细胞图谱。
这些图谱不是装饰,而是 HPA数据库的核心入口。不同问题对应不同图谱,先选对入口,后面的效率会高很多。
2.2 最实用的操作顺序
如果你是第一次用 HPA数据库,建议按这个顺序走:
- 先输入基因名,完成简单检索。
- 再看结果页的证据等级。
- 根据研究目的切换到组织图谱、病理学图谱或细胞图谱。
- 需要精筛时再用高级检索。
- 最后下载或保存图片,用于汇报和论文整理。
这一套流程的关键,是先定位,再验证。 不要一上来就钻进复杂筛选条件里。
3.三种检索方式,决定你能不能快速找到结果
3.1 简单检索:最适合入门
简单检索很直接。在首页检索框输入基因名,例如 RBM3,点击 Search,就会进入检索结果页。结果页通常会展示:
- 基因名。
- 基因描述。
- 证据等级。
- 组织图谱结果。
- 细胞系图谱结果。
- 病理学图谱结果。
- 脑组织图谱结果。
- 血液图谱结果。
在结果列表中,还可以通过 show/hide columns 控制显示列。需要导出时,也可以选择 XML、RDF、TSV、JSON 等格式。如果你的目标是快速确认一个蛋白有没有表达,简单检索就够用了。
3.2 证据等级:判断结果可信度的关键
HPA数据库的蛋白水平证据,会用圆形图标表示。课程资料明确给出了四档:
- 整圆,Enhanced。
- 3/4 圆,Supported。
- 1/2 圆,Approved。
- 1/4 圆,Uncertain。
证据等级越高,结果越值得优先参考。 对论文写作来说,这一步非常重要。尤其是做标志物筛选时,建议优先看高证据等级结果,再进一步验证。
3.3 高级检索:适合有明确条件的研究者
如果你已经有明确筛选标准,就用 Fields 进入高级检索。这里可以按多个字段限定结果,例如:
- 基因信息。
- 信息可靠程度。
- 抗体验证方式。
- 主要数据。
- 蛋白证据。
- 其他条件。
课程中以 Reliability score tissue 为例,勾选 Enhanced 后点击 Add,再点击 Search,就能只看高可靠度结果。高级检索的价值,是把“很多结果”变成“可用结果”。
4.按研究问题选图谱,效率会高很多
4.1 组织图谱和病理学图谱,最常用
如果你关心蛋白在正常组织中的分布,就看组织图谱。这里能看到人类蛋白在组织和器官中的表达和定位,还能结合组织切片查看图像信息。
如果你研究肿瘤,就重点看病理学图谱。课程资料指出,这一部分基于 17 种主要癌症类型的转录组系统分析,并提供交互式生存散点图。对于肿瘤标志物、预后分析和图3、Fig.6 类配图需求,这一模块非常实用。
4.2 细胞图谱、脑组织图谱和血液图谱
细胞图谱更适合看细胞内蛋白的空间分布。对于亚细胞定位研究,这个模块很有帮助。
脑组织图谱整合了人类、猪和老鼠的数据,适合神经科学相关研究。血液图谱则提供血液细胞类型和蛋白质组数据,适合免疫和血液学方向。
不同图谱对应不同研究问题。 这是使用 HPA数据库最容易忽略,但也最影响效率的一点。
5.3个常见应用场景,直接对应论文和课题
5.1 查肿瘤和正常组织表达
课程中的应用实例提到,以 CBX1 为例,可以先在病理学图谱中找到肝癌,再查看免疫组化图;随后切换到组织图谱,查看正常肝脏中的表达图。这个流程适合做肿瘤与正常组织对照。
对科研人员来说,这类图常用于:
- 验证候选基因是否具有组织特异性。
- 辅助论文中表达差异展示。
- 为后续实验设计提供依据。
如果你要做 IHC 图或表达总览图,HPA数据库是高频来源。
5.2 查细胞定位和表达水平
课程中还演示了 ORC3 和 RhoA 的检索。前者可用于查看细胞图谱中的定位,后者可用于查看 RNA 表达水平并按表达量排序。
这类功能适合:
- 细胞生物学课题。
- 亚细胞定位研究。
- 候选靶点优先级排序。
5.3 查生存曲线
MMP9、CSF1R、PTPRC 这类基因常用于预后分析。课程中展示了在病理学图谱里进入相关癌种后,查看生存曲线的流程。
对于临床科研,这一步非常关键。 它能帮助你初步判断某个基因是否与预后相关,但仍需结合独立队列和统计分析,不能只凭单一数据库结论下定论。
6.发表和引用时,别忽略这两件事
6.1 必须写明网址
课程资料明确提醒,使用 HPA数据库信息发表文献时,要标明网址:www.proteinatlas.org。这个细节不能省。它属于最基本的规范引用。
6.2 建议同步引用相关文献
资料中列出了 HPA数据库的重要参考文献,包括:
- Thul, P. J. 2017, Science。
- Uhlen, M. 2015, Science。
- Uhlen, M. 2017, Science。
如果你的论文、综述或课题报告使用了 HPA数据库数据,建议同时规范引用原始文献。 这样更符合 E-E-A-T,也更利于审稿沟通。
总结Conclusion
HPA数据库怎么用,核心不是记住每个按钮,而是掌握“检索、筛选、图谱切换、结果验证”四步。对医学生,它适合快速建立表达认知。对医生,它能辅助肿瘤和预后判断。对科研人员,它能提升选题和图表整理效率。先用简单检索找方向,再用高级检索提精度,最后用对应图谱完成验证。
如果你希望把这种数据库检索流程变得更高效,少走弯路,可以结合解螺旋 的科研技能内容和实操资源,系统掌握 HPA数据库的使用方法,把“会查”真正变成“会用”。
- 引言Introduction
- 1.HPA数据库是什么,适合谁用
- 2.HPA数据库怎么用:先掌握首页和检索逻辑
- 3.三种检索方式,决定你能不能快速找到结果
- 4.按研究问题选图谱,效率会高很多
- 5.3个常见应用场景,直接对应论文和课题
- 6.发表和引用时,别忽略这两件事
- 总结Conclusion






