david数据库主要能做什么？

主要用于GO富集分析、KEGG通路分析和基因ID转换。

使用david数据库前最重要的准备是什么？

先确认基因ID类型和物种是否正确，避免因ID选错导致匹配失败。

david数据库富集分析时应该重点看哪些结果？

重点看多重校正后的p值、命中基因数和与研究主题相关的通路条目。

david数据库：3步快速上手指南

作者：Dr.Xi

2026-05-14｜原创

引言Introduction

david数据库 是做GO、KEGG富集分析和ID转换时常用的工具。很多医学生和科研人员卡在第一步，不知道怎么上传基因列表、选物种、选分析类型。本文用3步拆解，让你快速完成一次标准分析。
一张DAVID数据库主页或分析流程示意图，突出“Start Analysis”“Gene List”“Functional Annotation Tool”等关键入口。

1. 认识david数据库的核心用途

1.1 它能解决什么问题

david数据库 全称是 The Database for Annotation, Visualization and Integrated Discovery。它的核心价值，是把基因列表映射到生物学注释条目，再做统计富集分析。

常见用途主要有三类。

GO富集分析。
KEGG通路分析。
基因ID转换。

对于差异基因、候选基因集、家族基因列表，david数据库 都适合做初筛和功能归类。它特别适合“拿到一串基因后，不知道它们在生物学上意味着什么”的场景。

1.2 使用前先明确输入类型

上传前最重要的一点，是先确认你的基因ID类型。
如果输入的是基因符号，就要在Step2选择 OFFICIAL_GENE_SYMBOL 。
如果是芯片探针，则应按平台选择对应ID类型，比如 Affymetrix 或 Agilent 相关ID。

ID类型选错，是最常见的失败原因之一。
它会导致匹配失败、结果缺失，甚至富集不到有效条目。

2. 第一步，上传基因列表并完成基础设置

2.1 进入分析页面

打开浏览器，输入 DAVID 官方网址。进入主页后，点击 Start Analysis 。这一步会进入数据上传页面，也是整个流程的起点。

在上传页面，你可以选择两种方式输入基因列表。

直接复制粘贴。
上传文本文件。

需要注意，文件应为制表符分隔文本。并且，DAVID默认只识别第一列数据。每行建议只放一个基因或蛋白名称。如果是复制粘贴输入，也不要只输入单个基因，因为这类输入很难得到有意义的富集结果。

2.2 设置物种和用途

在Step1输入你的基因列表后，进入Step2选择ID类型。随后在Step2a选择物种。
如果分析人类基因，可直接输入 Homo sapiens 或 ** 9606**，下方会自动出现候选项，选择 human 即可。

接着在Step3选择用途。

做GO/KEGG富集，选 Gene List 。
作为背景基因集，选 Background 。

如果你的目标是功能分析，绝大多数情况下都应选择 Gene List。

2.3 提交后先核对再继续

完成设置后，点击 Submit List 。页面刷新后会进入上传列表查看页面。此时先检查三件事。

物种是否正确。
基因列表是否完整。
Step1是否显示已成功提交。

确认无误后，选中对应的列表，例如 List_1，点击 Use 。然后在Background处再次确认物种信息，最后点击 Use 。
这一步看似简单，但它决定后续分析是否基于正确的数据基础。

3. 第二步，进行GO/KEGG富集分析

3.1 打开功能注释工具

在列表确认页面，点击右侧 Functional Annotation Tool ，即可进入富集分析界面。进入后，DAVID会默认勾选部分分析项。正式分析前，建议先取消默认勾选，或直接点击 Clear All 。

这一步很关键。
因为默认选项不一定等于你真正想要的分析集合。对于论文和汇报，最好只保留你需要的条目。

3.2 勾选GO和KEGG分析项

如果你的目标是标准GO/KEGG分析，需要勾选以下内容。

Gene_Ontology 下的 GOTERM_BP_DIRECT 。
GOTERM_CC_DIRECT 。
GOTERM_MF_DIRECT 。
Pathways 下的 KEGG_PATHWAY 。

勾选后，点击 Functional Annotation Chart 。系统会输出富集结果表。

结果表里最值得关注的参数有这些。

条目名称。
命中基因数。
命中比例。
EASE分数，也就是改良后的 Fisher 精确检验 p 值。
Benjamini校正后的 p 值。

通常优先关注校正后的显著性，而不是只看原始p值。
这对多重比较尤其重要。

3.3 如何读懂结果表

DAVID返回的表格可以帮助你快速判断基因集的功能倾向。比如某一通路里命中基因较多，且校正后p值显著，就说明该通路可能与输入基因集高度相关。

你还可以进一步查看。

每个富集条目包含哪些基因。
富集条目的来源。
是否还能继续查看相关条目。

如果你需要发表级别作图，建议把结果下载后再用 Excel、GraphPad Prism 或 R 进行整理和可视化。DAVID负责发现富集信号，后续软件负责完成规范化展示。

4. 第三步，做ID转换并导出结果

4.1 什么时候需要ID转换

很多数据来源不统一。RNA-seq结果可能是gene symbol，芯片数据可能是探针ID，蛋白组又可能是不同命名体系。
这时就需要用 david数据库 的 Gene ID Conversion Tool 先统一ID。

在列表上传成功后，点击右侧 Gene ID Conversion Tool 。系统默认会尝试转换为 ENTREZ_GENE_ID 。你也可以按研究需要选择其他类型。
然后再次确认物种，点击 Submit to Conversion Tool 。

4.2 重点看哪些转换信息

转换结果页会显示多个关键信息。

输入ID总数。
是否被DAVID收录。
转换是否成功。
是否存在模糊匹配。
转换后的ID。
DAVID收录的基因名称。

如果显示 Successful ，说明转换成功。
如果是 Pending ，表示匹配结果不够明确，需要进一步确认ID类型。
如果是 None ，则说明该ID没有成功映射。

对于批量分析，先统一ID再做富集，是最稳妥的流程。
这能减少因命名不一致带来的漏检。

4.3 下载并保存结果

在结果页点击 Download Files ，右键选择链接另存为，即可把结果保存为文本文件。
下载后用 Excel 打开，可以直接看到转换前后ID、物种信息，以及DAVID数据库收录名称。

这一步适合做两类工作。

备份分析过程。
方便后续复核和制图。

5. 实操建议，提升david数据库分析可靠性

5.1 先检查输入质量

david数据库 对输入质量很敏感。建议在上传前先统一命名规则，去掉重复项，并确认物种一致。
如果是人类数据，就不要混入其他物种基因。
如果是家族基因分析，例如CASP家族，先确认列表完整，再上传。

5.2 富集分析要控制阈值

DAVID允许调整富集阈值和显示参数。分析时不要只追求“结果多”，而要追求“结果稳”。
建议重点看以下几类结果。

经过多重校正后仍显著的条目。
与研究主题高度相关的通路。
命中基因较集中、逻辑链条清晰的条目。

显著不等于有生物学意义，必须结合课题背景解释。

5.3 结果展示要回到研究问题

如果你是做机制研究，GO可帮助你概括功能方向。
如果你是做通路研究，KEGG更适合讲清信号轴。
如果你是做转化或临床关联，建议把富集结果和表型、分组信息结合分析。

david数据库的价值，不只是出结果，而是帮助你形成可解释的研究假设。

总结Conclusion

david数据库 的上手逻辑很清晰。先上传基因列表，再做GO/KEGG富集，最后按需完成ID转换和结果导出。只要把ID类型、物种和分析用途选对，大多数常规分析都能快速完成。
一张三步流程总结图，包含“上传基因列表”“功能富集分析”“ID转换与下载结果”三个模块，风格简洁专业。

如果你希望把 DAVID 分析流程做得更高效、更规范，建议结合 解螺旋 的数据库与科研工具内容，进一步提升数据整理、富集解读和结果展示效率。对于医学生、医生和科研人员来说，这会直接节省重复试错时间。
下一步，就从一次规范的 dvid数据库分析开始。