国家生物信息中心数据集入选国家数据局首批高质量数据集典型案例

8月28日,国家数据局在2025中国国际大数据产业博览会上正式发布了首批高质量数据集典型案例入选名单,由中国科学院科技基础能力局推荐、国家生物信息中心申报的“面向人群复杂特征的高质量DNA甲基化数据集”入选。该数据集涵盖近300类人群复杂特征,收录超18万标准化的高质量DNA甲基化图谱,已应用于国内外多个疾病与衰老预测和药物靶点识别智能模型构建,将进一步支撑人工智能在健康监测与预警、疾病早诊与分型、精准治疗与干预、预后预测与评估等方面赋能应用,推动“人工智能+”行动在生命科学领域的深入落地实施。

高质量数据集是指经过采集、加工等数据处理,可直接用于人工智能模型开发训练的数据集合,有效提升模型性能。本次活动共征集到行业部委、地方数据管理部门及央企总部推荐报送的有效案例663份,按照“优中取优、突破示范引领、注重推广价值、确保可复制性”原则,经多轮专家评审,最终遴选出具有推广示范价值的104个典型案例,作为首批高质量数据集案例发布。

附件下载: