国家生物信息中心发布更新版人类长非编码RNA表达数据库LncExpDB 2.0

近日,国家生物信息中心发布全新升级的人类长非编码RNA(long non-coding RNA,lncRNA)表达库LncExpDB 2.0,相关成果以“Charting the expression landscape of human long non-coding RNAs across diverse biological contexts with LncExpDB 2.0”为题在学术期刊Nucleic Acids Research在线发表。

LncRNA通过多种分子机制调控人类生命与健康相关的重要生物学过程,是RNA功能研究的重要对象,也是药物开发和治疗策略中极具潜力的靶点分子。然而,人类基因组中大量lncRNA的功能仍不清楚,这已成为当前人类基因组注释所面临的核心挑战之一。LncExpDB 数据库于2021年首次发布,致力于系统刻画多生物学场景中人类 lncRNA 的表达丰度、宽度、潜力,鉴定不同生物学场景下的lncRNA功能特征,构建lncRNA与mRNA的共表达网络,为lncRNA的功能研究提供全面的表达图谱和可靠的候选靶点。为全面覆盖lncRNA相关的生物学场景,系统解析lncRNA的功能特征,推动高质量数据集建设,全面升级了LncExpDB数据库。

升级版数据库LncExpDB 2.0新增了免疫治疗、衰老、代谢疾病、神经退行性疾病、生殖、创伤愈合的生物学场景的表达谱数据,生物学场景总数拓展至15个,包含2,662个样本和374种生物学条件。基于这些丰富的表达谱数据,鉴定了44,752个具有高表达潜力的lncRNA基因和39,253个具有功能特征的lncRNA基因,以及35,188,816对lncRNA–mRNA共表达关系。同时,提供了肿瘤免疫微环境特征、衰老相关表达轨迹、生殖相关基因聚类、伤口愈合响应模式以及功能富集的分析结果和可视化展示。为满足用户的个性化分析需求,升级版推出了LncNet(lncRNA–mRNA互作网络可视化与功能预测)与LncImm(lncRNA–免疫检查点关联分析)两个在线分析工具,帮助用户以更直观、交互的方式深入探索lncRNA的潜在作用机制。最后,数据库还提供了一套标准化的RNA-seq数据分析流程,支持构建可重复的表达谱,并便于用户在本地复现与数据库一致的数据处理过程。

作为探索人类基因组“暗物质”功能的重要数据资源系统,LncExpDB 2.0将在lncRNA功能预测、疾病相关lncRNA筛选、复杂性状调控机制解析等研究中发挥重要作用,为生命科学基础研究与转化医学发展提供强有力的数据支撑。

国家生物信息中心博士研究生齐跃为本文第一作者,章张研究员与马利娜研究员为共同通讯作者。该研究得到了国家自然科学基金及中国科学院青年创新促进会项目资助。

LncRNA 基因多生物学场景表达图谱与功能解析


论文链接


附件下载: