基于深度学习的作物品种图像识别算法工具Img2Variety发布

作物品种的准确识别是精准育种和种质资源管理的重要基础,同一作物不同品种间表型差异细微,且早期形态特征不稳定,在作物生长早期阶段实现品种的有效区分,对缩短育种周期、提高试验管理效率尤为关键。然而,传统依赖人工经验或分子标记的方法在大规模应用中仍面临成本高、效率受限等问题,与此同时,现有基于叶片图像等局部形态特征的研究主要集中在特定作物或生育阶段,难以满足实际育种场景中多作物、跨生育期的高效识别需求。

近日,国家生物信息中心开发的基于深度学习的作物品种图像识别算法框架Img2Variety正式上线,该研究成果以“Img2Variety: Image-based intraspecific varieties identification across the whole growth period”为题在国际学术期刊Plant Phenomics在线发表。该研究系统评估了该方法在多品种、多生长阶段条件下的识别性能,为利用植物图像开展品种鉴别研究提供了新的技术路径和方案。

Img2Variety以整株作物RGB图像为输入,采用迁移学习策略,对多种经典卷积神经网络模型进行全参数微调训练,以适应品种数量多而单个品种样本有限的植物图像数据特点。针对作物在不同生长阶段和拍摄视角下表型差异较大的问题,本研究提出了生长阶段与多视角混合增强策略,在保持品种标签一致性的前提下扩展训练数据分布。同时,引入自适应交叉熵损失函数,提高模型对易混淆样本的关注度,从而改善品种间的区分效果。研究在两个作物数据集上对Img2Variety进行了验证,包括覆盖全生育期的93个水稻品种共11,170张图像,以及涵盖9个生长阶段的224个玉米自交系共5,599张图像。实验结果显示,Img2Variety在水稻和玉米数据集上的最高识别准确率分别达到88.66%和79.95%,并在部分早期生长阶段(水稻抽穗前、玉米十叶期)取得了80%以上的识别准确率。在此基础上,该方法在六个基准网络上均表现出一致的性能提升,在水稻和玉米数据集上的识别准确率分别平均提升15.09个百分点和34.65个百分点,表明Img2Variety不仅对不同网络结构具有良好的适应性,同时在不同作物类型上也具备稳定的泛化能力。

研究结果表明,结合迁移学习、多阶段图像信息和针对性训练策略的深度学习方法,在作物品种精细识别研究中具有一定应用潜力。相关方法和工具已通过网页平台对外开放(https://ngdc.cncb.ac.cn/opia/img2variety),为后续算法比较、方法改进及相关研究提供支持。

国家生物信息中心博士研究生曹永荣为本文第一作者,田东梅高级工程师和宋述慧研究员为共同通讯作者。该研究得到了中国科学院战略性科技先导专项、国家重点研发计划-生物与信息融合专项(BT与IT融合)、农业生物育种国家科技重大专项等支持。

Img2Variety框架设计


论文链接

附件下载: