-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于智能手机视频与深度学习的油棕鲜果串(FFB)成熟度检测数据集构建及收获预测研究
《Scientific Data》:Oil Palm Fruits Dataset in Plantations for Harvest Estimation Using Digital Census and Smartphone
【字体: 大 中 小 】 时间:2025年06月11日 来源:Scientific Data 5.8
编辑推荐:
本研究针对油棕种植园鲜果串(FFB)人工计数效率低、误差大的问题,开发了首个包含5种成熟度阶段(未熟、半熟、成熟、开花、异常)的油棕FFB图像数据集。通过智能手机多角度视频采集、CVAT标注及Albumentations数据增强,构建了14,503张图像数据集,并基于YOLOv8模型实现74.5% mAP0.5 的检测精度,为种植园资源优化提供自动化解决方案。
油棕产业面临鲜果串(FFB)人工计数耗时费力、主观性强等痛点,传统方法难以满足大规模种植园精准管理的需求。尽管机器学习技术为自动化检测提供可能,但现有数据集多局限于单一果实或理想环境,缺乏真实种植场景下的遮挡、低对比度等复杂条件数据。这一空白严重制约了收获时间预测、产量估算等关键应用的发展。
针对这一挑战,印尼建国大学的研究团队在《Scientific Data》发表研究,构建了首个覆盖5种成熟度阶段的油棕FFB野外数据集。该研究创新性地采用智能手机环绕拍摄1-3米高油棕树的视频(320×640像素,440段),通过CVAT(Computer Vision Annotation Tool)提取帧图像并标注,最终形成包含14,503张图像的数据集,按70:20:10比例划分为训练/验证/测试集。为解决类别不平衡(未熟类占74.5%),采用Albumentations库进行随机裁剪、翻转、噪声添加等增强。基于该数据集训练的YOLOv8s模型达到74.5% mAP0.5
和48.0% mAP0.5:0.95
,并成功部署至移动端实现实时检测。
数据记录
数据集采集自印尼中加里曼丹商业种植园,包含10,207训练图像(未熟4,990张)、2,896验证图像和1,400测试图像。每张图像均标注COCO格式边界框,涵盖部分可见、低对比度等真实场景挑战。
技术验证
通过消融实验证实数据增强使YOLOv8s的mAP0.5
提升2.6%。对比YOLOv8n(90 FPS)与YOLOv8s(36 FPS)显示,后者以21MB模型尺寸换取更高精度。
结论与意义
该研究填补了油棕FFB野外检测数据集的空白,其突出价值体现在三方面:一是首次系统定义5类成熟度标准并构建真实场景数据集;二是验证了轻量化模型(YOLOv8n仅6MB)在复杂条件下的实用性;三是为收获决策支持系统提供核心数据基础。局限性在于数据仅覆盖1-3米高树木,未来需扩展更高树冠数据。研究成果对实现联合国可持续发展目标中的可持续农业生产具有实践意义。
知名企业招聘