近日,福建农林大学农业人工智能研究院具身智能课题组在《Computers and Electronics in Agriculture》期刊发表题为“Accurate localization of fruit targets and picking points with multi-dimensional attention and dynamic upsampling”的研究成果。
![]()
该研究针对复杂农业环境中果实形态多变、采摘点区域微小、遮挡及背景干扰强等挑战,研究团队提出基于多维注意力与动态上采样的MDAD-YOLO 检测模型。该模型在特征增强阶段耦合区域感受野注意力与通道—空间联合注意力,提升对果实及采摘点的跨尺度/跨通道感知;在颈部结构中引入坐标注意力,提高果梗等细粒度结构的空间定位精度,并采用动态像素重组替代传统插值,上采样过程中更好地保留细节。最后通过级联自适应细粒度通道注意与位置敏感注意,实现通道依赖关系的多层级建模,并协同强化空间上下文表征。实验在辣椒和茄子跨数据集中克服了多种果实姿态和不同光照影响,在性能和精度上取得了SOTA。
![]()
MDAD-YOLO在辣椒和茄子多个数据集中实现了果实和采摘点精准定位
这项研究成果为实现高效、精准的果蔬自动化采摘提供了核心的视觉感知方案,有望解决农业生产中劳动力短缺和成本上升的痛点。未来,该技术可被集成到农业机器人或智能采摘装备中,直接应用于温室、果园等复杂环境。
![]()
第一作者
黄艺坤,福建农林大学计算机与信息学院2023级博士生,主要研究方向为具身智能、计算机视觉等。以第一作者在《Computers and Electronics in Agriculture》等期刊上发表多篇学术论文。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.