APPS | 基于深度卷积神经网络的孟加拉国水稻品种图像分类|种植

分享至

本文系Agricultural Products Processing and Storage原创编译，欢迎分享，转载请授权。

Introduction

近年来，图像处理与机器学习（ML）的结合给农业带来了显著变革，在传统劳动密集型行业中提高了精度、效率和自动化水平。从检测识别植物病害到评估质量，基于图像的计算方法正在重塑农业技术的格局。在这些发展中，深度学习（DL）以其出色的能力脱颖而出，能够执行复杂的视觉任务，如目标检测、定位和分类，精度接近人类水平。随着全球农业系统面临需求增长和资源减少的压力，人工智能（AI）的整合已成为智能和精准农业的关键推动因素。

水稻供养着世界半数以上的人口，在农业、文化和经济中扮演着至关重要的角色，尤其在亚洲。水稻种植已有数千年历史，适应不同地区的水稻品种超过10万个。在孟加拉国，水稻是粮食安全和农村生计的关键，全年在超过1 170万公顷（约占耕地面积的77%）的土地上种植。然而，在全球超过4万个按谷粒大小分类的品种中，快速、准确、大规模地识别水稻品种具有挑战性。正确的品种识别对于供应链、市场、消费者信任和防止欺诈至关重要。传统方法（主要是人工方式）不可靠、主观、耗时且容易出错。因此，对自动化、智能解决方案的需求从未如此迫切。计算机视觉和AI（尤其是DL）的进步为农业自动化和谷物分类开辟了新的前沿。

深度卷积神经网络（CNN）作为当代计算机视觉的基础，为这一问题提供了优雅的解决方案。通过学习图像中的层次化信息，CNN可以分辨出谷物形态、纹理和色度上的细微差异，这些差异通常是人眼难以察觉的。随着迁移学习和ResNet、视觉几何组（VGG）、Xception、AlexNet、DenseNet等强大的预训练架构的出现，农业图像分类的性能基准已达到新的高度。研究反复证明了这些模型在实际应用中的优势。例如，Kelishami等人利用微调的ResNet模型，通过手机拍摄的图像准确地对波斯水稻品种进行了分类。该研究不仅展示了基于移动设备的水稻品种检测的技术可行性，还强调了其对消费者食品选择体验和农业技术的更广泛影响。类似地，Sharma等人证明，在各种指标上，深度学习模型始终优于传统机器学习方法。在该研究中，与其他深度学习模型（包括CNN、Deep CNN、AlexNet2、Xception、Inception V3和DenseNet121）相比，ResNet50表现良好。Razavi等人强调了使用ResNet进行迁移学习如何成功区分视觉上相似的水稻品种，而Priya等人提出的DeepRiceTransfer模型则强调了迁移学习在作物分类中的鲁棒性。除了分类，CNN在水稻表型分析和病害检测等任务中也显示出潜力，进一步强调了它们在农业领域的多功能性。尽管已有一般性的水稻分类研究，但针对商业上至关重要的孟加拉国品种（Basmati、Chinigura、Jirashail、Kataribhog和Paijam）进行现代CNN架构的比较基准研究，在文献中仍然缺失。

因此，本研究旨在检验深度学习架构在分类5 个流行孟加拉国水稻品种（Basmati、Chinigura、Jirashail、Kataribhog和Paijam）时的有效性。这些品种不仅具有农业重要性，还具有特定的烹饪和商业价值。准确识别这些谷物对于维持质量标准、打击本地和国际市场上的假冒行为至关重要。在此背景下，本文的研究追求两个核心目标：1) 在受控成像条件下使用中等规模数据集，评估广泛采用的CNN模型（VGG16、VGG19、ResNet50、Xception和DenseNet）的分类性能；2) 将这些预训练模型与一个自定义构建的深度学习框架（BDriceNetworkV0）进行比较，评估它们在实际部署中的相对优势。这项工作的意义不仅在于其方法论上的贡献，还在于其实际应用。在工业环境中使用此类模型可以改变谷物分选方式、削减运营成本并保持稳定的质量控制。此外，这些方法本身具有可扩展性，并且可以适应边缘计算，实现实时分析，并在谷物类型和特征模式（如香气、营养成分）方面具有更广泛的适用性。总之，本研究通过对基于CNN的架构进行严格的基准测试，解决了一个具有国家重要性的实际问题，从而为农业AI的扩展前沿做出了贡献。通过对既有模型和自定义模型进行平衡评估，本研究阐明了AI驱动的谷物分类的可能性，以及其在支持孟加拉国农业部门的粮食安全、供应链透明度和技术创新方面的更广泛作用。

结果与讨论

训练动态与收敛

表2水稻品种分类所用深度卷积神经网络模型的训练轮次与超参数设置

本研究对所选所有模型采用统一训练参数框架，并根据各模型架构特性进行针对性调整，各模型超参数设置详见表2。所有模型均采用32的批量大小，结合Adam优化器开展训练；为平衡训练稳定性与收敛速率，差异化设置学习率：VGG16、VGG19及DenseNet的学习率设为0.000 001，ResNet50与Xception设为0.000 01，自定义模型BDriceNetworkV0则设为0.000 1。

训练周期数依据各模型验证阶段的收敛行为动态确定，存在显著差异：VGG16需21 个周期完成收敛，而DenseNet需40 个周期，这一差异表明，深层网络因架构复杂度更高，需更多迭代次数才能实现稳定学习。自定义模型BDriceNetworkV0的训练周期为29 个周期，在训练时长与泛化性能之间达成良好平衡。VGG16训练周期较少，主要源于其相较于DenseNet更浅的架构；但与DenseNet、ResNet等更复杂的网络相比，VGG16在特征表示能力上存在局限性，而深层网络通过更深的网络层次与特征重用机制，显著增强了对数据中复杂模式的捕获能力。

模型性能比较

各CNN模型的泛化能力与收敛性能存在显著差异，其中VGG19表现最为优异且稳定，其训练损失（0.019 0）、验证损失（0.014 2）均为最低，同时验证准确率高达99.40%（图9），表明该模型学习曲线稳健，过拟合程度极低，这一结论也得到其训练与验证损失、准确率曲线紧密对齐的支撑。VGG16的验证准确率略低（99.07%），但性能稳定且损失值适中，进一步印证了其适用于轻量级应用场景的特性。

尽管ResNet50以其独特的残差学习能力著称，但在所有预训练模型中，其验证准确率相对较低（98.67%），且验证损失最高（0.044 5），提示该模型可能存在欠拟合现象，或与本研究数据集的特定特征适配性较差。值得注意的是，DenseNet与Xception的验证准确率一致（99.20%），但DenseNet的训练损失更高，说明其学习过程更为平缓。自定义模型BDriceNetworkV0虽未超越预训练模型，但取得了具有竞争力的验证准确率（98.44%），且收敛性良好。所有模型的训练与验证曲线无显著差异，表明过拟合现象得到有效缓解。

图 9 用于孟加拉国水稻品种分类的卷积神经网络模型训练‑验证损失与训练‑验证精度曲线

最佳模型（VGG19）分析

表 3深度学习模型的测试性能

表 4深度学习模型的综合性能结果

表3与表4的评估结果清晰呈现了各模型在准确率与损失方面的相对有效性，其中VGG19脱颖而出成为最优模型，其测试准确率高达99.73%，测试损失低至0.013 1，充分展现了强大的泛化能力；同时，VGG19的各项验证指标也优于其他所有模型，证实了其在本水稻品种分类任务中的可靠性与鲁棒性。Xception是仅次于VGG19的较优模型，测试准确率达99.07%，测试损失为0.028 1，虽准确率略低于VGG19，但整体性能优异，在所有模型中具备显著优势。

VGG16紧随Xception之后，测试准确率为98.73%，测试损失为0.033 9；ResNet50表现与之相近，测试准确率为98.67%，仅测试损失略高（0.040 5），两者整体表现良好，其中VGG16在准确率上略占优势，ResNet50则在精确率与召回率方面具备竞争力。DenseNet与自定义模型BDriceNetworkV0的性能指标相对较低，测试准确率分别为98.20%和98.60%。

在分类质量方面，VGG19在所有性能指标上均保持优异表现，其平均精确率为0.997 3，是本分类任务中最可靠的模型，可最大限度减少假正例与假负例的产生。

混淆矩阵

图 10混淆矩阵。A. VGG19；B. VGG16；C. ResNet50；D. Xception；E. DenseNet；F. BDriceNetworkV0

本节通过构建5×5混淆矩阵，对比VGG16、VGG19、ResNet50、Xception、DenseNet、自定义 BDriceNetworkV0 六种模型对孟加拉国5 类水稻的分类细节（图10）。结果表明，所有模型整体分类效果良好，误分类主要集中在形态、纹理、尺寸高度相似的水稻品种间。其中VGG19性能最优，与其99.73%的总体准确率一致，仅出现2 次误判，可精准捕捉相似长粒水稻的细微形态差异；Xception次之，准确率为99.07%；VGG16（图10B）类别区分能力优于ResNet50（图10C）（分别为98.73%和98.67%）；DenseNet因特征提取清晰度不足，准确率最低；轻量级自定义模型BDriceNetworkV0（98.60%）可实现与ResNet50相近的分类效果。该误分类规律与现有水稻分类研究结论一致，验证了深度卷积网络在水稻品种识别中的有效性

最佳模型的性能分析与可视化

表 5 VGG19模型对孟加拉国水稻品种的分类性能

表5显示了本研究中表现最佳的VGG19模型的分类性能。VGG19模型在4 个水稻品种（Basmati、Chinigura、Kataribhog和Paijam）上取得了优异的精确率、召回率和F1分数（表5）。研究结果显示，该模型准确分类了这些种类，没有假正例或假负例，表现出卓越的性能。对于Jirashail类别，模型的精确率略有下降（0.993 3），但仍然达到了完美的召回率（1.00）和F1分数（0.996 6），表明模型在保持高整体性能的同时，仅在精确率和召回率之间进行了极小的权衡。总体准确率、宏观平均和加权平均分数进一步证实了模型在所有水稻品种上的一致和平衡性能（表5）。

图11中的ROC曲线进一步证明了模型的卓越性能。5 个水稻品种的曲线彼此几乎无法区分，并汇聚到理想状态下的左上角。这种完美对齐表明，模型对每个品种都实现了理想的分类率，保持了高真正例率（TPR）和低假正例率（FPR）。所有水稻品种的曲线下面积（AUC）得分均为1.00，进一步巩固了模型完美分离水稻类别且灵敏度或特异性无损的能力。ROC图中曲线的陡峭上升趋势进一步反映了模型在确保高TPR的同时保持低FPR的能力。优异的AUC分数源于实验条件下卓越的类别可分离性。可视化结果（图12）验证了前面提出的定量指标，进一步强化了VGG19在此任务中的卓越性能。

图11孟加拉国水稻品种多分类的 ROC曲线

图12 VGG19 模型对5 种孟加拉国水稻品种的分类示例

局限性

本研究的数据集仅限于5 个水稻品种，因此未能涵盖孟加拉国水稻多样性的全部范围。增加数据集以包含更多类型的品种和补充环境变量可能会提高模型的泛化能力。米粒图像是在受控的实验室环境中获得的，具有均匀的光照和背景。这可能限制模型在存在噪声和变异性的现场环境或现实世界中的适用性。本研究仅依赖视觉数据。纳入其他特征（如香气、谷粒重量或光谱数据）可能会提高分类性能和鲁棒性。最后，训练深度模型（尤其是VGG19和DenseNet）的计算成本对资源受限环境中的实时部署构成了挑战，这表明需要优化或采用更轻量级的架构才能实际应用。虽然VGG19准确，但它很重；因此，自定义模型（BDriceNetworkV0）是解决“计算成本”限制的方案。

结论与未来工作

本研究成功展示了深度学习（特别是CNN）在孟加拉国水稻品种自动分类中的应用。研究结果表明，预训练模型（尤其是VGG19）表现出很高的准确率和泛化能力，使其适用于质量控制、防伪等农业应用。自定义设计的模型BDriceNetworkV0为低资源环境提供了一个可行的解决方案，但需要进一步优化以实现更好的性能。未来的研究可以集中于增加数据集以包含更广泛的水稻品种和环境变量，同时探索整合其他感官数据（如香气和质地）以提高分类精度。此外，通过开发更高效的架构或利用迁移学习来解决深度学习模型的计算挑战，可以促进农业环境中的实时、可扩展应用。探索将CNN与其他机器学习技术相结合的混合模型也可能为提高分类准确率和鲁棒性提供新途径。最终，本研究为精准农业中更广泛地采用AI驱动解决方案铺平了道路，支持加强粮食安全和供应链完整性的努力。

Image-based classification of Bangladeshi rice varieties using deep convolutional neural networks

Syme Al-Azad Shuvoa, Khalilur Rahmana, Abdullah Al Naseeh Chowdhurya, Gourab Roya, Nafiz Nahida, Mahmud Hasanb, Md. Abu Naser Mojumdera, Md. Janibul Alam Soebb,* & Md. Fahad Jubayerc,*

aDepartment of Computer Science and Engineering, Sylhet Engineering College, Sylhet, 3100, Bangladesh

bDepartment of Farm Power and Machinery, Sylhet Agricultural University, Sylhet, 3100, Bangladesh

cDepartment of Food Engineering and Technology, Sylhet Agricultural University, Sylhet, 3100, Bangladesh

*Corresponding authors.

Abstract

This research investigates the application of deep convolutional neural networks (CNNs) for classifying 5 prominent rice varieties in Bangladesh: Basmati, Chinigura, Jirashail, Kataribhog, and Paijam. Rice is a significant agricultural product in Bangladesh. Proper categorization of rice varieties is vital for quality management, preventing adulteration, and preserving customer confidence. This research leverages advanced CNN architectures (VGG16, VGG19, ResNet50, Xception, DenseNet) and a custom model, BDriceNetworkV0, to automate the classification process. A balanced dataset comprising 15 000 images of rice grains was collected under controlled conditions to train the models. Performance metrics, including accuracy, precision, recall, and F1-score, were used to evaluate the models. VGG19 was identified as the superior performer (accuracy 99.73%). The custom model, BDriceNetworkV0, exhibited potential for resource-constrained applications (accuracy 98.60%); however, with slightly reduced precision. The findings highlight the feasibility of applying deep learning for rice classification, with potential benefits for enhancing quality, reducing operational costs, and improving food security in Bangladesh. This study offers valuable insights into the application of AI in agriculture, particularly in grain classification.

Reference:

Shuvo, S.AA., Rahman, K., Al Naseeh Chowdhury, A. et al. Image-based classification of Bangladeshi rice varieties using deep convolutional neural networks. Agric. Prod. Process. Sto. 2, 26 (2026). https://doi.org/10.1007/s44462-026-00061-9

文章翻译：王立磊（实习）

编辑：王佳红；责任编辑：孙勇

封面图片来源：图虫创意

为系统提升我国食品营养与安全的科技创新策源能力，加速科技成果向现实生产力转化，推动食品产业向绿色化、智能化、高端化转型升级，由北京食品科学研究院、中国食品杂志社《食品科学》杂志（EI收录）、中国食品杂志社《Food Science and Human Wellness》杂志（SCI收录）、中国食品杂志社《Journal of Future Foods》杂志（ESCI收录）主办，合肥工业大学、安徽省食品行业协会、安徽大学、合肥大学、合肥师范学院、北京工商大学、中国科技大学附属第一医院临床营养科、安徽粮食工程职业学院、皖西学院、滁州学院、蚌埠学院共同主办的“ 第六届食品科学与人类健康国际研讨会 ”，将于 2026年8月15-16日（8月14日全天报到）在中国安徽合肥召开。

长按或微信扫码进行注册

会议招商招展

联系人：杨红；电话：010-83152138；手机：13522179918（微信同号）

APPS感谢您的关注

欢迎广大作者积极撰写论文，踊跃投稿！

（点击左侧二维码查看期刊主页）

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.