魏 倩1
龚骏毅
2
1.南宁市青秀区市政园林所,广西南宁530299
2.广西慧云信息技术有限公司,广西南宁530031
摘要:农作物病虫害种类繁多,对农作物的产品和品质造成重大影响,而我国一线农业生产人员专业技术水平良莠不齐,导致现场缺乏有效和及时的客观判断㊂基于此,分析了传统和现代病虫害快速检测的方式和优缺点,并针对基于C N N 卷积神经网络的农作物病虫害A I 图像识别技术的要点和应用步骤进行详细阐
述㊂该技术具有较高的实用价值和可操作性,可促进A I 图像识别技术与传统农业生产的深度融合和赋能㊂
关键词:C N N 卷积神经网络;农作物病虫害识别;图像识别技术;特征提取及分析中图分类号:T P 183;T P 391.41;S 43
D O I :10.3969/j
.i s s n .2097-065X.2023.03.008基金项目:广西重点研发计划项目 面向区域特产业的智慧农业单品大数据平台的研制与应用
1 病虫害快速检测识别的必要性
目前,农作物病虫害是农业生产过程中面临的重要问题之一㊂2006-2015年农作物病害的受灾
面积由4.63亿h m 2扩大到5.075亿h m 2
,每年的虫害面积达2.36亿h m 2次,每年造成的损失,粮食约为15%,棉花约为23%,果蔬约为25%[1]㊂
2 传统病虫害检测的方式和缺点
传统的病虫害监测和防治,一方面依靠地方农技站的技术人员走访调查或生产技术培训,另一方面主
要依托农资销售门店的经营人员进行技术服务和培训㊂传统的病虫害监测和防治体系存在巨大的局限性,并且在与日俱增的生产力发展需求面前逐渐分崩离析,具体表现在以下方面:第一,随着人口老龄化,一线的地方农技站基本处于名存实亡的状态,专业的农业一线技术人员严重稀缺,使农业生产者无法通过官方的技术和服务渠道解决病虫害监测和防治的问题;第二,农资经营人员专业技术水平良莠不齐,往往以特定的农资销售任务达成为出发点进行技术服务,往往导致无法对农作物病理/生理特征做出专业㊁客观地判断;第三,农作物病虫害种类繁多,包括病害㊁虫害等
[2]
,在国内已经被发现的害
虫共有400余种,可以划分为食叶害虫㊁地下害虫㊁蛀烛害虫以及刺吸害虫等几大类,实际耕地情况错综复杂,难以实现全面兼容的病虫害,容易形成长期单一使用一种杀菌剂的情况㊂
3 基于图像识别技术快速识别的优点
(1
)基于作物叶㊁茎㊁花和果实的图像,可以快速而准确地识别作物疾病㊂
(2
)疾病的严重程度可以通过计算变形或者变区域相对于整个叶子㊁果实或者花的大小来估计㊂(3
)跟踪植物的疾病进程,对于检测感染阶段等细节和识别大多数人类观察者无法辨别的症状至关重要㊂I P T 技术还将帮助研究人员评估实验室正在调查的新作物品种的抗病性特征㊂
(4)通过I P T 收集的信息可以快速廉价地传播给偏远地区的其他人㊂
(5
)正确的诊断将导致更经济地使用杀虫剂,这将降低生产成本,同时保护环境,提高进入欧盟等监管严格但利润丰厚的市场的机会㊂
(6)加强了与人类专家的联系,可以从偏远地区咨询他们,而不需要推广人员亲自访问每个农场㊂
4 基于C N N 卷积神经网络的农作物病虫害
图像识别技术
近年来,卷积神经网络(C N N )
在图像识别任务中作为特征提取器和分类器表现突出,自2015年以来,大多数利用I P T s 进行叶部疾
病识别的研究都利用了深度学习㊂算法通过一系列优化而不是语义
特征来到表示数据的最佳方式㊂通过这个学习过程,不需要进行特征工程,因为特征是自动提取的㊂深度学习将推动农业在疾病诊断㊁害虫检测㊁质量管理㊁营销㊁自动化㊁机器人和大数据领域的进步㊂
训练神经网络需要由数千幅图像组成的大数据
集[3]
㊂目前,迁移学习是训练鲁棒的C N N 分类器
进行植物病害识别的最有效方法㊂迁移学习使预先训练的卷积神经网络能够通过用较小的数据集重新训练它们来适应,这些数据集的分布不同于以前从头开始训练网络所用的较大数据集㊂
相比于基于H a d o o p M a p
R e d u c e 实现的机器学㊃
32㊃基于C N N 卷积神经网络的病虫害图像识别应用技术综述
魏 倩 龚骏毅Copyright ©博看网. All Rights Reserved.
习算法(如H a d o o p M a n h o u t),S p a r k M L l i b在机器学习方面具有一些得天独厚的优势㊂机器学习算法一般都有由多个步骤组成迭代计算的过程,机器学习的计算需要在多次迭代后获得足够小的误差或者足够收敛时才会停止㊂如果迭代时使用H a d o o p M a p R e d u c e计算框架,则每次计算都要读/写磁盘及完成任务的启动等工作,从而会导致非常大的I/O和C P U消耗;而S p a r k基于内存的计算模型就是针对迭代计算而设计的,多个迭代直接在内存中完成,只有在必要时才会操作磁盘和网络,所以, S p a r k M L l i b正是机器学习的理想平台;S p a r k具有出而高效的A k k a和N e t t y通信系统,通信效率高于H a d o o p M a p R e d u c e计算框架的通信机制㊂S p a r k是基于内存计算的,从基础原理上适应于数据挖掘的迭代式计算,但对于中大型项目来说,需要去实现分布式的数据挖掘算法仍然具有极大的挑战,所以通常我们使用S p a r k提供的一个基于海量数据的机器学习库M L l i b,来构建常用数据挖掘算法的分布式实现㊂将M L l i b插入到H a d o o p工作流程,实现敏捷高效的分类㊁回归和聚类等算法,如图1所示㊂
图1M L l i b插入到H a d o o p工作流程
在训练模型时,比起增加训练E p o c h s的数目,增加数据对识别性能的贡献更大,深度学习检测器网络有能力识别同一植物上的多种感染,这种方式对植物上病变的大小和位置以及感染阶段的类内变
异具有鲁棒性,使用检测器的一个主要缺点是,通过标记感兴趣区域周围的边界框来进行数据集注释是一个非常劳动密集的过程㊂由于植物病虫害识别的数据集目前的多样性比较差,因此只需要一个比较简单紧凑的C N N模型就够了,在训练过程中可以通过隐藏层输出可视化㊁特征可视化㊁语义字典和注意力地图四种技术来查看C N N中的权重是否有冗余,如果有就可以将冗余的部分给去掉,以此来获得一个与原模型一样性能简单紧凑的更瘦的模型,结合几个C N N分类器可以产生更好的识别精度结果,并且可以从非常高分辨率的图像中检测疾病症状[4]㊂
在全连接层从C N N获取特征向量结果,并将其与手工制作的特征向量相结合,可以获得更准确的分类器性能㊂将额外手工制作的顺序统计量㊁纹理㊁形状和几何关系特征向量与C N N的全连接层进行连接,将使网络更好地泛化,加速模型的收敛,即使在数据集很小的时候将深度学习模型的性能与手工技术结合径向基函数支持向量机(R B F-S VM)分类器进行比较,C N N在特征提取和识别的场景中都表现出了优越的识别性能,如图2所示㊂
图2全连接层与C N N、手工制作特征向量的结合
5基于C N N卷积神经网络的农作物病虫害图像识别应用步骤
相较于传统的技术处理方式,基于卷积神经网络的农作物病虫害图像识别处理方法节约了大量预处理过程,将目标图像输入黑盒分析模型即可进行识别和分析㊂在具备较高识别准确率的前提下,还缩短
了识别的时间,利用图像分类和目标识别算法,将患病作物㊁受害部位直接从图像中分离出来进行分析,鲁棒性㊁适应性较高,对外界环境和条件不敏感,直接应用在田间地头复杂的现场环境[5],如图3所示
㊂
图3图像识别处理方式
(1)整理农作物病虫害图像库,数据是模型训练的基础,任何模型都不能脱离数据和应用场景来判断收敛识别度㊂不同的数据库对模型的特征分布具有不同的影响,C N N的最终目的是将数据中的趋势进行尽快收敛和拟合,所以到合适和充足的数据图像库,有利于更好地训练模型㊂
(2)分割病虫害图像库,将数据库分为训练库和测试/验证库,训练库的数据用于模型训练和参数调试,测试/验证库的数据用于验证模型的收敛效果,数据库分割方式和比例的差异会造成模型收敛的分布存在差异,因此建议原始数据库的80%用于训练库,20%用于测试/验证库㊂
(3)选用合适的C N N并针对农作物病虫害识别搭建模型,提前定义好回调函数㊁目标函数和优化算法,回调函数主要用于收敛训练过程中步长和损失之间的关系,通过调试模型的参数优化模型收敛效率和精度;目标函数用于衡量预测值和实际值的
㊃42㊃
数字农业与智能农机第3期2023年3月Copyright©博看网. All Rights Reserved.
差异,通过优化算法不断迭代缩小目标函数的值㊂
(4)分析模型的性能表现并将结果进行可视化输出,开发者具备完善的计算机理论知识,在提出模型方案之后,需要通过实际生产中的病虫害图像库来验证算法模型的综合性能,良好的可视化界面帮助开
发者明确模型的输出结果,方便根据结果进行优化性能㊁参数等;普通用户不关心C N N㊁模型算法过程,更加关注模型的输出结果准确率和性能,将模型的输出结果可视化,帮助普通用户便捷地使用识别应用㊂
(5)输出结果的验证和核验,C N N被看作一个黑盒模型,站在人类的角度,输出的结果是不能被完全理解的,只能通过大量的数据结果进行验证和核验,让算法模型无限向准确的目标收敛,针对一个病虫害识别任务如果给出错误的识别结果,可能会造成灾难性的后果,导致过度使用农药㊁土壤污染㊁环境破坏等恶性循环,所以将输出结果进行验证和核验是C N N应用中的重要部分[6]㊂
6存在的困难
(1)数据的采集和标记㊂农作物病虫害图像库的数据采集和标记处理耗时耗力,数据采集过程中,需要特定农作物特定病虫害的大量图像数据,尤其是在不同地区的特定农作物特定病虫害的图像数据采集更加困难,由于农药的广泛使用,难以出现足够规模数量的多种病虫害图像,而且需要每张图片数据进行专业的标记处理,几万张照片数据库往往只是一个基本要求,导致用于模型训练的数据规模远远不够㊂
(2)复杂的生产现场条件,光照条件的变化㊁前景背景重叠㊁遮挡㊁颜相近等都给目标的识别造成巨大困难,导致建立的病虫害识别模型不稳定,无法从复杂多变的现场环境图像数据中提取和检测病虫
害的相关图像识别特征,应用现场对于识别的准确度和效率有较高的要求,容忍度较差,导致广泛推广应用存在巨大困难㊂
7发展的趋势和目标
通过梳理和分析国内外研究状况及存在的问题,基于C N N卷积神经网络的病虫害图像识别方式,能够落地A I智能化大数据病虫害分析和诊断平台,并根据农业种植专业经验匹配对应的治理方案,对于提高农业生产水平和农村新基建的落实具有重要意义,针对不同地区典型农作物病虫害的识别诊断和治理,可以从以下方面加深研究[7]:
(1)建立跨地区的特定病虫害数据库,不同种农作物在不同的地区,不同时期的早㊁中㊁晚期表现均不同,识别的过程中为了提高准确度和效率,人工标注成本极其高昂,因此如何获得更全面的数据集且
如何对获得的数据集进行准确标注是重要待解决的问题,最终才能建立科学的病虫害数据库体系,采集跨地区㊁多时期的特定农作物病虫害图像㊂
(2)扩大病虫害数据库的维度和规模,扩大数据库的判断维度,结合地区定位和时间,结合病虫害的图像数据进行综合分析比对,增强识别模型对复杂现场图像数据的泛化能力,有效提高数据维度和规模㊂
(3)提高神经网络识别模型的效率,建立学习型
C N N识别模型,兼容复杂环境下的病虫害图像数据,完善循环优化训练体系,利用服务过程中收集的图像数据,定期优化训练算法模型,迭代优化神经网络识别模型的效率㊂
8结语
本文提出未来的研究方向可以采用深度学习模型来同时识别不同地区的多种农作物病虫害图像,并利用大数据平台实现移动端A P P快速识别农作物病虫害的功能;通过该农作物病虫害模型可以快速识别不同病虫害,为农业生产提供病虫害决策支持服务;及时准确诊断农作物病虫害情况,并且可以根据程度不同采取合适措施,喷洒不同剂量的农药,可以有效遏制病虫害的蔓延;降低对作物产量的影响,实现农业现代化的同时减轻农药对环境的污染,减少用药量达到目的,有利于农业生产提质增效㊁保障食品安全和维护人类健康;降低农作物病虫害大规模暴发风险,对维护农业生产的健康稳定和人类健康具有极大的经济意义与现实意义㊂
参考文献:
[1]陶志坚.基于G I S和模型的种植设计系统的探讨[J].
才智,2011(20):71.
[2]邹修国.基于计算机视觉的农作物病虫害识别研究现
状[J].计算机系统应用,2011,20(6):238-242. [3]陈兵旗,郭学梅,李晓华.基于图像处理的小麦病害诊
断算法[J].农业机械学报,2009(12):190-195. [4]彭可为,李婵,曹学仁,等.数字图像技术在植物病害自
动识别中的研究进展[J].江西农业学报,2012,24(9):
69-71.
[5]张飞云.基于多重分形和L V Q神经网络的小麦病害智
能识别[J].湖北农业科学,2013(7):1669-1671+1675.
[6]康飞龙,李佳,刘涛,等.多类农作物病虫害的图像识别
应用技术研究综述[J].江苏农业科学,2020,48(22):
22-27.未识别的网络
[7]杨晋丹,杨涛,苗腾,等.基于卷积神经网络的草莓叶部
白粉病病害识别[J].江苏农业学报,2018,34(3):
527-532.
作者简介:魏倩,女,1973年生,工程师㊂研究方向为园林绿化㊂龚骏毅,男,1988年生,工程师,硕士㊂研究方向为计算机㊁大数据㊂
㊃52㊃
基于C N N卷积神经网络的病虫害图像识别应用技术综述 魏倩龚骏毅
Copyright©博看网. All Rights Reserved.
发布评论