专题报道

    第三届中国林草计算机应用大会论文精选
    执行主编 李凤日
    默认 最新文章 浏览次数
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 融合Swin Transformer的虫害图像实例分割优化方法研究
    高家军, 张旭, 郭颖, 刘昱坤, 郭安琪, 石蒙蒙, 王鹏, 袁莹
    南京林业大学学报(自然科学版)    2023, 47 (3): 1-10.   DOI: 10.12302/j.issn.1000-2006.202206048
    摘要1995)   HTML63)    PDF(pc) (3804KB)(739)    收藏

    【目的】为了实现对虫害的精准监测,提出了一种融合Swin Transformer的图像实例分割优化方法,以期有效解决复杂真实场景下多幼虫个体图像识别分割困难的问题。【方法】选用Swin Transformer模型,改进Mask R-CNN实例分割模型的主干网部分,对黄野螟幼虫虫害图像进行识别分割。针对不同结构参数的Swin Transformer模型与ResNet模型,调整各层的输入输出维度,将其分别设置为Mask R-CNN的主干网进行对比实验,从定量与定性两个角度分析不同主干网的Mask R-CNN模型对黄野螟幼虫的识别分割精度与效果,确定最佳模型结构。【结果】①该方法在虫害识别框选方面的测度(F1)分数可达89.7%,平均精度(AP)可达88.0%;在虫害识别分割方面的F1分数可达84.3%,AP可达82.2%。相较于Mask R-CNN,在目标框选与目标分割方面分别提升8.75%与8.40%。②对于小目标虫害识别分割任务,该方法在虫害识别框选方面的F1分数可达88.4%,AP可达86.3%;在虫害识别分割方面的F1分数可达84.0%,AP可达81.7%。相较于Mask R-CNN,在目标框选与目标分割方面分别提升9.30%与9.45%。【结论】对于复杂真实场景下的图像实例分割任务,其识别分割效果极大地依赖于模型对图像特征的提取能力,而融合了Swin Transformer的Mask R-CNN实例分割模型,在主干网的特征提取能力更强,模型整体的识别分割效果更好,可为虫害的识别监测提供技术支撑,同时为保护农、林、牧等产业资源提供解决方案。

    图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
    2. 基于视觉加强注意力模型的植物病虫害检测
    杨堃, 范习健, 薄维昊, 刘婕, 王俊玲
    南京林业大学学报(自然科学版)    2023, 47 (3): 11-18.   DOI: 10.12302/j.issn.1000-2006.202210022
    摘要1941)   HTML49)    PDF(pc) (6997KB)(541)    收藏

    【目的】植物病虫害准确检测是病虫害精准化防治的关键,笔者构建准确高效的植物病虫害监测模型,为病虫害的早期诊断与预警提供重要依据。【方法】针对现有植物病虫害检测模型泛化能力弱、小目标漏检率高等问题,提出一种基于视觉加强注意力改进的植物病虫害检测模型--YOLOv 5-VE(vision enhancement)。为方便检测实验样本中的小目标采用Mosaic 9数据增强方法;设计出基于视觉注意力的特征加强模块CBAM(convolutional block attention module);为确定不同目标重叠在一起和被遮挡的定位损失引入边界框定位损失函数DIoU。【结果】YOLOv 5-VE模型在实验数据集上的识别精度和检测平均准确率达到65.87%和73.49%,比原模型提高了1.07%和8.25%,在型号为1 080 Ti的GPU上检测速度可达35帧/s。【结论】该方法可以在背景复杂的野外场景快速有效地检测和识别种类多样的病害和虫害,可以提高检测的鲁棒性能,提升模型对病虫害目标的特征提取能力,降低野外复杂场景对检测带来的干扰,表现出良好的应用潜力,可广泛运用于大规模的植物病虫害检测。

    图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
    3. 深度学习在基于叶片的油茶品种识别中的研究
    尹显明, 棘玉, 张日清, 莫登奎, 彭邵锋, 韦维
    南京林业大学学报(自然科学版)    2023, 47 (3): 29-36.   DOI: 10.12302/j.issn.1000-2006.202112037
    摘要1656)   HTML24)    PDF(pc) (2921KB)(570)    收藏

    【目的】 采用深度学习方法开展基于叶片的油茶品种识别研究,开发油茶品系图像识别技术,为油茶品种鉴别提供科学依据。【方法】选择自然光照条件下生长的11个油茶品种叶片作为研究对象,采集完整、无明显病虫害的叶片,以白色硬纸板为背景,利用智能手机对叶片的正、背面进行图像采集,通过可用性筛选去除无效图像,构建图像数量为2 791张的油茶叶片品种数据集,采用深度学习网络(GoogLeNet、ResNet)对11个油茶品种的叶片图像进行识别研究。【结果】GoogLeNet和ResNet网络均能满足基于叶片的油茶品种识别要求,总体识别准确率、召回率的调和平均值(F1)分别达94.0%和80.7%;其中GoogLeNet网络识别效果更好,平均准确率、召回率、多分类模型指标宏观F1(Macro F1)和微观F1(Micro F1)分别为94.1%、94.0%、94.0%和96.9%,其对油茶品种编号1和编号8的识别召回率高达100%。【结论】深度学习网络(GoogLeNet、ResNet)能够实现基于叶片的油茶品种识别,可为基于其他作物的品种识别提供参考。

    图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
    4. 基于BOVW和SVM的城市土地类型遥感变化监测研究
    黄靖舒, 高心丹, 景维鹏
    南京林业大学学报(自然科学版)    2023, 47 (3): 37-44.   DOI: 10.12302/j.issn.1000-2006.202110007
    摘要1639)   HTML18)    PDF(pc) (4191KB)(586)    收藏

    【目的】研究城市土地类型的变化,分析城市进化过程对环境气候、城市发展以及政府决策产生的影响。【方法】以15~30 m分辨率的NWPU-RESISC45标准数据集和哈尔滨城区Landsat 8遥感影像为实验数据,制作了包含城市建筑及道路、水体、植被、裸地4种土地类型的遥感影像数据集。在实验数据中加入纹理信息,提取SIFT(scale-invariant feature transform, SIFT)特征点。通过K-means聚类算法获取包含大量语义信息的视觉词典,从而构造视觉词袋模型(bag of visual words, BOVW)。然后将BOVW提取的特征点与支持向量机(support vector machine, SVM)分类器结合,对制作的数据集进行分类。最后,利用2013年、2019年同一季节Landsat 8影像,以哈尔滨市松北区为例计算各土地类型的位置及面积变化信息。【结果】基于BOVW和SVM的分类结果与5种单一分类模型和3种“特征提取+分类器”模型对比,发现使用尺寸为550个词汇的视觉词典时,本研究模型的分类与变化监测精确度分别为79.40%、79.29%。结合哈尔滨城市具体数据的监测结果表明,在2013-2019年间,哈尔滨市松北区城市建筑及道路与植被类型的覆盖面积减少明显,水体与裸地类型的覆盖面积增加,这一变化情况符合近年来哈尔滨市政府陆续推出的环境保护五年规划,以及其总体规划中合理控制城市规模的相关政策要求。【结论】对于时间跨度长、分辨率不高的Landsat遥感影像,BOVW和SVM的变化监测模型在土地类型变化监测方面效果良好,在一定程度上可提高分类与变化监测的精度,为土地类型变化监测提供借鉴。

    图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
    5. 基于多图像特征的幼龄沉香全氮估测
    袁莹, 王雪峰, 王甜, 陈飞飞, 黄川腾, 林玲, 董晓娜
    南京林业大学学报(自然科学版)    2023, 47 (3): 19-28.   DOI: 10.12302/j.issn.1000-2006.202107017
    摘要1516)   HTML24)    PDF(pc) (2742KB)(538)    收藏

    【目的】应用计算机视觉技术提取幼龄沉香的多图像特征,对沉香叶片全氮含量进行估测,为实现沉香氮营养状态的快速无损估测提供新方法。【方法】采用基于色调-亮度-饱和度(HIS)颜色空间的最佳直方图(KSW)熵法和形态学处理对幼龄沉香图像进行分割,并提取了图像的颜色、形状和纹理特征。然后利用偏最小二乘法(PLS)对多图像特征进行有监督降维,提取图像特征主成分。最后构建了天牛须搜索算法(BAS)优化后的Elman神经网络(Elman neural network,ElmanNN)模型对幼龄沉香叶片全氮量进行估测,并将模型验证结果与其他常用模型进行对比。【结果】以幼龄沉香可见光图像为研究对象,应用的基于HIS空间的分割算法效果优于常用的RGB和Lab颜色空间分割;PLS算法对图像特征提取了6个主成分,快速降低了图像特征的维数,并有效消除了特征变量间的多重共线性;提出的PLS-BAS-ElmanNN模型能实现模型参数的自适应选取,且估测效果较好,决定系数R2为0.740 7,均方根误差(RMSE)为1.265 3 g/kg,估测精度略高于偏最小二乘回归(PLSR)模型和偏最小二乘-广义可加模型(GAM)。【结论】提出以幼龄沉香为研究对象的图像处理方法,构建了能够稳定处理高维图像数据的PLS-BAS-ElmanNN估测模型,为幼龄沉香氮营养状态的监测及沉香培育的精准作业提供了新思路。

    图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0