广西师范大学学报(自然科学版) ›› 2023, Vol. 41 ›› Issue (3): 80-90.doi: 10.16088/j.issn.1001-6600.2022100804

• 研究论文 • 上一篇    下一篇

基于改进YOLOX的轻量型垃圾分类检测方法

李洋1,2, 苟刚1,2*   

  1. 1.公共大数据国家重点实验室(贵州大学), 贵州 贵阳 550025;
    2.贵州大学 计算机科学与技术学院, 贵州 贵阳 550025
  • 收稿日期:2022-10-08 修回日期:2022-11-30 出版日期:2023-05-25 发布日期:2023-06-01
  • 通讯作者: 苟刚(1976—), 男, 贵州贵阳人, 贵州大学副教授。E-mail: 6706605@qq.com
  • 基金资助:
    国家自然科学基金(62162010); 贵州省科技支撑计划项目(黔科合支撑〔2022〕一般267)

Lightweight Garbage Detection Method Based on Improved YOLOX

LI Yang1.2, GOU Gang1,2*   

  1. 1. State Key Laboratory of Public Big Data (Guizhou University), Guiyang Guizhou 550025, China;
    2. College of Computer Science and Technology, Guizhou University, Guiyang Guizhou 550025, China
  • Received:2022-10-08 Revised:2022-11-30 Online:2023-05-25 Published:2023-06-01

摘要: 生活垃圾分类是保护生态环境、促进绿色和谐发展的有效措施。针对移动端设备计算资源和内存有限,重量级模型难以嵌入等问题,本文提出一种基于改进YOLOX-tiny轻量型的垃圾分类检测方法。首先,使用EIoU替换原来的IoU损失函数,能加速收敛,提升检测精度;其次,在颈部网络引入注意力机制CBAM,对不同通道的权重重新分配,获取更多浅层的细粒度特征和深层的语义信息;最后,使用GhostBottleneck模块替换特征提取网络中的CSP模块,保留更多边缘信息,同时降低参数量,使模型轻量化。在华为云垃圾数据集上的实验结果表明,改进的算法与YOLOX-tiny相比,参数量降低至原来的87.97%,精度提升了0.3个百分点,在TrashNet数据集上的实验效果提升了0.36个百分点,从而证明了本文算法的有效性,该算法有利于嵌入移动端设备使用,具有一定的实用价值。

关键词: 垃圾分类, YOLOX, 轻量型网络, EIoU, CBAM, GhostBottleneck

Abstract: Household garbage classification is an effective measure to protect the ecological environment and promote green and harmonious development. Aiming at the problems such as limited computing resources and memory, and difficulty in embedding heavyweight models into mobile devices, a lightweight garbage classification detection method based on improved YOLOX-tiny is proposed in this paper. Firstly, the original IoU loss function is replaced by EIoU, which can accelerate the convergence and improve the detection accuracy. Secondly, the attention mechanism CBAM is introduced into the neck network to redistribute the weight of different channels to obtain more shallow fine-grained features and deep semantic information. Finally, the GhostBottleneck module is used to replace the CSP module in the feature picking network, which tends to retain more edge information, reduce the number of parameters, and lighten the model. Experimental results on Huawei cloud garbage dataset show that compared with YOLOX-tiny, the number of parameters of the improved algorithm is reduced to 87.97% of the original, the accuracy is increased by 0.3%, and the experimental effect on TrashNet dataset is increased by 0.36%, which proves the effectiveness of the proposed algorithm. The algorithm is conducive to the use of embedded mobile devices and has certain practical value.

Key words: garbage classification, YOLOX, lightweight network, EIoU, CBAM, GhostBottleneck

中图分类号:  TP391.41

[1] 国家统计局. 中国统计年鉴2021[M]. 北京: 中国统计出版社, 2021.
[2] 张涛, 白冬锐, 孙煜璨, 等. 全过程管理视角的上海市垃圾分类回顾与展望[J]. 环境工程, 2022, 40(3): 173-180, 146. DOI: 10.13205/j.hjgc.202203026.
[3] 王洁, 顾卫华, 陈泽辉, 等. 生活垃圾分类实践效果、问题与对策分析: 以湖州市织里镇为例[J]. 环境工程, 2022, 40(3): 188-193. DOI: 10.13205/j.hjgc.202203028.
[4] 贵阳市城镇生活垃圾分类管理条例[N]. 贵阳日报, 2022-08-16(4).
[5] 李永杰, 周桂红, 刘博. 基于YOLOv3模型的人脸检测与头部姿态估计融合算法[J]. 广西师范大学学报(自然科学版), 2022, 40(3): 95-103. DOI: 10.16088/j.issn.1001-6600.2021070911.
[6] 刘英璇, 伍锡如, 雪刚刚. 基于深度学习的道路交通标志多目标实时检测[J]. 广西师范大学学报(自然科学版), 2020, 38(2): 96-106. DOI: 10.16088/j.issn.1001-6600.2020.02.011.
[7] 吕方方, 陈光喜, 刘家畅,等. 基于卷积神经网络的小目标检测改进算法[J]. 桂林电子科技大学学报, 2021, 41(5): 368-374. DOI: 10.16725/j.cnki.cn45-1351/tn.2021.05.005.
[8] GIRSHICK R, DONAHUE J, DARRELL T, et al. Rich feature hierarchies for accurate object detection and semantic segmentation[C]//2014 IEEE Conference on Computer Vision and Pattern Recognition. Los Alamitos, CA: IEEE Computer Society, 2014: 580-587. DOI: 10.1109/CVPR.2014.81.
[9] GIRSHICK R. Fast R-CNN[C]//2015 IEEE International Conference on Computer Vision (ICCV). Los Alamitos, CA: IEEE Computer Society, 2015: 1440-1448. DOI: 10.1109/ICCV.2015.169.
[10] REN S Q, HE K M, GIRSHICK R, et al. Faster R-CNN: towards real-time object detection with region proposal networks[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 39(6): 1137-1149. DOI: 10.1109/TPAMI.2016.2577031.
[11] LIU W, ANGUELOV D, ERHAN D, et al. SSD: single shot multibox detector[C]//Computer Vision-ECCV2016: LNCS Volume 9905. Cham: Springer, 2016: 21-37. DOI: 10.1007/978-3-319-46448-0_2.
[12] REDMON J, DIVVALA S, GIRSHICK R, et al. You only look once: unified, real-time object detection[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Los Alamitos, CA: IEEE Computer Society, 2016: 779-788. DOI: 10.1109/CVPR.2016.91.
[13] REDMON J, FARHADI A. YOLO9000: better, faster, stronger[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Los Alamitos, CA: IEEE Computer Society, 2017: 6517-6525. DOI: 10.1109/CVPR.2017.690.
[14] REDMON J, FARHADI A. YOLOv3: an incremental improvement[EB/OL]. (2018-04-08)[2022-10-08]. https://arxiv.org/abs/1804.02767. DOI: 10.48550/arXiv.1804.02767.
[15] GE Z, LIU S T, WANG F, et al. YOLOX: exceeding YOLO series in 2021[EB/OL]. (2021-08-06)[2022-10-08]. https://arxiv.org/abs/2107.08430. DOI: 10.48550/arXiv.2107.08430.
[16] 陈智超, 焦海宁, 杨杰, 等. 基于改进MobileNet v2的垃圾图像分类算法[J]. 浙江大学学报(工学版), 2021, 55(8): 1490-1499. DOI: 10.3785/j.issn.1008-973X.2021.08.010.
[17] 高明, 陈玉涵, 张泽慧, 等. 基于新型空间注意力机制和迁移学习的垃圾图像分类算法[J]. 系统工程理论与实践, 2021, 41(2): 498-512. DOI: 10.12011/SETP2020-1645.
[18] 袁建野, 南新元, 蔡鑫, 等. 基于轻量级残差网路的垃圾图片分类方法[J]. 环境工程, 2021, 39(2): 110-115. DOI: 10.13205/j.hjgc.202102017.
[19] 罗安能, 万海斌, 司志巍, 等. 基于改进YOLOv5s的可回收垃圾的检测算法[J/OL]. 激光与光电子学进展: 1-15[2022-10-08]. http://kns.cnki.net/kcms/detail/31.1690.tn.20220713.1957.657.html.
[20] 吕东, 王萍, 王宇航, 等. 固体金属垃圾分类中基于深度学习方法的研究[J]. 广西科技大学学报, 2021, 32(4): 104-110, 126. DOI: 10.16375/j.cnki.cn45-1395/t.2021.04.016.
[21] YU J H, JIANG Y N, WANG Z Y, et al. Unitbox: an advanced object detection network[C]//Proceedings of the 24th ACM International Conference on Multimedia. New York, NY: Association for Computing Machinery, 2016: 516-520. DOI: 10.1145/2964284.2967274.
[22] REZATOFIGHI H, TSOI N, GWAK J Y, et al. Generalized intersection over union: a metric and a loss for bounding box regression[C]//2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Los Alamitos, CA: IEEE Computer Society, 2019: 658-666. DOI: 10.1109/CVPR.2019.00075.
[23] ZHENG Z H, WANG P, LIU W, et al. Distance-IoU loss: faster and better learning for bounding box regression[J]. Proceedings of the AAAI Conference on Artificial Intelligence, 2020, 34(7): 12993-13000. DOI: 10.1609/aaai.v34i07.6999.
[24] HU J, SHEN L, SUN G. Squeeze-and-excitation networks[C]//2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Los Alamitos, CA: IEEE Computer Society, 2018: 7132-7141. DOI: 10.1109/CVPR.2018.00745.
[25] WOO S H, PARK J C, LEE J Y, et al. CBAM: convolutional block attention module[C]//Computer Vision-ECCV 2018: LNCS Volume 11211. Cham: Springer Nature Switzerland AG, 2018: 3-19. DOI: 10.1007/978-3-030-01234-2_1.
[26] HAN K, WANG Y H, TIAN Q, et al. GhostNet: more features from cheap operations[C]//2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Los Alamitos, CA: IEEE Computer Society, 2020: 1577-1586. DOI: 10.1109/CVPR42600.2020.00165.
[27] HOWARD A, SANDLER M, CHEN B, et al. Searching for MobileNetV3[C]//2019 IEEE/CVF International Conference on Computer Vision (ICCV). Los Alamitos, CA: IEEE Computer Society, 2019: 1314-1324. DOI: 10.1109/ICCV.2019.00140.
[28] ZHANG Y F, REN W, ZHANG Z, et al. Focal and efficient IoU loss for accurate bounding box regression[J]. Neurocomputing, 2022, 506: 146-157. DOI: 10.1016/j.neucom.2022.07.042.
[1] 梁镇锋, 夏海英. 一种面向无人机航拍图像的快速拼接算法[J]. 广西师范大学学报(自然科学版), 2023, 41(3): 41-52.
[2] 韩欣月, 邓长征, 付添, 夏鹏雨, 刘旋. 基于MWOA-Elman神经网络的接地网瞬变电磁缺陷识别[J]. 广西师范大学学报(自然科学版), 2023, 41(3): 53-66.
[3] 钱有为, 何富运, 韦燕, 冯慧玲, 胡聪. 基于双编码路径融合和双向ConvLSTM的神经元图像分割[J]. 广西师范大学学报(自然科学版), 2023, 41(3): 67-79.
[4] 王鲁娜, 杜洪波, 朱立军. 基于流形正则的堆叠胶囊自编码器优化算法[J]. 广西师范大学学报(自然科学版), 2023, 41(2): 76-85.
[5] 魏明军, 周太宇, 纪占林, 张鑫楠. 基于YOLOv3的公共场所口罩佩戴检测方法[J]. 广西师范大学学报(自然科学版), 2023, 41(1): 76-86.
[6] 牛学德, 高丙朋, 任荣荣, 徐明明. 基于轻量级CNN的作物病虫害识别及安卓端应用[J]. 广西师范大学学报(自然科学版), 2022, 40(6): 59-68.
[7] 于梦竹, 唐振军. 基于手工特征的视频哈希研究综述[J]. 广西师范大学学报(自然科学版), 2022, 40(5): 72-89.
[8] 梁启花, 胡现韬, 钟必能, 于枫, 李先贤. 基于孪生网络的目标跟踪算法研究进展[J]. 广西师范大学学报(自然科学版), 2022, 40(5): 90-103.
[9] 李志欣, 苏强. 基于知识辅助的图像描述生成[J]. 广西师范大学学报(自然科学版), 2022, 40(5): 418-432.
[10] 万黎明, 张小乾, 刘知贵, 宋林, 周莹, 李理. 基于高效通道注意力的UNet肺结节CT图像分割[J]. 广西师范大学学报(自然科学版), 2022, 40(3): 66-75.
[11] 张萍, 徐巧枝. 基于多感受野与分组混合注意力机制的肺结节分割研究[J]. 广西师范大学学报(自然科学版), 2022, 40(3): 76-87.
[12] 李永杰, 周桂红, 刘博. 基于YOLOv3模型的人脸检测与头部姿态估计融合算法[J]. 广西师范大学学报(自然科学版), 2022, 40(3): 95-103.
[13] 陈文康, 陆声链, 刘冰浩, 李帼, 刘晓宇, 陈明. 基于改进YOLOv4的果园柑橘检测方法研究[J]. 广西师范大学学报(自然科学版), 2021, 39(5): 134-146.
[14] 张伟彬, 吴军, 易见兵. 基于RFB网络的特征融合管制物品检测算法研究[J]. 广西师范大学学报(自然科学版), 2021, 39(4): 34-46.
[15] 张灿龙, 李燕茹, 李志欣, 王智文. 基于核相关滤波与特征融合的分块跟踪算法[J]. 广西师范大学学报(自然科学版), 2020, 38(5): 12-23.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
[1] 黄四新,周先丽,牟俊飞,罗琴,黄晓,陈旭,梁成钦. 罗汉果甜苷ⅡA的分离鉴定含量测定及其降糖抗氧化活性研究[J]. 广西师范大学学报(自然科学版), 2019, 37(3): 132 -141 .
[2] 刘静, 边迅. 直翅目昆虫线粒体基因组的特征及应用[J]. 广西师范大学学报(自然科学版), 2021, 39(1): 17 -28 .
[3] 程瑞, 何明先, 钟春英, 罗树毅, 武正军. 野生与人工繁育鳄蜥游泳能力比较[J]. 广西师范大学学报(自然科学版), 2021, 39(1): 79 -86 .
[4] 王素, 范意兴, 郭嘉丰, 张儒清, 程学旗. 基于样本难度的神经机器翻译动态学习方法[J]. 广西师范大学学报(自然科学版), 2021, 39(2): 13 -20 .
[5] 谢冬林, 邓国和. 随机利率跳扩散模型下幂型乘积远期生效期权定价[J]. 广西师范大学学报(自然科学版), 2021, 39(5): 158 -172 .
[6] 庞冰冰, 叶丰彩, 李钰艳, 尚常花. 微藻类胡萝卜素合成与代谢调控研究进展[J]. 广西师范大学学报(自然科学版), 2021, 39(6): 13 -23 .
[7] 田晟, 宋霖. 基于CNN和Bagging集成的交通标志识别[J]. 广西师范大学学报(自然科学版), 2022, 40(4): 35 -46 .
[8] 钟辉, 宋树祥, 岑明灿, 蔡超波, 蒋品群, 刘振宇. 基于采样计算的差分N通道滤波器[J]. 广西师范大学学报(自然科学版), 2022, 40(4): 58 -67 .
[9] 王圳峰, 刘燕, 王欣珂, 林赛男, 刘兴诏. 福建省绿色空间时空演变及驱动因素分析[J]. 广西师范大学学报(自然科学版), 2022, 40(4): 227 -246 .
[10] 贺青, 刘剑, 韦联福. 微弱电磁信号的物理极限检测:单光子探测器及其研究进展[J]. 广西师范大学学报(自然科学版), 2022, 40(5): 1 -23 .
版权所有 © 广西师范大学学报(自然科学版)编辑部
地址:广西桂林市三里店育才路15号 邮编:541004
电话:0773-5857325 E-mail: gxsdzkb@mailbox.gxnu.edu.cn
本系统由北京玛格泰克科技发展有限公司设计开发