基于深度学习卷积神经网络的智能垃圾分类系统
Olugboja Adedeji,王增辉*
摘要
固体废物在城市地区的积累正成为人们关注的焦点,如果管理不当,它将导致环境污染,并可能危害人类健康。拥有先进/智能的废物管理系统来管理各种废料是很重要的。废物管理最重要的步骤之一是将废物分离成不同的成分,这一过程通常是通过手工采摘手动完成的。为了简化过程,我们提出了一种智能垃圾分类系统,该系统是通过使用50层残差网络预训练(ResNet-50卷积神经网络模型,这是一种机器学习工具,用作提取器)和支持向量机(SVM)来开发的,支持向量机用于将垃圾分类为不同的组/类型,如玻璃、金属、纸张和塑料等。在Gary Thung和Mindy Yang开发的垃圾图像数据集上测试了所提出的vstem,并能够在数据集上实现87%的准确率。使用拟议的废物材料分类系统,在没有或减少人类参与的情况下,废物的分离过程将更快、更智能。
关键词:卷积神经网络,暴雨模型,废物分离,自动化,机器学习,支持向量机
1.简介
世界银行的报告显示,全球每年有近40亿吨废物,而城市本身也对这一数字做出了很大贡献,预计到2025年,废物将增加70%(11。根据(11在未来25年,欠发达国家的废物积累将急剧增加。随着城市地区工业数量的增加,固体废物的处理确实成为一个大问题,固体废物包括纸张、木材、塑料金属、玻璃等。管理废物的主要方法是填埋。填埋效率低、成本高、污染严重。)例如,垃圾填埋场会影响留在垃圾填埋场周围的人的健康。管理废物的另一种常见方法是焚烧废物,这种方法会造成空气污染,废物中的一些有害物质会扩散到空气中,从而致癌2)。因此,为了保护环境和人类健康,有必要回收废物,我们需要将废物分离成不同的成分,这些成分可以用不同的方式回收
1.1动机
目前分离垃圾的方法是人工挑选法,即有人将不同的物体和材料分离出来。由于垃圾中的有害物质,分离垃圾的人很容易患上疾病。记住这一点。它促使我们开发一种能够对废物进行分类的自动化svstem。这个系统可能需要很短的时间来分拣废物。而且它在排序方面会比手动方式更准确。在系统就位的情况下。有益的分离废物仍然可以被回收并转化为用于经济增长的能源和燃料3。该系统是基于卷积神经网络和支持向量机(SVM)的组合,即卷积神经网络与支持向量机的组合进行识别和分类。由于垃圾图像数据集很小,我们使用了一个预先训练的ResNet-50模型,这是一种卷积神经网络架构。当深度增加时,卷积神经网络的识别精度可以增加41,但由于深度的增加,假设修改权重的信号在CNN的早期层减少。(5) 。这将使早期层的学习变得无关紧要,这被称为消失梯度。向网络中添加越来越多的层总是会导致训练错误。残差网络(ResNet-50)与普通卷积神经网络6的不同之处在于。它能够通过设计称为残差模型的Conyolutional神经网络模块来解决消失梯度的问题,ResNet模型和基本块如图1所示。
1.2相关工程
已经开发了许多不同的图像分类算法,如RNN、SVM、ANN等,但卷积神经网络作为一种机器学习算法确实比它们都表现得更好。当该算法被用于赢得2012年image-Net大规模视觉识别挑战赛(lLSVRC)时,CNNs一举成名,该挑战赛在(7)中提出。自2012年以来,已经开发了许多不同的CNN架构,解决了许多图像分类问题(819101111。卢雷理工大学在1999年承担了一个项目,并开发了一个使用机械形状识别器121回收金属废料的系统。(131使用了来自SIFT的特征和Bavesian计算框架上的轮廓形状,它们的系统基于Flickr材料数据库。(141151在2016年开发了一款能够区分堆肥的自动垃圾桶,并用树莓派回收,他们的系统是使用谷歌的Tensorflow开发的。他们的系统的缺点是只能区分堆肥材料。(16)开发了一个智能手机应用程序,能够大致识别图像中的垃圾堆。该应用程序使人们能够提供所在地区的垃圾信息,并使用AlexNet预训练模型获得85%的平均准确率。
1.3.数据集
在这项工作中,我们使用了Gary Thung和Mindy Yang(17)创建的皮疹图像数据集。这是一个小数据表,由1989张图像组成,分为四类:玻璃、纸张、塑料、金属,图像的所有图片都已调整为512 x 384。图2中显示了一些图像样本。
2.方法
在预处理阶段,由于图像尺寸较小,对图像进行了数据扩充。选择这种技术是因为废料的方向不同。一些技术包括图像的随机平移图像、随机缩放图像、图像剪切、随机缩放。通过这种技术,它最大化了数据集的大小。所提出的方法是基于ResNet-50预训练模型开发的,过程如图所示。
2.1.ResNet
在美国有线电视新闻网。几个拉沃尔人组成了网络1181191美国有线电视新闻网的拉沃尔人实施了一些行动。这允许其对输入图像进行分类。卷积层使用大小为3x3的滤波器窗口序列对输入的图像进行卷积。之所以使用这种方法,是因为讣告的区别在于小而局部的特征。基本特征是从输入图像中提取的。原始特征是在前几层的帮助下提取的。随着训练的深入,提取出越来越复杂和详细的特征。借助于损失函数概率。也就是说。Softmax函数(20我们的模型是在ResNet-50预训练模型的基础上开发的,该模型在尺寸为256 x 256的lmageNet图像上进行了预训练,并分类为1000个类别。如图3所示,ResNet-50预先训练的模型已经在MapNet数据集上进行了训练,并获得了一组权重ture来自网络。特征被传递到MulClass SVM模型,在那里进行分类。基于提取的特征。
2.2.支持向量机
SVM可以用于解决分类和回归问题。t是一种机器学习技术,被认为是最好的分类算法之一。使用此算法。数据项被绘制为n维空间中相对于特定坐标的特征值的特定点。SVM中的项目是基于每个多维数据的超平面分离进行分类的。它为训练数据找到最小距离较大的超平面。
3.实验与结果
网络的权重是固定的,完全连接层被去除并用SVM代替,SVM被训练并用于分类。我们使用以下参数进行SVM优化,使用径向基核,SVM C-参数设置为1000,gamma设置为0.5。使用的预训练ResNet-50是在图像大小为224 X 224的mageNet数据集上实现的。卷积后和激活前使用标准增色和批量归一化。动量和重量衰减分别为0.9和0.0001。训练是在具有两个时期的i5英特尔核心CPU上进行的。ResNet-50 CNN被用作特征的提取器,使用Kera pvthon和具有1989个图像的垃圾数据集。训练过程中使用了随机梯度动量下降法(SGDM)。在SGDM的帮助下,对权重和偏差进行了更新。样品是随机选择的,小批量为12个。整个数据集被分为两部分,比例为8.2,分别用于训练和测试样本。然后使用Multi-Class SVM21122对提取的特征进行分类。在整个训练之后,我们获得了87%的准确率,在第12个时期之后,准确率不再提高。在第12个历元之后停止的标准是测试损失停止减少,并且处于相同值。图4和图5分别显示了训练损失与验证损失以及训练准确性和验证准确性。对于训练时期的样本,将数据集输入网络,并对每个样本进行反向传播。损失存储在每个历元之后,并计算平均值。损失是根据历元绘制的,这给了我们训练和验证损失,如图4所示。当与历元绘制时,平均训练精度为94.5%,如图所示。5,这几乎是完美的。
4.结论
总之,我们提出了一种废物分类系统,该系统能够使用机械学习工具分离废物的不同成分。该系统可用于自动分类废物,并有助于减少人为干预,预防感染和污染。从结果来看,当与垃圾数据集进行测试时,我们得到了87%的准确率。使用我们的系统,在没有或减少人类参与的情况下,废物的分离过程将更快、更智能。如果将更多的图像添加到数据集中,则可以提高系统的准确性。在未来,我们将倾向于改进我们的系统,通过调整所使用的一些参数,能够对更多的废物进行分类。