本科毕业设计(论文)答辩记录
计算机科学与通信工程 学院 计算机科学与技术 专业
学生姓名 学号
课题名称
|
注意力机制驱动深度学习的多标签图像
分类系统设计与实现
|
指导教师姓名
|
|
职 称
|
教授
|
答辩摘要:
(1)如何理解多标签图像分类?
答:在一张图像中往往包含多个类别对象,每个对象一个标签,多标签图像分类就是将这张图片所包含的所有标签信息赋予该图像。比如一张图像描述的是“一个男孩在草地上玩橄榄球”,其中包含的标签有“男孩”、“草地”、“橄榄球”,如果我们试图仅使用一个标签来检索,往往不易检索到此图像,如果输入完整的三个标签,便可容易地检索到该图像。我们根据图像相应的输出多个标签具有重要的意义,如在医疗方面根据图像输出多个可能患有的疾病标签,智能驾驶根据图像识别出多个环境标签等等。
(2)介绍一下模型评估中用到的评价指标?
答:平均精度均值(mAP):先介绍精准率(precision)和召回率(recall)的概念,召回率每次取相同标签中的一个样本进行统计,如果模型预测的结果与样本的真实值一致,则召回率提高;精准率每次取已预测为同一类别样本进行统计,如果模型预测的结果与样本的真实值一致,则精准率相应提高。平均精度(AP)是把精准率在不同召回率取值时的值求平均。平均精度均值(mAP)就是对每个类别计算平均精度再次进行平均。CP,CR分别是所有类别的精准率和召回率的均值,OP,OR是全局精准率和召回率。模型里用到的F1是精准率和召回率的调和均值,CF,OF分别表示类别F1分数均值和全局F1分数。
(3)模型的主要改进之处在哪里?
答:在图卷积神经网络的基础上,构建动态图卷积神经网络以学习特定于图像的特定标签类别表示。并在图卷积网络之前加入注意力机制以加强标签与特定图像区域的关联。
(4)所有待识别的图像都要经过静态图和动态图吗?
答:是的。本模型经过静态图学习全局图像间的关联,主要记录在静态相关矩阵中,通过动态图生成特定于图像的自适应的标签关联。联合静态图和动态图可以更好的建模标签间的关联。
答辩小组组长签字:
20XX年 6 月 5 日
|