《多媒体技术》实验报告
目录
《多媒体技术》实验报告 1
一、 实验选题 1
二、 实验要求 1
三、 实验内容 1
(1)图像处理系统主题部分代码 3
(2)CNN人脸识别部分函数代码: 8
四、 实验效果 8
(1) 阈值二值化 8
(2) 边缘检测 9
加入降噪之后: 9
(3) 轮廓检测 10
(4) 高斯滤波 10
线性滤波: 11
(5) 色彩空间转换: 11
(6) 调节对比度: 12
(7) 人脸识别+人眼识别 12
五、 实验结论 14
一、实验选题
图像处理应用系统的开发
二、实验要求
(正文部分)
三、实验内容
1.平台选择
对于本实验,我选择的编程语言是python,开发平台是pycharm+anaconda,选择python作为我的开发语言的原因是,python是一种语法简单的脚本化语言,python可以调用很多第三方库,包括我采用的当下比较热门的图像处理库OpenCV,学习成本较低,代码可读性也很高。选择pycharm的原因是,比起python自带的IDE,它内置了语法补全、语法高亮的功能的功能,最新版的pycharm也可以一键安装所需的python版本,非常方便,同时加上anaconda,它包含了许多开发需要的python科学包,如numpy等,并且可以方便的使用conda命令,比起pip命令更加方便。
2.处理技术介绍(如果是算法设计,需要给出算法的基本思想介绍;如果是媒体处理,需要给出处理的基本思路)
(1)阈值二值化:这里我采用的是二分阈值化,实现非常简单,首先,图像必须转化为灰度图像,对于RGB空间而言,需要将他们取平均,得到的为灰度值,对这个灰度图像设置一个阈值,超过这个阈值的像素点,显示为黑色图像,低于这个阈值的像素点设置为白色,阈值范围在[0,255]。
(2)边缘检测:边缘是指图像中图像像素值变化明显的位置。这些变化明显的位置常常是图像中需要关注的位置,对这些关键位置的检测,就叫做边缘检测。也就是需要对这些位置求导数,这里一般有两种常用的算子,我采用了canny算子,即梯度方向的二阶导数过零点,但首先需要使用高斯滤波来降噪,以排除噪点的影响(为了说明高斯滤波降噪的重要性,我设置了一个check方法来对比),接着使用canny算子来计算边缘部分, 在获得梯度大小和方向后,将对图像进行全面扫描,以去除可能不构成边缘的所有不需要的像素。为此,在每个像素处,检查像素是否是其在梯度方向上附近的局部最大值,最后采用双阈值法得到最终图像,它的原理是,在非极大值抑制后的边缘点中,设置两个阈值TH和TL,梯度值超过TH的为强边缘,小于TH大于TL的为弱边缘,小于TL的不是边缘,可以肯定的是,强边缘必然是边缘点,因此必须将T1设置的足够高,以要求像素点的梯度值足够大(变化足够剧烈),而弱边缘可能是边缘,也可能是噪声,如何判断呢?当弱边缘的周围8邻域有强边缘点存在时,就将该弱边缘点变成强边缘点,以此来实现对强边缘的补充。最终得到了一张边缘检测之后的视频图像。