摘要: 随着现代互联网技术的飞速发展,网络传播途径遍布世界的每一个角落。网络在带给人们便利使用的同时,也带来了一些安全隐患,比如互联网上色情图像的非法传播就带来了一系列的社会问题和法律问题,尤其是给青少年造成了极大的危害。本论文主要是讨论可识别色情等不良图像信息的图像检测系统的研究与实现。
关键词:信息安全;图像检测;系统研究
Research and explore forpornographic image Information detection system
Tu Min
Jiangxi Police College,nanchang,jiangxi,330103
Abstract:With the rapid development of Internet technology, network transmission spreads every corner of the world. Network brings convenience for the people ,at the same time, it also brings some security risks, such as the illegal diffusion of pornographic images on the Internet. It can cause a series of social problems and legal issues, especially do great harm to the young people. This thesis is to discuss the research and realization of the pornographic image information detection system .
Keywords:Information security; image detection; system
0 引言
随着现代互联网技术的飞速发展,网络传播途径遍布世界的每一个角落。网络在带给人们便利使用的同时,也带来了一些安全隐患,比如互联网上色情图像的非法传播就带来了一系列的社会问题和法律问题,尤其是给青少年造成了极大的危害。
淫秽色情信息的传播和泛滥一直是世界各国非常重视的社会问题。随着信息技术的飞速发展,互联网网站成为传播色情淫秽信息的主要途径。仅美国本土,色情网站数量就超过了10万家。截止2010年5月1日,我国的网民数量达到4.04亿,网民规模位居世界第一,如果不对网络色情的传播和泛滥进行取缔,将严重危害我国人民的身心健康。
目前公安部网络安全监察部门和其他执法部门正在加大监管网上不良图像信息的力度,我们将讨论可识别色情等不良图像信息的图像检测系统的研究与设计,为执法机关打击网络色情等犯罪行为提供有力的监管工具。
1.国内外研究现状与发展趋势
目前图像识别技术识别难度高、技术复杂、准确率低(60%—70%),在国内外均还没有广泛应用。当前在图像识别技术方面的研究主要存在以下的不足:对静态图像、视音频数据识别技术的研究普遍停留在理论阶段,即使有少量产品具备这部分功能,但实际的应用效果并不好。尤其在打击互联网色情活动的专项行动中,这些产品暴露出了对非文本信息缺乏有效识别能力的缺陷。
针对互联网不良图像信息的类型和表现形式,发展多种行之有效的不良图像信息识别技术,是当今互联网信息监控技术的必然发展趋势。
2.目前图像识别的关键技术
互联网图像信息识别系统,将主要应用图像检索技术、图像识别初定位技术、光线补偿算法、高斯平滑算法、均衡直方图算法、图像对比度增强算法等关键技术。
2.1 图像检索技术
利用计算机的强大处理能力,从大容量的图像库中找到所想要的图像。图像检索包括以下几个步骤:步骤一,根据图像数值特征操作把大量的被检索图像生成特征量,并写入索引库;步骤二,通过了索引库,取出与作为检索要求的用户所给的关键字图像相似的图像;步骤三,通过比对之后,按照顺序给予显示,使得用户可以高效地找到所希望的图像数据;步骤四,结果反馈,系统根据这些反馈信息重新调整查询矢量,进行新的检索,使检索系统更加完善,提高用户检索的精度。
2.2 人脸识别初定位技术
采用自行设计的肤色样本选取方法提取肤色样本,以及肤色模型的分析比较,然后在TSL色空间中以单峰高斯模型为肤色模型求取肤色概率图的方法进行人脸初定位。人脸初定位对于人脸检测来说是非常重要的首要环节,恰当的初定位算法会使人脸检测事半功倍,不仅能大大提高检测速度,而且也能保证检测的准确性;反之则会使人脸检测事倍功半,甚至直接导致检测的失败。
该技术也可以用于对视频图像人脸的检测。视频图像的人脸检测,彩色信息是可被利用的重要信息,而在彩色信息中肤色信息具有稳定独特、不随人脸姿态、表情等变化而变化的优点,同时便于提取且计算简单快速,因此利用肤色信息进行人脸初定位能够确保人脸检测具有很好的鲁棒性和实时性。
2.3 光线补偿算法
光线补偿算法是将整个图像中所有像素亮度(是经过了非线形r-校正后的亮度)从高到低进行排列,取前5%的像素,如果这些像素的数目足够多(例如,大于100),就将它们的亮度作为“参考白”(Reference White),也即将它们的色彩的R、G、B分量值都调整为255。整幅图像的其他像素点的色彩值也都按这一调整尺度进行交换。这种算法可以解决肤色等的色彩信息经常受到光源颜色、图像采集设备的色彩偏差等因素的影响,而在整体上偏离本质色彩而向某一方向移动的问题。
2.4 高斯平滑算法
高斯平滑算法可以降低图像的视觉噪声,同时除去图像中的高频部分,使本来不明显的低频成分更容易识别。使用该种算法可以解决在图像的采集过程中,图像中出现一些不规则的随机噪声,如数据在传输、存储时发生的数据丢失和损坏等对图像质量影响的问题。
2.5 均衡直方图算法
通过点运算使输入转换为在每一灰度级上都有相同的像素点数的输出图像。它的实现主要是利用灰度均衡的转换式 DB = f (DA)= H(u)du 。
2.6 图像对比度增强算法
通过对图像的灰度值进行统计,对于小于Low则认为是有关的信息,则将它作为黑色处理,对于处于High以上的则认为是一些无关的信息,将它们去掉,而处于两者之间的,则进行对比度增强,将他们在总的灰度值里面的比例作为新的像素信息保存起来。
3.研究方案
在可识别色情等不良图像信息的图像检测系统中,我们主要采用以下技术路线进行研究与探索:
3.1人脸图像识别
通过采用自行设计的肤色样本选取方式提取肤色样本,在TSL色空间中以单峰高斯模型为肤色模型求取肤色概率图的方法进行人脸初定位。然后对人脸进行识别。识别方式如下:
3.1.1获取人脸区域:主要根据肤色非线形分段色彩变换来实现。这一非线性分段色彩变换得到的肤色模型属于色彩空间中的聚类模型,这一类肤色模型的建立首先要选取一种合适的色彩空间;
3.1.2图像预处理:通过对图像进行光线补偿、高斯平滑、均衡直方图等方式实现图像的对比度增强、二值化变换等效果;
3.1.3人脸定位:通过提取两只眼睛的距离,眼睛的倾角度、眼睛嘴巴中心,及用矩形标注出每个特征,将典型的脸部特征都标记出来以后将得到相应的特征值以便存入后台数据库。
3.1.4海量数据保存:将提取的特征值与处理后的数据存入后台大型数据库中,辅助后期完成识别功能。
3.1.5特征匹配:从图片中提取的特征值和后台数据库中的值进行比较来完成匹配功能。
3.2 图像过滤分类
图像过滤实质上是一个分类问题,同时也是一个比较困难的问题,主要是因为图像的内容非常丰富,很难简单地从图像中抽取出可以区分不同类别图像的有效特征,计算机所能自动提取出来只是一些低层次的视觉特征,能表征图像内容的高层次语义特征还是靠人工标注。图像是否有色情内容,实际上是一种高层次的语义特征,如果能够通过机器学习手段,从大量色情图像样本中发现出该类图像的规律,利用这些规律去分析现实世界中的其他图像,那么图像过滤问题就可以得到解决。图像过滤就是企图在由低层次视觉特征组成的向量空间中找“有色情内容”和“没有色情内容”两类图像的最优分类面。相对于色情图像来说,其他图像在表现形式上是异常丰富多彩的,在数量上是非常惊人的,为此我们期望通过小样本的学习而达到预期的分类效果。支持向量机在解决小样本、非线性及高维模式识别问题中表现出许多特有的优点,该方法通过把数据点映射到高维空间,使本来在低维空间上线性不可分问题在高维空间上线性可分,从而找到最优分界面。
3.3 一种基于边缘重心特征的图像检索系统及其图像检索方法
以边缘重心为图像特征,分别从关键字图像和检索图像中提取边缘线,从边缘线条中提取边缘点,把同一个边缘线上的边缘点组成一个边缘线物体系,并计算各个边缘点到边缘线物体系的重心距离比率;通过将关键字图像的边缘重心的图像特征与检索图像的被拆分的边缘重心的图像特征进行比较,可以实现局部图像相似的检索,可以从大量的图像数据中按顺序取出包含与作为检索要求的用户所给的关键字图像相似的图像数据并显示,是一种可以高效、准确地找到所包含相似的关键字图像的图像检索系统及其图像检索方法。
3.4 一种基于内容的人体上半身敏感图像识别方法及其系统
包括对静态图像进行人脸识别,排除不包含人脸信息的图像;利用神经网络识别对纹理图像进行识别,查出相关敏感信息位置;利用检测到的人脸区域的颜色分布信息与默认肤色信息生成此图像人体的肤色模型;根据所建立的人体肤色模型,提取出此图像中人体皮肤区域;如果敏感信息图像与人脸信息图像符合人体上半身形状模型,并且敏感信息图像所包含的皮肤比例超过阈值,则判定为敏感图像。采用人脸识别、上半身识别与敏感图像识别相配合,使其能够对性感写真图像与色情敏感图像进行区分,从而有效地降低了对性感写真图像的误报率。
4.系统主要功能模块
在可识别色情等不良图像信息的图像检测系统中,主要功能模块有:人脸识别初定位和图像过滤分类两大模块。
4.1 人脸识别初定位
该模块具有以下功能:
人脸区域获取:图像里人脸区域的获取,主要是根据肤色来进行获取,通过肤色非线形分段色彩变换来实现。这一非线性分段色彩变换得到的肤色模型属于色彩空间中的聚类模型,这一类肤色模型的建立首先要选取一种合适的色彩空间。
图像预处理:主要包括图像光线补偿、高斯平滑、均衡直方图、实现图像对比度增强、二值化变换等。
人脸定位:将典型的脸部特征(如眼睛,鼻尖,嘴唇等等)标记出来,在本系统中,定位的特征是眼睛,鼻尖和嘴巴三个。由于眼睛具有对称性,因此可以很快就能标记出来,而鼻子是在眼睛下面,且嘴巴在鼻子下面,所以只要眼睛标记好,鼻子和嘴巴也能相应的标记出来。
特征提取:在定位后的人脸图片中将眼睛、鼻子、嘴巴的特征值提取出来。在特征提取完之后将会得到相应的特征值以便存入后台数据库。
海量数据保存:将提取的特征值与处理后的数据存入后台大型数据库中,辅助后期完成识别功能。
特征匹配:将图片中提取的特征值和后台数据库中的值进行比较来完成匹配功能。
4.2 图像过滤分类
该模块具有以下功能:
图像分割:把图像分成各具特性的区域并提取出感兴趣目标。
肤色模型检验:可以得到皮肤占整个图像的百分比。
纹理模型检验:可以区别较光滑图片与非光滑图片。
分布模型检验:区别较边远图片与中央图片
各特征向量加权决策:通过直方图的统计分析来确定各个特征空间的模型。并从中确定各个特征向量的加权值。
5.结束语
我们希望能通过本系统的研究,有效地打击网络色情活动,为网络安全监察部门、新闻监管部门和其他执法部门有效地监管网上不良图像信息提供有力的工具,此研究对加强国家安全和社会稳定都将具有重要的意义。
参考文献:
1. 尹显东等. 基于内容的特定图像过滤方法[J].《计算机测量与控制》2004年第03期
2. 刘蔚琴, 凌捷. 敏感图像信息识别模型研究[J].《计算机应用与软件》2008年第06期
3. 戚义茹, 王国营. 基于目标区域的敏感图像特征提取[J].《计算机工程与应用》2006年第23期
4. 温泽逢,袁华. 基于内容的图像过滤新方法[J].《通信学报》2006年第21期
5. 蒋丽亚,霍宏涛. 基于IE浏览器的色情图像过滤器[J].《计算机应用研究》2009年 第03期
6. 周黎,王士林,李生红,李建华. 基于图像内容的过滤网关技术[J].《信息安全与通信保密》2006年 第01期
(责任编辑:)