微美全息科学院:一种用于图像分类的抗噪声干扰的卷积神经网络

图像被噪声破坏会影响卷积神经网络(CNN)的性能。在预处理过程中,经常会对噪声图像进行恢复,能提升CNN的分类性能。然而,由于噪声的高密度,噪声图像可能在预处理步骤中不能完全恢复,因此会对CNN的学习和验证产生负面影响。此外,去除噪声的预处理是一个昂贵和耗时的过程。因此,一种用于噪声图像分类的抗噪声鲁棒性卷积神经网络(NR-CNN)被提出,它不需要进行去噪的预处理。这种方法对各种类型的噪声具有鲁棒性,如脉冲噪声、缺失的图像样本、图像传输中的丢包、损坏图像和篡改图像。这种NR-CNN通过添加一个噪声图层和自适应调整大小层来修改基本卷积神经网络的体系结构,实现对噪声的鲁棒性,并考虑了在NR-CNN不同分量中噪声图像的分类。作为纳斯达克上市企业“微美全息US.WIMI”旗下研究机构“微美全息科学院”的科学家们大量的实验证明了该NR-CNN在噪声图像分类中的有效性。

卷积层、池化层和全连接层是卷积神经网络的主要组成部分。卷积层由几个包含特征图的卷积核收集。对于分类问题,softmax函数通常应用于输出层(CNN的最后一层)。用于分类的CNN参数的最优值(如权向量和偏差项)可以通过最小化损失函数来实现。接下来介绍NR-CNN的组成部分。

1.噪声图层

该NR-CNN有一个放置在NR-CNN开始地方的噪声图层,该图层可用于检测脉冲噪声、缺失的图像样本、图像传输丢包、损坏图像、篡改图像。噪声图层检测各种类型的噪声,并为每个图像产生一个的噪声层来表示有噪声和未损坏的图像。噪声图层的结构如图1所示。

图1.噪声图层的架构

从图1可以看出,脉冲噪声是通过局部一致性索引方法检测。图像传输中的丢包基于图像内容进行检测。此外,缺失的图像样本用目标区域进行检测,受损图像使用统计方法检测,篡改的图像使用图像身份验证方法进行检测。

在所提方法中,为了增强CNN对噪声的鲁棒性,在前面的步骤中为每个图像生成一个基于噪声类型的噪声图。如图2所示,每幅图像包含四个通道:噪声图通道,红色通道,蓝色通道和绿色通道。因此,图像是通过四个通道传送给CNN的。在基于噪声图的训练过程中,NR-CNN学习处理噪声像素。

图2.每个图像有四个通道。

2.自适应调整层

卷积神经网络通常从卷积层开始。CNN的输入图像一般有一个固定的大小(即244*244)。因此,图像的维度比CNN的尺度要大时,应该减小其维度。在NR-CNN中,一个新的层(称为自适应调整大小层)被放置在CNN以增加网络对噪声的鲁棒性。自适应调整大小层的任务是提高用于较大图像的降维方法。在利用噪声图从几个像素中选取一个像素来减小图像尺寸时,噪声像素被移除,利用剩下的像素实现降维处理。自适应调整层使噪声像素不参与在CNN输入图像的降维过程中。具有自适应调整大小层的CNN的开始部分如图3所示。

图3.具有自适应调整层的CNN的开始部分

3.对噪声的自适应卷积层

卷积层参数包括一组可学习的滤波器。在NR-CNN中,通过自适应滤波为CNN对噪音的鲁棒性提供了一种有效的方法,从而实现了对CNN卷积层结构的改进。

3.1自适应滤波

该方法通过丢弃卷积的源和核之间的噪声连接,减小噪声对CNN的影响。自适应滤波基于CNN中那些能提高分类精度的像素值,来执行丢弃噪声连接。丢弃噪音连接能阻止输入的噪声像素进入到下一层。这种丢弃噪声连接的方法可用于不同的卷积核尺寸。值得一提的是,噪声图在每一层都会更新。

3.2自适应步幅

这里提出的自适应步幅在算法1中进行了描述,提高了噪声图像的分类精度。

算法1:

1制作一个位矩阵作为步幅图

2在每个步幅中标记所选像素

3匹配噪声图和步幅图,检测噪声像素

4将滤波器的位置从有噪声的区域更改为最接近w*w的未损坏的区域

修正自适应步幅图可以使噪声像素在分类过程中不被考虑。如图4所示,噪声图与步幅图最初是匹配在一起的,然后执行步幅操作。w*w是搜索找到用于改变过滤器位置的最近的未损坏位置的区域。

图4.基于噪声图的CNN自适应步长。有噪声的像素用黑色表示。

此后,再经过针对噪声的自适应池化层和基于噪声图的数据增广等过程。

总结

我们可以将NR-CNN的优点总结为如下:

1.该方法可同时用于CNN对几种类型噪音的鲁棒性分析。具有不同噪声类型的图像只需要该NR-CNN处理一次。

2.该NR-CNN无需噪声图像恢复的预处理,并能在训练阶段加速这些图像的分类。

3.该NR-CNN的性能优于其他噪声图像的分类方法。

微美全息科学院成立于2020年8月,致力于全息AI视觉探索科技未知,以人类愿景为驱动力,开展基础科学和创新性技术研究。全息科学创新中心致力于全息AI视觉探索科技未知, 吸引、集聚、整合全球相关资源和优势力量,推进以科技创新为核心的全面创新,开展基础科学和创新性技术研究。微美全息科学院计划在以下范畴拓展对未来世界的科学研究:

一、全息计算科学:脑机全息计算、量子全息计算、光电全息计算、中微子全息计算、生物全息计算、磁浮全息计算

二、全息通信科学:脑机全息通信、量子全息通信、暗物质全息通信、真空全息通信、光电全息通信、磁浮全息通信

三、微集成科学:脑机微集成、中微子微集成、生物微集成、光电微集成、量子微集成、磁浮微集成

四、全息云科学:脑机全息云、量子全息云、光电全息云

以下是微美全息科学院的部分科学家成员:

李徐周,山东大学计算机科学与技术学院博士,是模式识别与图像处理方向学术带头人。近年来一直从事模式识别与图像处理等领域的研究、开发与应用工作。曾参与国家自然科学基金重点项目和山东省自然科学基金重点项目等多项课题的研究工作。在模式识别、图像处理等方面打下良好的工作基础。近年来已在模式识别、图像处理等方向发表多篇学术论文。

郑玉洁,重庆大学博士学位,研究方向包括产品设计变更管理、VR/AR驱动商业模式创新,曾经主研的科研项目包括山东科技大学菁英计划的《基于VR/AR技术的复杂机械产品设计变更管理研究》、重庆大学汽车协同创新中心重点项目《VR/AR技术在汽车消费行为偏好挖掘中的应用及关键技术》及其他多项国家自然科学基金项目,也曾参与发表多篇期刊论文。

刘湘辉,国防科技大学计算机工程与科学专业博士,研究方向包括成像卫星任务规划、无线传感器网络以及公路工程管理软件应用等。曾参加多项国家自然科学基金,其中,其在无线传感器网络方面的相关研究论文曾被《计算机研究与发展》、《电子与信息学报》、《软件学报》以及若干国际会议录用和发表。

丁凯,华中科技大学电力电子与电力传动专业博士,香港理工大学研究员,研究方向包括电子电力学仿真技术,电动汽车、电池管理系统等,曾主导过多项相关的研究项目。

郭松睿,湖南大学计算机科学技术工学博士,曾在中科院科学计算国家重点实验室合现实技术研修班学习混合现实,增强现实技术,参与研发多个重点项目。

江涛,中国科学院沈阳自动化研究所博士,机器人学国家重点实验室,研究方向为微型仿生飞行器的气动/结构设计、控制与系统开发,在2018年获得ICRCA-2018机器人EI国际会议"最佳论文奖"。

杨军超,重庆邮电大学通信与信息工程学院信息与通信工程专业博士研究生,华盛顿大学电子工程学院联合培养博士,长期研究虚拟现实、5G多媒体传输优化、基于MEC的智能转码优化,以第一作者发表SCI/EI论文6篇,中文核心1篇,申请专利4项。

李维娜,2017年博士毕业于韩国忠北国立大学的信息和通信工程学院。2017年8月去了新加坡的Singapore-MIT Alliance for research and technology centre(SMART)从事压缩全息(compressive digital holography)的博士后工作,2018年11月进入清华大学深圳国际研究生院的先进制造学部,在以前工作的基础上把数字全息(digital holography)拓展到机器学习(machinelearning)领域,特别是对U型网络(U-net)的改进和应用。在上述研究领域以第一作者发表高水平论文5篇,以第二作者发表的高水平论文2篇。

曲晓峰,香港理工大学博士,现任清华大学深圳研究生院博士后,主要研究生物特征识别、机器视觉、模式识别,与绿米联创合作进行嵌入式产品算法、深度学习应用、图像与视频相关算法以及生物特征识别相关产品的开发。

危昔均,香港理工大学康复治疗科学系博士,南方医科大学深圳医院虚拟现实康复实验室负责人,主要研究基于虚拟现实技术的康复系统搭建及相关临床和基础研究。

单羽,昆士兰科技大学数字媒体研究中心(澳大利亚)博士,研究方向为虚拟现实娱乐产业与亚洲创意经济,曾参加多场虚拟现实产业的国际学术会议并发表主题演讲,发表多篇以“虚拟现实艺术”相关的学术论文,并参与国内多个虚拟现实娱乐产业领域的项目研究。

刘超,新加坡南洋理工大学博士,是深圳市南山区领航人才,深圳市海外高层次人才孔雀计划C类,Molecular Physics 2011年度最佳年轻作者提名,主要研究方向为人工智能预测过渡金属氢化物金属氢键键长与解离能和环式加成反应中量子力学/分子力学反应机理研究,曾参与过流程模拟软件的开发与研究。

张婷,美国西北大学博士后,香港大学博士,海外高层次人才孔雀计划C类,主要从事VR/MR关键技术研发应用和复杂服务系统优化等研究,发表全息专利5项。获全国"挑战杯"创业计划大赛湖北省一等奖,华中科技大学一等奖。

姚卫,湖南大学计算机科学与技术工学博士,主要研究方向:忆阻神经网络及其动力学行为,应用于:图像处理、安全通信。基于VDCCTA具有长时记忆特性的忆阻器电路及其构成的神经网络。参与设计基于忆阻器的神经网络系统模型。基于忆阻器的仿生物神经元和突触连接的微电子电路设计,参与基于忆阻器的神经网络系统模型的设计与动力学行为的分析。

彭华军,博士,毕业于香港科技大学显示技术研究中心(CDR),从事硅基液晶器件、AMOLED材料与器件、TFT器件、显示光学等研发工作。彭博士一直从事信息显示领域前沿工作,涵盖电视图像色彩管理、AMOLED生产制造、微显示芯片设计与制造、投影与近眼显示光学等。彭博士在国际刊物上发表20篇文章。已申请近50项中国发明和美国发明专利,其中10项美国专利和20项中国发明专利获得授权。

陈能军,中国人民大学经济学博士、上海交通大学应用经济学博士后,广东省金融创新研究会副秘书长、广东省国际服务贸易学会理事。主要从事文化科技和产业经济的研究,近年来在版权产业领域研究方面有较好的建树。近年来先后主持、主研“5G时代的数字创意产业:全球价值链重构和中国路径”“深圳加快人工智能产业发展研究”“贸易强国视角下中国版权贸易发展战略研究”,“文化科技融合研究:基于版权交易与金融支持的双重视角”等省部级课题多项,并在《商业研究》《中国流通经济》《中国文化产业评论》等核心期刊发表论文多篇。

潘剑飞,香港理工大学博士学位,现为广东省高校“千百十工程”人才,深圳市海外高层次人才,深圳市高层次人才、深圳大学优秀学者。研究领域主要为自动化+VR应用、先进数字化制造、数字制造全息孪生工厂、机器人等。主持多项国家自然科学基金项目、广东省科技计划项目和广东省自然科学基金项目。

杜玙璠,北京交通大学光学工程博士,取得与显示产品相关专利20余项,发表期刊文章3篇,曾打造全球最高分辨率的8K*4K的VR产品,并提出了采用光场显示技术,解决VR辐辏冲突问题;推出首款国产化率100%的单目AR眼镜,第一次联合提出基于未来空间信息的非接触式交互的操作系统概念(System On Display),在运营商体系进行虚拟现实数字产业合作。

伍朝志,深圳大学光机电工程与应用专业博士,研究方向主要为精密/微细电解加工,发表过多篇期刊论文和会议论文,获得三项相关专利,曾参与国家重点研发计划、国家自然科学基金重大研究计划重点项目等。

丁茹,中国社会科学院,数量经济研究所的技术经济及管理博士,从事大数据与数字经济、创新发展研究、科研项目管理等领域,主要研究领域为科技服务、产业经济研究、技术创新与创业。任山东省技术市场协会副秘书长,擅长整合创新资源、拓展创新业务和创新产业规划和产业经济,参与虚拟现实技术应用方面的相关创新研究和产业资源对接。

翟振明,美国肯塔基大学博士毕业,为广州大学R立方研究所所长、中山大学博导、人机互联实验室主任,曾撰写英文专著《Get Real:A Philosophical Adventure in Virtual Reality》,该书对虚拟现实和扩展现实发展趋势进行技术迭代预言并得到相关印证,此著作被美国评论者认为“有可能在虚拟现实技术和哲学两个领域都成为里程碑性的著作”。其设计创建中山大学人机互联实验室,其中的“虚拟与现实之间无缝穿越体验系统”已在国内外产生广泛影响。其首创了虚拟现实作为逆向艺术的概念,为虚拟世界的艺术与人文理性做出了突出贡献。

谭昕,副教授,主要研究全息虚拟现实应用设计等战略新兴产业相关课程,是数字媒体艺术设计专业主任,担任国泰安教育技术有限公司名誉顾问;受聘深圳市文化广电旅游体育局文化产业专家库专家;受聘深圳市龙岗区文化创意产业专家库专家;担任重庆青年职院项目化课程重构指导指导专家。曾主编《虚拟现实应用设计》。

陆建勋,深圳大学工学博士,其主要产学研方向为虚拟现实技术应用、智能制造技术及相关设备开发等,在相关领域有着广泛而深刻的研究,并发表过多篇期刊论文,曾参与了国家自然科学基金项目、广东省自然科学基金项目和深圳市知识创新基础研究等项目。

张鑫,湖南大学计算机科学与技术工学博士,主要研究硬件电路前后仿真,并进行实际的芯片设计工作,有丰富的整套流流程的经验,如集成电路设计、性能仿真、版图设计、版图验证、前后仿真、流片及封装测试等。曾参与过多项国家自然科学基金项目,发表多篇相关学术论文,多次参加相关领域的学术会议。

洪岳,瑞典乌普萨拉大学工程科学学院博士,现为深圳大学全息计算机技术、光电通信技术助理教授。研究方向包括全息计算机科学、半导体光电、自动化与信息工程、通信系统等等。曾参与发表相关研究领域的多篇期刊论文和会议论文。

张伟略,昆士兰科技大学博士,研究方向主要有沉浸式现场娱乐,跨文化研究、用户体验、本地化策略、沉浸式戏剧等等,其拥有众多光路设计作品,曾获2014上海青年创意基金相关奖项。

王璨,哈尔滨工业大学电气工程博士,德国慕尼黑工业大学,电力电子与电力传动研究所,联合培养博士。研究领域有电力电子工业VR技术应用、新一代全息孪生工厂技术、工业4.0等。曾参与国家自然科学基金委联合基金重点支持项目、国家自然科学基金委青年项目、广东省自然科学基金委面上项目等。发表了多篇相关领域的期刊论文,联合取得相关专利3项。

刘艺涛,新加坡南洋理工大学电气与电子工程学院博士,曾为新加坡南洋理工大学,罗尔斯•罗伊斯-南洋理工大学联合实验室博士后。曾主持国家自然科学基金青年项目、广东省科技厅博士启动项目、深圳市基础研究等项目。参与发表过多篇相关领域的学术论文。

刘云,浙江大学电力系统及其自动化工学博士,美国中佛罗里达大学电气工程和计算机科学联合培养博士,曾为新加坡南洋理工大学能源研究中心博士后研究员,是深圳市南山区C类“领航人才”、深圳市海外高层次人才C类,主要研究方向包括微网/主动配网分布式优化控制等。参与发表过多篇相关领域期刊论文和会议论文,联合发明专利一项,曾做过多场专业学术报告,参与/主持多项科研项目,包括图像信息处理与智能控制教育部重点实验室开放基金(IPIC2019-02),多能源集成优化调度等。

胡国庆,北京大学电子学系博士、博士后,北京大学深圳研究院副研究员,北京大学深圳研究院5G课题组组长,北京大学深圳系统芯片设计重点实验室副主任,深圳市高层次专业人才,广东省百名博士博士后创新人物,深圳市南山区“十大南山好青年”,深圳市新兴战略产业博士专家联谊会创始发起人、副会长兼执行秘书长,深圳5G产业协会专家委员会副主任,深圳5G产业联盟专家委员会副主任,深港澳博士专家联盟副秘书长,朴素资本首席信息技术顾问。拥有副研究员、高级工程师两个高级职称,一个客座教授荣誉称号。参著学术专著一部,发表SCI/EI/ISTP等高质量学术论文40余篇,申请发明专利17项;主持国家及省市级科研项目六项,参研国家级项目十余项。

袁志辉,中国科学院大学(中国科学院电子学研究所),通过硕博连读获得通信与信息系统专业博士学位,主要研究方向:(1)InSAR信号处理;(2)信号分析与处理。现主持国家自然科学基金项目1项,湖南省自然科学基金项目1项,主持湖南省教育厅科学研究项目2项;先后参与国家自然科学基金、湖南省自然科学基金和省教育厅重点科研项目等5项;目前获专利授权2项;在国内外重要学术期刊上发表论文十余篇,其中SCI收录9篇,并担任过IEEE GRSM、TGRS、JSTARS、Access、Letters、SPL和JARS等国际遥感类和信号处理类权威期刊的审稿人。

李庆普,上海理工大学博士,在虚拟现实领域有丰富的研究经验及项目实践经验,曾参与基于计算机触觉技术的虚拟医疗仿真技术研究、汽车模拟驾驶仿真研究、多体感VR硬件研发及VR实训安全教育等多个项目。其已发表多篇相关论文并取得多项专利。

微美全息科学院旨在促进计算机科学和全息、量子计算等相关领域面向实际行业场景和未来世界的前沿研究。建立产研合作平台,促进重大科技创新应用,打造产业、研究中心深度融合的生态圈。微美全息科学院秉承“让有人的地方就有科技”为使命,专注未来世界的全息科学研究,为全球人类科技进步添砖加瓦。

微美全息成立于2015年,纳斯达克股票代码:WiMi。$微美全息(WIMI)$ 
微美全息专注于全息云服务,主要聚集在车载AR全息HUD、3D全息脉冲LiDAR、头戴光场全息设备、全息半导体、全息云软件、全息汽车导航、元宇宙全息AR/VR设备、元宇宙全息云软件等专业领域,覆盖从全息车载AR技术、3D全息脉冲LiDAR技术、全息视觉半导体技术、全息软件开发、全息AR虚拟广告技术、全息AR虚拟娱乐技术、全息ARSDK支付、互动全息虚拟通讯、元宇宙全息AR技术,元宇宙虚拟云服务等全息AR技术的多个环节,是一家全息云综合技术方案提供商。

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

举报

评论1

  • 推荐
  • 最新
  • 贝莱欧
    ·2022-08-23
    好高级的样子
    回复
    举报