自编码器理论与方法综述①

更新时间：2009-03-28

1 引言

自编码器是一种无监督学习算法,其输出能够实现对输入数据的复现.自编码器的概念是Rumelhart等[1]最早提出的,自编码器是一种数据压缩算法,它使用编码器实现数据压缩,使用解码器实现解压缩.编码阶段将高维数据映射成低维数据,减少数据量; 而解码阶段正好相反,从而实现对输入数据的复现.

2006年,Hinton等[2]将其作为一种降维方法发表在Science上.文章通过使用“互补先验”的方法推导出一个快速贪婪算法,逐层学习深度定向网络,然后对整个网络的参数进行优化,改善了传统方法易陷入局部极小的情况,由此产生了深度自编码器.Bengio 等[3]在深度自编码器的研究过程中,加入了稀疏性的限制,使用尽可能少的神经元学习提取有用的数据特征,进而产生了稀疏自编码器.Vincent等[4]为了提高算法的健壮性,在输入数据中加入了噪声,形成了去噪自编码器.2010 年,Rifai等[5]在维度处理的过程中加以限制,提出了收缩自编码器.次年,Masci等[6]提出卷积自编码器用于构建卷积神经网络.

自编码器在其优化发展过程中,被应用到很多领域,比如图像分类、人脸识别、自然语言处理以及其他领域,并取得了较好的成绩.本文也将从这些方面着重介绍自编码器的特点及性能,并对这些方法进行分析和比较.

2 基础介绍

自编码器通过对输入数据进行压缩,将其映射到低维空间中,从而避免了“维度灾难”; 在解码阶段实现对输入数据的还原,从而实现非监督的特征学习.

2.1 模型介绍

一个自编码器有编码器和解码器两部分组成(如图1所示),对于输入x,通过编码函数:

得到编码h,实现数据压缩.其中sf为编码器的激活函数,通常取为 sigmoid 函数,即:

W表示输入层和隐层之间的权值矩阵.在解码阶段使用解码函数:

图1 自编码器的基本结构

将编码h映射到原始高维空间,从而达到对输入的复现.其中WT为隐层和输出层之间的权值矩阵(为简单起见,这里的权值矩阵取为W的转置),sg为解码器的激活函数,通常取为sigmoid函数或恒等函数,即:

或:

根据解码器激活函数的不同,L(x,y)通常有以下两种取法:

使用反向传播的方法,求出最后输出层与个层神经元的残差,利用梯度下降法不断更新W和b,使得输出更接近输入.

刘勘等[8]使用微博数据作为分析对象,利用基于深层噪音稀疏自编码器的短文本聚类算法进行无监督学习.文章数据来源于大数据共享平台,可分为IT、财经、健康三大类,每一类取1500条微博.通过Entropy和Precision两种方法衡量聚类效果,最终得到深层噪音稀疏自编码器(DSAE)+ k-means的方法效果最好,综合信息熵为0.207,综合准确度为87.8%.

在重构误差的基础上,本文针对训练数据集S设置整体的损失函数(loss function)为:

刘洋洋等[23]提出将多尺度单层自编码器的方法应用到医学图像自动分类中,选择ImageCLEFMed 2009数据集中20类共4780幅图像,其中3350幅作为训练集,选择原测试数据集中的1430幅作为本实验测试样本,实验学习到的特征表示和总体准确率明显由于传统方法.

图2 自编码器网络结构

2.2 自编码器算法流程

2.2.1 算法思路

自编码器算法的设计思路如下:

概念图模型的建立能够帮助学生快速理清各概念之间的联系，特别有利于联系前后章节，建立大单元学习背景，在整体教育思想的指导下，高瞻远瞩地看问题。

(1) 对于给定的无标签数据,本文使用无监督学习方法学习特征.对于无类标签的数据,文中通过编码器将输入数据进行编码,然后使用解码器得到一个输出信息,如果输出近似等于输入数据,则可以通过调整编码和解码阶段的参数,使得重构误差最小.

3.EPC工程总承包项目结算和审计问题。《审计法》第二十二条、《审计法实施条例》第二十条规定，所有的以政府资金为主的项目都需要进行审计。在EPC工程总承包项目中，业主一般采用风险可控的固定总价合同模式，政策发文也提倡这种合同模式，这与目前的以项目竣工审计为依据的结算体系出现矛盾。更深一步讲，固定总价合同模式下，是否需要最终审计，如何进行审计，这是目前业主也无法给出答案却亟待解决的现实问题。

张开旭等[7]利用自编码器能够实现无监督学习的特点,从大量无标注语料中提取词汇的高维分布信息,使用自编码器学习得到的低维特征来提升中文分词词性标注任务的效果.文中还将自编码器方法与主成分分析和k均值聚类的方法进行了比较.在宾州中文树库5.0数据集上的实验表明,自编码器能够显著提高从大规模无标注语料中学习词汇特征的效果.

于乃功等[36]基于深度自编码器与Q学习,提出了移动机器人路径规划方法,利用深度自编码器学习机器人所处环境特征,Q学习根据环境信息选择机器人要执行的动作,从而让机器人通过与环境的交互,实现自主学习.机器人仿真实验证明了该方法的有效性.

2.2.2 算法步骤

(1) 求各层激活值.

通过前向传播的方法,对每一层的神经元进行前向传导计算,利用前向传播公式,得到各层的激活值.

(2) 计算W和b的残差,利用梯度下降法更新W和b,使得输出更好的表示输入.

1) 当 sg 为恒等函数时,取平方误差函数,即:

自编码器的基本流程如图3所示.

图3 自编码器算法基本流程图

2.3 自编码器算法实现

这里本文使用Matlab代码来实现自编码器算法.首先,本文将训练数据加载到内存,定义并训练自编码器神经网络,设置各参数初始值,在训练过程中,本文可以得到特征权重的可视化结果.对于分类问题而言,文中使用softmax分类器对样本进行分类.表1中定义了算法中使用的函数及其功能.

4)从模拟和现场监测轴力数据来看，现场监测轴力值明显高于模拟轴力值.随着开挖深度的增加，内支撑轴力最大值出现的位置也在逐渐下移，最终第三道盾构井内支撑轴力最大.

表1 自编码器算法 Matlab 实现基本语句

函数语句功能定义trainAutoencoder( ) 无监督地训练自编码器view( ) 可视化模型拓扑plotWeights( ) 可视化学习得到的权值矩阵TrainSoftmaxLayer( ) 应用于分类问题时,使用softmax分类器进行分类

在表1中的第一条Matlab语句中,本文需要设置自编码器神经网络中参数的初始值,并定义隐层神经元的数量.通过上述方法,文中使用一幅磁共振病理脑图像进行训练,设置隐层神经元个数为100,则可以得到病脑图像的可视化权值如图4所示.

图4 第一层自编码器训练得到的可视化权重

3 实际应用

在实际生活中,自编码器已经应用到了很多方面,如自然语言处理、图像分类、人脸识别等,这些应用使得自编码器拥有了更广阔的发展前景.

3.1 自然语言处理

(2) 将编码器产生的特征作为输入,逐层训练下面层的网络.由于第一个训练层得到的编码可以看作是输入数据的复现,所以下面层的训练过程类似第一层.

2) 当 sg 为 sigmoid 函数 (xi∈[0,1])时,取交叉熵(cross-entropy)函数,即:

胡庆辉等[9]基于递归自编码器(RAE)方法,使用真实的搜索引擎广告系统中的检索词-拍卖词对(共11 205例),并在其中随机选取词对进行人工标注.实验结果表明,RAE方法取得的实验准确率为85.12%,高于传统的LDA和BM25方法.

由表5，按照考察参数对6个计划的周期总值影响程度，将参数分为4个敏感度档次：第一档为即供应链碳足迹对的变化非常敏感，两者呈强正相关性，因此模型优化时，需要尽量明确设置该参数值;第二档包括和两者与碳足迹呈较强正相关性，即模型对其变化较为敏感；第三档包括三者与碳足迹呈弱正相关性，模型对其变化敏感度一般;第四档包括个参数，其与碳足迹呈现非常弱正相关性，模型对其变化较不敏感。

王贵新等[10]采用稀疏自编码器和支持向量机(SVM)相结合的方法进行学习和分类仿真实验.42 560条垃圾短信和70 000条正常短信作为测试样本,采用深度学习理论,考虑词语在短信中的权重,在文本分类中取得了较好的分类效果,但是使用该方法的训练时间较长.

秦胜君等[11]利用稀疏自编码器算法自动提取文本特征,结合深度置信网络形成SD算法进行文本分类.实验数据集来源于搜狗全网的新闻语料库,可分为20个栏目的新闻数据,从中随机抽取样本,训练集数目分为 300,800 和 1300.实验结果表明,文中使用的SD算法在3个训练集上的准确率分别为: 78.6%,88.0%,92.3%.在同一数据集上,与 SVM 方法进行比较得出,当样本数量较少时,SD算法容易出现过拟合现象,准确率不如 SVM,但是当数据集较大时,SD 算法的优势渐渐体现,准确率和召回率都有所提升.

李翰清等[12]采用6000余条家庭服务语料库(包含60个意图)进行实验,利用深度去噪自编码器方法提取指令的高阶特征、高斯核支持向量机进行训练和预测,在所建语料库上进行多折交叉验证,结果表明指令意图理解的平均准确率达到了96%以上.

魏扬威等[13]首先根据英语作文写作技巧提取了大量语言学特征,再使用自编码器、特征离散化方法对特征进行重构,然后用分层多项模型来输出文章的最终得分.实验表明,在使用自编码器将特征压缩到100维时,相关系数达到0.787,与直接使用支持向量机进行回归的实验相比,准确率提升了3.4%.

刘广秀等[14]通过自编码器模型网络建造Adaboost框架下的弱分类器,并在自编码器神经网络部分引入噪声,更改不同参数以及层数构造弱分类器,利用稀疏性来提高分类器的泛化能力.实验使用NLPIR分词系统提取文本特征、TFIDF作为词语的权值,根据权值来选择特征词,并统计词频作为文本特征训练集.以调节自编码器参数等方式实现每个分类器的结构互异性,提高各分类器的分类各异性,从而实现网络的结构设计使得不同弱预测器具有不同的预测倾向性,提高系统泛化能力,提高分类器分类效果.

李阳辉等[15]使用改进的降噪自编码器(IDAE)对微博情感进行分析,模型的训练集和测试集通过COAE2014的微博评测数据集获取,为检验模型的抗干扰能力,作者采用Python方法从微博网页上直接爬取实时数据,并将其作为样本集特意加入实验当中.结果表明该方法聚类效果较好,且准确度和稳定性与DAE相比有所提升.

2.1 所有患者依从性行为得分和分级脑卒中偏瘫患者的依从性行为总得分为(35.01±2.91)，除10例(11%)的依从性行为属于高等水平，其余患者都处于中等(75例，83%)及低等(5例，6%)水平。从药物治疗因子、吸烟因子、态度因子、意向因子、生活方式因子以及责任因子等6个方面评估患者的依从性行为，结果显示药物治疗因子的平均分最低(1.53±0.62)分，责任因子的平均分最高(2.26±0.79)分。见表2。

刘红光等[16]在对中文新闻文本进行分类时,采用降噪自编码器实现对文本的压缩及分布式的表示,并使用SVM算法进行分类.实验结果证明,随着样本数目的增大,分类准确率、召回率等都在提高,平均分类准确率达到了95%以上,但数据量依然较小,并不能完全发挥该方法并行处理大容量数据的优势.

表2 列出了自编码器在自然语言处理中的应用以及其优化后的方法,方法的特点中也介绍了该方法应用于该领域的优势及不足.

3.2 图像分类

林少飞等[17]将稀疏自编码器方法应用到数字识别中,通过多个系数自编码器的堆叠构建成的深度网络学习数字图像的特征,最后使用softmax分类器进行数字分类.实验通过matlab平台实现,使用MNIST数据库 (训练集 60 000 张手写数字图像,测试集 10 000 张图像),设置softmax层回归迭代100次,第一层稀疏自编码器迭代100次,第二层迭代100次,微调部分迭代达到100次之后,实验准确流畅高达98.00%.

尹征等[18]采用标准卷积自编码器方法,选取MINIS和CIFAR-10数据集进行训练,实验表明将卷积层相关理论运用到自编码器中能提高网络的识别性能,并且实验识别率提高了2%,识别错误率降低了近6%,并且该方法对于加入了噪声的数据具有较强的鲁棒性.

表2 自然语言处理中自编码器的应用

文献方法适用范围优点缺点张开旭等[7] DAE + SAE 中文分词词性标注避免了由于特征过多造成的稀疏问题没有解决词串、句法关系等的特征表示刘勘等[8] DSAE + k-means 微博数据分析能够在降低向量维度的同时,有效地提取数据的本质特征数据只分为IT、财经、健康三类,并不能应用到其他类别胡庆辉等[9] RAE 搜索引擎广告系统融入了权重信息,降低了权重较大的词语在短语中的贡献选取词对进行人工标注,耗时很多王贵新等[10] SAE + SVM 生活短信能有效处理垃圾短信,并且短信数量较大训练时间较长秦胜君等[11] SD 搜狗全网的新闻语料库当数据集较大时,过拟合等问题可被解决,方法优势明显样本较少时,容易产生过拟合李翰清等[12] DAE + SVM 家庭服务语料库采用多折交叉验证的方法,算法准确率高数据集数据较少,泛化能力不强魏扬威等[13] SAE + HMM 英语作文写作技巧提取出的特征具有一定的主题无关性没有考虑到人工评分的主观性刘广秀等[14] Adaboost + DSAE 文本分类泛化性能较强,分类效果较高文中没有具体的实验证明李阳辉等[15] IDAE 微博情感分析提高了情感分析系统的稳定性和抗干扰能力实验中,并没有为降噪自动编码器设计深度刘红光等[16] DAE + SVM 中文新闻文本分类实验准确率较高,实验充分体现了该方法与其他方法相比较的优势数据量较小,泛化能力较弱

樊养余等[19]使用一种基于卷积稀疏自编码器的方法,对少量有标记抽象图像进行自适应的学习,并使用平均梯度准则对所学到的权重进行排序,用于对基于不同领域的特征学习结果进行比较.实验使用Abstract100、Abstract280数据库中的数据进行分类,结果表明,该方法学习到的特征不仅能被用于认知层面的图像识别,还能够被用于情绪语义层面的图像辨识,这些结论也给深度学习在其他有限样本集合中的应用带来启发.

导向图纸审核工作是新线导向系统筹备的物质基础，导向图纸审核的质量直接关系到实地施工能否顺利进行以及日常运营中的良好应用。由于图纸设计部门对于总部导向标识系统规定熟悉程度不高，因此在新线导向系统建设过程中，应该要更加注意图纸审核模块，把错误杜绝在建设之前。而导向图纸的审核重点可以简单分为新线导向系统的完备性、连续性、准确性及实用性等方面。

戴晓爱等[20]引用栈式稀疏自编码器自学习原始数据的特征表达,然后将其连接到支持向量机分类器,完成微调过程.实验采用挪威NEO公司Hyspex成像光谱仪以地面成像方式在选定试验区获取的数据进行模拟性能测试,选取全部7类108个波段数据,实验精度达到87.82%.但是该方法模型参数调整复杂,易陷入局部最小或过拟合状态,从而影响分类结果.

2.锐意改革的突破价值。小岗人当年发起的大包干，就是要突破当时计划经济的桎梏，突破市场经济与资本主义划等号的错误认识。新时代，我国经济社会改革已进入到攻坚克难阶段，都是难趟的“深水区”，都是难啃的“硬骨头”，没有现成的道路，没有成功的示范，唯有锐意改革，勇闯“雷区”，方能踏平坎坷成大道，实现改革的预期目标。

防沙治沙造林海，终将沙漠变绿洲，辛勤的付出得到了丰厚的回报。2013年，三十四团被评为“全国防沙治沙先进单位”，2016年，顺利通过了国家治沙办对防沙治沙“十二五”目标任务完成情况的验收。□

王杰等[21]使用稀疏自编码器的方法来对烟叶成熟度进行分类,降低了人工成本.实验样本采自河南农业大学科教实验园区的烟叶试验田.该算法直接从像素层面提取所需特征,减少了人为选定特征的时间,并且避免了某些重要特征的丢失,分类精确度高达98.63%.

张一飞等[22]为了提高传统遥感图像分类准确率较低的问题,使用一种基于栈式去噪自编码器的分类方法,采用无监督逐层分类的方法获得更具鲁棒性的特征表达,然后通过误差反向传播方法对整个网络参数进行微调.实验采用国产高分一号遥感数据,分类精度高达95.7%,高于传统的支持向量机和BP神经网络方法,但是该方法时间消耗很大,因此可能限制其大规模、深层次模型的应用.

基本的自编码器可以看作一个三层的神经网络结构: 输入层、隐层、输出层,其网络结构如图2所示.图中 xi表示输入节点,xi'表示输出节点,“+1”表示偏置项,hW,b(x)表示经过三层网络结构之后对输入数据的近似输出.

徐守晶等[24]基于Matlab平台,使用CIFAR-10数据库中的STL-10数据集,利用栈式去噪自编码器(SDA)的方法,对包括飞机、鸟、小汽车、猫、狗、轮船、卡车、马、猴子、鹿等10类图像进行分类,结合SIFT和ISDA特征检索查准率为91.3%.

4.学位论文，课程作业抄袭。随着多媒体的普及与传播，带来很多便利的同时也带来了很多浮躁。目前大学生中，相当数量的学生对教师布置的作业和论文不是仔细查阅资料，认真钻研，而是东拼西凑，从学术刊物上整段地摘录，或从网上下载几篇稍做变动，更有甚者将整篇文章全部据为己有，论文中的数据造假现象比比皆是，这表明大学生普遍不重视毕业论文的撰写，缺乏诚实的学习态度。这种现状在全国很多高校都存在，这一状况的恶性发展不论对高校教学质量还是学生全面素质教育都有极大的障碍。

Zeng等[25]开发了一种将单一图像SR耦合到深度自动编码器的数据传输模型,通过探索广泛的数据自动学习LR/HR图像补丁的内在表示及其关系,将LR表示精确地映射到其对应的HR表示的大数据传输函数.与Set5和Set14数据集上的其他先进的算法相比较,实验证明了文中提出方法具有卓越的有效性和效率.

表3列出了自编码器在图像分类中的应用以及其优化后的方法,方法的特点中介绍了该方法应用于该领域的优势及不足.

表3 图像分类中自编码器的优化与应用

文献方法适用范围优点缺点林少飞等[17] SSAE + softmax 数字识别算法准确率很高未能深入研究网络层数对特征学习的影响尹征等[18] CDAE 数字图像识别算法的鲁棒性较强,与传统的自编码器相比,准确率较高时间复杂度作为检验算法性能的指标之一,文中并没有介绍樊养余等[19] CSAE 认知层面和情绪语义层面的图像识别人工方法对图像进行评价打分具有一定的主观性戴晓爱等[20] SSAE + SVM 高光谱影像分类分类性能高于文中其他算法该方法模型参数调整复杂,易陷入局部最小或过拟合状态王杰等[21] SAE 烟叶成熟度分类避免了重要特征的丢失,降低了人工成本没有考虑试验田中的烟叶与市场上烟叶的差别张一飞等[22] SDAE 遥感图像分类总体分类精度高达95.7%,且高于文中其他方法的实验准确率时间消耗大刘洋洋等[23] 多尺度单层SAE + SRC 医学图像分类方法简单,适用性广,精确度高文中没有考虑该算法的时间复杂度徐守晶等[24]SDAE + softmax 图像识别一定程度上解决了训练过程缓慢的问题但是算法鲁棒性较弱Zeng等[25] CDA 具有超分辨率的单图像在不同数据集上与其他先进的算法相比,具有较好的有效性及效率将自编码器应用于情绪识别,具有一定的创新性研究工作没有涉及该算法在其他领域的应用

3.3 目标识别

张宁等[26]基于深度自编码器设计了机场安检中的人脸识别系统,使用Gabor小波函数作为卷积核函数,在对原始图像分块的基础上进行卷积运算,采用多个RBM堆叠组成的自编码器,通过比较差异算法训练RBM,实现自动提取人脸特征,最后构建一个三层的BP神经网络,将自动提取的人脸特征特作为输入,将图像标签作为输出层,通过反向传播算法训练网络进行人脸识别.实验使用YALE数据库中的图片进行训练,算法的平局正确率高达99.08%.

赵飞翔等[27]提出了一种基于栈式降噪稀疏自编码器的雷达目标识别方法,通过设置不同隐层数量和迭代次数,从雷达数据中高效地提取出各层次特征.实验采用暗室仿真数据,通过多次实验,设置隐层数为4层,隐层单元数分别为150-100-50-10,训练迭代次数依次为10、30、50,实验结果均高于90%.

康妙等[28]提出基于栈式自编码器(SAE)特征融合的合成孔径雷达(SAR)图像车辆目标识别算法,然后利用softmax分类器微调网络,提高了网络的融合性能.实验基于MSTAR数据集的10类目标分类精度达95.88%.

张彦等[29]使用所有已知样本训练深度自编码器,得到广义深度自编码器,然后使用但样本目标的单个样本微调广义深度自编码器,得到特定类别的深度自编码器,识别时,将识别图像输入每个特定类别的深度自编码器,得到包含与测试图像相同类内变化的该类别的重构图像,并用其训练softmax回归模型,分类测试图像.实验在公共测试库 Extended Yale Face Database B及 AR Database 上进行,在相同环境下,比其他算法获得了更高的识别率,并且识别一幅图像的所需平均时间更少.

李江等[30]针对传统方法识别人脸表情具有较差的鲁棒性的问题,提出了一种基于降噪自编码器的方法,同时为了避免由于样本不足造成的过拟合现象,在全连接层采用了Dropout技术.实验数据集采用CK+、JAFFE和Yale,每个数据集的平均准确率分别为99.65%、98.92%、99.67%,该方法也表明了该方法较强的鲁棒性和抗身份信息干扰的能力.

冉鹏等[31]在处理人脸识别问题时,采用了栈式降噪自编码器的方法.该方法可分为无监督的预训练和有监督的训练两个阶段.无监督预训练阶段能够自动学习人脸的一般特性,有监督训练阶段进行人脸识别的测试.实验使用YALE、AR、FERE三个人脸数据库进行实验,实验表明,在不同数据库中,文中提出的方法得到的测试准确率均由于其他方法.

于万钧等[32]为了提高气体识别的准确率,提出了一种基于栈式降噪自编码器的方法,并与千层机器学习算法的气体定性识别方法进行比较.实验使用UCI机器学习气体数据集进行训练,测试准确率达到82.2%,高于传统手工提取特征的方法,并且过程简单,改善了传统方法的复杂过程.

本研究主要探讨了高校创新能力的构成及其影响，未来可以从以下几方面继续研究:(1)高校创新能力的构建是一个长期过程，本研究基于黑龙江省高校的横截面数据进行了理论探讨与实证分析，未来研究可以收集黑龙江省高校的纵向数据进行验证。同时，也可以将调研对象拓展至其他省份高校，进一步检验本研究模型的普适性。(2)未来研究可以探讨高校合作伙伴技术溢出对其创新能力的驱动作用，如官产学研协同创新网络对高校创新能力的影响。(3)本文主要验证高校不同维度的创新能力对其绩效水平的影响，未来研究可以采用权变视角，深入地探讨在何种情境下，创新能力的作用会发生变化，为高校提供更细致的指导。

表4列出了自编码器在目标识别中的应用以及其优化后的方法,方法的特点中也介绍了该方法应用于该领域的优势及不足.

表4 目标识别中自编码器的优化与应用

文献方法适用范围优点缺点张宁等[26] Gabor + DAE 机场安检中的人脸识别识别率高,收敛速度快没有考虑人脸被遮挡等情况赵飞翔等[27] SDAE 雷达目标识别实验准确率均高于90% 该方法不能确定其抗噪性康妙等[28] SAE + softmax SAR图像车辆目标识别使用softmax分类器微调网络,提高了网络的融合性能 SAR图像获取比较困难,代价较高张彦等[29] DAE + softmax 人脸识别识别率高,耗时少随着样本复制倍数增加时,使用该方法会产生过拟合现象李江等[30] DAE + Dropout 人脸表情识别该方法具有较强的鲁棒性和抗身份信息干扰的能力该方法只针对大小尺度较小的图像,使用范围有一定的局限性冉鹏等[31] SDAE 人脸识别避免了过拟合情况的发生测试集数据较少,并且文中没有分析时间复杂度于万钧等[32] SDAE 气体识别改善了传统方法的复杂过程,识别准确率较高实验数据获取困难,无法验证出模型学习到的具体内容

3.4 其他领域

陈国定等[33]将堆栈式稀疏自编码器应用到评估尾矿库的安全状况中,实验数据采自于淳安某尾矿库,该算法解决了多层网络结构权值易陷入局部最小的问题,采用微调技术之后,该方法的准确率高达99.27%,但该方法作为深度神经网络的一种,仍处于学术界的广泛讨论中,将其应用于尾矿库安全评价仍需进一步的研究和实验,以获取更优的效果.

李荣雨等[34]将平行堆栈式自编码器应用于过程工业预测建模中,首先通过聚类算法对输入数据的属性进行聚类,然后按结果将数据分类后输入并行的稀疏自编码器中进行特征的模块式提取,联合学习得到的特征再进行逐层学习得到拟合结果.在对加氢裂化的预测建模研究过程中,本方法获得的平均预测准确率在95%以上,在预测能力和稳定性能方面高于栈式自编码器和多层感知器.

李远豪[35]提出基于深度自编码器的人脸美丽吸引力预测模型,利用深度自编码器网络提取人脸图像美丽特征,然后用支持向量机分类器来预测人脸美丽.在中国科学院CAS-PEAL-R1共享人脸库和互联网手机的人脸图像中,得到该模型的预测性能达到了77.3%.但是所学到的特征鲁棒性较低,没有达到理想的预测效果,这有待于后续深入研究.

有监督地微调整个神经网络.在训练完所有层网络之后,自编码器学习获得了可以较好地代表输入的特征,并且这些特征可以最优地表示原始输入信号.因此,本文就可以在自编码器之后加入一个分类器(如SVM等),然后通过有监督训练的方法实现对整个网络进行微调.

寇茜茜等[37]将自编码器应用于金融领域,提出了汇率时间序列预测的方法.首先通过自编码器对时间序列进行无监督的特征识别与学习,然后利用有监督微调的方法调整权值.实验使用来源于真实金融市场的 Time Series Data Library 数据库,文中使用的方法的预测效果优于传统的BP神经网络方法和SVR方法.但是反向传导算法在网络层次过深时,会出现梯度扩散的现象,因此更适合网络层次不是特别深的预测.

岭南园林体现天人合一的民族文化所在，是独立于世界之林的最大特色，也是永具艺术生命力的根本原因。保利滨湖广场裙楼的造型灵感来自佛山岭南园林，将园林中亭台楼阁、石山小径、小桥流水、奇花异草等元素转化为立面设计语言，形成具有本地文化特点的酒店裙楼，营造身临其境的到达感以及舒适的人体尺度空间。塔楼通过体量的穿插变化，增加了建筑立面的丰富性和立体感，打造简洁又不失精致的商务酒店气质。

王宪保等[38]利用堆栈式降噪自编码器的方法进行胶囊缺陷检测,首先对样本进行降噪训练,获取网络初始权值,之后通过BP算法进行微调,得到样本与无缺陷模版之间的映射关系,通过对比实现测试样本的缺陷检测.训练样本为包括裂纹、空洞和胶囊帽缺失的数据,实验取得了100%的缺陷胶囊检出率,但是该方法只能处理64×64维的图像,处理高精度的缺陷图像将是今后研究主要工作.

SUN等[39]为了实现感应电动机的故障诊断,提出了一种将去噪自编码融入稀疏自编码器的深度神经网络的方法,提出了算法的鲁棒性,结合反向传播算法对网络进行微调,提高了分类的准确度,通过引入“Dropout”训练方法,降低了由过拟合带来的预测误差.实验选用了50 Hz供电频率下的电动机,以Y轴方向的振动信号作为试验处理信号,信号采样频率为20 kHz.实验得到的不同故障的平均识别正确率为97.61%.

表5列出了自编码器在其他领域中的应用以及其优化后的方法,方法的特点中也介绍了该方法应用于该领域的优势及不足.

表5 自编码器在其他领域的应用

文献方法应用领域优点缺点陈国定等[33] SSAE + Fine-tune 尾矿库安全评估该算法不易陷入局部最小的问题,并且实验准确率较高仍处于初步尝试阶段,没有一定的理论证明李荣雨等[34] PSAE 工业过程建模预测在预测能力和稳定性能方面高于栈式自编码器和多层感知器在将训练数据按特征簇类型分类时,没有考虑聚类算法的准确率李远豪[35] DAE + SVM 人脸美丽吸引力预测该模型的预测性能高于文中的其他算法学到的特征鲁棒性较低于乃功等[36] DAE + Q学习移动机器人路径规划提高了系统的收敛速度,缩短了学习时间文中强化学习处理的状态时离散的,而真实环境中机器人的状态时连续的寇茜茜等[37] SAEP + Fine-tune 汇率时间序列预测实验结果优于文中的其他方法文中提出的模型只适合于低配置计算资源中网络层次不是特别深的预测中王宪保等[38] SDAE + BP算法胶囊缺陷检测实验中算法的准确率高达100% 无法处理更高像素精度的图像SUN等[39] DSAE + BP算法+Dropout 感应电动机的故障诊断(1) 鲁棒性更强; (2) 减少了过拟合现象的发生; (3) 具有更强的优化能力在进行数据采集时,没有考虑不同供电频率以及信号采样频率的影响

4 总结与展望

目前,自编码器在图像分类、自然语言处理等多个方面都有了广泛的应用,并且取得了不错的成果,这也促进了自编码器的发展,使其更有效地为人类服务.

(1) 自编码器能够自动提取特征,这有效降低了传统手动提取特征的不足;

(2) 对于大数据训练问题,自编码器能有效地避免过拟合情况的发生;

(3) 在各文献中的实验中,与传统的神经网络相比,自编码器方法取得的准确率都较高;

(4) 通过总结各文献的应用领域,我们发现自编码器方法的应用范围较为广泛.

我们希望通过日后的研究工作,自编码器能够更有效、更广泛地应用于我们的日常生活需要当中.因此,针对自编码器存在的以下不足:

(1) 深度自编码器需要逐层训练每一隐层,然后才能使用某种算法对整个网络进行优化调整,学习时间较长;

我礼貌地向起身迎我的包东坡和裘子打招呼：你们好。裘子滑稽地双手捂着肚子说：好啥好呀！这年头，身体好的都在医院住着呢，在饭店胡吃海喝的，都一身病。

(2) 自编码器无监督学习的特性使得其学习获得的特征表示的物理意义并不明确;

(3) 深度自编码器处理的数据规模大,结构较为复杂,现有的软硬件设备均难以满足用户需求.

我们日后的研究重点将放在如何解决上述问题当中,使自编码器更有效地发挥其优势,为人类社会服务.

3.环境营造：让学员置身于一个良好的具身学习情境。具身认知理论认为，认知不仅源自大脑和身体本身，还包含与所处特定情境中身体与该情境互动的结果。莱夫（lave）也明确地指出：“情境意味着，在特殊性和普遍性的许多层面上，一个特定的社会实践和活动系统中社会过程的其他方面具有多重的交互联系。”［10］身体一旦离开了情境，就无所谓交互，更不可能产生新的认知构建。所以，培训是人脑、身体与特定情境交互的知识体验过程，学员的身体只有沉浸在良好的情境中，调动大脑的参与，才能更好地获得知识和能力的建构、内化和迁移。而培训中的情境应该包括：心理情境、物理情境和虚拟情境。

参考文献

1Rumelhart DE,Hinton GE,Williams RJ.Learning representations by back-propagating errors.Nature,1986,323(6088): 533–536.[doi: 10.1038/323533a0]

2Hinton GE,Osindero S,Teh YW.A fast learning algorithm for deep belief nets.Neural Computation,2006,18(7):1527–1554.[doi: 10.1162/neco.2006.18.7.1527]

3Bengio Y,Lamblin P,Popovici D,et al.Greedy layer-wise training of deep networks.Proceedings of the 19th International Conference on Neural Information Processing System.Canada.2006.153–160.

4Vincent P,Larochelle H,Bengio Y,et al.Extracting and composing robust features with denoising autoencoders.Proceedings of the 25th International Conference on Machine Learning.Helsinki,Finland.2008.1096–1103.

5Rifai S,Vincent P,Muller X,et al.Contractive autoencoders: Explicit invariance during feature extraction.Proceedings of the 28th International Conference on Machine Learning.Bellevue,WA,USA.2011.833–840.

6Masci J,Meier U,Ciresan D,et al.Stacked convolutional auto-encoders for hierarchical feature extraction.Proceedings of the 21st International Conference on Artificial Neural Networks.Espoo,Finland.2011.52–59.

7张开旭,周昌乐.基于自动编码器的中文词汇特征无监督学习.中文信息学报,2013,27(5): 1–7,92.

8刘勘,袁蕴英.基于自动编码器的短文本特征提取及聚类研究.北京大学学报 (自然科学版),2015,51(2): 282–288.

9胡庆辉,魏士伟,解忠乾,等.基于递归自编码器的广告短语相关性.计算机应用,2016,36(1): 154–157,187.[doi: 10.11772/j.issn.1001-9081.2016.01.0154]

10王贵新,彭娟,郑孝宗,等.基于稀疏自编码器和 SVM 的垃圾短信过滤.现代电子技术,2016,39(17): 145–148.

11秦胜君,卢志平.稀疏自动编码器在文本分类中的应用研究.科学技术与工程,2013,13(31): 9422–9426.[doi: 10.3969/j.issn.1671-1815.2013.31.051]

12李瀚清,房宁,赵群飞,等.利用深度去噪自编码器深度学习的指令意图理解方法.上海交通大学学报,2016,50(7):1102–1107.

13魏扬威,黄萱菁.结合语言学特征和自编码器的英语作文自动评分.计算机系统应用,2017,26(1): 1–8.[doi: 10.15888/j.cnki.csa.005535]

14刘广秀,宋单单.基于Adaboost框架下自动编码器提升方法的文本分类.电子世界,2016,(11): 195,197.

15李阳辉,谢明,易阳.基于降噪自动编码器及其改进模型的微博情感分析.计算机应用研究,2017,34(2): 373–377.

16刘红光,马双刚,刘桂锋.基于降噪自动编码器的中文新闻文本分类方法研究.现代图书情报技术,2016,32(6):12–19.[doi: 10.11925/infotech.1003-3513.2016.06.02]

17林少飞,盛惠兴,李庆武.基于堆叠稀疏自动编码器的手写数字分类.微处理机,2015,(1): 47–51.

18尹征,唐春晖,张轩雄.基于改进型稀疏自动编码器的图像识别.电子科技,2016,29(1): 124–127.

19樊养余,李祖贺,王凤琴,等.基于跨领域卷积稀疏自动编码器的抽象图像情绪性分类.电子与信息学报,2017,39(1): 167–175.

20戴晓爱,郭守恒,任淯,等.基于堆栈式稀疏自编码器的高光谱影像分类.电子科技大学学报,2016,45(3): 382–386.

21王杰,贾育衡,赵昕.基于稀疏自编码器的烟叶成熟度分类.烟草科技,2014,(9): 18–22.

22张一飞,陈忠,张峰,等.基于栈式去噪自编码器的遥感图像分类.计算机应用,2016,36(S2): 171–174,188.

23刘洋洋,唐奇伶.基于多尺度单层自编码器的医学图像分类.科教导刊,2017,(15): 20–21,192.

24徐守晶,韩立新,曾晓勤.基于改进型 SDA的自然图像分类与检索.模式识别与人工智能,2014,27(8): 750–757.

25Zeng K,Yu J,Wang RX,et al.Coupled deep autoencoder for single image super-resolution.IEEE Transactions on Cybernetics,2017,47(1): 27–37.[doi: 10.1109/TCYB.2015.2501373]

26张宁,朱金福.基于深度自动编码器的机场安检人脸识别系统设计.计算机测量与控制,2015,23(2): 644–647.

27赵飞翔,刘永祥,霍凯.基于栈式降噪稀疏自动编码器的雷达目标识别方法.雷达学报,2017,6(2): 149–156.

28康妙,计科峰,冷祥光,等.基于栈式自编码器特征融合的SAR 图像车辆目标识别.雷达学报,2017,6(2): 167–176.

29张彦,彭华.基于深度自编码器的单样本人脸识别.模式识别与人工智能,2017,30(4): 343–352.

30李江,冉君军,张克非.一种基于降噪自编码器的人脸表情识别方法.计算机应用研究,2016,33(12): 3843–3846.[doi:10.3969/j.issn.1001-3695.2016.12.072]

31冉鹏,王灵,李昕.一种基于栈式降噪自编码器的人脸识别方法.工业控制计算机,2016,29(9): 100–101,104.

32于万钧,安改换,鹿文静,等.基于栈式降噪自动编码器的气体识别.计算机工程与设计,2017,38(3): 814–818,836.

33陈国定,姚景新,洑佳红.基于堆栈式自编码器的尾矿库安全评价.浙江工业大学学报,2015,43(3): 326–331.

34李荣雨,徐宏宇.平行堆栈式自编码器及其在过程建模中的应用.电子测量与仪器学报,2017,31(2): 264–271.

35李远豪.基于深度自编码器的人脸美丽吸引力预测研究[硕士学位论文].江门: 五邑大学,2014

36于乃功,默凡凡.基于深度自动编码器与Q学习的移动机器人路径规划方法.北京工业大学学报,2016,42(5): 668–673.[doi: 10.11936/bjutxb2015100028]

37寇茜茜,何希平.基于栈式自编码器模型的汇率时间序列预测.计算机应用与软件,2017,34(3): 218–221,247.

38王宪保,何文秀,王辛刚,等.基于堆叠降噪自动编码器的胶囊缺陷检测方法.计算机科学,2016,43(2): 64–67.[doi:10.11896/j.issn.1002-137X.2016.02.014]

39Sun WJ,Shao SY,Yan RQ.Induction motor fault diagnosis based on deep neural network of sparse auto-encoder.Journal of Mechanical Engineering,2016,52(9): 65–71.[doi: 10.3901/JME.2016.09.065]

作者

贾文娟，张煜东

出处

《计算机系统应用》 2018年第05期

上一篇：没有了

下一篇：协议无关的数据中心网络源路由机制研究①

《计算机系统应用》2018年第05期文献

基于深度神经网络的关键词识别系统① 作者：孙彦楠，夏秀渝

国土资源网上交易系统云平台迁移技术实践① 作者：丁强龙，叶惠珠

基于RSA算法的智能锁设计① 作者：王思远，朱敏玲，温智博，王胜

基于HC-12的水果栽培信息采集系统① 作者：徐小玲，刘凌云

基于手机大数据的动态人口感知① 作者：杨皓斐，曹仲，李付琛

基于Hadoop的生物质能源工程数据资源管理平台① 作者：李海涛，刘云生，兰长杰

基于虚拟现实技术的车床仿真系统① 作者：蔡宝，石坤举，朱文华

“魂芯”DSP配套基础软件的自动化测试平台① 作者：林广栋，耿锐，王昊

基于格雷码的无人机图像传输自适应译码算法① 作者：方解，徐磊，徐哲鑫，吴怡

基于OpenSSD的闪存转换算法优化① 作者：陆政，范长军，江云飞

基于DPP改进RANSAC算法的图像拼接① 作者：汪旌，张赟，陈爽

角点密度特征下的粘连蘑菇定位算法① 作者：杨永强，叶明，陆永华，任守纲

基于用户联合相似度的推荐算法① 作者：朱振国，刘民康，赵凯旋

基于猴群算法求解0-1背包问题① 作者：徐小平，师喜婷，钱富才

基于知识点与错误率关联的个性化智能组卷模型① 作者：潘婷婷，詹国华，李志华

自编码器理论与方法综述① 作者：贾文娟，张煜东

协议无关的数据中心网络源路由机制研究① 作者：常坤，赵敏，刘磊，田野

基于骨骼约束的人体运动捕捉数据失真恢复① 作者：汪亚明，鲁涛，韩永华

基于Space系统的叠合式安全机制① 作者：轩浩，刘金刚

基于双向关系相似度函数学习的行人再识别① 作者：张娜，张福星，王强，胡玲玲，桂江生