无监督特征学习的人体活动识别(

上传人:Sc****h 文档编号:142896195 上传时间:2022-08-25 格式:DOC 页数:9 大小:436.50KB
收藏 版权申诉 举报 下载
无监督特征学习的人体活动识别(_第1页
第1页 / 共9页
无监督特征学习的人体活动识别(_第2页
第2页 / 共9页
无监督特征学习的人体活动识别(_第3页
第3页 / 共9页
资源描述:

《无监督特征学习的人体活动识别(》由会员分享,可在线阅读,更多相关《无监督特征学习的人体活动识别((9页珍藏版)》请在装配图网上搜索。

1、无监督特征学习的人体活动识别*收稿日期:2015-XX-XX基金项目:国家自然科学基金资助项目(61202117,91118008)作者简介:史殿习(1966),男,山东龙口人,教授,博士,E-mail:dxshi史殿习1,李勇谋1,丁博1(1.国防科学技术大学 计算机学院,湖南 长沙 410073)摘要:基于智能手机内嵌的惯性传感器进行人体活动识别是目前普适计算领域中重要的研究方向。特征表示在人体活动识别中扮演着重要角色,人体活动识别中常用的特征包括时域统计特征和频域特征,这两类特征通常是由专家依赖于特定的领域知识设计的,由于人的局限性可能会导致在提取特征中丢失重要信息,从而影响最终的识别效

2、果。针对上述问题,论文提出了一种基于无监督特征学习技术的惯性传感器特征提取方法,其核心思想是使用无监督特征学习方法学习多个特征映射,而后再将所有特征映射拼接起来形成最终的特征计算方法,其优点是不会造成重要信息的损失,而且可以显著减少所使用的无监督特征学习模型的规模。为了验证所提出的特征提取方法在活动识别中的有效性,基于一个公开的活动识别数据集,使用三种常用无监督模型进行特征提取,最后使用支持向量机进行活动识别,实验结果表明,本文所提出的特征提取方法取得了良好的效果,与其他方法相比具有一定的优势。关键词:人体活动识别;无监督特征学习;智能手机;传感器中图分类号:TP391 文献标志码:A文章编号

3、: Unsupervised Feature Learning For Human Activity RecognitionSHI Dianxi, LI Yongmou, DING Bo (College of Computer,National University of Defense Technology, Changsha 410073, China) Abstract: Human activity recognition using smartphone inertial sensors is currently an important research direction in

4、 the field of pervasive computing. Feature representation has a significant impact on human activity recognition. While the common used features, including time domain features and frequency domain features, heavily rely on the specific domain knowledge and are designed by hand, which may cause the

5、loss of important information, thus affecting the classification results. To solve these problems, this paper proposed a feature extraction method based on unsupervised feature learning techniques. Firstly, we use unsupervised feature learning method to learn multiple feature maps, then concatenate

6、them together. This method can avoid the loss of important information, and also can significantly reduce the scale of unsupervised feature learning model used. To evaluate the proposed method, we perform experiments on a public human activity recognition dataset, using three commonly used unsupervi

7、sed feature learning models, and finally using support vector machines to classify activities. The results show that the proposed feature extraction method achieves good results, and has certain advantages compared with other methods. Keywords: human activity recognition; unsupervised feature learni

8、ng, smartphone, sensors9目前广泛使用的智能手机如Apple iPhone以及Android的各种型号的智能手机,大都内置了多种传感器,例如加速度传感器、陀螺仪传感器、距离传感器、光传感器以及GPS等。内嵌了各种传感器的智能手机的广泛普及和应用,催生了崭新的基于智能手机传感器的应用和研究,例如人体活动识别、跌倒检测、身份识别等等1。其中,人体活动识别是当前的热点研究问题。活动识别可以作为健康评估和医疗保健的干预工具,通过长时间识别和记录用户的活动,可以计算出用户的活动水平和能量消耗,可以为活动太多或太少的用户提供反馈信息,帮助其建立健康的生活方式。文献1中对现有的活动识别

9、研究作了比较全面的论述,按识别的活动的类别可以分为:运动类活动、交通模式、锻炼、日常活动和手机使用方式等。目前,运动类活动识别是当前的研究热点问题,也是本文关注的重点,通常包括走路、上楼梯、下楼梯、跑步、坐、站、躺等,通常涉及加速度计和陀螺仪两种惯性传感器的一种或者两种。活动识别是一个典型的时间序列分类问题,其问题可以定义为:确定传感器数据流的某一连续部分是由哪种人体活动产生的。活动识别的处理过程一般分为以下三个过程:数据预处理、特征提取和分类1。数据预处理通常包括噪声消除和数据流分割。采集数据时,由于外界环境的影响如路面不平以及智能手机位置的变动,会使数据包含大量的噪声,噪声消除通常采用的是

10、低通滤波器技术。由于从连续的传感器数据流提取有用信息比较困难,并且大部分的分类算法无法处理连续的数据流,因此一般使用具有50%重叠、长度固定的滑动窗口将数据分割为等长的段,如图1所示。图1 50%重叠的滑动窗口Fig.1 Sliding windows with 50% overlap经过预处理后,得到固定长度的数据,直接用于分类时效果较差,一般需要先进行特征提取。所谓特征,通常是指原始数据的抽象表示,好的特征是分类成功的关键。特征提取的本质是确定从原始数据到特征的变换方法,这种变换方法大部分都是由研究人员,根据一些特定领域的专业知识人工设计的。常用的特征分为时域特征和频域特征:时域特征是直接

11、从时域数据中计算出的一些统计值,例如均值、标准差、能量、熵和相关系数等;频域特征通常是使用快速傅里叶变换得到原始数据的频域表示,然后基于频域表示提取特征。常用的这两类特征依赖领域知识,在应用于不同类别的活动时,一是可能会存在不适应于特定数据的问题;二是它们通常由人工设计的,可能由于设计的失误,导致在提取特征后,重要信息的丢失,从而影响分类效果。为了减少这两个问题的影响,可以使用无监督特征学习技术2,该技术能够直接从传感器数据中学习特征的变换方法。在使用无监督特征学习技术提取特征时,不需要依赖领域知识,而且由于是从数据中学习特征,因此也不存在数据不适应问题。据我们所知,目前使用该技术对惯性传感器

12、数据进行特征提取,进而进行活动识别的研究仅有文献3,4,5。文献3最早使用无监督特征学习技术如DBN(Deep Belief Networks)和PCA(Principal Components Analysis)技术对加速度传感器数据进行处理,学习特征变换方法,进而提取相应的特征对厨房活动、日常活动以及汽车生产流水线中工人的活动等进行识别;文献4在文献3的工作基础上,使用平移不变性稀疏编码(Shift-invariant Sparse Coding)技术提取特征;文献5亦使用稀疏编码技术进行特征提取,进而对运动类活动识别和交通模式类活动进行识别如静止、走路、乘车、骑自行车等。活动识别的最后一

13、步是分类:首先,选择合理的分类算法对分类器进行训练;而后,使用通过训练得到的分类器进行分类。目前,活动识别中所用的分类算法大多数是有监督分类算法1,比如SVM(Support Vector Machine)、ANN(Artificial neural network)、决策树C4.5、朴素贝叶斯和K近邻等算法。相对而言,目前使用半监督的分类方法的研究相对较少,文献6研究了自我学习(Self-learning)、协同学习(Co-learning)和主动学习(Active Learning)三种经典的半监督的分类方法在活动识别领域的应用;文献7使用无监督聚类算法来提高已有分类器的性能,亦属于半监督

14、的分类方法。对于半监督的分类方法来说,由于其可以利用无标注的数据,在实际应用中效果较好,其识别准确率可以达到80%以上1。虽然目前有很多分类算法,选择合适的分类算法仍然是比较繁琐和具有挑战性的工作。在活动识别的处理过程中,虽然活动类型是由分类器来识别和分类的,但是活动识别的前两个阶段也都具有十分重要的作用,预处理和特征表示都是获取高性能的分类结果的关键因素。本文针对活动识别领域使用的常用特征的一些缺陷,提出了一种基于无监督特征学习技术的惯性传感器特征提取方法,在此基础上,使用支持向量机SVN分类方法,在一个活动识别公开数据上进行了实验验证,实验结果表明,本文所提出的特征提取方法具有一定的优势。

15、本文组织如下:节1描述了本文所提出的惯性传感器特征提取方法,并介绍了所涉及的特征学习模型;节2描述了使用稀疏自编码器(SAE)、去噪自编码器(DAE)和主成份分析(PCA)三种无监督特征学习方法进行惯性传感器数据的特征提取过程,以及使用SVM进行活动识别的实验结果和分析;最后,对本文加以总结,并指出进一步的工作方向。1惯性传感器数据特征提取方法1.1基本思想本文所涉及的惯性传感器包括3轴加速度传感器和陀螺仪传感器。这两种传感器都具有三个方向,与我们生活的三维空间相对应。但是手机的三维坐标系是基于手机屏幕的,如图2所示。图2 智能手机坐标系16Fig.2 Coordinate system of

16、 smartphones当智能手机在人身上的位置和方向相对固定时,其采集的三维数据比较稳定,能够正确的反应身体的运动;当方向变化较大时,其合成量仍然可以可靠的测量身体运动的程度。基于上述考虑,我们增加一个维度的信息,特征提取时将使用四个维度的信息,即,我们将每个维度称为一个channel,即四个channel。在此基础上,我们提出了一种基于无监督特征学习的惯性传感器特征提取方法,并将其集成到经典的分类问题处理流程中,如图3所示。首先,将传感器数据流使用滑动窗口技术分割为等长的数据段,分割后得到等长数据段有三个channel,即;而后,计算合成量,将这四个channel的数据作为无监督特征学习模

17、型的输入。我们的特征提取方法主要包含以下两个步骤:l 对每个channel的数据使用无监督特征学习技术,学习特征变换方法,如图3所示,四个channel分别得到四个特征映射方法:mapX,mapY,mapZ,mapR。l 把X, Y, Z, R四个channel的数据分别使用对应的特征映射方法mapX,mapY,mapZ,mapR得到的特征拼接起来,作为最终的特征向量,用于分类。图3基于无监督特征学习的活动识别Fig.3 Activity recognition based unsupervised feature learning我们将这种首先分channel使用无监督特征学习技术进行学习特

18、征映射,然后将其拼接到一起的特征提取方法,称作为基于无监督特征学习的channel-wise特征提取方法8 。与之相对应的是不分channel的无监督特征学习3,4,5,即将三个channel 或者四个channel的原始数据拼接起来,作为一个无监督特征学习模型的输入,学习特征表示。我们提出的这种基于无监督特征学习的channel-wise特征提取方法的优点主要包括:使用特征学习技术能够克服对领域知识的依赖,也不会造成重要信息的损失;channel-wise方式使用无监督特征学习技术,与不分channel的方式相比,可以显著减少所使用的无监督特征学习模型的规模,例如在基于神经网络的无监督特征学

19、习方法中,可以将权值数量降为1/4,从而减少训练时间和所需要的数据规模;channel-wise方式更为灵活,可以在不同的channel使用不同的超参数,甚至不同的模型;使用channel-wise方式,使实现模型的并行训练更为容易。虽然,这种channel-wise方式不能提取不同channel间的相关信息,但是由于无监督特征学习技术能够控制好特征提取带来的信息损失,所以不同channel的相关信息仍然可以被分类算法所利用。1.2特征学习模型在本文所提出的特征提取方法中,需要用到无监督特征学习技术从每个channel学习特征映射方法。在经过对常见的无监督特征学习技术分析之后,本文主要研究将两

20、种基于AE(自编码器)的模型和PCA(主成分分析)应用于传感器数据特征提取,其原因在于这两种模型具有一定的代表意义,AE模型是非线性模型,而PCA是线性模型。AE通常定义为一个单隐藏层神经网络,其输入单元的数量与输出单元的数量相同,在训练时将输入值作为目标值进行训练,本质上AE是尝试去学习一个恒等函数,换句话说,它尝试逼近一个恒等函数,从而使得输出接近于输入。若令和分别表示输入单元的数量和隐藏单元的数量,那么一个AE的参数可以形式化地表达为:和分别表示从输入层到隐藏层的权值和从隐藏层到输出层的权值,和分别表示隐藏层偏置和输出层偏置。一个AE可以分解为两部分,编码部分和解码部分。编码部分将输入变

21、换为隐藏层表示,解码部分是使用隐藏层表示重建原始输入。隐藏层表示和原始输入的重建的计算方法如下: (1) (2)其中,是激活函数,通常使用sigmoid函数和tanh函数。AE的目标是学习隐藏层表示,也可以将看作特征映射。将用于训练AE的无标签的数据集记作,其中,采用均方误差作为衡量输入和输出的相似程度的标准,所以AE的代价函数可以表示为: (3)其中,表示AE的参数集合。不作限制的使用AE通常并不能取得好的效果,需要对AE增加某些限制。为了学习获取有用的表示,一种常用的限制是对隐藏层单元施加稀疏性约束,一般认为超完备的稀疏表示能够取得的性能高于规模更小的表示9。稀疏性约束是指限制每个隐藏层单

22、元的平均激活值,使其接近于一个固定的常数,通常是一个接近于0的较小的值(比如)。其中,隐藏神经元在训练集上的平均活跃度用表示。这种具有稀疏性约束的AE通常被称为SAE(Sparse Auto-encoder)。稀疏性约束是通过在AE的代价函数加入用于描述神经元的平均激活值和的相差程度的KL(KullbackLeibler)散度(又称相对熵)实现的,其中散度的定义为:因此,SAE的代价函数为: (4)其中,第一项为均方误差,第二项为稀疏性惩罚,为调节两项的比例的参数。由于散度是平滑且可微的,所以其代价函数也是可微的,可以使用基于梯度的优化方法进行训练。当最小化代价函数时,第一项是用于减小重构时的

23、信息损失,第二项使隐藏层单元的平均激活值保持在预设的水平。值得注意的是,由于散度只在(0,1)上有定义,在使用tanh等值域为(-1, 1)的函数作为激活函数时,需要将隐藏单元的平均激活值伸缩到(0, 1)上。AE模型的另外一个扩展是DAE(Denoising Auto-encoder),DAE最初是在文献10中作为深度神经网络的基本构造块而引入的。为了使AE能够学习到鲁棒性更好的特征,减轻噪声对特征的影响,DAE试图从加入了噪声破坏的原始输入重建出无噪声的原始输入(Denoising)。在DAE中常用的噪声有以下两种11:l 高斯噪声:用表示加入高斯噪声后的数据, 则,其中为所加入的噪声的协

24、方差矩阵。l Mask噪声:对于每个输入,从所有元素中随机选择占比例个元素,将其设置为激活函数的值域的最小值,若使用sigmoid函数则置0,若使用tanh函数则置-1。最后,在使用基于AE的模型进行特征学习时,为了克服单隐藏层网络表示能力的一些缺陷,通常的做法是将多个AE堆叠起来,即将一个AE的隐藏层输出作为另一个AE的输入。在训练时,先用原始数据训练最外层的AE,得到其隐藏层输出后将其作为输入数据训练下一层AE。PCA(Principal Components Analysis)是一个被广泛使用的具有良好数学基础的维度缩减方法。它通过使用正交变换,将可能存在相关性的一定维度的变量转换成维度

25、更小的无相关的变量,同时在维度缩减的过程中保持信息损失最小化。在PCA中,数据集的协方差矩阵的最大的几个特征值所对应的特征向量所张成的低维子空间,能够保持原始数据最大的方差。从原始数据到方差最大化的子空间的投影可以作为特征表示,也可以用于数据的可视化。PCA可以看作是一种无监督特征学习方法,主要是由于这种方法可以自动地从数据中学习到紧凑、且有意义的原始数据的表示,并且不需要依赖于领域知识。本质上,PCA学习到一个线性变换,把数据映射为特征,这与使用线性激活函数的AE具有相似的效果。1.3 超参数选择方法机器学习模型中的参数可以分为两类:参数和超参数。寻找最优参数问题已经得到很好的解决,目前有很

26、多优化算法可以使用;而对于超参数的选择,尚未得到很好解决,更多地依赖于经验和穷举搜索。然而,合理的超参数设置也对机器学习方法的性能具有至关重要的影响12。本文对于超参数的选择,采用基于经验与穷举搜索相结合的方法,其中,对于数值型超参数,选取合理的取值范围和搜索步长,进行网格搜索。2 活动识别实验验证和结果分析为了验证提出的特征提取方法在活动识别中的有效性,我们在公开数据集合上设计实验,共提取了8中特征,最后使用SVM对常见的六种活动进行识别并分析实验结果。2.1 活动识别数据集本文实验的数据来源于一个常用的活动识别的数据集:UCI机器学习资源库14中的“Human Activity Recog

27、nition Using Smartphones Data Set”15,我们简记为UCI-HAR数据集。该数据集所收集的数据来自一组30个年龄分布在19-48的志愿者,每个人要求执行6种活动包括WALKING、WALKING UPSTAIRS、WALKING DOWNSTAIRS、 SITTING、STANDING和LAYING,在执行这些活动的时候将一部智能手机(三星Galaxy S II)固定在腰部。在活动的过程中,使用智能手机内置的加速度计和陀螺仪两种惯性传感器,以50Hz固定频率记录三轴线性加速度和三轴角速度。在实验进行过程中,使用视频记录用于人工的标记数据。所获得的数据集被随机分成

28、两组,其中70%的志愿者被选择用于生成训练数据,另外30%用于生成测试数据。该数据集中的传感器信号已经经过噪声消除,并且使用长度2.56s具有50%的滑动窗口进行分割,分割后的数据每个窗口128个采样点。滑动窗口分割后,训练集有7352个样例,测试集有2947个样例。每个样例的属性包括三轴加速度、三轴角速度、活动标签以及生成数据的人的编号。为了便于在AE中使用sigmoid函数作为编码函数和解码函数,我们将所有传感器数据都伸缩到0.1, 0.9。2.2 特征提取实验为了验证所提出的特征提取方法的有效性,对比不同特征的效果,我们不仅使用两种基于特征学习的方法提取特征,还提取了常用的统计特征和频域

29、特征。本节将简单描述以channel-wise和不区分channel两种方式使用特征学习技术进行特征提取的过程,以及统计特征和频域特征的定义和计算方法。在进行特征学习时,我们使用UCI-HAR数据集中训练集与测试集的所有数据,共10299个训练样例对特征学习模型进行训练。在基于AE的方法中我们级联了两层AE,SAE和DAE第一层网络结构参照PCA的合适压缩维度进行选择,SAE第二层仍然采取同样方法,对于DAE第二层网络结构则参照SAE第二层。2.2.1 基于SAE的channel-wise方式特征学习通过使用PCA模型进行分析,我们发现当将128维的各个channel的数据压缩为64维时,所有

30、channel均可以保持超过99%的方差比例,因此将隐藏层单元数目设置为64的1.5倍,所以第一层SAE网络结构为12896128。根据1.3节提出的方法,稀疏性稀疏。再对各个channel的数据进行搜索最优的,搜索时对SAE使用Pylearn2中的带线搜索的批处理梯度下降法训练200个周期,模型的评价标准为最后五个周期MSE平均值,搜索结果(如表1所示)表明,对于加速度传感器数据最优分别为0.25, 0.25, 0.30, 0.15,陀螺仪传感器数据最优值分别为0.25, 0.10, 0.10, 0.40。在确定第一层SAE的各个超参数后,我们使用Pylearn2中的带线搜索的批处理梯度下降

31、法,对其训练200个周期。训练后的第一层SAE的隐藏层输出作为下一层SAE的输入。表1 所有channel第一层SAE 搜索结果Tab.1 Search results of SAE in first layer for all channels Channel0.050.100.150.200.250.300.350.40Acc-R0.0510.0370.0340.0370.0400.0440.0460.049Acc-X0.1190.0830.0740.0710.0690.0810.0850.094Acc-Y0.1650.1460.1340.1250.1180.1220.1210.121Ac

32、c-Z0.1130.0890.0830.0790.0760.0710.0800.076Gyro-R0.0480.0330.0290.0270.0260.0250.0220.021Gyro-X0.0570.0540.0520.0510.0480.0490.0530.055Gyro-Y0.0620.0530.0580.0610.0620.0550.0600.057Gyro-Z0.0510.0440.0460.0440.0490.0530.0580.059第二层SAE使用与第一层SAE相似的方法确定超参数,通过对第一层SAE的隐藏层输出使用PCA分析,我们发现16维为合适的压缩维度,因此第二层SAE

33、的网络结构为64x24x64。使用同样的方法搜索最优取值,根据搜索结果(由于篇幅限制未列出):加速度传感器数据最优分别为0.30, 0.30, 0.40, 0.40,陀螺仪传感器数据最优值分别为0.40, 0.05, 0.30, 0.20。在确定各个channel第二层SAE的最优稀疏性参数的取值后,使用与第一层类似的训练方法和设置对其进行训练。将每个channel第二层SAE的隐藏层输出作为特征,每个channel得到24个特征,这种特征提取方法共提取了192个特征。2.2.2 基于DAE的channel-wise方式特征学习根据使用SAE时对数据的分析,将第一层DAE隐藏层单元数量设为64

34、,第二层DAE隐藏层单元设为16。本文采用网格搜索方式来确定DAE的噪声类型和噪声水平,模型的选择标准基于训练集的10-折交叉验证结果,分类器使用one-vs-one多类扩展的、带有RBF(Radial Basis Function)核函数的SVM,SVM的两个超参数的搜索空间分别为和。搜索结果(如表3所示)表明,第一层DAE使用的GN噪声、DAE2使用的GN噪声所取得效果最好。这种方式共提取了128个特征。表3 channel-wise DAE 超参数搜索结果Tab.3 Search results of channel-wise DAEs hyper-parameters第一层 DAE第二

35、层 DAECV 准确率(%)GN: GN: 94.8GN: 94.9MN: 94.5MN: 94.3GN: GN: 95.0GN: 94.9MN: 94.5MN: 94.4MN: GN: 94.5GN: 94.6MN: 94.1MN: 94.5MN: GN: 94.3GN: 94.4MN: 94.2MN: 94.12.2.3基于PCA的channel-wise方式特征学习为了使提取的特征具有可比性,使用PCA将每个channel 128维数据压缩为16维。最终也提取了128个特征。2.2.4不区分channel方式特征学习为了对比本文提出channel-wise方式的特征学习方式与不区分cha

36、nnel方式,我们也对应提取了三种不区分channel方式的特征。为了使结果具有可比性,对于不区分channel方式的学习,我们对每种传感器数据使用与channel-wise方式相对应的结构和参数。在使用SAE模型进行不区分channel方式特征学习时,即第一层SAE为512384512,第二层SAE为38496384。使用与channel-wise方式相似的稀疏性参数搜索过程,由于网络规模较大导致训练时间较长,本文在不分channel-wise方式特征学习搜索中仅对模型训练100个周期,第一层搜索结果为:加速度数据0.05,陀螺仪数据0.10。在第一层SAE确定最优后,仍然对其训练200个周

37、期,然后将其隐藏层输出作为第二层SAE的输入对其进行参数搜索,搜索结果为:加速度数据0.10,陀螺仪数据0.05。最后对第二层SAE使用最优参数训练200个周期,每种传感器数据得到96个特征,共计192个特征。在使用DAE模型进行不区分channel方式特征学习时,第一层DAE网络结构为512256512,第二层DAE网络结构为25664256。对于不区分channel方式,DAE1使用的GN噪声、DAE2使用的MN噪声所取得效果最好。这种方式共提取了128个特征。在使用PCA模型进行不区分channel方式特征学习时,将所有加速度数据使用PCA压缩为64维度,陀螺仪数据也压缩为64维度。最终

38、,同样提取了128维数据。2.2.5时域统计特征和频域特征时域统计特征是基于智能手机的活动识别研究中使用最多的特征,其主要优点是计算简单,适用于在资源有限的智能手机上实现。我们选取最为常用的几个统计特征,包括从每个channel提取均值、标准差、能量和熵,以及每个传感器提取6个相关系数,共计44个特征。频域特征也是基于智能手机的活动识别研究的常用特征,频域特征效果一般比统计特征要好,但是频域特征计算复杂度更高。频域特征一般是先对信号进行离散傅里叶变换得到傅里叶系数,然后基于傅里叶系数提取特征。我们对每个channel的数据进行离散傅里叶变换后,取其最大的8个系数作为特征,每个系数记录其频率和振

39、幅,每个channel提取16个特征,所有channel共128个频域特征。2.2 实验结果与分析在完成特征提取后,我们使用支持向量机SVM识别上文所提的6种活动。所使用的SVM的多分类扩展使用one-vs-one方式,核函数使用常用的高斯核函数。实验过程中,首先在训练集上使用10-折交叉验证,在和网格中搜索最优的和取值,然后使用最优的和在训练集上训练出分类器,最后我们报告了交叉验证的准确率和在测试集上的准确率如表4所示。从表4中的结果可以看出:(1)对于两种特征学习方式,我们提出的channel-wise方式要优于不区分channel方式,所以在处理惯性传感器数据时,channel-wise

40、方式使用特征学习技术更为合适。(2)使用channel-wise方式的三种特征学习技术都明显优于常用的统计特征和频域特征,这说明我们提出的特征提取方法具有一定的优势。(3)在使用channel-wise方式的三种特征学习技术中,线性方法PCA取得最好的结果,非线性的SAE的准确率略低于PCA,我们认为这是由于用于特征学习的数据较少的原因。在两种基于AE的技术中,SAE要比DAE更好,说明SAE更适合处理传感器数据。表4不同特征使用SVM识别准确率Tab.4 Recognition accuracy of SVM for different features特征交叉验证准确(%)测试准确率(%)

41、SAE channel-wise95.1491.08SAE Mono95.0588.60DAE channel-wise95.0188.87DAE Mono92.8779.10PCA channel-wise95.2991.82PCA Mono94.9890.53时域统计特征97.5588.56频域特征92.8685.143 结论本文提出了一种基于无监督特征学习的惯性传感器数据特征提取方法,这种方法具有以下特点;由于无监督特征学习一般使用信息损失最小化方法学习特征映射,所以可以避免重要信息损失;能够自动地从数据学习特征表示,对于领域专业知识的依赖更少;细粒度的特征提取方式速度快、规模小,对于其

42、他问题也有一定的借鉴意义。本文基于上述方法提取的特征在公开数据集上进行活动识别实验。实验结果表明,本文所提出的channel-wise方式特征学习在活动识别的准确率上优于不分channel方式,并且也优于时域统计特征和频域特征。在所研究的三种特征学习模型中,SAE和PCA大致相当并优于DAE。由于本文实验所使用的数据较少,而无监督特征学习模型通常需要大量数据,在下一步工作中将会收集更多数据用于学习特征表示。参考文献(References)1 Incel O D, Kose M, Ersoy C. A review and taxonomy of activity recognition on

43、mobile phonesJ. BioNanoScience, 2013, 3(2): 145-171.2 Bengio Y, Courville A C, Vincent P. Unsupervised feature learning and deep learning: A review and new perspectivesJ. CoRR abs/1206.5538, 2012.3 Pltz T, Hammerla N Y, Olivier P. Feature learning for activity recognition in ubiquitous computingC/IJ

44、CAI Proceedings-International Joint Conference on Artificial Intelligence. 2011, 22(1): 1729.4 Vollmer C, Gross H M, Eggert J P. Learning Features for Activity Recognition with Shift-Invariant Sparse CodingM/Artificial Neural Networks and Machine LearningICANN 2013. Springer Berlin Heidelberg, 2013:

45、 367-374.5 Bhattacharya S, Nurmi P, Hammerla N, et al. Using unlabeled data in a sparse-coding framework for human activity recognitionJ. Pervasive and Mobile Computing, 2014.6 Longstaff B, Reddy S, Estrin D. Improving activity classification for health applications on mobile devices using active an

46、d semi-supervised learningC /Pervasive Computing Technologies for Healthcare (PervasiveHealth), 2010 4th International Conference on-NO PERMISSIONS. IEEE, 2010: 1-7.7 Zhao Z, Chen Y, Liu J, et al. Cross-people mobile-phone based activity recognitionC/IJCAI Proceedings-International Joint Conference

47、on Artificial Intelligence. 2011, 22(3): 2545.8 Li Y, Shi D, Ding B, et al. Unsupervised Feature Learning for Human Activity Recognition Using Smartphone SensorsM/Mining Intelligence and Knowledge Exploration. Springer International Publishing, 2014: 99-107.9 Yang J, Yu K, Gong Y, et al. Linear spat

48、ial pyramid matching using sparse coding for image classificationC /Computer Vision and Pattern Recognition, 2009. CVPR 2009. IEEE Conference on. IEEE, 2009: 1794-1801.10 Vincent P, Larochelle H, Bengio Y, et al. Extracting and composing robust features with denoising autoencodersC/Proceedings of th

49、e 25th international conference on Machine learning. ACM, 2008: 1096-1103.11 Vincent P, Larochelle H, Lajoie I, et al. Stacked denoising autoencoders: Learning useful representations in a deep network with a local denoising criterionJ. The Journal of Machine Learning Research, 2010, 11: 3371-3408.12

50、 Bergstra J, Bengio Y. Random search for hyper-parameter optimizationJ. The Journal of Machine Learning Research, 2012, 13(1): 281-30513 Kalman B, Kwasny S C. TRAINREC: A System for Training Feedforward & Simple Recurrent Networks Efficiently and CorrectlyM. Washington University, Department of Comp

51、uter Science, 1993.14 Asuncion A, Newman D. UCI machine learning repositoryJ. 2007.15 Anguita D, Ghio A, Oneto L, et al. A public domain dataset for human activity recognition using smartphonesC/European Symposium on Artificial Neural Networks, Computational Intelligence and Machine Learning, ESANN. 2013.16 Android. SensorEvent ClassM/OL. http:/

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!