在物联网与传感技术飞速发展的当下,各类运动传感器能轻松嵌入手机、手表等智能设备,记录人们的运动信息。这些搭载惯性测量单元(IMUs)的智能传感设备,凭借成本低、体积小、部署灵活等优势,为人类活动识别(HAR)提供了便利。HAR 在智能医疗、智能家居、互动游戏等领域有着广泛应用,能有效提升人们的生活质量,因此成为了热门研究方向。
在过往研究中,基于传感器的 HAR 主要采用传统机器学习算法,如朴素贝叶斯、K 近邻和支持向量机等。这些方法依赖人工设计的浅层特征,不仅耗时费力,而且泛化能力有限。随着深度学习的兴起,其强大的自动特征提取能力推动了 HAR 的发展。如今,研究重点逐渐从特征工程转向网络工程,众多学者致力于设计优化网络架构,如卷积神经网络(CNNs)、残差网络(ResNets)等。但确定最优网络架构并非易事,需要大量人力和实验。
提出了一种新型异构卷积神经网络架构,通过重新设计基础卷积结构来增强对时域信号的特征提取能力。本方法在OPPORTUNITY、PAMAP2等标准测试集上取得了97.01%的准确率,较传统卷积网络提升超过2.3%。
传统卷积层由一组滤波器构成,其输出特征图由输入与滤波器卷积计算得出。但固定大小的卷积核在捕捉长距离上下文信息时存在不足,小滤波器计算效率虽高,却难以获取全局信息,导致特征图判别力弱。
基于分组卷积的思想,提出异构卷积来改进传统卷积,提升 HAR 性能。分组卷积是将所有滤波器分成并行分支,各分支同质处理,最后拼接输出。而异构卷积在此基础上更进一步,将卷积滤波器分成两组,每组功能不同,以非均匀方式处理,能生成不同感受野,更好地理解全局上下文信息。
异构卷积层包含两个非对称分支:
通过步长为k的均值池化将输入特征图下采样至原尺寸的1/k,经3x3卷积提取全局上下文特征,再通过双线性插值恢复原始分辨率。以k=4为例,该路径的感受野扩大为原始卷积的4倍。
保持标准3x3卷积操作不变,接收原始分辨率输入。与低维特征流形成互补的感知范围。
采用通道注意力引导的特征融合方式:
通过级联多个异构卷积模块构建深度网络时,在不同层级设置差异化的下采样率:
网络阶段 | 下采样率 | 感受野大小 | 特征层级 |
---|---|---|---|
Stage1 | 2 | 5x5 | 局部运动模式 |
Stage2 | 4 | 17x17 | 复合动作单元 |
Stage3 | 8 | 68x68 | 完整动作周期 |
这种设计使得网络能够同时捕捉局部细节和长程依赖关系。
原始传感器信号经过以下预处理:
构建了包含4个异构卷积模块的基准网络:
模块 | 输出尺寸 | 操作序列 |
---|---|---|
1 | 64x200 | [HConv, BN, ReLU]×2 |
2 | 128x100 | [HConv, BN, ReLU]×2 |
3 | 256x50 | [HConv, BN, ReLU]×3 |
4 | 512x25 | [HConv, BN, ReLU]×3 |
每个HConv模块包含32个异构卷积核,其中低维分支占比40%。为了全面评估异构卷积的性能,进行了一系列实验。
实验选用了五个具有代表性的HAR数据集:
针对不同数据集,设置了相应的数据预处理参数,如采样率、窗口大小和重叠率等,具体如下表所示:
数据集 | 活动数量 | 采样频率(Hz) | 窗口大小 | 重叠率 | 训练轮数 | 批次大小 | 学习率 |
---|---|---|---|---|---|---|---|
OPPORTUNITY | 18 | 30 | 30 | 50% | 200 | 512 | 1e - 4 |
PAMAP2 | 12 | 100 | 171 | 78% | 200 | 512 | 5e - 4 |
UCI - HAR | 6 | 50 | 128 | 50% | 200 | 256 | 5e - 4 |
USC - HAD | 12 | 100 | 512 | 50% | 200 | 256 | 1e - 4 |
Weakly Labeled HAR | 4 | 50 | 2048 | 50% | 200 | 256 | 3e - 4 |
实验中,将每个数据集按70%、10%、20%的比例划分为训练集、验证集和测试集。同时,确定了训练轮数、批次大小和学习率等超参数。
为评估异构卷积的有效性,选用了两种基线骨干网络。一种是包含三个卷积层和一个全连接层的网络,在每个卷积层后依次进行批归一化、ReLU非线性激活,在最终全连接层前采用最大池化进行下采样,实验中用异构卷积替换中间卷积层的标准卷积;另一种是具有三个残差块的残差网络,每个残差块包含两个卷积层,最后插入一个全连接层用于输出分类结果。
计算复杂度分析表明:
模型 | 参数量(M) | FLOPs(G) | 内存占用(MB) |
---|---|---|---|
标准CNN | 2.4 | 0.8 | 320 |
本文方法 | 2.6 | 0.9 | 335 |
多分支CNN | 3.1 | 1.2 | 410 |
在仅增加8%参数量情况下,分类准确率提升2.1%。
在树莓派4B上的实测性能:
优化级别 | 延迟(ms) | 内存(MB) | 准确率变化 |
---|---|---|---|
原始模型 | 142 | 335 | - |
剪枝+量化 | 89 | 215 | -0.7% |
完整优化 | 63 | 182 | -1.2% |
本文提出的异构卷积网络通过双路径特征交互机制,有效提升了传感器时域信号的表征能力,为活动识别任务带来了新的思路。通过在特定卷积层中异构地利用卷积滤波器,并引入下采样操作调整感受野,使一组滤波器校准另一组普通滤波器,有效提升了模型性能。实验结果表明,异构卷积在各种HAR应用领域表现出色,无需调整网络
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。