近日,浙江万里学院华美生命健康学院科研团队以“浙江万里学院”为第一单位在国际期刊IEEE Wireless Communications(Q1,IF = 10.9)期刊发表题为WiSense: A Dataset for WiFi-based Human Activity Recognition的研究型论文,论文第一作者为华美生命健康学院廖振龙。文章介绍了作者制作的WiSense数据集,旨在支持使用WiFi信号进行的人类活动识别研究。本文解决了现有数据集有限、收集WiFi数据成本高且耗时的问题,提供了高质量且易于获取的WiFi数据来应用于机器学习。
近年来,人体活动识别(Human Activity Recognition, HAR)技术在医疗健康领域得到了广泛关注和深入研究。该技术利用可穿戴设备和传感器,通过机器学习和人工智能算法,实时监测和分析人体活动模式。它在老年人护理、跌倒检测、日常活动监测和慢性病管理等方面具有重要应用。通过监测患者的活动数据,技术可以提供个性化健康管理建议,并为康复期患者设计个性化的训练计划。
传统的人体活动识别方法主要依赖传感器或视觉技术。然而,传感器方法要求用户携带设备,如智能手机或可穿戴传感器,可能带来不便;而基于视觉的方法虽然高效,但可能会侵犯用户隐私且视野有限。相比之下,基于WiFi的识别方法最近获得了关注,因为它们只需部署发射器和接收器。WiFi信号的普及和覆盖范围扩大,使得这些方法可以准确地进行活动分类,而不需要用户携带额外设备,整个过程成为非接触式。
图1 基于WiFi的人体活动识别基本步骤
利用机器学习对基于 WiFi 的人体活动识别进行了广泛的研究。机器学习算法的有效学习在很大程度上依赖于大型数据集。然而,收集和标注无线通信数据是一个耗时且成本高昂的过程,而且公开可用的数据集仍然相对稀缺。这极大地阻碍了该领域机器学习研究的进展。因此,迫切需要建立从无线环境中收集的大规模、可公开访问的数据集。丰富的活动数据可以大大提高研究人员研究人体活动识别的能力,并提高识别算法的准确性。因此,作者制作收集了名为WiSense的数据集。
作者使用公开可用的通道状态信息(Channel State Informatio, CSI)收集工具和简单设备,进行了数据收集。详细记录了数据收集的步骤和数据处理方法,旨在让研究者们能够方便地利用这一数据集进行活动识别研究,同时也为非专业人士复现这一收集过程提供了可能。设备由一个发射器(路由器)和一个接收器(配备 Intel 5300无线网卡的笔记本电脑)组成
图2 实验设备
作者在两个房间收集了WiFi信号。会议室面积为 4×8 m2,配备了一张多人会议桌和几把椅子,将发射器和接收器相距3米,并要求志愿者在两者之间的中点进行活动,以确保采集信号的质量。志愿者与会议桌之间的距离为1米。办公室面积为3×5 m2,摆放有书柜、沙发、办公桌和椅子。接收器和发射器相距 3 米,志愿者在中点进行活动。
图3 实验环境
图4 步行活动的 RSSI 和 CSI:a) RSSI; b) CSI
WiSense 数据集中收集的 WiFi 信号包含 RSSI。图 4(a) 显示了步行活动的 RSSI 信号图。图中三条彩色线代表三个接收天线的信号路径能量,包括发射器和接收器之间的直接视线。由于多径效应,很难区分房间内多条路径产生的信号成分。因此,RSSI 通常被认为是检测活动变化的粗粒度信息,通常用于人类室内定位。CSI 描述了信道中存在的散射、衰减、功率衰减和其他因素的综合影响。通过监测数据包中子载波的频率响应,CSI 可以更详细地了解频率选择性信道。图 3(b) 表示信道中带有数据包的 30 个子载波的波形。与来自 MAC 层的 RSSI 不同,CSI 来自物理层,对环境变化更加敏感。与 RSSI 相比,CSI 包含更精细的物理信息,通常用于活动和手势识别等应用。
图5 使用 Hampel 滤波器对原始数据进行去噪处理
商用 WiFi 设备的硬件缺陷、电磁干扰和不可避免的白噪声会在原始 CSI 数据中引入噪声成分。这会严重影响提取活动特征的能力。因此,有必要对数据进行降噪处理,可以结合各种滤波器来提取所需的时域或频域信息。第一步是使用常用的 Hampel 离群值滤波器去除明显的离群值。
表1 使用不同分类方法比较不同数据集的准确性
| KNN | RF | SVM | CNN | LSTM | BLSTM |
WiSense | 85.56% | 83.78% | 84.44% | 91.65% | 93.21% | 95.35% |
Widar | 84.17% | 81.36% | 83.13% | 90.11% | 92.32% | 93.74% |
为了评估 WiSense 数据集在人体活动识别任务中的性能,作者使用 KNN、RF、SVM、CNN、LSTM 和 BLSTM 算法进行了实验。这些技术以成熟的理论为基础,在不同领域都有广泛应用。为了反映 WiSense 数据集的新颖性,作者还将其与 Widar 数据集进行了比较。表1显示了基于不同数据集的活动识别分类算法的准确率。部分数据集用于训练,其余用于测试。
华美生命健康学院是浙江万里学院与宁波市第二医院、国科宁波生命与健康产业研究院合作共建的新型实体二级学院,致力于“新医科”人才的培养、技术研发和产业服务。这一研究成果与学院“医学+X”的多学科融合培养模式相契合,不仅推动了医学技术的创新与应用,还为复合型医技人才培养、医疗健康管理服务和技术成果转化提供了重要支持,彰显了学院在新医科人才培养、技术研发和产业服务方面的优势,助力其向建设高水平应用型学院的发展目标迈进。