首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

中山大学团队开发出新的手势识别算法

研究中九个互动手势的图片。作者:Zhang等人

2002年,约翰·安德顿在电影《少数民族》中用自己的“透明手套”将自己的科幻小说《少数民族》中的角色用透明的手套套在屏幕上。计算机能识别出他放大、放大和滑动的手势。尽管这种未来的计算机与人之间的交互已经有20年的历史了,但今天的人类仍然通过鼠标、键盘、遥控器或小型触摸屏与计算机进行交互。然而,研究人员已经投入了大量的精力来解锁更自然的通信方式,而不需要用户和设备之间的联系。语音命令是一个突出的例子,它已经进入了现代智能手机和虚拟助理,让我们可以通过语音进行交互和控制设备。

手势是人类交流的另一种重要方式,可用于人机交互。相机系统、图像分析和机器学习的最新进展使得基于光学的手势识别在大多数情况下比依赖于可穿戴传感器或数据手套的方法更具吸引力,正如Anderton在《少数派报告》中所使用的那样然而,现有的方法受到各种限制的阻碍,包括计算复杂度高、速度慢、精度差或可识别手势数量少。为了解决这些问题,由中国中山大学的于智义领导的团队最近开发了一种新的手势识别算法,在复杂度、准确性和适用性之间取得了很好的平衡。正如他们的论文所详述的,该论文发表在电子成像杂志,该团队采用创新策略来克服关键挑战,并实现了一种可轻松应用于消费者级设备的算法。

该算法的一个主要特点是对不同手型的适应性。该算法首先尝试根据手掌宽度、手掌长度和手指长度之间关系的三种测量方法,将用户的手类型分为苗条型、正常型或宽大型。如果这个分类成功,接下来的步骤就在手上了手势识别进程只将输入手势与存储的同一手型样本进行比较。Yu解释说:“传统的简单算法由于无法处理不同类型的手,识别率往往较低。通过首先按手势类型对输入手势进行分类,然后使用与此类型匹配的样本库,我们可以在几乎可以忽略的资源消耗的情况下提高整体识别率。”。

团队方法的另一个关键方面是使用“快捷功能”来执行预识别步骤。虽然识别算法能够从九个可能的手势中识别出一个输入手势,但是将输入手势的所有特征与存储的所有可能手势的特征进行比较将非常耗时。为了解决这个问题,预识别步骤计算一个手的面积比例,以选择可能的九个手势中的三个最有可能的手势。这个简单的特征足以将候选手势的数量缩小到三个,其中最终的手势是使用基于“Hu不变矩”的更复杂和高精度的特征提取来决定的Yu说,“手势预识别步骤不仅减少了所需的计算量和硬件资源,而且在不影响精度的前提下提高了识别速度。”

研究小组在商用PC处理器和使用USB摄像头的FPGA平台上测试了他们的算法。他们让40名志愿者多次做9个手势来建立样本库,另外40名志愿者来确定系统的准确性。总的来说,结果表明所提出的方法可以识别手势实时精度超过93%,即使输入手势图像被旋转、平移或缩放。据研究人员称,未来的工作将集中在改善恶劣雷电条件下的算法性能,并增加可能的手势数量。

手势识别有许多很好的应用领域,可以为控制电子设备的新方法铺平道路。一场人机交互的革命即将到来!

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20211230A047UY00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券