这项行为识别技术,透过深度学习来识别多个关节串联的复杂动作,或获取行为中相邻关节位置资讯。较过往未使用邻近关节资讯的常规技术相比,获得相当显着的进步。例如开箱取出物品,手、肘部及肩关节随着手臂弯曲和伸展,这样多关节相互变化的复杂行为也能获得识别。
富士通研究所于日前1月10日至1月15日在线上举行的第25届国际模式识别会议(25th International Conference on Pattern Recognition,ICPR 2020)中揭幕这项新AI技术的细节。
2021年中,富士通研究所将追加此项新技术至「行为分析技术Actlyzer」中,期待打造更高精确度且能快速应用的辨识系统。应用于检查工厂的工作程序以及检测公共环境中的危险行为,可望大力提升社会安全性。
近年来AI技术的进步,已实现深度学习从视频图像识别人类行为。
一般来说,利用AI进行人类行为识别取决于各骨骼关节位置的时间变化,包括手、肘部及肩关节的识别特徵,然后将这些特徵连接到简单的运动模式(例如站立或坐下)。常规技术下已能准确掌握每个关节的特性。再加上对完成训练的AI模型,进一步提供连接相邻关节的组合特徵,来实现复杂运动的高精度识别。
富士通针对图形卷积神经网路(Graph Convolutional Networks,GCN)开发了一组新的AI模型,藉由採取透过以人体关节姿势的结构为节点作为基础,以邻近关节(作为节线)所构成的图来执行图结构的卷积运算。
透过关节的时间序列数据,预先训练此模型可以优化与相邻关节的连接强度(Weight)并可以获取用于行为识别的有效连接关系。
这项技术利用骨架数据对行为识别领域的世界基准进行了评估。在实际数据中,与简单行为(如坐、立)相比,准确率和常规技术持平;然而,在诸如开箱或扔掷的复杂行为辨识上准确率则大大地提升,与常规技术相比提高了7%以上,成功达到世界第一的识别精度。
发表意见
中时新闻网对留言系统使用者发布的文字、图片或檔案保有片面修改或移除的权利。当使用者使用本网站留言服务时,表示已详细阅读并完全了解,且同意配合下述规定:
违反上述规定者,中时新闻网有权删除留言,或者直接封锁帐号!请使用者在发言前,务必先阅读留言板规则,谢谢配合。