清华大学团队研发出新颖唇语解读系统

来源:光明日报
本报北京3月25日电(记者邓晖)人说话时嘴唇动作跟语音同步,清华可以通过识别唇动来进行语言交流。大学读系对于声带、团队统喉舌损伤的研发颖唇语解失声人群,唇语是出新一种不占用双手的、日常无障碍交流的清华有效方式。但唇语对讲话者友好,大学读系对解读唇语的团队统听众来说却并不轻松。为降低唇语解读难度,研发颖唇语解现有技术手段常采用磁场、出新视觉图像、清华超声波等方法。大学读系以最流行的团队统非接触式视觉图像方法为例,尽管其唇语识别准确率较高,研发颖唇语解但依然容易受到面部角度、出新光强、头动和遮挡等因素的干扰。特别是在新冠肺炎疫情期间,佩戴口罩给基于视觉的唇动解读带来全新挑战。通过直接捕捉面部肌肉细微动作解读唇语技术具有重要的科学研究价值与广阔的应用前景。
近日,清华大学机械工程系智能与生物机械团队与中科院北京纳米能源与系统研究所团队合作,研发出了一种新颖的唇语解读系统。相关研究成果在线发表在《自然·通讯》期刊上。
该系统包含低成本、自供电的柔性摩擦电传感器和基于原型学习的深度学习模型。传感器将唇部肌肉运动产生的电信号传输到解码系统,翻译成可沟通的语言。该研究测试分析了传感器的机械与电气性能,采集并提取了选定元音、单词、短语、无声语音和发声语音的唇动信号特征。通过比较同步采集的唇动和声音信号,证明了无论是否发声,嘴唇运动信号都具有一致性。进一步分析了语速与唇动模式等不同参数对信号特征的影响规律。提出了一种基于原型学习的空洞循环神经网络模型,用于唇动信号的识别,在20个分类(100样本/类)情况下,测试准确率达到94.5%。
值得注意的是,上述自供电传感器由柔性聚合物薄膜与柔性电极组成,可提高人体佩戴的舒适性。研究团队利用该系统进行了多种场景应用展示,如解锁大门的身份识别、移动模型车的方向控制、唇动/语音的实时转换等,展示了该系统在唇动识别领域的可行性和应用潜力。
面向失声人群日常无障碍沟通需求,该工作为特殊场景下唇语翻译应用开拓了创新的研究方向。此外,该工作在控制、个人身份验证、人机界面、残疾辅助、无声语音、情报、反恐任务实施、康复、生物医学工程和虚拟现实等诸多领域中都具有较大的潜在应用价值。
团队相关负责人表示,尽管该工作已展示了该技术的有效性和应用前景,但仍然面临系统可靠性、稳定性等问题。研究团队相信,随着研究的深入,该技术有望切实为失声人群服务,提供无障碍语言交流的科技手段。
相关文章
财政部等发布第三批适用增值税政策的抗癌药品和罕见病药品清单 自2022年12月1日起执行
财政部 海关总署 税务总局 药监局公告2022年第35号为鼓励制药产业发展,降低患者用药成本,现将第三批适用增值税政策的抗癌药品和罕见病药品清单等公告如下:一、自2022年12月1日起,本公告附件1中2025-07-06- 郑开住房公积金将同城化运行6月23日,记者从河南省住房和城乡建设厅获悉,为助力郑州市和开封市同城化发展,方便两地住房公积金缴存职工跨市使用住房公积金,郑州、开封住房公积金管理中心日前在开封签署了住房公2025-07-06
- 来源:市界作者丨陶婷周五,一位中国的33岁神秘女富豪,以8000万欧元约5.63亿元人民币)买下意大利豪宅的新闻刷屏了。这座豪宅位于意大利撒丁岛著名度假区翡翠沙滩中最顶级地段切尔沃港,在上世纪70年代2025-07-06
Keep海外业务大撤退,Keep Trainer和Keep Yoga六月底暂停运营
整理|zhifang“如果Keep有海外版本,我想成为它的首位用户。”2017年3月,公司首席执行官蒂姆·库克在访问Keep北京总部时说道。尽管被寄予厚望,最近的消息表明Keep的海外业务正在大撤退。2025-07-06马斯克“以民之名”送大礼,特朗普对推特账号被解封表示“没兴趣”
[环球时报特约记者 甄翔 徐伦]20日上午,推特新老板马斯克发布推文称,美国前总统特朗普的推特账号解封。从18日开始,就“是否解封特朗普的账号”这一问题,马斯克进行了为时24小时的网络民意调查,共有12025-07-06- 30岁的时候,我已婚,未生孩子。之前听过很多姐姐告诉我,“到了二十七八岁,似乎身体就拼命地想生孩子。”奇怪的是,我的身体好像没有告诉我这件事。于是,要不要生孩子,就成了一个意志层面的问题:“我们为什么2025-07-06
最新评论