拉德堡德大学和 UMC Utrecht 的研究人员成功地将大脑信号转化为可听语音。通过植入物和人工智能的结合解码来自大脑的信号,他们能够预测人们想说的话,准确率达到 92% 到 100%。他们的研究结果发表在《神经工程杂志》上。
拉德堡德大学唐德斯脑、认知和行为研究所和 UMC Utrecht 的研究员、主要作者 Julia Berezutskaya 表示,这项研究表明脑机接口领域取得了有希望的发展。Berezutskaya 和 UMC Utrecht 和 Radboud University 的同事使用癫痫患者的大脑植入物来推断人们在说什么。
Berezutskaya 表示:“最终,我们希望将这项技术提供给处于锁定状态、瘫痪且无法沟通的患者。”“这些人失去了移动肌肉的能力,从而失去了说话的能力。通过开发脑机接口,我们可以分析大脑活动并让他们再次发出声音。”
在新论文中的实验中,研究人员要求植入临时大脑的非瘫痪患者大声说出一些单词,同时测量他们的大脑活动。
Berezutskaya 说:“我们能够在大脑活动和语音之间建立直接映射。我们还使用先进的人工智能模型将大脑活动直接转化为可听语音。这意味着我们没有“我们只是能够猜测人们在说什么,但我们可以立即将这些单词转化为可理解的声音。此外,重建的语音甚至在语气和说话方式上听起来都像原始说话者。”
世界各地的研究人员正在研究识别大脑模式中的单词和句子的方法。研究人员能够用相对较小的数据集重建可理解的语音,表明他们的模型可以用有限的数据揭示大脑活动和语音之间的复杂映射。