天天时讯:靠脑电波输出想法,瘫痪男子拼出1100个单词

来源:生物探索 | 2022-11-16 15:43:26 |

时任法国时尚杂志《ELLE》总编辑的Jean-Dominique Bauby,在一次偶然的中风苏醒后,除了左眼还能够眨动外全身瘫痪。然而,这种名为闭锁综合征的疾病没能将他清醒的意识禁锢在僵死的肉体中,他依靠眨眼选择别人念出的字母,来完成单词的拼写。单词串成语句,语句连成段落,他花费了两年的时间,完成了生命中唯一的著作《潜水钟与蝴蝶》。“潜水钟”象征沉重的命运,而蹁跹飞舞的“蝴蝶”则象征着不甘束缚的思绪,正是作者自身状况的最好写照。

这名被称作Bravo1的瘫痪男子则比Bauby幸运一些。他在20岁时因为脑桥中风,被神经科医生和语言病理学家诊断为严重的痉挛性四肢瘫痪和构音不全。认知能力虽然完整,也保留了发出咕噜声和呻吟声的能力,但他无法发出清晰的语言。他的头颈还能转动,所以能够通过加装在帽子上的指针点触屏幕上的字母来进行交流,速度约为每分钟5个单词或18个字符。

图1 Bravo1通过控制帽子上的指针点触屏幕(图源:[1])


(资料图片仅供参考)

但交流还可以变得更简单。到了2019年,作为BCI手臂和声音恢复(BCI Restoration of Arm and Voice,BRAVO)临床试验的第一位参与者,研究人员通过手术在他大脑的语言运动皮层区域植入一个高密度电极。BCI即Brain Computer Interface,意为脑机接口。通过这个电极,Bravo1的大脑信号传输到计算机中进行实时分析。

Bravo1可以从预先定义的50个极常用单词中挑选他想说的那个,然后作出大声念出该单词的尝试(overt-speech attempts)。对于某些构音不全患者,在尝试说话时能够产生有限的口腔运动和无差别的发声。计算机识别出Bravo1在尝试说话期间的神经活动,并通过深度学习模型评估Bravo1说出某个单词的概率。结合神经活动给出的线索,以及在一般语句表达中某个单词出现的合理性,计算机最终会给出Bravo1最可能想要表达的完整句子。

图2 由神经活动直接解码词汇的示意图(图源:[2])

这个系统最终达到了每分钟15.2个单词的中位速率,以及74.4%的中位单词正确率。相关研究成果以“Neuroprosthesis for Decoding Speech in a Paralyzed Person with Anarthria”为题于2021年7月发表在The New England Journal of Medicine(图2)[2]。

图3 研究成果(图源:[2])

在此基础上,研究人员还想要再进一步。首先是词汇量的扩充,必须要让Bravo1有办法拼写出更多的较常用单词,但这对于计算机将神经活动准确解码为特定单词,难度将大幅提升。其次Bravo1并不喜欢通过尝试大声说话的方式来控制拼写系统,因为那样异常费力,如果改为仅仅在心中尝试默念(silent-speech attempts),对他来说会更为舒适,但尚不清楚仅靠默念时的神经活动能否正确解码出Bravo1想要表达的内容,尤其Bravo1已经十多年不能说话了,语言控制背后的神经信号是否仍然完整需要存疑。

为此,研究人员设计了如下的实时拼写流程:1·Bravo1尝试默念单词激活拼写系统;2·屏幕上呈现倒计时提示,倒计时结束,Bravo1按照北约音标字母表默念单词,比如他想说字母c就默念Chalie,字母t就默念Tango;3·拼写系统根据接下来2.5s内的神经活动判定Bravo1最可能想要表达的字母是什么;4·拼写系统根据一般语句表达的合理预期调整当前字句,比如“我吃……”后面跟着的更可能是“过了”而不是“过去”;5·重复步骤2、3、4直到拼写系统以大于80%的概率检测到Bravo1有攥紧右手的尝试,随后句子的拼写结束。

图4 拼写流程(图源:[2])

为了减轻拼写系统的检索压力,构成句子的单词仅在预设的1152个单词中候选,这些单词足以涵盖“自然英语句子中超过85%的内容”。拼写速度达到了每分钟29.4个字符,字符错误率仅为6.13%。而离线模拟的结果表明,该方法可以推广到包含超过9000个单词的大型词汇表,同时仍然保持较低的字符错误率(8.23%)。研究成果“Generalizable spelling using a speech neuroprosthesis in an individual with severe limb and vocal paralysis”于2022年11月8日发表在Nature Communications[3]。

图5 研究成果(图源:[3])

9000多个单词“基本上够大多数人一年用的了。”Sean Metzger,这项研究的第一作者说,“Bravo1非常喜欢使用这个设备,因为他能够快速轻松地与我们交流。”短句“Anything is possible”是Bravo1最喜欢拼写的句子之一。

虽然斯坦福大学在2021年开发的用于解码想象中手写动作的BCI达到了每分钟90个字符的输出速率,但Metzger认为他们基于语音的方法拥有独特的优势。有调查显示,许多潜在的BCI用户更喜欢语音驱动而不是手、臂驱动。此外,依靠该BCI,Bravo1既可以完整默念那50个极常用单词用于完成许多互动,也可以随他心意拼写出不那么常用的单词。

该拼写系统还有许多需要改进的地方。比如当Bravo1想要拼写的内容是简短的词组而非完整的句子时,解码的错误率会有所增加。而在真正临床推广这一系统前,还需要在更多的人身上进行验证。

参考资料:

[1]https://www.youtube.com/watch?v=z4bpgXCAokw

[2]Moses DA, Metzger SL, Liu JR,et al. Neuroprosthesis for Decoding Speech in a Paralyzed Person with Anarthria. N Engl J Med. 2021 Jul 15;385(3):217-227. doi: 10.1056/NEJMoa2027540.

[3]Metzger, S.L., Liu, J.R., Moses, D.A. et al. Generalizable spelling using a speech neuroprosthesis in an individual with severe limb and vocal paralysis. Nat Commun 13, 6510 (2022). https://doi.org/10.1038/s41467-022-33611-3