最近,美国加州大学旧金山分校的科研团队使用人工智能解码系统,把人的脑电波转译成英文句子,最低平均错误率只有3%。这项研究发表在《自然·神经科学》杂志上。
参加实验的4名志愿者都是癫痫患者,他们由于治疗需要在大脑表面植入了数百个微电极。研究人员正是利用这些微电极阵列来记录其脑电波信号,然后借助人工智能系统进行解码。
正确率胜过人工速记员
论文显示,10年前,科学家首次从人类大脑信号中解码出语音,但是解码的精度和速度远低于自然语速。
低到什么程度呢?
研究团队介绍,迄今为止,在直接从脑电波中解码语音的研究中,脑机接口系统仅限于解码单音节,或在志愿者连续念出约100个单词的情况下,只能正确解码不到40%的单词。
为提升解码精确度,研究团队从机器翻译中获得启发,训练了一种循环神经网络。研究中,4名志愿者被要求大声重复朗读30至50句话。他们大脑外侧皮质上分布着大量微电极,可以监测到相应的大脑神经活动。这些脑电波数据输入人工智能系统后,先被编码成一串序列,然后解码成相应的英文句子。
研究人员表示,这项研究展示了以高精度和自然语速来解码皮层脑电图。在对其中一个志愿者的脑电波解码任务中,平均每句话只有3%需要纠正——低于专业人工速记员平均5%的错误率。
但研究团队也强调,该研究涉及的句子量比较少。“如果你尝试不使用这50个句子的数据集,解码就会糟糕很多。”论文第一作者约瑟夫·马金接受媒体采访时说。
展示AI解读神经信号的潜力
“这项研究的创新之处在于,采用端到端的深度学习网络实现神经信号翻译,从工程角度展示了人工智能技术应用于神经信号解读的潜力。”清华大学医学院神经工程实验室、清华大学人工智能研究院教授洪波在接受记者采访时评价说。
洪波分析,这项研究的难点在于两个方面。
首先是采用了高密度微电极阵列,间距4毫米,多达256个电极,覆盖大脑皮层表面的关键脑区,获取了足够的神经信息用于解码。这种电极在国内尚没有可用于临床的产品。
另外,研究中深度循环神经网络的训练,除了采用时间轴上的卷积操作提高特征提取能力,还把语音频谱特征也作为训练目标,大大降低了对神经数据量的需求。
“脑机接口的一个核心难题是神经信息的解码和翻译,脑电信号噪声大,背后的神经编码机制复杂未知,这些都是挑战。”洪波认为,以深度学习为代表的人工智能技术发展,为脑机接口打开一条应对该挑战的新路径。
不过,在洪波看来,人工智能与脑机接口结合,也带来新难题:如何获得大量的训练数据?来自人脑的高精度神经数据通常只在临床条件下才能获得,这会使神经网络训练陷入困境。
现实应用仍存技术障碍
“这项技术目前主要用于癫痫外科的临床,帮助外科医生在切除癫痫病灶之前,确定关键的语言功能区。要让渐冻人、高位截瘫等残疾患者用上这样的脑机接口,还要继续解决长效电极和解码效率的问题。”洪波说。
他认为,相关技术在未来实际应用中,仍然有很大的技术障碍,例如高密度的微电极阵列目前还无法长期植入,难以作为未来脑机接口的标准电极。
洪波团队也在和材料、微电子以及临床团队合作,开发可以长期植入的微创解决方案。他告诉记者,根本上说,人工智能应用于脑机接口,关键门槛还是长期可靠的神经电极和清晰准确的神经解码规律。
“人们所期待的戴上脑电帽就能读出心里话,从科学和工程角度来看还有很远的距离。但脑科学和人工智能技术的结合,有可能加速这些探索和研发的进程。”洪波说。
来源: 科技日报