原标题:脑机接口新研讨:超准“脑活动翻译器”,过错率不到3%
智东西(大众号:zhidxcom)
编 | 董温淑
智东西3月31日音讯,脑机接口研讨又有新进展!美国加州大学旧金山分校研讨人员研发了一种新式机器翻译算法,能以较高精确率解码脑神经活动,并将其翻译成文字,转录过错率低至3%,可比美专业的语音转录算法。
该研讨30日宣布在英国《天然-神经科学(Nature Neuroscience)》杂志上,论文标题为《翻译大脑(Translating the brain)》。
关于失掉言语才能但认知完好的人(比方中风患者)而言,这一研讨为他们带来了像正常人般顺利沟通的期望。
论文链接:https:///articles/s41593-020-0616-8
一、转录之难:表达进程杂乱,表述办法多样
大约在10年前,一些学者已在进行脑机接口相关研讨。可是多年曩昔,脑机接口在解码神经活动方面普遍存在速度慢和精确率低的问题。
据论文介绍,此前的解码模型过错率高至约60%。
1、言语表达进程杂乱,难以切入
言语表达自身是一个杂乱的进程:
首要,大脑要确认想要表达的意思,并在表达的进程中对语义进行不断批改。
然后,大脑要挑选与语义相匹配的词汇。当然,人类把握了言语才能后,可以在说话或写文章时天可是然地做出合理的挑选。
终究,当组织好了言语,大脑会组织肌肉群来发声。
面临这样的一个进程,解码模型很难找到适宜的切入点来完结转录。
2、表达办法丰厚,难以精确转录
除了言语表达进程自身的杂乱性,脑机接口还遭到表达办法的影响。说话时,多个不同的音节组成单词、不同单词再形成语句。
在这样的一个进程中,不同的口音、口误及其他听觉问题都会对转录成果形成影响。多样的表达办法、难以了解的表达过错大大提升了核算难度。
二、受翻译软件启示,试验验证过错率仅3%
此次研讨中,美国加州大学旧金山分校的神经外科研讨员约瑟夫·马金(Joseph Makin)及其搭档凭借机器翻译办法,练习了一种循环神经网络,将大脑神经信号直接映射成语句,均匀过错率仅有3%。
1、从翻译软件取得创意
依据论文,研讨人员是从翻译软件中取得了启示。
翻译软件的作业原理是先从语句层面临文本加以了解,依据语境推测出语句的意思,再依据语义扫除歧义词的影响。翻译进程中,软件会先将文本处理成一种过渡形式,从中提取含义,再倒推文字应该是什么。
马金教授团队以为,解码神经活动也可以学习文本翻译进程,先将神经活动处理为过渡形式,再解码为言语。
论文写道:“为了取得更高的精确度,咱们运用解码言语神经信号与机器翻译的类似之处,他们都是从一种言语向另一种言语的算法翻译。从概念上讲,这两件事的方针都是在同一根底剖析单元的两种不同表达之间树立联络。”
为了完成这种想象,研讨人员方案先将神经信号转化成各自独立的单词,而不是语序通畅的语法模块。这样就可以在不扩展词汇量的情况下取得更高的精确度。
2、4位癫痫患者参加测验,转录过错率仅3%
为了验证想象,研讨团队用两种不同的神经网络和颅内电极制作了一个解码器模型,并邀请了4位女人癫痫患者来参加试验。
试验之前,研讨人员在受试者大脑中植入颅内电极,以监测她们的脑电波。
试验进程中,每位受试者被要求在40分钟内阅览一组语句,每组语句重复两次。据了解,每组语句约有30~50个语句,最多包括250个不同的单词。
受试者朗诵的一起,研讨者记载了她们的大脑神经活动。
朗诵完后,研讨人员将受试者的神经活动记载,以及阅览的录音输入一个循环神经网络数据库。该神经网络会对试验数据进行整理,寻觅元音、子音等与言语相关的信号。通过比较类似之处,数据库会辨认出受试者阅览同一句话的脑电波。然后,该数据库会捕捉这些与言语相关的信号,将它们处理成一个过渡形式。
终究,这个过渡形式将被发至第二个神经网络。第二个神经网络体系会把过渡形式转换成单词,从而组成语句。
在这一进程中,算法并没有回忆受试者说某个语句时的脑电波。马金教授解说说,每逢一个人说同一个语句时,大脑活动是类似的,但并不完全相同,“回忆这些语句对大脑活动不会有协助,所以网络有必要去学习它们的类似之处,以便它终究能归纳出这个比方”。
研讨人员发现,在这四名女人之中,模型的均匀过错率仅有3%,简直到达了专业语音转录算法的精确率。考虑到仅进行了少数练习,它到达的精确率现已算对错常优异。
3、通过搬迁学习,模型精确率再进步
除了对固定的几组语句进行试验,研讨人员还练习模型进行了各种形式的搬迁学习。
例如,一位受试者说了一组在之前测验中没有运用过的语句。通过练习,模型的转录过错率下降了30%。别的,研讨人员还依据两位用户更好的供给的数据对模型进行了练习,终究模型的单词过错率低于8%,与人工翻译的过错率适当。
这些搬迁学习具有重要含义:
一方面,它阐明晰该模型的模块化特征可以让它在源于文本的中心表征上进行练习,而不是在任何时候都需求神经记载。虽然在开始,这种做法可能会导致解码过错率添加,但久远来说,这将使模型适宜于在更多情况下运用。
另一方面,这也表明晰这个模型终究也可以为试验受试者以外的人群服务,比方那些损失发声才能的人。此外,个人所需的练习时刻也将大幅度削减。
三、词汇量少,练习时刻短,模型仍有局限性
虽然这个模型在试验中的精确率较高,可是它间隔实践运用的要求仍有间隔。
现在,模型可以辨认的言语还非常有限。研讨人员在论文中坦承了这一点:“虽然咱们咱们都期望解码器可以学习并运用言语的规律性,可是咱们也知道从试验中的少数语料扩展到常用英语还需求许多数据。”
伦敦大学学院的索菲·斯科特(Sophie Scott)也以为间隔完成全面翻译大脑信号数据还有很长的路要走,“他们试验中运用的言语对错常有限的。”她提到。
假如要做到为言语障碍者补偿言语才能,则“至少是几年今后的事了。”马金博士承受媒体采访时说。
别的,现在该解码模型的安全性也还未经验证,植入人体仍需慎重。
结语:研讨仍在持续,言语障碍患者或能从中获益
研讨人员表明,他们将在之后的研讨中持续扩展这个模型的词汇量和灵活性。搬迁试验的成果也阐明晰解码模型还具有很大的发展潜力。
或许在未来,言语障碍患者可以终究靠植入这一类体系而取得“说话”的才能,让咱们拭目而待。
文章来历:Ars Technica,Inverse,BBC,NewScientist
责任编辑: