你脑中的小小声音,如今可以被一个脑扫描仪解码了——至少有些时候可以。研究者开发了首个非侵入性的方法,可以确定想象中说话的主旨内容,为无法说话的人提供了一个可能的交流渠道。但这个技术离实现真正的读心术还有多远?政策制定者如何确定这样的技术发展不被滥用?
大多数现有的思想-言语转换技术使用脑植入物,监测一个人运动皮层的活动,并预测嘴唇试图形成的词。为了理解思想背后的真实含义,得克萨斯大学奥斯丁分校的Alexander Huth和Jerry Tang与同事结合了功能性磁共振成像和称为大型语言模型的人工智能算法,该算法支持着类似ChatGPT的工具,被训练用于预测一段文本中的下一个词。
一项研究使用功能性磁共振成像(fMRI)解码人们的思想。来源:Jerry Tang 和 Alexander Huth
(资料图片)
在《自然-神经科学》5月1日发表的一项研究中,研究者让3位志愿者躺在fMRI扫描仪里,在他们每人聆听16小时播客时记录他们的脑活动[1]。通过检测志愿者脑部血流,结合这一信息与他们听到的故事细节及LLM理解单词间关系的能力,研究人员开发了一个编码图谱,关于每个人的大脑如何响应不同的词汇和词组。
接下来,研究者记录了被试在听一个故事、想象讲故事,或观看一场无对话电影时的fMRI活动。研究人员利用先前为每一名参与者编码的模式,结合能根据句子中其他词语确定句子可能如何构建的算法,试图解码这种新的大脑活动。下面的视频显示了当被试在观看动画片Sintel时做的大脑记录中生成的句子。
有准,有不准
解码器产生的句子能捕捉到当事人思考的大意:比如“我还没有驾照”这个词组被解码成了“她还没开始学驾驶呢”。而且它在描述人们所看的电影内容方面相当准确。但它产生的许多句子并不准确。
研究者还发现这个技术很容易被愚弄。当参与者在听一个录音故事的时候想着一个不同的故事,解码器就无法确定他们听到的是什么词。这个编码图谱还因人而异,意味着研究者无法制造出一个对所有人适用的解码器。Huth认为,随着研究者创建出更详细的个人大脑图谱,要开发通用解码器会变得更加困难。
确定大脑如何从语言中创造意义非常困难,Francisco Pereira说,他是美国国立精神卫生研究院的神经科学家。“能看到有人实现这个真是令人钦佩。”
“警钟”
神经伦理学家对于这一最新进展是否威胁心理隐私意见不一。“我不是煽动恐慌,但这种复杂的、非侵入性技术的发展,似乎比我们想的更接近现实了。”哈佛医学院的生物伦理学家Gabriel Lázaro-Muñoz说,“我认为这是给公众和政策制定者的一个警钟。”
但达特茅斯大学科学哲学家Adina Roskies说,这个技术太难用也太不准确,当下不会产生什么风险。首先,fMRI扫描不是便携的,所以没有某人的配合不可能扫描他们的大脑。她还怀疑除了恢复交流功能以外,是否还有任何理由值得花时间和成本来训练某个人的解码器。“我不觉得现在就该开始担心,”她说,“政府有的是别的方法知道我们在想什么。”
麻省理工大学的认知神经科学家Greta Tuckute认为,解码系统不能在不同个体间通用,而且人们通过想别的事情就能轻易骗过它,这一点令人振奋。“这很好地说明了我们究竟有多少主体性。”她说。
谨慎前进
尽管如此,Roskies说就算解码器效果一般,如果律师或法庭试图在不理解其科学限制的情况下加以利用,也是会产生问题的。比如,在当前这个研究中,词组“我就跳出了[车]”被解码为“我不得不把她推出车”。“这些差距太明显了,它们可能会在司法案例里产生巨大的不同后果,”Roskies说,“我担心他们在不应使用的时候就有能力用上这类东西。”
Tang也同意。“测谎仪不准确,但它有负面后果,”他在一次新闻发布会上说,“没有人应当在不合作的情况下被解码大脑。”他和Huth呼吁政策制定者,主动应对“读心”技术怎样可以和不可以合法使用的问题。
Lázaro-Muñoz说,政策行动可以参照2008年的一项美国法律,该法律防止保险公司和雇主以歧视性方式使用人们的遗传信息。他还担心解码器对患有强迫症等疾病的人会有什么影响,他们可能会有非自愿的、侵入性的伤害他人的想法,但绝不会采取行动。
Pereira说,解码器可以变得多准确还是个悬而未决的问题,同样,它们是否会最终变得通用而非因人而异也是一样。“这取决于你认为人类有多独特。”
尽管解码器最终会变得善于预测一个系列里的下一个单词,它可能很难理解比喻或隐喻。Pereira说,把单词凑到一起和确定大脑如何编码单词间的关系,之间是相当大的一步。
标签: