【#研究发现AI能预测你说话时在想什么#】据美国趣味科学网站3月16日报道，一个

【#研究发现AI能预测你说话时在想什么#】据美国趣味科学网站3月16日报道，一个经过数十小时真实对话训练的人工智能(AI)模型，准确地预测了人类的大脑活动，并表明语言结构的特征无需编码即可显现。科学家们利用AI揭开了日常对话中展现的复杂大脑活动。

研究人员表示，AI这一工具可以为语言神经科学提供新的见解，有朝一日，它可以帮助改进旨在识别言语的技术或帮助人们交流。

基于AI模型将音频转录成文本的方式，研究人员能够比传统模型更准确地绘制对话过程中发生的大脑活动。传统模型对语言结构的特定特征，如音素(构成单词的简单声音)和词性(如名词、动词和形容词)进行编码。

这项研究中使用的模型名为Whisper，它采用音频文件及其文本记录，将其用作训练数据，将音频对应到文本。然后，它使用这一对应的统计数据来“学习”并预测以前从未听过的新音频文件的文本。因此，Whisper完全通过这些统计数据工作，而不需要在原始设置中编码的任何语言结构特征。尽管如此，这项研究显示，一旦模型经过训练，这些结构仍然会出现在模型中。

这项研究结果揭示了这类AI模型——被称为大型语言模型——是如何工作的。但研究小组更感兴趣的是它对人类语言和认知的洞察。识别模型如何培养语言处理能力和人类如何培养这些技能的相似之处，可能有助于设计制造帮助人们交流的设备。

研究报告的主要作者、以色列耶路撒冷希伯来大学的助理教授阿里埃勒·戈德斯坦说：“这实际上跟我们如何看待认知有关。”他对本网站记者说，研究结果表明，“我们应该通过这种(统计)模型的视角来思考认知”。

研究人员使用80%的录制音频和随附的文本记录来训练Whisper，这样它就可以预测剩下的20%音频的文本记录。

然后，研究小组观察了Whisper如何捕捉音频和文本记录，并将这些表征与电极捕捉到的人类大脑活动进行了对比。

经过这种分析，他们可以用这个模型来预测未出现在训练数据中的、伴随对话的大脑活动。该模型的准确性优于基于语言结构特征的模型。

尽管研究人员一开始没有将音素或单词的内容编程到他们的模型中，但他们发现，这些语言结构仍然体现在模型如何推测文本记录的过程中。这样看来，它在没有得到指示的情况下提取了这些特征。

德国慕尼黑神经科学中心的研究小组负责人莱昂哈德·席尔巴赫在给本网站的一封电邮中说，这项研究是一项“开创性的研究，因为它展示了计算声学-语音-语言模型的工作原理与大脑功能之间的联系”。他没有参与此项研究。

但他补充说：“还需要更多的研究来调查这种关系是否真的意味着，语言模型和大脑处理语言的机制存在相似性。”（编译/王海昉）