研究人员试图在机器中重现类似人类的思维

牛津大学的研究人员最近尝试使用语言引导想象(LGI)网络在机器中重建人类思维模式。在arXiv上发表的一篇论文中概述了他们的方法,可以为人类智能的人工智能的发展提供信息,这种人工智能需要以语言为导向的目标导向的心理思想流。

人类思维通常要求大脑理解特定的语言表达,并用它来组织思想中的思想流。例如,如果一个人离开她的房子意识到正在下雨,她可能会在内部说:“如果我拿到雨伞,我可能会避免弄湿”,然后决定在出路时拿起雨伞。然而,当她想到这个想法时,她会自动知道她观察到的视觉输入(即雨滴)意味着什么,以及如何拿着雨伞可以防止弄湿,甚至可能想象握住伞或弄湿雨伞的感觉。雨。

虽然有些机器现在可以识别图像,处理语言甚至感知雨滴,但它们还没有获得这种独特和富有想象力的思维能力。人类可以实现这种“持续思考”,因为他们能够生成由语言引导的心理图像,并从真实或想象的情境中提取语言表达。

近年来,研究人员开发了自然语言处理(NLP)工具,可以以类似人的方式回答查询。然而,这些仅仅是概率模型,因此无法以与人类相同的方式和相同的深度理解语言。这是因为人类在大脑发育过程中具有与其相伴的先天累积学习能力。已经发现这种“人类思维系统”与大脑中的特定神经基质相关,其中最重要的是前额皮质(PFC)。

PFC是负责工作记忆的大脑区域(即,当人们执行给定任务时发生的记忆过程),包括维护和操纵头脑中的信息。为了在机器中再现类似人类的思维模式,执行最近研究的两位研究人员冯琦和吴文川创建了一个受人类PFC启发的人工神经网络。

“我们提出了一种语言引导想象(LGI)网络,以逐步学习众多单词和语法的含义和用法,旨在形成一个类似人类的机器思维过程,”研究人员在他们的论文中解释道。

Qi和Wu开发的LGI网络有三个关键部分:视觉系统,语言系统和人工PFC。视觉系统由编码器组成,编码器将网络接收的输入或想象的场景解开为抽象的人口表示,以及从更高级别的表示重建想象场景的想象解码器。

第二个子系统,即语言系统,包括将符号文本转换为二进制矢量的二进制化器,通过从输入文本中提取数量信息来模拟人类顶内沟(IPS)功能的系统和将二进制矢量转换为二进制矢量的文本处理器。文字符号。他们的LGI网络的最后一个组成部分模仿人类PFC,结合语言和视觉表示的输入来预测文本符号和操纵图像。

Qi和Wu在一系列实验中评估了他们的LGI网络,发现它成功地以累积的方式获得了八种不同的语法或任务。他们的技术也形成了第一个“机器思维循环”,展示了想象图片和语言文本之间的相互作用。未来,研究人员开发的LGI网络可以帮助开发更先进的人工智能,它具有类人的思维能力。策略,例如可视化和想象力。

研究人员写道:“LGI逐渐学会了八种不同的语法(或任务),通过语言和视觉系统之间的适当交互,形成并验证了机器思维循环。” “我们的论文提供了一种新的架构,让机器以类似人的方式学习,理解和使用语言,最终使机器能够构建虚构的心理场景并拥有智能。”