清华大学深圳国际研究生院、腾讯人工智能实验室和鹏程实验室的研究人员最近发表了一篇论文,称该研究团队开发了一种名为梦境扩散的图像生成模型,可以直接从脑电信号生成高质量的图像。相关论文发表在美国康奈尔大学在线学术论文平台arxiv上。
目前,许多团队都研究了使用文本到图像扩散模型从人脑生成图像的方法,但大多数团队使用功能磁共振成像(FMRI)来捕捉大脑活动来生成图像。这项技术不切实际,因为它需要专家操作,需要昂贵且难以携带的fMRI设备。
相比之下,EEG是一种非侵入性、低成本的记录脑波活动的方法,已经有一些便携式商业产品可以轻松采集脑电信号。因此,研究团队提出了一种稳定扩散的图像生成方法,可以减少脑电信号的噪声干扰,使扩散模型的预训练更加稳定有效。
该团队向6名受试者展示了属于40个不同对象类别的2000张图像,然后通过收集受试者的脑电信号生成高质量的图像。在下图中,左侧标记为GT的每个组都是原始图像,右侧的样本图像为EEG生成图像。
为了评估这种方法的准确性,研究小组将其与最近的另一项类似研究Brain2Image进行了定性比较。结果表明,该方法的准确率明显高于Brain2Image生成的图像,从而证明了该方法的有效性。