早报 | ImageBind:跨模态之王,6种模态全部绑定! 焦点热讯
当地时间5月9日,Meta宣布开源了一种可以将可以横跨6种不同模态的全新AI模型ImageBind,包括视觉(图像和视频形式)、温度(红外图像)、文本、音频、深度信息、运动读数(由惯性测量单元或IMU产生)。目前,相关源代码已托管至GitHub。
何为横跨6种模态?
(相关资料图)
即以视觉为核心,ImageBind可做到6个模态之间任意的理解和转换。Meta展示了一些案例,如听到狗叫画出一只狗,同时给出对应的深度图和文字描述;如输入鸟的图像+海浪的声音,得到鸟在海边的图像。
相比 Midjourney、Stable Diffusion 和 DALL-E 2 这样将文字与图像配对的图像生成器,ImageBind 更像是广撒网,可以连接文本、图像/视频、音频、3D 测量(深度)、温度数据(热)和运动数据(来自 IMU),而且它无需先针对每一种可能性进行训练,直接预测数据之间的联系,类似于人类感知或者想象环境的方式。
研究者表示 ImageBind 可以使用大规模视觉语言模型(如 CLIP)进行初始化,从而利用这些模型的丰富图像和文本表示。因此,ImageBind 只需要很少的训练就可以应用于各种不同的模态和任务。
ImageBind 是 Meta 致力于创建多模态 AI 系统的一部分,从而实现从所有相关类型数据中学习。随着模态数量的增加,ImageBind 为研究人员打开了尝试开发全新整体性系统的闸门,例如结合 3D 和 IMU 传感器来设计或体验身临其境的虚拟世界。此外它还可以提供一种探索记忆的丰富方式,即组合使用文本、视频和图像来搜索图像、视频、音频文件或文本信息。
该模型目前只是一个研究项目,没有直接的消费者和实际应用,但是它展现了生成式 AI 在未来能够生成沉浸式、多感官内容的方式,也表明了 Meta 正在以与 OpenAI、Google 等竞争对手不同的方式,趟出一条属于开源大模型的路。
最终,Meta 认为ImageBind 这项技术最终会超越目前的六种“感官”,其在博客上说道,“虽然我们在当前的研究中探索了六种模式,但我们相信引入连接尽可能多的感官的新模式——如触觉、语音、嗅觉和大脑 fMRI 信号——将使更丰富的以人为中心的人工智能模型成为可能。”
ImageBind的用途
如果说 ChatGPT 可以充当搜索引擎、问答社区,Midjourney 可以被用来当画画工具,那么用 ImageBind 可以做什么?
根据官方发布的 Demo 显示,它可以直接用图片生成音频:
也可以音频生成图片:
亦或者直接给一个文本,就可以检索相关的图片或者音频内容:
也可以给出音频,生成相应的图像:
正如上文所述, ImageBind 给出了未来生成式 AI 系统可以以多模态呈现的方式,同时,结合 Meta 内部的虚拟现实、混合现实和元宇宙等技术和场景结合。用 ImageBind 这样的工具会在无障碍空间打开新的大门,譬如,生成实时多媒体描述来帮助有视力或听力障碍的人更好地感知他们的直接环境。
关于多模态学习还有很多待发掘的内容。人工智能研究界尚未有效地量化只出现在较大模型中的扩展行为并理解其应用。ImageBind是朝着以严格的方式评估它们并展示在图像生成和检索方面的新应用的一步。
关键词:
相关阅读
-
早报 | ImageBind:跨模态之王,6种模...
Meta新的开源模型ImageBind将多个数据流连接在一起,适用于文本、视... -
钢板桩支护多少钱一米?钢板桩倾斜原因...
钢板桩支护多少钱一米?钢板桩支护的价格因地区、钢板桩型号、施工要... -
钢材市场价格多少钱一吨?钢板桩单边支...
钢材市场价格多少钱一吨?钢材主要分为:板材、型材、管材、线材四种... -
天天日报丨宏微科技:5月18日融资买入87...
5月18日,宏微科技(688711)融资买入873 1万元,融资偿还1027 17... -
阿里巴巴什么时候在美国上市?阿里巴巴...
阿里巴巴什么时候在美国上市?阿里巴巴是2014年9月19日在美国上市。2... -
每日速讯:百倍提效,火箭回收从“找”...
5月17日,长征三号乙运载火箭在西昌卫星发射中心点火升空,成功将北... -
备份星“入列”,“北斗”再出发_天天微...
2023年5月17日10时49分,由中国航天科技集团有限公司第五研究院(以... -
世界快资讯丨焦炭开启第八轮提降 部分...
5月18日,国内焦炭主流市场第八轮提降(提出要求降价)落地。据兰格... -
环球聚焦:新活力新气象,中国旅游市场...
中新网5月19日电(记者李金磊)今年5月19日是第13个“中国旅游日”,... -
空、天、地协同,为农场黑土地做“体检”
对比之前的监测手段,此次实验结合了太空、天空和地面的数据,实验... -
增容改造添动力,清洁能源产业“加速跑”
近年来,青海省着力打造国家清洁能源产业高地,国内一批批颇具影响... -
4.6亿年前的“海绵宝宝”重见天日_焦点日报
4 6亿年前的“海绵宝宝”长什么样?软躯体生物化石为何特别珍稀?... -
环球今日报丨国家能源集团研讨数字化生...
科技日报讯(记者陆成宽)当前,能源行业的数字化转型和智能化建设... -
微波和光学光子首次实现纠缠
科技日报北京5月18日电(记者张梦然)奥地利科学技术研究所、维也纳... -
“硬核”智能科技成果闪亮登场|天天速递
随时随地与5G特拍机器人、AI书法机器人亲密互动;体验VR划船、机械... -
全球关注:多地用电量整体回升 经济发...
(责编:王仁宏、吕骞) tjewm{width:100%;text-align:center;margin... -
业界:提升综合金融服务能力 推动大湾...
人民网北京5月18日电(黄盛)自《粤港澳大湾区发展规划纲要》实施以... -
观速讯丨金融支持新能源汽车下乡需重视...
助推新能源汽车下乡,除需进一步健全基础设施等之外,还要解决钱从... -
电子承兑汇票与纸质承兑汇票有什么区别...
电子承兑汇票与纸质承兑汇票有什么区别?1、电子票据和纸质票据的本... -
电子承兑最晚签收时间是什么时候?电子...
电子承兑最晚签收时间是什么时候?电子承兑最近7天签字。电子汇票需...