7 月 16 日消息,Meta 公司宣布开发出一款名为 CM3Leon 的人工智能模型,该模型可以根据文本生成高质量的图像,也可以为图像生成文本描述,甚至可以根据文本指令编辑图像。
Meta 公司称,这款模型在文本到图像生成方面达到了业界最高水平,超过了谷歌、微软等公司的产品。CM3Leon 是一种基于 Transformer 的模型,Transformer 是一种利用注意力机制来处理输入数据的神经网络结构。相比于其他基于扩散(diffusion)的模型,Transformer 模型更加高效,训练速度更快,计算成本更低。
Meta 公司展示了 CM3Leon 在不同任务上的优异表现,包括根据复杂的文本提示生成图像,根据文本指令编辑图像,以及生成图像描述和回答。Meta 公司表示,CM3Leon 是图像生成和理解领域的一大进步,但也承认该模型可能存在数据偏见的问题,并呼吁行业加强透明度和监管。
Meta 公司使用了数百万张来自 Shutterstock 的授权图片来训练 CM3Leon,最强大的版本有 70 亿个参数,比 OpenAI 的 DALL-E 2 模型多两倍。
Meta 公司没有透露是否会公开发布 CM3Leon 模型。
为您推荐与 meta 相关的帖子:
- Meta 公司确认将于10月1日关闭 Neighborhoods 服务
- Meta CEO 扎克伯格:将裁减一些中层管理人员
- Meta 减少数字藏品,发力 Meta Pay 等金融科技工具
- Meta 请竞争对手提供反垄断诉讼证据,eBay 怒斥“你查我商业机密”
- Meta CEO 扎克伯格:办公室办公比远程办公更高效
- 扎克伯格裁员不手软,消息称 Meta 即将再裁 4000 人
- Meta 公布 2025Q2 财报:营收 475.2 亿美元,同比增 22%;净利润 183.4 亿美元,增 36%
- 曝 Meta 每天投放 150 亿条欺诈广告,去年从中获利 160 亿美元
- 消息称 Meta 正就为自有数据中心导入 TPU AI 芯片与谷歌洽谈
暂无回复。
