2 月 28 日消息,金融时报(FT)今天(2 月 28 日)发布博文,报道称深度求索(DeepSeek)将于下周发布全新多模态大语言模型 V4,原生支持图片、视频与文本生成功能。
这是 DeepSeek 自 2025 年 1 月推出 R1 推理模型以来的首个重大版本更新,有望进一步填补国内低成本、开源模型的市场需求。
码农网援引博文介绍,在下周发布 V4 时,DeepSeek 计划同步公开一份简短的技术说明,并于约一个月后发布详尽的工程报告。
在 硬件 适配方面,消息称 DeepSeek 为国产算力提供深度支持,已联合华为和寒武纪优化 V4 模型的硬件适配,预估大幅提振本土半导体需求,并加速 AI 模型“推理”环节靠拢本土芯片。
相关阅读:
《DeepSeek 新论文剧透 V4 新框架:用闲置网卡加速智能体推理性能,打破 PD 分离瓶颈》
《消息称 DeepSeek V4 模型打破惯例:华为等国内厂商可早期访问,不让英伟达 AMD 先用》
《OpenRouter:中国 AI 模型 2 月全球 token 用量首超美国,MiniMax 等四款大模型霸榜前五》
《DeepSeek V4 Lite 原生多模态 AI 曝光:百万 tokens 上下文,非思考生图秒杀前代》
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,码农网所有文章均包含本声明。
猜你喜欢:暂无回复。
