提升7倍 DeepSeek官宣测试全新大模型：或为V4 Lite

zhiyongz 6个月前 (02-14) 阅读数 125 #人工智能

文章标签 DeepSeek V4 Lite

快科技2月13日消息，前几天国产AI来了一波爆发，智谱GLM-5、Minimax 2.5及DeepSeek在11日同一天都发布了新的大模型，其中DeepSeek的自然最受关注。此前我们已经报道过了，这次更新主要是提升了上下文能力，达到了1M，而之前的DeepSee V3系列也就是128K，这方面相对前代V3系列大模型提升了7倍。

今晚DeepSeek也在官方群中正式确认了这一点，表示网页及APP版正在测试新的长文本模型结构，支持1M上下文。同时DeepSeek还强调API服务还没变，还是V3.2系列大模型，只支持128K上下文。

提升7倍 DeepSeek官宣测试全新大模型：或为V4 Lite

从DeepSeek的介绍来看，这次的新模型还是文本模型，主要提升就是上下文能力，这个在很多领域也非常重要，长对话时很容易因为上下文不够导致大模型记不住之前的内容了。虽然网上已经有很多实测显示这次的DeepSeek大模型在编程、输出速度等方面提升也非常大，但相比于此前的期待，这次的更新难免有些失望。

这次的大模型显然不是V4，更可能是V4 Lite，因为参数量据悉只有2000亿，比V3系列的6700亿还少很多，因此部分能力比V3还差也是正常。猜测这个模型是V4 lite，DeepSeek未来发布的V4大模型也不太可能只有一款，而是有不同版本，每个系列有不同的方向和设计，现在的这个V4 Lite只是探路，因此提升的内容不多，而且DeepSeek官方也没有详细说明其技术架构，一切还有待更多信息释放。

传闻中的DeepSeek V4满血版是1.5万亿参数，比V3系列翻倍还多，还会使用之前DeepSeek研究的Engram、mHC等新技术，性能全面提升的同时成本还低，这个期待值还是很高的。

提升7倍 DeepSeek官宣测试全新大模型：或为V4 Lite

【本文结束】出处：快科技

版权声明

本站所有文章来源于本站原创或网络，如有侵权请联系删除。文章观点并不代表本站观点，请网友自行判断，如涉及投资、理财请谨慎应对！

上一篇：美国“龙”飞船将新一批宇航员送往国际空间站：计划开展多项科研实验下一篇：春节拒喝酒指南：9大招数包教包会！

发表评论:取消回复

◎欢迎参与讨论，请在这里发表您的看法、交流您的观点。

提升7倍 DeepSeek官宣测试全新大模型：或为V4 Lite

版权声明

作者文章