去年7月的事儿估计还有人记得——DeepSeek量从8000多万暴跌到2000万,“跌落神坛”的话题刷遍科技圈。谁能想到,才过一年这家公司就攒够了劲儿,要在春节前后搞个大动作:2月中旬发布新一代模型DeepSeek-V4,这次的靶子直接对准了AI编程的核心赛道。

DeepSeek能否第二次震惊全世界

要是说去年R1模型靠推理能力证明了“低成本也能做大事”,那V4就是冲着“代码生成”这个当下最卷的领域去的。根据知情人士透露,V4在内部基准测试里,编程任务表现已经超过了Claude和GPT系列。更关键的是,它解决了两个困扰AI很久的“病”:以前让R1栽跟头的“数strawberry里有几个r”问题(模型死记硬背数据,把正确的3说成2),V4能彻底杜绝——它不是死记答案,是真的“理解”了“数”的逻辑;还有训练时“学新忘旧”的“灾难性遗忘”,V4也搞定了——变聪明的同时没丢旧能力,刚好踩中了“Agent时代”的痛点:现在改一行代码可能牵动几千行依赖,以前的模型根本hold不住,V4这波相当于给编程Agent“搭了脚手架”。

DeepSeek能否第二次震惊全世界

其实DeepSeek的底气早有伏笔。去年R1登《Nature》封面时,团队就公开过一组扎心数据:从V3-Base到R1只花了29.4万美元——直接把“中国大模型靠烧钱”的说法怼了回去;年底那篇《mHC:流形约束超连接》论文更狠,给模型信号加了个“精密阀门”,把增益控制在1.6倍左右,解决了大模型“越做越不稳定”的物理难题,这就是V4的技术底子。再说现在赛道有多卷?至知创新的IQuest-Coder-V1才40B参数,就拿到了SWE-benchVerified81.4%的高分;字节豆包的Trae工具能从构思到部署一站式完成,还和中兴合作出了能跨应用操作的手机助手;阿里通义千问都能并行处理四个任务了——DeepSeek要是没点真东西,根本不敢往这堆里扎。

DeepSeek能否第二次震惊全世界

最近资本市场的动静也在“补刀”:智谱AI1月8日港交所敲钟,首日涨13%;MiniMax更夸张,上市当天暴涨109%,直接冲进千亿市值俱乐部。这说明什么?“百模大战”的泡沫散了,现在市场只认“有硬实力的头部”。DeepSeek作为曾经用低成本颠覆行业的“黑马”,这次带着V4杀回战场,能不能再复制去年的“震惊时刻”?

DeepSeek能否第二次震惊全世界

春节的脚步越来越近,大家一边抢火车票一边等消息——毕竟去年DeepSeek跌落时,没人想到他们能憋出这么个大招。这次V4要是真能在代码生成赛道站稳,说不定又能给AI行业搅起一阵风浪。至于能不能“第二次震惊全世界”?反正就等春节那几天了,咱们搬个小马扎,等着看DeepSeek的“新年答卷”。