DeepSeek昨晚宕机7小时,Bloomberg说这是上线以来最严重的一次。但你有没有发现,去年R1的时候卡20分钟就能上热搜,这次宕8小时很多人看了新闻才知道。
我翻了DeepSeek过去一年发的7篇核心论文,把V4的技术拼图拼了出来:mHC解决万亿参数训练稳定性(梁文锋亲自署名),NSA拿了ACL 2025最佳论文让百万上下文在计算上走通,V3.2已经悄悄完成了小规模验证,benchmark甚至超过了GPT-5。
Polymarket上4月15日前发布的概率是54%,全世界都在等。但比V4本身更值得关注的是:在Agent时代token需求暴增、国产模型集体涨价的当下,DeepSeek能不能再来一次价格屠杀?
00:00 DeepSeek宕机7小时,但很多人看了新闻才知道
02:35 3月频繁宕机:日活增长67%,算力只增长8%
04:01...DeepSeek昨晚宕机7小时,Bloomberg说这是上线以来最严重的一次。但你有没有发现,去年R1的时候卡20分钟就能上热搜,这次宕8小时很多人看了新闻才知道。
我翻了DeepSeek过去一年发的7篇核心论文,把V4的技术拼图拼了出来:mHC解决万亿参数训练稳定性(梁文锋亲自署名),NSA拿了ACL 2025最佳论文让百万上下文在计算上走通,V3.2已经悄悄完成了小规模验证,benchmark甚至超过了GPT-5。
Polymarket上4月15日前发布的概率是54%,全世界都在等。但比V4本身更值得关注的是:在Agent时代token需求暴增、国产模型集体涨价的当下,DeepSeek能不能再来一次价格屠杀?
00:00 DeepSeek宕机7小时,但很多人看了新闻才知道
02:35 3月频繁宕机:日活增长67%,算力只增长8%
04:01 论文拼图1:mHC — 让万亿参数模型训得动
08:12 论文拼图2:NSA — ACL最佳论文,百万上下文走通
12:32 论文拼图3:V3.2悄悄超过GPT-5
14:54 V4预测规格:万亿参数 + 百万上下文 + 多模态 + 国产芯片
16:53 Agent时代token不便宜,国产模型集体涨价
18:31 大家想再感受一次R1那个夜晚的冲击