首頁
影片
頻道
食衣住行
全部
23861
DIY
1566
衣著
411
妝扮
753
車
3038
房屋
1420
社會
4095
政論
105
美食
4058
烹飪
6825
新聞
202
環保
330
點心
1058
休閒娛樂
全部
68124
ASMR
151
小說
2836
戶外
1067
日常
3653
卡通
946
民俗
1341
休閒
953
收藏
609
明星
3749
玩具
968
美女
773
音樂
6120
旅遊
959
神秘
1403
配音
412
偶戲
599
動漫
5396
開箱
512
新奇
717
運動
1810
遊戲
7847
電視劇
8307
電影
4302
漫畫
662
綜藝
4410
劇場
835
廣播
392
趣味
3337
寵物
1317
魔術
1741
教學知識
全部
38226
3C
1300
人物
383
人際
107
心靈
1662
文化
1048
文學
556
生物
138
地理
863
宇宙
300
兒童
848
兩性
1142
命理
980
宗教
3046
法律
380
知識
1845
科學
1420
軍武
946
財經
4862
健康
3358
動物
1508
教育
2044
軟體
936
植物
247
園藝
2345
演講
288
綜合
1388
歷史
1679
職場
380
雜談
831
藝術
944
攝影
452
我要推薦
回上一頁
DeepSeek V4发布前,梁文锋连发3篇论文,我读完发现一个规律
1.35萬
2026-01-14
314
AI进化论花生
DeepSeek V4传闘愈演愈烈,2月中旬春节前后发布几成定局。但在V4到来之前,DeepSeek连发三篇梁文锋署名论文,透露了下一代模型的技术方向。 本期视频带你读懂这三篇论文的核心思想: Engram:给模型装上"记忆",75%思考+25%记忆是最优解。博尔赫斯1942年就写过:完美的记忆会杀死思考。 mHC:残差连接用了10年,DeepSeek证明它不是最优解。稳定性提升3个数量级,只增加6.7%训练时间。 R1论文更新:从22页扩展到86页,29.4万美元训练成本首次公开,连失败案例都写进去了。 DeepSeek的风格:先发论文,再发模型。看完这三篇,V4发布时你就能看懂它到底强在哪。
DeepSeek V4传闘愈演愈烈,2月中旬春节前后发布几成定局。但在V4到来之前,DeepSeek连发三篇梁文锋署名论文,透露了下一代模型的技术方向。 本期视频带你读懂这三篇论文的核心思想: Engram:给模型装上"记忆",75%思考+25%记忆是最优解。博尔赫斯1942年就写过:完美的记忆会杀死思考。 mHC:残差连接用了10年,DeepSeek证明它不是最优解。稳定性提升3个数量级,只增加6.7%训练时间。 R1论文更新:从22页扩展到86页,29.4万美元训练成本首次公开,连失败案例都写进去了。 DeepSeek的风格:先发论文,再发模型。看完这三篇,V4发布时你就能看懂它到底强在哪。
12:32
音乐创作被改写了:我只跟 AI 聊一句话,10 分钟就做完一首歌和完整 MV
13:31
😮首个AI“伤害人类”事件!"AI 威胁论"成真?马斯克的预言已经成真?
09:17
【上集】2025年度 300C1 區園遊會|獅友進場式+捐贈儀式|熱情開幕#C1區園遊會#獅子會#LionsClub#進場式#捐贈儀式#服務精神#公益活動#社會服務#WeServe#300C複合區
01:50
臺灣文化教材課文MV:臺灣路邊攤
1:01:55
一小时Jenkins教程 #jenkins #devops #cicd
༺ 資料蒐集來源:
YouTube
༻
本站不需註冊加入會員,保障個人隱私,完全不用Cookei