睿文小說 > 學霸的征途是星辰大海 > 第301章 真理的啟迪者 三

第301章 真理的啟迪者 三

⬅ 上一章 📋 目錄 ⚠ 報錯 下一章 ➡
⭐ 加入書籤
推薦閱讀: 花都風流第一兵王 代嫁寵妻是替身 天鋒戰神 穿越古代賺錢養娃 我覺醒了神龍血脈 我的老婆國色天香 隱婚嬌妻別想跑 遲遲也歡喜 全職獵人之佔蔔師

稍微適應了一下升級後的大腦,徐辰估摸著DeepSeek的論文應該是發出來了。

他開啟電腦,熟練地登入arXiv,輸入了關鍵詞。

果然,那篇論文赫然在列。

徐辰在公寓裡下載了這篇論文,仔細研讀了一遍。

論文的核心原理極其驚艷,直擊當前大語言模型(LLM)的軟肋:現有的Transformer架構雖然通過MoE(混合專家)實現了「條件計算」,但缺乏原生的知識查詢機製。   解悶好,.超流暢 ,提供給你,的閱讀體驗

當模型需要回憶一個靜態事實的時候,比如「巴黎是法國的首都」,它隻能通過消耗寶貴的注意力機製和前饋網路層去「重新計算」和「模擬提取」。這就像是讓一個頂級數學家去死記硬背電話號碼,極大地浪費了推理算力。

而DeepSeek給出的解法,正是「條件記憶」。

他們引入了一個名為「Engram(記憶印跡)」的模組,將經典的N-gram嵌入現代化,實現了O(1)時間複雜度的常數級知識查詢。簡單來說,模型不再需要死記硬背,而是學會了「查字典」。

論文中還提出了一條「U型縮放定律」,證明瞭將大約20%到25%的稀疏引數分配給Engram模組時,模型效能達到最優。更恐怖的是,由於Engram的查詢是確定性的,它完全可以繞開昂貴的GPU視訊記憶體(HBM)限製,直接從廉價的主機記憶體(DRAM)中進行執行時預取,幾乎沒有額外的效能開銷。

「幹得漂亮。」

徐辰看著論文裡的架構圖,暗自點頭。

以他升級後的資訊學LV2的眼光來看,梁文鋒的這個成果,和係統當初給出的那個完美的D-LTMN方案相比,其實做了一些工程上的妥協。

係統方案更偏向於底層硬體架構的微調,而DeepSeek則是在現有的GPU集群和Transformer框架下,做到了軟體層麵的極致壓榨。

「這算是……係統方案的『青春版』?」

徐辰摸了摸下巴。

但這已經足夠驚艷了。

不出意外,這篇論文將在接下來的幾個月裡,成為整個AI界討論的焦點。

……

徐辰猜得沒錯。

此時的曼哈頓下城,摩根史坦利大樓。

高階分析師約翰·史密斯正對著電腦螢幕發呆,手裡那杯昂貴的冷萃咖啡已經在那兒擺了半個多小時,冰塊化了一半,也沒動一口。

螢幕上是一份還沒寫完的研報草稿——《英偉達:算力帝國的黃昏還是黎明?》。

約翰感覺自己的頭髮都要掉光了。

現在的華爾街,簡直就是個精神分裂的瘋人院。

一方麵,整個美股全靠那幾隻科技巨頭撐著,尤其是英偉達,簡直就是全村的希望。隻要AI的故事還在講,隻要大模型還需要燒錢買卡,納斯達克就能接著創新高,大家的年終獎就有著落。

如果英偉達倒了,AI泡沫破裂,美股大盤就會瞬間崩盤,引發係統性的金融危機。到那時,不僅他的飯碗保不住,整個華爾街都要排隊去跳樓。

所以,上頭的指令很明確:「看多!必須看多!不能讓泡沫破了!」

但另一方麵,現實的資料卻像是一記記響亮的耳光。

年初那個中國小子搞出來的SLRM架構,已經讓訓練端對GPU的需求砍了一半。現在好了,DeepSeek又搞出了個Engram,直接在推理端把視訊記憶體需求給廢了!

「這日子沒法過了……」

他在研報裡敲下了一段極其糾結的文字:

【……我們注意到,近期來自中國研究團隊的SLRM架構與Engram模組,在優化大語言模型(LLM)的KV Cache視訊記憶體占用及推理計算量方麵取得了顯著進展。這表明,在純文字推理端,算力邊際成本遞減的趨勢正在加速。】

【基於DCF(現金流折現)模型及對未來三年TAM(總潛在市場)的重新評估,我們預計北美四大雲服務商(CSP)在純文字推理端的Capex(資本支出)增速將出現拐點。Engram架構的O(1)常數級查詢特性,實質上打破了『視訊記憶體牆』的物理限製,導致單Token的算力與視訊記憶體成本呈斷崖式下降。因此,我們將英偉達2026財年的營收預期下調12%,目標價由145美元下調至115美元。】

寫完這段,約翰又覺得太悲觀了,可能會被老闆罵「唱空美股」。

於是他又加了一句找補的話:

【當然,如果考慮到未來AI應用場景的爆發式增長,市場總需求的急劇膨脹將完全對沖單Token算力成本下降帶來的負麵影響,英偉達的算力護城河依然深不可測。因此,我們維持『增持』評級。】

看著螢幕上這段文字,約翰自己都覺得滑稽。

一邊大幅下調目標價,一邊又給出「增持」評級,這簡直就是**裸的精神分裂!

但是作為華爾街的分析師,他根本沒辦法。

他既要閉著眼睛吹捧美國AI產業蒸蒸日上,以保住當前脆弱的股市大盤和自己的飯碗;又要麵對英偉達不斷累積的產業崩盤風險,在研報裡留下足夠的「免責宣告」,免得日後泡沫破裂時被憤怒的投資者起訴欺詐。

其實,不僅僅是華爾街,現在的美國到處都在上演著這種「精神分裂」的荒誕劇。比如華盛頓那幫政客,美聯儲一邊聲嘶力竭地喊著維持高利率抗擊通脹,財政部一邊卻又在瘋狂發債印鈔,往市場裡大肆放水。

這種極度擰巴的現象,歸根結底,核心矛盾隻有一個——美國的真實科技與金融實力已經開始不可逆地衰退,但為了維持全球霸權,外部的宣傳和資產定價卻必須死死撐住,絕不能露出半點疲態。

裡子已經千瘡百孔,但麵子還得硬撐。這就是約翰,也是整個華爾街此刻麵臨的死局。

……

然而,就在華爾街還在糾結怎麼「圓謊」的時候,有人已經動手了。

對於幻方量化(DeepSeek母公司)的交易團隊來說,技術突破不僅僅意味著發論文,更意味著——暴利。

早在論文發布的前一週,他們就已經通過複雜的期權組合,在離岸市場上悄悄建立了大量的英偉達空頭頭寸。

當論文發出的那一刻,也就是收網的時候。

納斯達克開盤。

英偉達(NVDA)的股價,在盤前交易階段就跳空低開了5%。

開盤後,更是如自由落體般一路向下,短短半小時內蒸發了近千億美元的市值。

交易大廳裡,哀鴻遍野。

「該死!DeepSeek這幫人簡直是強盜!」

一個交易員憤怒地摔了鍵盤,「他們一邊發論文砸盤,一邊在期權市場上做空!這簡直是降維打擊!技術碾壓就算了,金融手段也這麼狠!」

「聽說幻方那邊的空單已經翻了三倍了!這幫搞量化的,簡直比搶銀行還快!」

恐慌情緒迅速蔓延。

原本還在觀望的機構紛紛拋售,英偉達的股價一度跌破了關鍵支撐位。

幾位交易員癱坐在椅子上,不禁發出了靈魂拷問:

「上帝啊,到底誰纔是科技強國?到底誰纔是金融強國?」

「我們建了那麼複雜的金融衍生品,不就是為了收割全世界嗎?怎麼現在反過來被中國人用技術加金融的雙重手段給收割了?這劇本不對啊!」

……

第 1 頁
⬅ 上一章 📋 目錄 ⚠ 報錯 下一章 ➡
升級 VIP · 無廣告 + VIP 章節全解鎖
👑 VIP 特權 全站去廣告清爽閱讀 · VIP 章節無限暢讀,月卡僅 $5
報錯獎勵 發現文字亂碼、缺章、內容重複?點上方「章節報錯」回報,審核通過立獲 3天VIP
書單獎勵 前往 個人中心 投稿你的私藏書單,審核通過立獲 7天VIP
⭐ 立即升級 VIP · 月卡僅 $5
還沒有帳號? 免費註冊 | 登入後購買