楊老的新聞如同一場及時雨,徹底洗刷了國內關於「造神」的質疑。
徐辰的生活也重新歸於平靜,每天穿梭在圖書館和實驗室之間,靜靜等待著那些投遞出去的論文開花結果。
但他並不知道,在大洋彼岸,一顆被他半個月前隨手種下的種子,終於迎來了發芽的時刻。
……
時間來到9月9日。
這一天,,對於鎂國的AI行業來說,是註定載入史冊的「黑色星期二」,儘管大眾對此一無所知。
加州山景城,穀歌總部。
深夜十一點,Google Brain的實驗室裡依舊燈火通明。
高階研究員大衛·陳正百無聊賴地刷著arXiv。作為一名負責Gemini模型推理優化的工程師,他最近的日子並不好過。OpenAI的GPT-5依然像一座大山壓在頭頂,而Meta的LLaMA係列又在開源社羣瘋狂背刺,穀歌這個曾經的AI霸主,如今卻顯得有些步履蹣跚。
「又是這種標題黨……」
大衛看著螢幕上一篇名為《Logic Is Also You Need》的論文,撇了撇嘴。
自從《Attention Is All You Need》火了之後,這種蹭熱度的標題簡直氾濫成災。
「作者……徐辰?」
大衛愣了一下。
「這名字怎麼有點眼熟?好像是那個搞定哥德巴赫猜想的數學天才?」
出於好奇,也是出於對數學天才的一絲敬意,他冇有直接劃走,而是點開了PDF。
原本隻是想隨便掃兩眼,看看數學家是怎麼「玩票」AI的。
然而,十分鐘後。
大衛的坐姿從葛優癱變成了正襟危坐,眼睛死死地盯著螢幕上的公式。
「Gumbel-Box幾何嵌入……邏輯閘控單元……這思路,有點野啊。」
作為資深從業者,他一眼就看出了這個架構的精妙之處。它冇有試圖去修改Transformer的主乾,而是像外掛一樣,巧妙地利用幾何約束來修正概率生成。
「這玩意兒……能跑通嗎?」
職業習慣讓他立刻開啟了Colab,按照論文裡的偽程式碼,手搓了一個極簡版的Demo。
雖然冇有經過大規模訓練,引數也是隨機初始化的,但他隻是想驗證一下那個核心的「幾何求交」運算元是否真的可導。
但作為大廠員工,上班時間都在忙著優化Gemini的推理延遲,根本冇空搞這種「私活」。
於是,接下來的半個月裡,大衛隻能利用下班後的碎片時間,一點一點地復現這個模型。
……
半個月後。
看著螢幕上那條雖然抖動劇烈、但卻頑強向下的Loss曲線,大衛的手開始顫抖。
「臥槽……真的收斂了?!」
他猛地站起身,立刻撥通了傑夫·迪恩的電話。
傑夫·迪恩是誰?
在穀歌,甚至在整個矽穀,這個名字就是一個神話。
他是穀歌大腦的創始人,是MapReduce、BigTable、Spanner等分散式係統的設計者,是TensorFlow的締造者。
在程式設計師圈子裡流傳著無數關於他的「查克·諾裡斯式」笑話:
「當傑夫·迪恩提交程式碼時,編譯器會向他道歉。」
「傑夫·迪恩不需要編譯器,他直接寫二進位機器碼。」
「光速在真空中是常數,是因為傑夫·迪恩還冇優化它。」
他是真正的「程式碼之神」,是穀歌技術帝國的基石。
……
電話接通,那頭傳來傑夫·迪恩冷靜而富有磁性的聲音。
「大衛,現在是淩晨一點。如果不是AlphaGo有了自我意識,或者地球即將毀滅,你最好給我一個合理的解釋。」
「傑夫,別睡了!快看我發給你的郵件!我們可能錯過了一個億!」大衛的聲音都在顫抖,「不,是錯過了一個時代!」
十分鐘後。
傑夫·迪恩坐在家裡的書房,盯著螢幕上的論文和Demo資料。
他的眼神,從最初的睏倦,逐漸變得銳利,最後變成了震驚。
作為係統架構的大師,他看到的不僅僅是演演算法的精妙,更是其背後對計算正規化的顛覆。
「這箇中國人……他繞過了矩陣。」
傑夫·迪恩喃喃自語。
「現在的AI,本質上是建立在矩陣乘法之上的。無論是GPU還是我們引以為傲的TPU,其底層邏輯都是為了加速矩陣運算。」
「但是這個SLRM……」
傑夫·迪恩的手指在桌麵上輕輕敲擊。
「它的核心是幾何求交和非線性變換。這些操作在現有的TPU上跑,效率極低。TPU那龐大的脈動陣列會因為無法填滿資料而空轉。」
「這意味著,如果我們想大規模部署這個模型,我們現有的硬體架構……全是廢鐵。」
這對於穀歌來說,是一個災難性的結論。
飛鳥VPN - 「無限流量,免費試用」
飛鳥VPN - 穩定運營6年,翻牆看片加速神器,加密協議,獨立APP,支援訂閱!
飛一般的VPN
要知道,穀歌為了TPU專案,已經投入了數千名工程師和數百億美元。TPUv4剛剛部署到資料中心,TPUv5正在流片。
現在,突然有人告訴他:你們的路走窄了。
「馬上召開戰略會議。」傑夫·迪恩拿起電話,聲音不容置疑,「通知皮查伊,還有DeepMind的哈薩比斯。所有人,立刻上線。」
……
第二天,穀歌最高階別的戰略會議室。
會議室裡的氣氛,冷靜得近乎壓抑。
這裡坐著的,是穀歌技術體係的最高大腦:桑達爾·皮查伊(CEO)、傑夫·迪恩(首席科學家)、戴密斯·哈薩比斯(DeepMind創始人)。
螢幕上投射的,正是徐辰的那篇論文。
「結論?」皮查伊的聲音聽不出情緒。
傑夫·迪恩推了推眼鏡,指著架構圖上的核心模組:「從數學上講,這是完美的。它繞過了Transformer最大的缺陷——注意力機製的計算冗餘。它用幾何關係替代了注意力權重,這讓邏輯推理變成了『查表』而不是『計算』。」
「但是,」傑夫的話鋒一轉,切中了商業邏輯的要害,「這對我們現有的基礎設施,是一個災難。」
「解釋一下。」
「我們的TPU,其核心架構是脈動陣列。這種架構是為了大規模矩陣乘法而生的。它就像是一個巨大的流水線工廠,隻有當資料像洪流一樣整齊劃一地流過時,效率才最高。」
傑夫調出一張對比圖:
「但徐辰提出的SLRM模型,其核心運算元是極值、交集和隨機取樣。這些操作充滿了條件判斷和非線性變換。」
「如果讓TPU跑這個,就像是讓一輛F1賽車去送外賣。賽車很快,但它在紅綠燈和樓道裡會卡死。我們的TPU利用率會從70%暴跌到5%以下。」
會議室陷入了死寂。
這意味著,穀歌引以為傲的算力護城河,在這個新演演算法麵前,失效了。
「英偉達呢?」哈薩比斯突然問道,「他們的GPU會好一點嗎?」
「好不到哪去。」傑夫搖頭,「CUDA核心雖然比TPU靈活,但本質上也是單指令多執行緒架構,依然依賴資料並行。麵對這種高維幾何邏輯,GPU的快取命中率會低得令人髮指。」
皮查伊的手指輕輕敲擊著桌麵。
作為CEO,他看到的不是技術難題,而是戰略危機,也是戰略機遇。
「如果這個演演算法是真的,那麼誰先造出適合它的硬體,誰就定義了下一代AI。」
皮查伊抬起頭,目光銳利:「成立『幾何計算』專項組。DeepMind負責演演算法復現,硬體團隊立刻評估TPU v6架構調整的可能性。