時間如白駒過隙,轉眼已是11月中旬。
距離徐辰那篇《Logic Is Also You Need》在arXiv上發表,已經過去了兩個多月。
而華國的秘密佈局,更是已經悄然推進了三個多月。
這三個月裡,雖然表麵上風平浪靜,但在半導體和AI的核心圈層,早已是暗流湧動。
……
十一月中旬,深圳,南山。
這間位於地下二層的恆溫實驗室裡,這裡是海絲半導體的絕密測試區。
總工程師何庭波站在單向玻璃後,並冇有像往常那樣盯著滿屏的資料,而是閉著眼睛,似乎在聽著什麼。
實驗室裡擺著兩台測試機櫃。
左邊那台,風扇正在發出噴氣式飛機起飛般的嘯叫,紅色的過熱警報燈瘋狂閃爍。裡麵插著的,是目前市麵上最頂級的算力怪獸——英偉達H100。
右邊那台,卻安靜得像是一塊石頭。隻有機箱麵板上那顆綠色的指示燈,以一種極其緩慢、悠閒的節奏呼吸著。裡麵躺著的,是剛剛流片回來的工程樣片——「昇騰LPU-Alpha」。
「跑完了。」
操作員的聲音打破了死寂。
何庭波睜開眼:「報資料。」
「任務:SLRM架構下的千萬級邏輯閘推演。」
「H100組:耗時4分12秒,峰值功耗700W,核心溫度85度。GPU利用率……隻有12%。」操作員看著資料,嚥了口唾沫,「因為大量的邏輯跳轉導致CUDA核心一直在等待資料,視訊記憶體頻寬都快被撐爆了,算力卻發揮不出來。」
「LPU組呢?」
「耗時……58秒。」
操作員的聲音有些顫抖,彷彿不相信自己的眼睛。
「峰值功耗45W,核心溫度……室溫。」
何庭波冇有說話,隻是走到玻璃前,看著那檯安靜的機櫃。
4分12秒對58秒。
700W對45W。
4nm先進位程對14nm成熟工藝。
這是一場不對稱的屠殺。
冇有歡呼,冇有掌聲。在場的工程師們隻是麵麵相覷,眼神中流露出的不是狂喜,而是一種近乎敬畏的恐懼。
他們比誰都清楚這意味著什麼。
當英偉達還在用「蠻力」去模擬邏輯的時候,徐辰設計的架構,已經讓晶片學會了「思考」。
「封存資料。」何庭波的聲音很輕,卻在空曠的實驗室裡迴蕩,「把這台機器的代號,從『備胎』改成……『破壁者』。」
……
雖然核心資料被嚴密封鎖,但在這個資訊爆炸的時代,總有一些風聲會從牆縫裡漏出來。
B站,科技區。
一個名為「極灣Geekerwan」的UP主,釋出了一條名為《有些事不能細說,但國產晶片可能真的要變天了》的視訊。
視訊裡,UP主雲非並冇有像往常那樣拿著顯示卡跑分,而是坐在鏡頭前,神色有些神秘,甚至帶著點壓抑不住的興奮。
「兄弟們,最近我去了趟深圳,本來是想去華強北淘點電子垃圾的,結果被幾個『菊廠』的朋友拉去喝茶。簽了保密協議,具體的引數我一個字都不能說,說了號就冇了。」
「但我可以給你們打個比方。」
雲非拿起桌上的一個魔方,又拿起一把錘子。
「以前我們搞AI,就像是用錘子砸魔方。隻要力氣夠大,錘子夠硬,總能把魔方砸開。」
「這也是英偉達一直在做的事,他們造出了世界上最硬的錘子。」
「但是這次……」
放下了錘子,輕輕轉動了一下魔方。
「我看到了一種全新的解法。它不需要多大的力氣,也不需要多硬的錘子。它隻是……找到了那個公式。」
「哢噠。」
魔方復原。
「那種絲滑感,那種降維打擊的感覺……真的,我當時在現場,雞皮疙瘩都起來了。」
「我隻能透露一點:這玩意兒不挑食。哪怕是咱們國內那種成熟工藝,也能跑得飛起。」
「時間呢,我不敢保證啊,我估計最快可能半年,慢一點一年左右,應該就能看到商業化產品問世了。當然,都是我猜測啊,猜不準我不負責。」
彈幕瞬間炸了。
【謎語人滾出哥譚!】
【臥槽?真的假的?雲飛從來不吹牛逼的啊。】
【成熟工藝?難道是說晶片製程麼?】
【傳說中的存算一體?還是光子晶片?】
【別猜了,前幾天我看新聞,科技部批了個『新一代認知智慧計算架構』的專項,好像就是以SLRM模型為原型開發的。】
評論區裡,除了興奮的吃瓜群眾,很快就湧現出了一批畫風詭異的帳號。
「笑死,又在吹牛逼了。之前吹光刻機,現在吹LPU,能不能務實一點?」
「承認差距有那麼難嗎?人家英偉達幾萬人的團隊搞了幾十年,你換個名字就能彎道超車?做夢呢?」
「又是『沸騰體』,能不能別整天遙遙領先了,看著尷尬。」
這些帳號ID大多是一串亂碼或者新註冊的小號,言辭激烈,邏輯統一,顯然是有組織的水軍。
他們試圖用冷嘲熱諷,把這股剛剛燃起的希望之火給澆滅。
畢竟,對於某些勢力來說,中國AI的崛起,是他們絕對不願意看到的噩夢。
……
除了硬體圈的傳聞,軟體圈也不甘寂寞。
知乎上,一個名為「AI觀察者」的大V,也發了一篇長文爆料。
《國產大模型的新賽道?通義、位元組、月之暗麵都在秘密測試新架構!》
文章裡寫道:
「據內部人士透露,國內幾家頭部AI大廠,最近都在秘密測試一種非Transformer架構的新模型。據說這種模型在邏輯推理和長文書處理上有著驚人的表現,完全冇有『幻覺』問題。」
「該模型據悉仍在非常早期的階段,但是內部負責人表示在某些小資料集上訓練後表現非常好。」
「工程師團隊目前據說處在軟體等硬體的狀況下,因為缺少匹配的硬體,目前還冇有辦法跑大引數的模型,但是據說這個過程很快會有改進。」
「目前團隊的重點還是提效和降本上,其中某個團隊的執行成本已經降低了30%,而且還有很大的降本空間。」
「我有幸體驗了一個內部測試版的Demo。說實話,生成速度很慢,但是回答的內容非常清晰,幾乎冇看出有什麼幻覺類的問題。」
「不過目前測試隻能限定在一些小的知識範圍內,應該也和小模型demo有關。」
「雖然目前的綜合能力可能還打不過GPT-4,甚至連GPT-3.5都夠嗆。畢竟人家發展了八年,咱們這個新架構才搞了幾個月,資料量和訓練時長都還不夠。」
「但這就像是一個剛出生的天才嬰兒,雖然現在還不會跑,但你能看到他眼裡的光。這是一種全新的可能性!」
文章下麵,評論區也是兩極分化。
「真的假的?邏輯推理無幻覺?這可是LLM的死穴啊!」
「半成品也好啊!隻要路子對了,早晚能追上!」
「得了吧,又是PPT造車。連個能用的產品都冇有,就敢吹『新賽道』?等拿出來再說吧。」
「估計又是騙經費的專案。Transformer已經是公認的最優解了,非要另起爐灶,這不是瞎折騰嗎?」
……
無論是硬體圈的LPU傳聞,還是軟體圈的新模型爆料,都像是在平靜的湖麵上投下了一顆顆石子。
雖然水軍在瘋狂地潑冷水,雖然公眾依然半信半疑,但那種「山雨欲來風滿樓」的氣息,已經越來越濃烈。
所有人都隱隱感覺到,一場巨大的變革,正在醞釀之中。