黃小蘭坐到電腦前,雙手放在鍵盤上,深吸一口氣。
螢幕上,那些原始日誌還在滾動。
她隨手關掉,開啟一個空白的程式設計介麵。
然後她開始敲鍵盤。
啪。啪。啪。
手指落在鍵盤上的聲音,清脆而有節奏。
她沒有急著寫程式碼,而是在腦子裏先把昨晚和一號老師討論的內容過了一遍。
算力有限——那就不能跑大模型。
資料匱乏——那就得在演演算法上找補。
傳統機器學習方法在這個時代是主流。支援向量機、隨機森林、Adaboost……這些演演算法對算力的要求低得多,而且在小樣本資料上表現不錯。
她可以先把這些基礎框架搭起來,然後在上麵慢慢疊加。
就像蓋房子一樣。
先打地基,再砌牆,最後纔是裝修。
她開始寫第一行程式碼。
定義資料結構。
初始化引數。
設定訓練介麵。
一行一行,一個函式一個函式。
她的速度很快,快到旁邊那幾台老伺服器還沒來得及反應,她已經寫完了基礎框架。
然後她停下來,盯著螢幕看了一會兒。
不對。
太常規了。
常規的演演算法,常規的思路,常規的架構——那出來的也隻能是常規的結果。
她要的不是常規。
她想要的是,在現有硬體的極限上,儘可能逼近那個“不可能”。
一號老師說過,那是“精美工藝品”的路子——不是靠堆料,而是靠巧思。
她刪掉剛寫的一半程式碼,重新開始。
這一次,思路變了。
不是從演演算法出發,而是從硬體出發。
她要先摸清這幾台老伺服器的底細。CPU型號、快取大小、記憶體頻寬、IO吞吐……每一個細節,都會影響最後的設計。
她調出係統資訊,一行一行看下去。
Pentium4,單核,2.8GHz。
2GB記憶體,還不如未來一個智慧手機的記憶體。
硬碟2-3塊,146GB,SCSI硬碟。
黃小蘭看著那些資料,嘴角抽了抽。
這也太老了。
不過有雙千兆乙太網口,算是比較超前。
但她沒抱怨,隻是深吸一口氣,繼續敲鍵盤。
先測CPU算力極限。
她寫了一個簡單的迴圈,跑浮點運算。伺服器發出低沉的嗡鳴聲,風扇開始加速轉動。
三分鐘後,結果出來了。
每秒大約能跑2億次浮點運算。
後世一塊普通顯示卡的千分之一都不到。
黃小蘭沉默了兩秒。
然後她笑了,苦笑。
——
她開始設計第一個演演算法。
不是傳統的神經網路,而是一個極度精簡的決策樹整合係統。
每個樹隻有幾層深,但數量可以很多。訓練的時候並行跑,預測的時候加權投票。
對記憶體要求低,對算力要求也低,而且可以在小樣本資料上表現不錯。
她一行一行地敲著程式碼,完全沉浸進去。
時間一分一秒過去。
螢幕上,程式碼越來越長,越來越複雜。
但她的思路越來越清晰。
窗外的陽光從東邊移到西邊。
孟棠來敲了一次門,叫她吃飯。
她沒聽見。
孟棠又敲了一次,還是沒聽見。
最後孟棠推門進來,站在她身後,看著她敲鍵盤。
看了五分鐘。
然後默默退出去,把門帶上。
算了,這丫頭現在聽不見任何聲音。
多給她準備一些零食,反正兩餐沒吃餓不死。
——
螢幕上,第一個演演算法終於寫完。
黃小蘭停下來,活動了一下僵硬的手指。
然後她點下執行鍵。
伺服器嗡鳴聲變大,風扇轉速加快,機房的溫度似乎都升高了一點。
一秒。兩秒。三秒。
螢幕上跳出一行字:
訓練完成。準確率:67.3%。
黃小蘭盯著那行字,看了很久。
67.3%。
不高。甚至可以說很低。
但這隻是第一次嘗試。
隻是最基礎的版本。她還有很多優化空間,還有很多技巧可以加進去。
她活動了一下脖子,繼續敲鍵盤。
窗外,天已經黑了。
——
黃小蘭揉了揉發酸的眼睛,站起來活動了一下脖子。
三台老機器,算力確實有限。
但對現在夠了。
至少,夠她把程式重新跑一遍,看看問題到底出在哪兒。
咕——
肚子適時地叫了一聲。
她愣了一下,看了看電腦右下角的時間——晚上九點十七分。
九點了???
她記得開始寫的時候是上午十點。
十一個小時了?
她摸摸肚子,確實餓得前胸貼後背。
“孟棠這人居然沒叫我吃飯?太過分了吧……”
話音剛落,她的目光掃到桌角。
那裏放著一個盤子,盤子裏整整齊齊擺著幾個小蛋糕。
旁邊還有一個保溫杯,應該是裝著溫水。
黃小蘭愣住了。
她伸手摸了摸保溫杯——還是溫的。
應該是剛換過不久。
她又看了看那幾個小蛋糕,奶油還是新鮮的,沒有幹掉的跡象。
孟棠來過。
而且來過不止一次。
她隻是……太沉迷了,完全沒注意到。
黃小蘭有點心虛地拿起一個小蛋糕,咬了一口。
奶油甜絲絲的,蛋糕體鬆軟,好吃。
她又喝了一口溫水,溫熱的液體滑進胃裏,整個人都舒服了一點。
孟棠這人……居然沒直接把她拉出辦公室。
雖然嘴上總是損她,但該做的從來不少。
黃小蘭一邊吃一邊想,等會兒回去得好好謝謝她。
雖然可能又要被損一句“你還知道回來啊”。
她笑了笑,繼續吃蛋糕。
眼睛卻已經又瞟向螢幕。
還剩最後一段程式碼沒寫完。
吃完這個蛋糕,再寫一會兒。
——
黃小蘭又吃了兩個小蛋糕,喝了半杯溫水,感覺整個人都活過來了。
她活動了一下手指,重新把手放回鍵盤上。
剩下的程式碼不多,但很關鍵——是訓練任務的排程係統。
要讓這幾台老伺服器在這幾天裏合理分配算力,既不能過載,也不能閑著。
她一行一行地敲著,速度很快,思路清晰。
四十分鐘後。
最後一個字元敲完。
她檢查了一遍,確認沒有語法錯誤,然後深吸一口氣,點下了執行鍵。
伺服器嗡鳴聲驟然變大,風扇轉速加快,機房的溫度似乎都升高了一度。
螢幕上跳出一行字:
「訓練任務已提交。預計執行時間:72小時。」
黃小蘭盯著那行字,看了幾秒。
七十二小時。
三天。
夠這老夥計跑一陣子了。
看女頻小說每天能領現金紅包🧧