這回她學聰明瞭,不問醫學了,換賽道了。
筆記本又翻了一頁。
這一頁的內容,跟前麵的風格又不同。
頁麵頂部寫著幾個字:多智慧體協同決策演演算法。
下麵是一段偽程式碼,還有一張手繪的流程圖。流程圖畫得很工整,箭頭標註清晰,每個節點都有備註。
林墨掃了一眼。
腦子裡“嗡”了一下。
不是犯病的那種嗡。
是一種奇怪的熟悉感。
這個流程圖……他好像在哪兒見過。
不對,不是見過。是寫過。
記憶模糊得厲害,斷斷續續的,就像隔著一層毛玻璃看對麵的人影。但那個流程圖的大致框架,他確實有印象。
是在那張披薩傳單上。
高考完那天晚上,他在家犯了一次病,醒過來的時候手邊有張外賣傳單,上麵被他畫得亂七八糟。後來那張傳單被他揉了扔了,跟每次犯病一樣,內容完全記不住。
但此刻看著呂青璿筆記本上的這段東西,有幾個關鍵節點的位置,腦子深處有什麼東西在輕微震動。
呂青璿注意到了他的停頓。
她冇有開口催促,筆尖在那頁紙的邊緣輕輕點了兩下,然後收回手,等著。
林墨盯著那張流程圖,皺著眉。
“這個……我好像有點印象。”
呂青璿夾著筆的手指收緊了一圈。
“什麼印象?”
“之前犯病的時候,好像畫過類似的東西。”林墨撓了撓後腦勺,“就那種……多個智慧體之間怎麼分配任務、怎麼協調的框架。”
教室前排,教授的PPT已經翻到了蘇美爾泥板文書的圖片。冇人在聽。至少後三排冇人在聽。
呂青璿的呼吸節奏變了,快了半拍。
她把筆記本往林墨那邊推了推,指尖落在流程圖中間一個標著紅色問號的節點上。
“這個位置。多個智慧體在博弈環境下做實時決策,存在一個納什均衡的收斂問題。當智慧體數量超過一百個,現有的演演算法框架算力消耗會呈指數級爆炸。”
她的聲音壓得很低,語速卻比平時快了不少。
“我導師的聯合課題組在這個位置卡了將近一年。全世界做多智慧體強化學習的團隊,冇有一個交出過滿意的解法。”
她停了一下。
“你畫的那個框架裡,這個問題是怎麼處理的?”
林墨聽完,臉上的表情複雜得很。
他確實有印象。
不是那種清清楚楚的記憶,更像是做過一個很真實的夢,醒來之後大部分內容都散了,隻剩幾個畫麵殘片。
但偏偏這個“收斂問題”,他腦子裡留了個影。
不是公式,不是程式碼,是一種直覺。
“分層。”
這個字從嘴裡冒出來的時候,林墨自己都愣了一下。
“分層?”呂青璿的筆停了。
“對……把一百個智慧體按照任務型別分成幾個小組,每個小組內部先達成區域性最優,然後小組之間再做一次全域性協調。”
林墨邊說邊用手指在桌麵上畫。
“就是彆讓一百個一起算,拆開。先讓十個一組自己搞定內部分工,然後十個組長再坐一塊開個會,把大方向定了。這樣算力不就下來了?”
他說完抬起頭,看見呂青璿整個人僵在那兒。
手裡的筆懸在半空,一動不動。
“怎麼了?”林墨被她的反應弄得心裡發毛,“我說的不對?”
呂青璿冇回答。
她腦子裡正在進行高速運算。
分層博弈。區域性納什均衡先行收斂,再通過層間通訊機製實現全域性協調優化。