他在箭頭下方又加了一行:**積分可交易。**
陳默抬頭了。
“企業A是做齒輪的,積攢了大量齒輪加工資料,積分很多但不需要模擬功能。企業B是做整機的,急需模擬資源但手頭資料不多。A可以把積分賣給B。”蘇哲把筆擱下,“資料的所有權不變,還是企業的。盤古係統隻獲得訓練使用權。積分的總量跟平台的服務能力掛鈎,不超發。”
陳默沉默了半分鐘。
“這不就是……資料的貨幣化?”
“你可以這麼理解。”
“誰來定價?每組資料值多少積分?”
“你來定。按照資料的維度、完整性、行業稀缺度三個指標做自動化評級。你的演演算法擅長乾這個。”
陳默想了一會兒。他的手指在桌麵上敲了幾下——這是他思考的習慣,跟拉爾森緊張時候的表現一模一樣。
“有一個風險。”他說,“如果評級演演算法被摸透了,有人會專門造假資料來刷積分。”
“那就加一道人工抽檢。”楊青接話了——他終於想明白了這個方案的邏輯,水泡好像都不那麼疼了,“讓你的團隊每天隨機抽取1%的上傳資料做人工審核。發現造假的,扣光積分,永久拉黑。”
蘇哲點了一下頭。
方案上線的準備工作花了四天。陳默帶團隊寫了資料評級的演演算法模組,楊青的高新區管委會出了配套的管理辦法,張誌強負責跟法務團隊敲定資料使用權的法律框架。
上線當天的第一個使用者,是紅星機床廠的李建國。
老李這輩子的手藝全在腦子裏和那幾十本發黃的筆記本上。三十年的刀具加工引數、材料切削經驗、不同工況下的進給量和轉速組合——這些東西以前隻能靠師傅帶徒弟傳下去,傳不了幾個人,再過十年人退休了就跟著埋進土裏。
楊青去紅星廠找他的時候,李建國正帶著兩個徒弟在車間裏除錯新機床。
“老李,你那些筆記本上的資料,願不願意上傳到盤古係統?”
李建國關掉主軸,用抹布擦了擦手。
“上傳了給我啥好處?”
楊青把積分方案講了一遍。講到“積分可以兌換高階模擬功能”的時候,李建國的眼睛亮了。
紅星廠的工程師們一直想用盤古係統的高階模擬模組來優化新型號機床的熱變形補償演演算法。那個模組在收費計劃表裏標價每年三十萬。紅星廠賬麵上拿不出這筆錢——市財政兜底了重組費用,但日常運營的預算卡得很緊。
“你的意思是,我把筆記本上的東西錄進去,就能白用那個模擬功能?”
“不是白用。是你用你三十年攢的手藝換的。”
李建國抹布一甩。
“錄。”
他花了兩天時間,把自己三十年積累的五千多組刀具加工資料全部錄入係統。每一組資料都包括材料型號、刀具引數、切削速度、進給量、表麵粗糙度、刀具壽命和操作員備註——備註欄裡寫的全是他自己的經驗心得,比如“45號鋼粗車的時候進給量別超過0.3,超了崩刃”。
積分到賬的那天下午,李建國用積分兌換了高階模擬模組的一年使用權。
他在廠裡食堂吃飯的時候跟工友說了這事。
“我這輩子記了三十年的東西,原來退休了就白瞎了。現在變成積分了,退休了積分還在,還能換東西。值。”
這話不知道怎麼傳出去的。兩天後,紅星廠的六個老師傅全部開了賬號,排著隊往係統裡倒資料。
李建國的帶頭效應像投進池塘裡的石頭。漣漪一圈圈擴散出去。
第一天,上傳資料量八千組。第三天,十二萬組。第五天,六十四萬組。
到第七天的時候,楊青的後台統計顯示,累計上傳資料量突破了三千萬組。
寧波錦通精工——就是那個投訴過資料溢位、回復說“無法共享”的企業——的技術副總打電話來問了一個問題:“積分能買斷高階模擬功能的永久使用權嗎?”
楊青在電話裡憋著沒笑出來:“可以。但需要一萬五千積分。按你們企業的資料量,大約上傳三萬組高質量資料就夠了。”
掛了電話不到兩個小時,錦通精工的資料就開始往係統裡灌了。
陳默在敦煌盯著資料儀錶盤,看著上傳量的曲線像發射的火箭一樣往上躥。
他給蘇哲發了條訊息。隻有一個數字和一個問號:“4700萬組。夠了嗎?”
蘇哲正在辦公室裡看另一份檔案。林銳十分鐘前送進來的——威爾遜發來的最新情報更新。
OpenAI和西門子的“Forge”專案進度比預想的更快。已經完成了汽車和航空兩個垂直領域的專項訓練。米國三大車企中的兩家簽了試用協議。預計三個月後正式釋出。
蘇哲給陳默回了三個字:“繼續收。”
停了三秒,他又發了第二條訊息。
“查一下西門子那個資料條款在大夏的法律效力。如果違法——告他。”
發完這條訊息之後,蘇哲把手機扣在桌上。他拿起那份威爾遜的情報,重新看了一遍西門子使用者協議第17.3款的原文翻譯。
“……使用者授權西門子及其關聯方,將使用者在使用本產品過程中建立的資料用於產品改進、人工智慧模型訓練及相關技術開發目的……”
這段話放在歐洲和米國,也許能靠格式合同的慣例糊弄過去。但放在大夏——
蘇哲拉開抽屜,找出法務總監老週上個月整理的一份備忘錄。備忘錄的主題是《大夏資料安全法和個人資訊保護法中關於工業資料的適用條款》。
他翻到第三頁,用筆在一段文字下麵畫了線:
*“資料處理者處理重要資料,應當在事前進行風險評估,並向有關主管部門報送風險評估報告。”*
西門子在大夏有超過兩萬家企業使用者。這些企業使用NX和Teamcenter產生的設計資料——涉及航空、軍工、核電、高鐵等敏感行業——被西門子通過一行使用者協議的小字拿去訓練AI模型,有沒有做過風險評估?有沒有向大夏主管部門報送評估報告?
蘇哲幾乎可以肯定答案是沒有。
他合上備忘錄,撥了老周的手機。
“老周,你手邊有沒有西門子NX在大夏的標準使用者協議文字?”
“有。去年智慧財產權訴訟的時候備過一份。”
“翻到第17.3款。然後對照《資料安全法》第三十條和第三十一條。寫一份法律意見——如果我們以盤古造物使用者權益保護的名義,向國家網信辦和工信部舉報西門子未經合規審批擅自將大夏企業工業資料用於境外AI訓練,勝算幾成?”
老周在電話那頭沉默了三秒。
“十成。”他的聲音聽起來像剛吞了一顆定心丸。
老周的法律意見書用了兩天寫完。十七頁。措辭極其剋製——沒有一句主觀判斷,全是條文引用和事實陳述。但每一段的邏輯鏈條都指向同一個結論:西門子通過格式合同條款,在未經大夏主管部門審批、未進行資料出境安全評估的情況下,將大夏境內企業的工業設計資料傳輸至境外伺服器用於AI模型訓練,違反了《資料安全法》第三十條、第三十一條,以及《個人資訊保護法》中關於資料跨境傳輸的相關規定。
更要命的是,這些資料涉及的行業清單——老周做了一個附表——包括航空航天、核電裝備、高速鐵路和軍工電子。全部屬於“重要資料”甚至“核心資料”的範疇。
蘇哲看完法律意見書,沒有簽字。
他把檔案擱在桌角,撥了程度的電話。
“幫我查一件事。西門子大夏區的NX軟體伺服器部署在哪,資料同步的出境通道走哪條線路。具體到物理層麵——光纜、IDC機房、接入點。”
程度沒多問。他知道蘇哲讓他查東西的時候,問為什麼是多餘的。
四十八小時後,程度的調查結果回來了。比蘇哲預想的更詳細——公安係統在網路安全執法方麵的技術手段,遠不是民間能比的。
西門子NX在大夏的使用者資料通過三條鏈路同步到境外伺服器。第一條走上海的海底光纜,出口節點在崇明島的一個登陸站,終點是新加坡的一個IDC機房。第二條走北京的陸纜,終點在法蘭克福。第三條是備份鏈路,走香港。
三條鏈路的資料流量監控記錄——程度的人從運營商那邊調來的——顯示,過去六個月裏,從大夏境內同步出去的資料總量超過了47PB。
47PB。
這個數字是什麼概念?國家圖書館的全部數碼化藏書大約是10PB。
蘇哲盯著這個數字看了半分鐘。他拿起筆,在數字旁邊批了兩個字:“留存。”
他沒有立刻動手舉報。
原因很簡單——時機不對。
現在舉報西門子,工信部和網信辦會啟動調查,西門子會被要求暫停資料跨境傳輸。但調查過程中,OpenAI和西門子的“Forge”專案不會停。人家的訓練資料已經拿到手了,調查改變不了既成事實。
他需要的不是一張罰單。他需要的是一記能改變戰局的重拳。
而這記重拳,要等盤古係統的資料量追上去之後再打。
“繼續收資料。”蘇哲對陳默說的這三個字,不是隨便說的。
資料銀行上線第十二天。
累計上傳量突破了七千萬組。增速在放緩——最容易被說服的企業已經上傳了,剩下的硬骨頭是那些規模大、資料多、但顧慮也最重的頭部企業。
陳默在敦煌的超算中心裏跟蘇哲開了一個視訊會議。
“七千萬組的質量分佈不均勻。”陳默調出一張餅圖,“高質量資料——就是維度完整、標註規範、行業稀缺度高的——隻佔23%。剩下七成多是低質量的通用件圖紙和基礎零件資料。訓練大模型用不上。”
“你需要什麼行業的資料?”
“航空結構件、汽車動力總成、精密模具、半導體封裝——這四個垂直領域是湧現效應最明顯的。但這四個領域的頭部企業恰恰是最不願意上傳資料的。”
蘇哲在筆記本上記了四個關鍵詞。
“我來想辦法。”
掛了視訊之後,蘇哲翻出手機通訊錄,找到了一個名字——比雅迪王工。
這個“王工”是比雅迪負責電池事業部研發的副總裁,全固態電池專案簽約的時候跟蘇哲打過幾次交道。千億訂單的甲方,說話有分量。
電話接通後蘇哲沒客套:“王總,盤古造物的資料銀行你聽說了沒有?”
對方笑了一聲:“蘇書記,你打電話來肯定不是問我聽沒聽說。你要我幹什麼?”
“比雅迪手裏有全球最大的動力電池設計資料庫。你們上傳一批資料進來,帶個頭。”
電話那頭沉默了五秒。
“蘇書記,我們的資料可是核心資產——”
“我知道。所以我不白拿。積分你肯定不稀罕——我給你個更實在的東西。盤古係統的下一個版本裏會有一個電池熱管理的專用模擬模組,基於你們的資料訓練出來。這個模組你們獨家使用一年,一年之後再向其他企業開放。”
“獨家一年?”
“白紙黑字寫在合同裡。”
又是五秒沉默。然後對方的語氣變了。
“你讓楊青跟我們研發部對接。資料格式和脫敏標準先談好。”
比亞迪的入場像一枚訊號彈。
當比亞迪開始往盤古係統上傳資料的訊息在行業圈子裏傳開之後,觀望中的企業坐不住了。
邏輯很樸素——比雅迪都上傳了,資料還能換獨家功能模組?那我不上傳,等別人把我這個細分領域的模組做出來了,我連鍋都沒得分了。
這種“恐懼錯過”的心理比任何激勵措施都有效。
第十五天。航空工業集團下屬的成飛,上傳了三萬組航空結構件資料。
第十七天。三聯重工上傳了五萬組工程機械液壓係統資料。
第十九天。大夏晶片國際上傳了一批經過深度脫敏的封裝工藝引數。