辭職回家，我靠做糕點成名第195章啟動數據收集

資料收集計劃正式啟動的第一天，林記車間就被濃鬱的糯米香氣包裹。蘇晚穿著白色工作服，正小心翼翼地將揉好的麪糰放入發酵箱，李萌萌拿著濕度儀在一旁等候，陳曦則除錯著高清相機，準備拍攝麪糰的特寫照片。

“第一組麪糰，發酵時間15分鐘，環境溫度25c，現在開始計時。”蘇晚一邊記錄資料，一邊按下計時器。按照計劃，她們需要每天製作30組不同發酵等級的麪糰樣本，涵蓋不同溫度、不同批次的糯米粉，確保資料的多樣性。

但實際操作起來，進度卻遠不如預期。蘇晚一個人要負責揉麪、調配餡料、控製發酵時間，還要協助李萌萌記錄濕度、溫度資料，陳曦則需要為每組麪糰拍攝3個角度的高清照片，再將照片與資料關聯歸檔。由於流程銜接不暢，常常出現“麪糰發酵好了，相機還冇除錯好”“資料記錄完了，麪糰已經過了最佳拍攝時間”的情況。

到了傍晚，團隊盤點當天的成果時，結果令人沮喪：一整天忙下來，隻完成了30組樣本，而且其中有5組因為發酵時間控製不當，資料出現偏差，不得不作廢。

“這樣下去根本不行。”林默看著資料收集表，眉頭緊鎖，“按照每天25組有效樣本的進度，要完成500組目標，需要20天時間，遠超我們計劃的7天週期。而且深度學習模型對資料的時效性要求很高，樣本存放時間過長，特征會發生變化，影響模型訓練效果。”

蘇晚也有些焦慮：“主要是流程太繁瑣了，揉麪、發酵、拍攝、記錄，每個環節都需要專人盯著，單人操作根本忙不過來。尤其是發酵時間的控製，差一分鐘都可能影響麪糰的狀態，我們已經很小心了，還是出現了偏差。”

李萌萌補充道：“更麻煩的是臨界樣本的收集。‘略不足’和‘略過度’這兩個等級的麪糰，發酵時間就差5分鐘，氣孔直徑和濕度的差異非常小，我們很難精準控製。今天嘗試製作了10組臨界樣本，結果隻有3組符合標準，其餘7組要麼偏向合格，要麼直接過度，根本無法使用。”

陳曦開啟電腦中的樣本統計檔案夾，螢幕上的柱狀圖清晰地顯示出樣本分佈的不均衡：“你們看，合格、不足、過度這三個等級的樣本已經有22組，但‘略不足’和‘略過度’的臨界樣本隻有3組，占比僅6%。深度學習模型需要均衡的樣本分佈才能精準學習特征，臨界樣本太少，模型還是無法區分那些細微差異，之前的演演算法問題還是解決不了。”

團隊再次陷入困境。如果不能在計劃時間內收集到足夠的樣本，尤其是臨界樣本，不僅會影響模型訓練的進度，還會導致模型識彆精度不足，“糕小默2.0”的量產計劃就要再次推遲。

“必須優化製作流程，提升效率，同時找到精準製作臨界樣本的方法。”林默當機立斷，“現在我們開個短會，重新梳理流程，分工協作，務必在10天內完成500組樣本收集，而且臨界樣本占比要提升至20%以上。”

會議上，小王提出了一個大膽的想法：“我們可以借鑒工廠的流水線作業模式，把麪糰製作的流程拆分成三個環節，安排專人負責，提高效率。”他拿起筆，在紙上畫出流程示意圖，“第一環節由蘇晚負責，專門揉麪和調配餡料，確保麪糰的大小、軟硬一致；第二環節由李萌萌負責，控製發酵時間和環境溫度，精準把握每個等級的發酵狀態；第三環節由我負責，對接陳曦，完成照片拍攝和資料歸檔，同時編寫程式自動關聯圖片和資料，減少人工操作。”

“這個思路很好！”林默立刻表示支援，“流水線作業能減少等待時間，提高銜接效率。按照這個分工，每個人專注於自己的環節，熟練度提升後，單日樣本量肯定能大幅增加。”

蘇晚也補充道：“我可以提前一天把第二天需要的麪糰揉好，放入冷藏櫃儲存，第二天直接拿出來發酵，這樣能節省大量時間。而且批量揉麪能保證麪糰的一致性，避免因單次揉麪差異導致的樣本偏差。”

針對臨界樣本難以精準製作的問題，蘇晚結合自己的傳統糕點製作經驗，提出了“時間控製法”：“之前我們憑感覺控製發酵時間，誤差太大。現在我們可以把每個發酵等級的時間精準量化，比如合格等級的發酵時間是2小時，那‘略不足’就設定為1.8小時，‘略過度’設定為2.2小時，再結合濕度資料進行微調。比如當1.8小時到了，若麪糰濕度在68%-72%之間，就是合格的‘略不足’樣本；若濕度低於68%，就說明發酵有點過快，需要縮短下次的發酵時間。”

“這個方法可行！”陳曦點點頭，“我們還可以在發酵箱裡安裝一個小型的時間報警器，每個等級的發酵時間一到，報警器就會提醒，避免錯過最佳時間。而且每個批次的糯米粉吸水性不同，我們可以先做一組測試，確定該批次糯米粉的最佳發酵時間，再進行批量製作。”

本小章還未完，請點選下一頁繼續閱讀後麵精彩內容！方案確定後，團隊立刻行動起來。小王重新規劃了車間的佈局，設定了揉麪區、發酵區、拍攝區三個功能區域，每個區域都配備了必要的工具和裝置；蘇晚提前揉好了50斤麪糰，分成均勻的小份，放入冷藏櫃儲存；李萌萌在發酵箱上貼了不同發酵等級的時間標簽，安裝了時間報警器；陳曦則優化了資料采集程式，實現了照片拍攝後自動命名、自動與資料關聯的功能。

第二天，流水線作業模式正式執行。蘇晚在揉麪區專注地揉著麪糰，動作熟練而精準，每一個麪糰的重量都控製在50克左右，誤差不超過1克；李萌萌在發酵區來回檢視，根據不同的發酵等級，精準控製時間和溫度，當時間報警器響起時，她立刻取出麪糰，用濕度儀測量濕度，記錄資料；小王則在拍攝區協助陳曦，將麪糰放在指定位置，陳曦按下快門，拍攝完3個角度的照片後，小王通過程式將照片與蘇晚、李萌萌記錄的資料自動關聯，存入資料庫。

整個流程銜接順暢，冇有了之前的等待和混亂。到了中午，團隊已經完成了20組有效樣本，遠超昨天一整天的成果。“照這個速度，今天完成50組樣本完全冇問題！”李萌萌興奮地說道，她的手上雖然沾滿了麪粉，但臉上卻洋溢著笑容。

臨界樣本的製作也取得了突破。蘇晚按照“時間控製法”，精準設定每個等級的發酵時間，再結合濕度資料進行微調。比如製作“略不足”樣本時，發酵1.8小時後，若麪糰濕度在69%，正好符合標準；若濕度在73%，就說明發酵不夠，她會把下一組的發酵時間延長10分鐘；若濕度在67%，就說明發酵有點快，下一組的發酵時間縮短5分鐘。

通過這種方法，臨界樣本的合格率大幅提升。當天下午，團隊就成功製作了15組“略不足”和12組“略過度”樣本，而且資料都非常精準。“現在臨界樣本的特征很明顯，氣孔直徑、濕度都在我們設定的範圍內，這樣模型就能更好地學習這些特征了。”蘇晚拿著放大鏡觀察著麪糰的氣孔，滿意地說道。

林默每天都會檢查資料收集進度，他用excel製作了“樣本完成率折線圖”，實時跟蹤每天的樣本完成數量、不同等級樣本的占比情況。從圖表上可以清晰地看到，隨著流水線流程的不斷優化，團隊的效率越來越高，第三天完成了45組樣本，第四天完成了50組樣本，第五天更是完成了55組樣本，遠遠超過了預期目標。

在資料收集的過程中，陳曦也發現了一個新的問題。“你們看，這兩組同樣是合格等級的麪糰，在早上的自然光下拍攝的照片，顏色偏淺；在下午的燈光下拍攝的照片，顏色偏深。”陳曦指著電腦螢幕上的兩張照片，對團隊說道，“不同光線條件下，麪糰的顏色識彆會有差異，這可能會影響模型的判斷精度。”

“這個問題確實需要重視。”林默說道，“實際生產中，車間的光線會隨著時間、天氣變化，如果模型不能適應這種變化，就可能出現誤判。”

“我有一個想法。”陳曦說道，“我們可以在後續的模型訓練中，加入‘光線補償演演算法’。通過采集不同光線條件下的樣本資料，讓模型學習光線變化對顏色特征的影響，自動調整識彆引數，抵消光線乾擾。現在我們可以先記錄每組樣本的拍攝光線條件，為後續的演演算法優化提供資料支援。”

團隊採納了陳曦的建議，在資料收集表中新增了“拍攝光線條件”列，詳細記錄每組樣本是在自然光、燈光還是混合光下拍攝的。這個小小的調整，為後續解決環境乾擾問題埋下了重要伏筆。

時間一天天過去，資料收集工作有條不紊地推進。蘇晚的揉麪技術越來越熟練，能精準控製麪糰的重量和軟硬；李萌萌對發酵時間的把握也越來越精準，臨界樣本的合格率穩定在90%以上；小王編寫的資料采集程式不斷優化，實現了樣本資料的自動分類、篩選，大大減少了人工工作量；陳曦則每天檢查拍攝的照片質量，確保每個角度的特征都清晰可見。

遠在鹽城的老周也時刻關注著資料收集的進展，他每天都會給林默發微信詢問情況：“林總，資料收集還順利嗎？需要我們再寄點糯米粉過去嗎？”

“周叔，一切都很順利，謝謝你的關心！”林默每次都會耐心回覆，“你們寄來的糯米粉品質很好，製作出來的樣本資料很穩定，為我們的模型訓練提供了很大的幫助。”

到了第十天，團隊終於完成了500組樣本的資料收集工作。林默開啟樣本統計資料庫，螢幕上的資料令人振奮。

“完美！”林默激動地說道，“臨界樣本（略不足略過度）的占比達到了40%，遠超我們設定的20%目標，而且資料合格率平均在97%以上，樣本分佈均衡，資料質量很高。有了這些樣本，我們的深度學習模型訓練就能順利推進了！”

這章冇有結束，請點選下一頁繼續閱讀！陳曦看著這些資料，心中充滿了信心：“這些樣本涵蓋了不同發酵等級、不同環境溫度、不同批次糯米粉的特征，而且臨界樣本的數量充足，模型一定能精準學習到不同狀態下的特征差異，尤其是那些細微的臨界差異。”

蘇晚也露出了欣慰的笑容：“這十天雖然很累，但看到這些成果，覺得一切都值了。通過這次資料收集，我也深刻體會到，傳統工藝的經驗可以轉化為可量化的標準，再結合現代科技，就能實現精準控製，這也是我們‘糕小默2.0’的核心競爭力。”

小王則迫不及待地說道：“現在資料已經收集完畢，我們可以馬上開始模型訓練了！我已經做好了資料預處理的準備，明天就能將資料輸入模型，進行迭代訓練。”

林默看著團隊成員們疲憊卻充滿鬥誌的臉龐，心中十分感動：“這十天大家都辛苦了！但這隻是模型訓練的開始，接下來我們還要投入更多的精力，確保模型的識彆精度穩定在90%以上。我相信，憑藉我們收集的高質量樣本和團隊的努力，一定能攻克演演算法難關，讓‘糕小默2.0’早日量產。”

當天晚上，團隊冇有舉行慶祝活動，而是簡單收拾了車間，整理好了所有樣本資料。陳曦將500組樣本資料進行了預處理，包括影象歸一化、資料增強、特征提取等，為第二天的模型訓練做好了充分準備。

蘇晚在整理資料收集表時，看著那列預留的“傳統手測評分”，心中有了一個新的想法：“等模型訓練完成後，我們可以將機器識彆結果與傳統手測評分進行對比，看看模型的識彆精度是否能達到甚至超過人工水平。如果可以，我們就能真正實現‘機器替代人工’的目標，為後續的規模化生產打下基礎。”

林默點點頭：“這個想法很好。傳統手藝的經驗是無價的，我們的目標不是拋棄傳統，而是讓傳統與現代科技完美結合，讓非遺手藝在新時代煥發新的生機。”

夜色漸深，車間裡的燈光漸漸熄滅，但團隊成員們心中的希望之火卻越燃越旺。他們知道，接下來的模型訓練將是一場硬仗，但有了這些高質量的樣本資料，有了團隊的團結協作，他們一定能取得成功。而陳曦提出的“光線補償演演算法”，也將在後續的模型優化中發揮重要作用，讓“糕小默2.0”的視覺識彆係統能夠適應不同的環境條件，實現更精準、更穩定的識彆。

第195章啟動數據收集

📣📣📣親愛的會員朋友📣📣📣

VIP權益👉

1、全站0廣告+全網VIP熱文免費看

2、免費！深！夜！讀！物（老司機上高速！）

3、每日更新男女頻熱度/新書榜/精選內容/作者合集上千個，再也不用擔心文荒了！

4、專屬聽書功能，超多小說解鎖音訊，解放雙手！

5、免費短劇站+免費漫畫站

開通會員免費贈送合作站的同時長會員，免費送！買多久！送多久！

🌟月卡：5美金

🌸1個月，約130新台幣

🌟季卡：13美金

🌸3個月，約110新台幣/月

🌟年卡：45美金

🌸12個月，約100新台幣/月

第195章 啟動數據收集

📣📣📣親愛的會員朋友📣📣📣

VIP權益👉

1、全站0廣告+全網VIP熱文免費看

2、免費！深！夜！讀！物（老司機上高速！）

3、每日更新男女頻熱度/新書榜/精選內容/作者合集上千個，再也不用擔心文荒了！

4、專屬聽書功能，超多小說解鎖音訊，解放雙手！

5、免費短劇站+免費漫畫站

開通會員免費贈送合作站的同時長會員，免費送！買多久！送多久！

🌟月卡：5美金

🌸1個月，約130新台幣

🌟季卡：13美金

🌸3個月，約110新台幣/月

🌟年卡：45美金

🌸12個月，約100新台幣/月

第195章啟動數據收集