鴻富華智能 | 2020-11-17
工業制造在標準、互聯等領域始終是很特殊的,現在談工業4.0與AI是否為時過早?AI在工業4.0時代是否真的在發揮作用,以及究竟發揮到何種程度?這是我們期望以由上至下的方式,從工業制造AI解決方案、AI芯片、EDA,以及實際應用幾個層面,來窺見當下工業制造的AI技術現狀。
意大利有家公司叫ROJ,這家企業專注于針對工業領域的電子技術,產品典型如基于ARM Cortex-M/A、FPGA的工業板和模塊。這家公司有個特色,是“基于客戶軟件、硬件需求來提供個性化解決方案”。其典型客戶如Mares——這是個生產潛水裝備的企業,包括潛水表。Mares的特色也在滿足不同客戶的產品定制化需求。而“定制化”就意味著產品生產周期必須短,制造響應速度必須快,而且可能某一款產品的需求量還不大。實際上越來越多的制造商開始轉向這種量不大,但品種多樣的生產模式,這也是工業4.0的重要特點。
這在傳統的生產模式中是不可想象的,直到數字工廠、智能制造開始出現:不同小訂單之間的不同需求,生產設備可以很方便地通過數字操控的方式實現轉變和協調——當然還有IT/OT融合、TSN的出現、各類統一與融合標準在工業領域的出現,都是實現這種操作的必要條件。不過這些不是本文要探討的核心。
ROJ在智能制造時,所選方案的其中一個關鍵是Valor Material Management材料管理系統——這是來自西門子數字工業軟件的一部分。ROJ首席執行官Franco Oliaro曾表示:材料需要在正確的時間、正確的位置提供,而制造現場的停工往往是因為材料沒有到位。數字化的材料管理系統能做的就是材料分發,在需要材料的時候確保其準備就緒。
這個例子實際只是數字化生產和工業4.0的基本應用。當生產設備本身變得越來越復雜,越來越智能,就會產生海量數據。當這些數據熔于一爐后做數據分析,不僅用以了解過去的生產狀況,同時利用機器學習還能提高未來生產質量、降低制造成本,即是AI技術對工業4.0的推動了。
工業制造在標準、互聯等領域始終是很特殊的,現在談工業4.0與AI是否為時過早?AI在工業4.0時代是否真的在發揮作用,以及究竟發揮到何種程度?這是我們期望以由上至下的方式,從工業制造AI解決方案、AI芯片、EDA,以及實際應用幾個層面,來窺見當下工業制造的AI技術現狀。
AI智能制造解決方案能做什么?
“傳感器數據速率正在持續增長。大部分客戶現如今的工廠傳感器數據采集速率還在1Hz,但越來越多的芯片制造商收集速率達到了10Hz、100Hz。晶圓廠的數據量級現在開始進入PB級別,而不再是MB或者TB。”BISTel首席執行官W.K. Choi表示,“客戶需要更出色的分析來驅動產品質量提升;工程師則期望更快地進行根因分析,近實時地(in near real time)、準確地解決影響良率和工程生產的問題。”這能說明什么問題?BISTel是一家提供智能制造解決方案的韓國企業,解決方案離實際應用總是靠的更近。
以半導體制造為例,我們先來看一個例子:晶圓制造發生不良率高的問題時,常規手法是工程師們調查并討論,這個過程一般需要很久。如W.K. Choi所說,實現數字生產的工廠,傳感器數據采集速率現如今已經很高了。針對晶圓生產不良率高的問題,可觀察的參數至少包括溫度、振動、壓力等各項指標。如果針對所有相關指標做監測,那么分析難度自然可以得到降低。在這個例子中,不少晶圓片靠近邊緣位置出現問題,因此成為“bad”晶圓。
BISTel的HMP(Health Monitoring & Prediction)在數據追蹤中,系統列出總共6個導致良率問題的最優關聯度參數,其中前兩個分別是蝕刻工序的最后一步,電流發生激增;以及氦氣值明顯降低(圖1)。蝕刻流程的最后一步就是氦氣分離,這一例的“根因”就是在分離過程中,托盤與晶圓邊緣接觸,產生小范圍火花——所以電流出現了激增,與此同時托盤某些氦氣口堵塞造成氦氣值降低。
在晶圓制造良率問題的“根因分析”這一例中,至少能夠表現持續增長的“數據速率”是怎么回事,以及將原本需要以天、周為單位計的根因分析時間縮短到分鐘、小時級別內。而AI技術在此處的核心,即如何利用海量數據做分析,并得出結論。
“具備AI能力的智能應用,可讓系統和流程實現自動化,讓客戶得以近實時地針對每天的生產問題,做出檢測(detection)、分析(analyses)和預測(prediction)解決方案。”W.K. Choi說,“現在我們在生產流程中,融入了更多強有力的AI分析,能夠從這些流程中學習。我們隨后就會把這些新的智能,應用到知識庫(knowledge base)中。”
這里的“知識庫”即是AI在W.K. Choi所說“預測”中的大腦,其中包含所有“知識點”和解決方案,并通過學習不斷完善。這里再來看一個例子,在某晶圓廠半導體制造CVD(化學氣相沉積)流程中,追蹤發現某一天(本例為4月18日)出現了異常高的報警數,很多晶圓質量都受到影響(圖2)。報警內容為:“TDS”設備某節氣閥發生位置偏移。如果這份數據拉長到為期半個月,那么很容易發現,在高報警事件發生的前兩天,數據就已經顯現出節氣閥位置發生潛在漂移——而且早在10天以前,前序壓力就因為節氣閥位置偏移而出現不規則現象。
那么實際在發生高報警數之前,通過預測性維護(Predictive Maintenance)就能率先預知問題,“在錯誤發生之前就預測到錯誤”,以避免故障停機時間,因此得以提升效率并節省成本。更多的“預測”行為還包括預測設備的剩余可用壽命(RUL),以及各種執行基于條件的的預測性分析。
這里“基于條件”的預測性分析可認為是智能制造的核心產物。就好像日常的汽車保養,仍是基于時間或里程的:如每隔一個固定時間或固定行駛里程前往4S店做保養;但如果能夠針對汽車發動機轉速、溫度、振動等各種參數做關聯分析和預測,則在綜合所有參數與AI分析過后,系統得出現在是否需要維護或下一次維護時間應該是在什么時候,這才是節約保養成本、提高生產效率的最佳方案。
現在我們知道,AI在智能制造中的應用,至少可有檢測、分析和預測三步驟。不過這依然不是AI的全部。在BISTel的定義中,AI能夠實現的終極目標遠不止此。“AI應用,可嵌入已習得的知識,并實現自動化操作;應用AI獲取的知識庫,具備自主控制、自主治愈的能力。”
這句話強調的是AI學習的“自適應”能力,全過程包括完全自主地發現問題、學習問題,并采取行動。工廠內部的這個過程無需或少有人工干預。W.K. Choi說:“這是我們理想中的智能生產。”即便這一步尚未達成。
當工業MCU/SoC開始增加AI單元
從上述解決方案的實例來看,AI如何部署似乎還不夠明朗。我們嘗試往下看解決方案底層的硬件支持。不難想見,上層AI應用需求自然能夠帶動下層AI芯片或專核的興盛,比如工業現場生產用機械臂或電機內部的MCU/SoC——畢竟我們反復在說AI這一技術熱點是貫徹在整個垂直行業的。
常規能夠想到的AI專核通常是具備高度并行計算能力+片上存儲+低精度計算的ASIC核心,尤其如果是特別針對某個具體的工業應用場景。不過行業內頗具代表性的瑞薩電子DRP(Dynamic Reconfigurable Processor)技術,或稱e-AI(嵌入式AI,DRP是e-AI技術的一部分)在思路上還略有不同。這里還是先舉個例子。
在圖3故障預判解決方案中,工業制造現場電機運行時,可通過加速度傳感器來采集電機運行振動情況,這些采集的數據上傳到云服務器,經由云服務器的學習軟件做深度學習(基于谷歌TensorFlow神經網絡架構);再由解釋器將高級語言AI模型翻譯成MCU可識別的機器語言,AI控制軟件將AI模型下載到本地e-AI單元,實現故障預判。
這套系統監測的是電機運行情況,并可預測其剩余使用壽命,屬于相當典型的AI預測性維護使用場景。在這一例中,由于硬件的具象化,我們得以更清晰地理解預測性維護的流程是什么樣。瑞薩電子中國工業自動化事業部高級總監徐征告訴我們,除了預測性維護,e-AI還能用于異常檢測,提高質量,自動化檢驗。
“我們已經在一些工業生產現場取得驗證性測試結果,比如瑞薩電子那珂工廠,GE醫療(日本)日野工廠。那珂工廠的驗證測試結果表明,以下三點在智慧工廠中是完全可行的:
使用AI識別異常結果。通過為復雜波形設置閾值,消除難點。
顯著減少錯誤信息,從每月每臺機器大約50條錯誤信息降低為零,消除工程師負擔。
準確檢測異常結果。通過使用高分辨率數據,將異常結果檢測率提高6倍以上。”
在我們的理解中,DRP在專用和通用,或者在性能和可編程性之間是個相對折中的方案。從結構上來看,這種動態可重構處理器包含可編程數據通道硬件(PE處理單元陣列)和狀態轉換控制器(完全可編程有限狀態機),是十分典型的軟件定義芯片(圖4),可針對工業嵌入式設備的AI推理(inference)做加速。
“算法的種類和大小可由同一個DRP硬件進行時間復用處理。其靈活性非常適用于AI產業的DNN(深度神經網絡)的快速演化。”徐征表示,“DRP可對硬件資源和應用場景做動態調整,做并發處理,幫助在后臺做很多場景的匹配和預處理。”例如對可動態加速圖像處理算法,達到相比通用CPU快10倍的速度。
類似DRP這類AI硬件的出現,及在兼顧彈性基礎上對性能的追逐,實際都是智能制造開始全面步入AI的第一步。
在瑞薩電子的設想里,“首先會提供附加AI單元的解決方案以拓展市場,從而使e-AI實用性得到市場廣泛理解,再推進工業終端設備e-AI預安裝解決方案普及。”徐征說。這段話大概是瑞薩電子推廣工業AI芯片的策略,但或許還能表明,智能制造和數字工廠的AI仍處在新生期,所以前期提供的是“附加AI單元”解決方案。
從宏觀到微觀世界的數字復刻
而從MCU/SoC的高度繼續再往下層或供應鏈上層走,是EDA廠商。主流EDA廠商目前最特別的存在應該就是Mentor了:這家公司在被西門子并購以后,劃歸西門子的“數字工廠(Digital Factory)”業務旗下,且愈發看重“工業軟件領域”的競爭力,而不只是以前那個,幫助系統與IC設計企業進行高級印刷電路板和芯片設計的EDA廠商。
西門子當年收購Mentor的業務邏輯一直被人多番揣測。Mentor中國區總經理凌琳在接受采訪時表示:“我們絕大部分客戶,都同時使用機械和電子工具來設計、制造產品。為了讓機電一體化產品的設計、工程和制造更高效,一個集成性的軟件平臺就很重要。”西門子Mechatronics就是連接了機械和電子領域的解決方案。
西門子給予Mentor的投入,另外包括針對更多EDA相關企業的進一步收購,如Sarakol、Infolytica、Austemper等,顯然是對上述策略的進一步補全。好比Infolytica在低頻電磁模擬,包括電動馬達、發電機和電磁設備設計支持方面的能力。所以凌琳說“電子設計、機械設計領域的協同”,“提供了整個閉環的系統設計。”其中的業務邏輯也變得一目了然。這是Mentor受西門子影響之時,踐行“工業化之路”的代表。
用時下比較流行的話來說即數字復刻版(或稱數字孿生,digital twin)。這個詞更像是個營銷詞匯,EDA的仿真、驗證原本就屬于典型的“數字復刻版”,是在芯片制造之前的數字復刻,只不過它是對微觀世界的復刻。西門子收購Mentor以后的復刻,則既包含宏觀世界的機械設計,也包含電子設計。在這套“閉環系統“中打造的數字復刻版,包含了整個生產環境或價值鏈:產品本身、產品的制造和性能,以及產品制造流程的完整復刻。在生產或制造前期,就對數字世界的產品、機器和設施設備進行仿真與優化,確保后續真實世界的制造生產。
西門子2018財年數字工廠業務營收129.32億歐元,同比增長11%;西門子PLM技術軟件(現已更名為西門子數字工業軟件)一年營收約在42億美元左右。無論是西門子的“數字工廠”,還是西門子數字工業軟件公司,都能表征工業4.0帶來的經濟效益,似乎比單純的EDA業務更有協同優勢。不過也正因如此,Mentor的EDA廠商角色定位,令其在工業4.0+AI方面更具發言權。
在機器學習IP方面,Mentor提供Catapult HLS AI/ML設計套裝,幫助芯片架構師和設計師理解如何利用機器學習算法,以及構建起低功耗的硬件加速器。它能夠展示如何將數字工具或DNN框架開發的算法,轉為可綜合(synthesizable)C/C++/SystemC代碼,并最終綜合為RTL芯片硬件設計語言。中間環節展示哪部分算法在處理器上執行更高效,以及若執行于IC專用硬件單元則能效比會是如何。
這類方案是對AI應用大門的進一步拓寬,或許HLS高層次綜合不僅代表了Mentor的策略,它更像是AI在各領域實現普及的趨勢,包括工業制造。當然在此過程中,少不了應用層做驗證,包括協同建模(co-modeling)、Virtual-ICE、SW debug、性能監測應用等各種應用驗證技術。
除此之外,機器學習本身也在反哺EDA工具,比如在芯片測試期間,Tessent Yield Insight能夠告訴客戶和工廠,影響產量的錯誤究竟是出現在芯片設計環節還是制造環節;還有利用機器學習提升芯片良率的Calibre Machine Learning OPC(機器學習鄰近效應修正)和Calibre LFD with Machine Learning;甚至利用半導體制造數據,來反饋設計優化流程方案,“比如說,同時采用X光和AOI(自動光學檢測)的時候,我們可以判斷哪些層級X光可以略過,因為X光是個慢速機器,經常會成為制造瓶頸。”
現在的智慧工廠有多智能?
AI的最有趣之處大概就在于,整個技術供應鏈上的諸多環節,既通過出售AI技術來賺錢,同時自己也是AI技術的使用者。Mentor這樣的EDA廠商大概就是最好的例證。在探討了智能制造解決方案提供商、AI芯片制造商以及EDA廠商這三個層級之后,我們大致上已經將AI現階段在智慧工廠的價值勾勒出來了,即便從芯片制造商層級就不難發現,AI技術在工業制造中仍在發展初期。
除了文首提及ROJ在數字工廠方面借由西門子方案的實現,如今在世界范圍內逐步發展智能制造乃至AI技術的先進工廠大約也不在少數。前不久我們踏入林德(Linde)東亞區遠程控制中心,可對智慧工廠的發展程度做管中一窺。林德是目前全球最大的氣體供應商,其業務也涵蓋了為晶圓廠提供電子氣體。不過這里,我們不探討其作為半導體上游供應商的價值,而將其作為智慧工廠的實踐者來審視一番。
林德在中國大陸地區有總共350公里的管道,部分氣體就是通過管道供應給客戶的。遠程控制中心能夠對管道系統、空氣分離裝置、制氫裝置、食品級二氧化碳提純,進行中央化的遠程監控。遠程監控設備,能夠顯示這些裝置和系統的運行效率與狀態,同時還能對數據進行分析。
林德公司大中華區遠程運行中心總監陸賢表示:“當發現監控的動設備參數有上升趨勢,就會結合當時的設備運行狀態進行詳細分析,及時做出調整和相應措施,包括對客戶供應氣體的可靠性。”“數據趨勢往上走,雖然現在沒有報警,但就要開始準備備件了。”“甚至通過對數據的分析,預測三個月后的情況。”這是數字工廠典型的實際應用了,看起來很像預測性維護。
“小型制氮現場是無人的,大型空分現場也只配備最少的人員。”“一些大型空分、液體空分會有一套先進控制系統,可根據客戶的壓力、純度等波動,自動調整裝置負荷。超過設定值,客戶一側則會切換到備用系統。”
而在林德遠程控制中心的數字化程度中,讓人感受“數字化”程度最深的是針對寧波的數字化管網控制。“寧波有82公里長的氮氣、氧氣、氫氣系統裝置,沿著永江穿越市區。”在出現壓差較大等情況,發生報警時,遠程控制中心就需要做出響應。
控制中心的圖形化界面里,顯示了整個寧波的俯瞰3D圖——地圖通過無人機拍攝并做建模,其上清晰描繪林德氣體管線途經的區域,甚至包括埋地管線。和谷歌地球一樣,遠程控制中心的操作人員可對其進行任意放大縮小操作,觀察氣體管道狀況,查看管道實時數據,包括管道直徑、壓力、材料、所在高度等;甚至還能調取周期性的現場巡檢視頻。
在真正的機器學習實現上,“我們正在實施一個專家分析系統,這個系統就是運用機器學習相關技術,通過數據的自動采集、分析,定期或不定期地完善搭建的模型,做到分析結果精確、運行標準設置精確。”陸賢表示。
“我們未來運行現場智能化包括,機器自我學習,幫助我們更安全、高效、可靠地運行裝置;建立更加精準和有效的裝置能耗模型,監控并優化能源消耗情況;建立更智能的運行培訓工具——準確模擬空分實際運行,用以更高效地培養我們的工程師;大數據分析工具開發,預測空分設備未來的運行情況。”林德大中華區消費市場營銷總監陳聞翊表示。
林德的遠程控制中心實則已經是現階段全球范圍內,在智能程度上比較領先的工廠中樞了,即便其氣體產品在生產領域具有一定的特殊性。其數字化程度早已顛覆我們對傳統工廠的認知,不過機器學習的應用仍在開發前期,包括預測性維護的進一步完善也在他們的規劃中。
W.K. Choi在向我們解釋BISTel理念中的AI演進階段時,將智慧工廠的付諸實現比作一次旅行。其中第一階段為具備AI能力的應用,這一階段是在傳感器、生產流程、設備、工廠和設施中增加智能層,智能模塊跑在云IoT平臺上,實現最佳流程控制、最大化的自動化,并向自適應智能邁出一大步。但“這個過程不是一夜之間就能完成的,它常常需要耗費3年時間。”
第二階段,具備AI能力的工程系統。即向工程系統增加智能,這個階段需要大數據環境,智能模塊(inter-module)在系統、傳感器和設備間共享信息。所有的模塊彼此相互學習,相互共享信息,而且是以自動化、有效的方式,還包括知識庫的更新。第三階段,具備AI能力的企業。這個階段,每個工程系統(inter-systems)與工廠中的其他軟件系統分享信息和知識,如MES、ERP、維護系統等。系統間實現互通與協作。
即便BISTel認為,我們現在正處在第二階段,實際就我們的觀察,更多的制造工廠仍在第一階段構建時期。不過這也正表明AI在工業4.0時代的發展潛力,這仍是惠及整個工業制造垂直領域的契機和利潤增長點。