日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 人工智能 > pytorch >内容正文

pytorch

结合深度学习的工业大数据应用研究

發布時間:2025/3/15 pytorch 18 豆豆
生活随笔 收集整理的這篇文章主要介紹了 结合深度学习的工业大数据应用研究 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

結合深度學習的工業大數據應用研究

李廣 ?楊欣

電子科技大學大數據研究中心,四川 成都? 611731

成都數之聯科技有限公司,四川 成都? 610041

摘要:如何將大數據等核心技術與智能制造結合,進一步提高產能與質量,并且降低成本,是新一代制造業革新的關鍵任務。通過一個具體應用案例,即針對工業中常見的機床刀具消耗冗余的問題,提出了基于大數據和人工智能的方法,以準確預測機床刀具的崩刃,從而增加了機床的生產效率,降低了生產成本。相對于以往使用數據統計和傳統機器學習進行刀具磨損預測的方法,新方法通過高速電流采集器獲取主軸電流值,結合了卷積神經網絡的強擬合性和異常檢測算法的強泛化能力,對大數據量的電流值進行預測分析,實現了更快的網絡收斂及更高的預測準確率和頑健性。

關鍵詞:深度學習;工業大數據;智能制造;異常檢測;刀具磨損


1 引言

智能制造(intelligent manufacturing)是指集成知識工程、制造軟件系統與機器人視覺等技術,在無人工干預下由智能機器人獨立實現的生產過程。智能制造系統是一種融合智能機器與智能行為,在訂單制作、產品設計、生產、營銷、銷售等制造過程的各個方面都可以集成,用一種靈活的方式充分發揮先進生產系統的制造能力的系統。隨著云計算、物聯網、大數據、人工智能等新一代信息技術的發展,智能制造的內涵有了突飛猛進的變化。目前,智能制造已經成為每個工業發達國家的國家戰略。

在工業智能制造中,李杰提出將智能制造體系分為3個階段。首先,把問題變成數據,也就是傳統的信息化過程,利用數據對問題進行建模,把過去老工人的經驗變成可挖掘、可量化的持續價值,從而不會因為人的原因而失去知識。然后,把數據變成知識,從“解決顯而易見的問題”延伸到“探索不可見的隱藏問題”,不僅要明白“怎么解決問題”,還要理解“為什么會出現問題”。最后,把知識再變成數據,這里的數據指的是生產中用到的設備指令、機械加工的工藝參數、可執行的決策等所有能夠量化的指標,用從知識得來的量化數據修正和完善制造過程,從根本上避免問題的出現。

作為智能制造最重要的技術之一,大數據技術對傳統工業制造業的影響是巨大的。智能制造的基礎是將工業生產中的問題數據化,利用獲取的數據對問題解決方法進行數據建模,當類似的問題出現的時候,能夠根據模型提出解決問題的方法。這樣,將知識固化于數據與算法模型中。

通過對大數據的深入挖掘,獲取產品的需求感知,基于大數據分析實現制造業“需求— 制造 — 需求 ”的全流程生命周期管理,實現數字化、網絡化、智能化的生產優化、流行預測、精準匹配、供應鏈優化、營銷推送等眾多智能制造核心應用,進而驅動產品設計和產業發展。大數據技術對制造業的影響主要有兩個方面:一是在制造和管理流程中運用大數據技術提高產品質量和生產效率;二是在現有產品與服務中融入大數據技術,以進行顛覆式的革新。簡而言之,融入大數據技術的智能制造關心的兩大重點分別是制造流程技術和制造出的產品技術。

深度學習是機器學習研究中的一個新的熱門領域,作為人工智能領域的熱門技術,近年來發展迅猛。隨著深度學習技術的流行,使用人工智能技術在各行各業進行創新應用成為發展趨勢。不同于傳統的機器學習技術,深度學習對于圖像處理具有先天優勢,因此大部分在智能制造中的深度學習技術應用案例是在計算機視覺領域的,例如通過圖像對產品外觀進行檢測,以發現殘次品。在工業的制造過程中,使用深度學習技術的自動光學檢測(automatic optic inspection,AOI)設備也開始替代傳統檢測設備。

本文通過一個智能制造的實際案例,驗證了使用深度學習技術對數控機床進行刀具壽命檢測的可行性。從實際應用效果來看,在制造生產過程中,結合了大數據技術的方法比過去采用傳統的方法獲得了更好的性能提升,同時也節約了成本。


2 智能制造應用

本文將深度學習技術運用到了制造業最重要的環節——使用數控機床(或數控加工中心)進行加工制造,用人工智能代替生產工人對數控機床加工中用到的數控刀具(又稱工具)進行壽命監控。通過采集、測量機床電流負載數據的方式,證實了數控機床主軸電流負載的變化與刀具的磨損程度之間存在一定的相關性。例如,當刀具磨損等異常狀況(如刀具的崩缺)出現時,電流負載在極短時間內會劇烈波動。然后,進一步采集某一類刀具從正常使用到崩刃的全生命周期的電流數據,從中找到能夠反映刀具磨損趨勢的特征。經過驗證,筆者構建的卷積神經網絡(convolutional neural network,CNN)可以使刀具異常狀態檢測的準確率達到96%。


2.1 問題描述

根據實際生產制造中的數據統計得知,20%以上的數控機床停工是由刀具的過度磨損引起的。及時更換刀具能夠將機床的利用率提高至150%,并且節約30%以上的成本。為了及時更換過度磨損的刀具,防止過度磨損的刀具對機床部件造成損壞,傳統的辦法主要有兩種:一種是計數法,根據經驗對刀具設定極限加工次數,在刀具達到這個加工次數之后,無論好壞都將其廢棄,這種方法的優點在于對刀具壽命進行了管理,缺點在于有些刀具在達到設定的極限加工次數后還能夠繼續使用,從而造成浪費,或者有些刀具在達到極限次數之前就已經損壞,從而影響生產質量;另一種方法是通過對加工完的工件進行質檢來判斷機床的刀具是否正常,這種方法的優點是能夠克服刀具壽命管理“一刀切”的問題,但缺點在于質檢滯后于生產,在檢測出廢件的時候往往已經有一批廢件產生了。

為了解決傳統方法的不足,一個更加科學的方式是在刀具發生異常的極短時間內進行響應:提醒工人換新刀,或者機床自動換新刀。實際上,在加工過程中直接測量刀具的磨損程度幾乎是不可能的,但是,刀具的磨損狀況是可以從聲音、振動、切削力,甚至從電流負載變化反映出來的。


2.2 解決思路

本文采取測量機床電流負載的方式,證實數控機床主軸電流負載的變化與刀具磨損程度之間的相關性是存在的。主流數控系統對主軸變速系統進行了閉環設計,即刀具在加工時能夠通過傳感器將轉速恒定在設定數值。假定數控機床主軸夾載的刀具會根據磨損狀況影響主軸轉速,而主軸負載電流則能夠通過調整來穩定主軸轉速。于是筆者猜想,通過觀測主軸電流變化能夠預測出刀具的磨損程度。因此,需要研究以下幾個問題。

(1)負載電流能否反映出刀具磨損度的變化

筆者希望在刀具磨損以及出現異常狀況(如刀具崩缺)的過程中,在電流負載上找到能夠反映出刀具磨損度變化的趨勢,于是在機床電氣箱內部加裝了高精度的霍爾傳感器(電流傳感器),用來采集機床的主軸電流信號,再通過時域、小波域等特征進行分析。

(2)電流負載和刀具磨損程度之間的聯系能否實時檢測出刀具的磨損程度

筆者將采集某一特定種類的數控刀具從正常使用到異常(例如崩刃)過程中的電流數據,并用“刀具崩刃”“刀具正常”這兩個標簽將數據進行分類。在這個過程中,需要確定一些能夠反映刀具磨損趨勢的特征。筆者構建了一個簡單的卷積神經網絡,并用這些特征數據做訓練測試,從而計算模型對刀具崩刃檢測的準確率。刀具實時性檢測主要由數據的實時性決定,筆者采用的霍爾傳感器采樣率為每秒20000個數據點,足以識別出極短時間內的電流變化,達到實時檢測的目的。而模型檢測存在一定的延時,這主要是受特征數據的時間跨度(即輸入數據的大小)、計算機的運算速度的影響。

通過測量數控機床主軸電流數據,對機床刀具出現的異常狀況進行建模,從而挖掘出這些電流數據中的潛在價值。在實驗中,主要解決3個問題:證明電流分析刀具磨損的可行性;找出能夠反映刀具磨損的特征;通過神經網絡的方法檢測刀具崩刃。

在實驗中,筆者抓取到的原始電流信號往往雜亂無章,因此在證實電流分析方法可行性之前,需要在原始電流信號上進行特征處理,找出能夠反映刀具磨損變化趨勢的特征,并且保證該特征在大多數的刀具電流信號上能夠反映出變化趨勢。另外,一個特征往往是不夠的,不具備可靠性,因此需要從多個角度進行多個特征的分析。最后,將找出的特征作為模型輸入,訓練筆者設計的算法模型。


3 實驗過程及結果分析

3.1 實驗環境

該實驗使用霍爾傳感器和NI數據采集卡對數控機床的主軸電流信號進行采集,采集頻率為每秒20 000個數據點,機床的主要加工信息見表1。



3.2 時域分析與特征工程

因為采集到的電流信號是一種時序信號,常見的時域、頻域信號分析方法有均值、方差、峰峰值、偏度、峰度、快速傅里葉變化、短時傅里葉變化、能量百分比分析、小波變換等。筆者發現電流信號在時域特征上有著明顯的變化,并且從均值、方差、峰峰值、峰度、偏度上進行了特征分析。

電流的均值往往表征了一段時間內電流的穩定性和信號的變化中心,通常對電流的分析是基于電流有效值進行的,從計算效率上考慮,本文通過計算電流值的絕對值求解電流在一段時間內的均值,從而進行分析,如式(1)所示。


?(1)


電流的方差描述了數據偏離平均值的程度,同時還揭露了數據之間的波動程度,其計算式如下:


(2)


電流的峰峰值描述了信號中最大值和最小值之差,也往往被用于檢測整個信號段的波動大小,如式(3)所示。


?(3)

峰度描述了頻率分布曲線的峰值和數據分布的平坦程度。峰度通常可以在異常檢測問題中取得良好的結果,高峰度意味著方差的增加是由低頻率大于或者小于平均值的極端差值引起的,如式(4)所示。


?(4)


偏度描述了實際隨機變量概率分布的不對稱性。偏度為0,意味著數據均勻分布在平均值兩側;偏度為負,意味著大多數數據在平均值的右側;偏度為正,表明大多數數據在平均值的左側。偏度的計算式如下:


?(5)


本文分別對5 把數控刀具的全生命周期電流信號以1 s、1 min為時間跨度進行了時域分析,實驗中5 把數控刀具的分析結果是平行的,考慮到信息冗余,本文以1把刀具的特征分析為例,取得的分析結果如圖1、圖2、圖3所示。


圖1?原始數據?


圖2?時間跨度為1 s的時域分析


圖3?時間跨度為1 min的時域分析

去除不必要的電流數據之后,筆者分析了均值、方差、峰峰值、峰度、偏度等在數控刀具的全生命周期上的特征表現情況。可以看出,在時間跨度為1 s的時域分析中只能發現在生命周期的尾部有一個突變,而對于刀具磨損的趨勢卻反映得不太明顯,這可能是因為圖中的數據點仍然很多(原始圖像中每分鐘120萬個數據點),于是將時間跨度改為1 min,又進行了時域分析。

通過對比可以看出,時間跨度為1 min 的圖像更平滑,并且趨勢變化更明顯,這也是很容易理解的,因為時間跨度的提升相當于對信號做了一種類似于平滑處理的操作。在時間跨度為1 min的時域分析中,不僅在尾部出現了較大的波動,并且也體現出了明顯的上升趨勢,這與刀具磨損的物理現象是吻合的。普通銑刀在加工過程中,隨著表面磨損的增加,其與工件的接觸面也增加,從而造成機床負載的增加,并最終反饋于電流上,電流呈現逐步上升的趨勢。在刀具嚴重磨損到崩刃的時候,刀具在物理形態上出現了變化,大多數情況是崩缺,刀具上缺了一小塊,使得刀具與工件的接觸面突然少了,這使得機床負載也突然減少,但是現代機床具有負載補償的功能,在刀具崩刃之后,機床會開始補償,于是負載在驟然下降后又會上升,而負載上的變化又會反映在電流信號中。通過檢查現場工作人員記錄的加工情況表(見表2)與實驗的時域分析圖的對應情況,進一步驗證了本文的結果。

表2展示了數控刀具在加工過程中的切削聲音情況。由于現場加工環境惡劣且復雜,在加工過程中用儀器直接測量刀具磨損狀況十分困難,故在實驗中由現場工作人員根據經驗記錄當前機床加工的聲音。在時間跨度為1 min的實驗中,發生驟變的時間點是加工到58 min時,這與加工情況表中機床切削出現尖銳切削聲表明刀具崩刃的時間在同一個區間。通過監測刀具的整個生命周期可以看出,刀具磨損在電流信號上的表現趨勢與刀具磨損在物理意義上的變化是相符的。本文在同等加工情況下進行了5 次實驗(即5把刀的全生命周期),都得到了類似的變化趨勢,由此證明了電流方法的可行性,同時也提取出了能夠很好地反映刀具磨損的特征:均值、方差、峰峰值、峰度、偏度。峰度和偏度從兩個不同的角度展示了刀具崩刃的驟變情況,呈現出了與均值、方差、峰峰值類似的變化趨勢,因此也將其作為神經網絡的輸入,以幫助網絡進行數據擬合。


3.3 小波包分析

小波包變換是在小波變換的基礎上發展起來的,具有多分辨特性,可以由粗到精逐步地對信號進行分解分析。利用小波包分析技術進行時頻域分析,將原始信號正交地分解到精細的、相互獨立的頻帶上,可以同時獲得時間和頻率上的局部特征以及通過多分辨率分析得到的特征。將各個頻帶內的信號能量作為相應的特征量。小波包變換效果經常受到小波基和分解層數的影響,本文使用db5 作為小波基,同時對信號進行了5層分解,分析結果如圖4所示。

圖4?數控刀具初始加工的頻率帶能量分布


從圖4可以看出,信號能量主要集中在第31頻帶(0 ~312 .5 Hz)和第32 頻帶(312.5~625 Hz)內。本文對整個刀具生命周期中這兩個頻帶的能量進行了分析,分析結果如圖5所示。


圖5?第31頻帶、第32頻帶的能量分布

從圖5可以看出,這兩個頻帶都表現出了明顯的變化趨勢:第31頻帶隨著加工時間的增加,能量逐漸下降,在刀具崩刃之后,能量又逐漸上升;第32頻帶隨著加工時長的增加,能量逐步增加,并在刀具崩刃后下降。

通過對電流信號進行頻域、時頻特征分析,從多個特征域中發現了電流隨刀具磨損變化而產生的上升趨勢或下降趨勢的特征,在模型訓練和檢測中,本文選取了均值、方差、峰值、峰度4個特征作為網絡的輸入特征。


3.4 斷刀檢測

經過驗證,神經網絡往往比傳統機器學習算法具有更好的頑健性、表達能力和學習能力,筆者期望神經網絡的這些優點可以穩定、準確地檢測出刀具崩刃。筆者從CN N 和傳統的反向傳播(backpropagation,BP)神經網絡著手,對電流信號進行擬合訓練測試,并對比兩種網絡的表現能力。神經網絡相關參數見表3。

其中,CNN的具體框架如圖6所示。受計算資源和數據的限制,5層神經網絡參數(神經元權重參數接近5億)已經具備擬合訓練數據的能力,實際上也正是如此,本文設計的網絡在訓練集上已經達到了過擬合,具有足夠小的偏差,此時更需要做的是使用一些正則化方法來減少網絡的方差。本文在網絡的1、2、3層的卷積層后添加了批標準化層以減小過擬合,并認為小卷積核能夠提取更細致的特征,Adam方法可以幫助網絡更快速、安全地到達網絡最優點。本文共有4 0 4 個數據樣本,52 080 000個數據點,在每次網絡的輸入批次中,隨機抽取了正常加工數據和刀具斷刀數據,并且比例為1:1。最后,通過對網絡的訓練和測試得出的實驗結果見表4。

圖6?卷積神經網絡的設計框架


本文將準確率作為度量標準,CNN取得了96.46%的準確率,BP神經網絡取得了86%的準確率。CNN的96.46%準確率在正樣本(正常加工樣本)中表現很好,正樣本預測全部正確,剩余的3.54%錯誤率主要表現在對負樣本(斷刀數據樣本)的預測上。筆者分析,主要有兩方面原因:一是負樣本與正樣本之間分布差異較大,并且不同的刀具負樣本之間分布差異也較大;二是負樣本數據量少,網絡的參數大部分用于擬合正樣本數據,而對負樣本數據的擬合情況較差,因為在加工生產中負樣本獲取的成本較高,所以在實際中獲取大量可利用的負樣本數據從而減少網絡的方差,也是不太符合實際的。但是網絡9 6 .4 6% 的準確率依然表現了神經網絡的優勢,達到了較為滿意的效果,并驗證了通過神經網絡的方法檢測刀具崩刃的可行性與應用前景。

3.5 異常檢測網絡

從異常檢測 的角度來看,負樣本少、樣本奇異是異常檢測問題的特征之一,刀具崩刃是一種典型的異常檢測問題。在異常檢測中,異常點與正常點通常有著較大的差異,因此,閾值法是異常檢測問題中一種常用的方法。筆者發現,同一個加工環境下不同刀具的正常加工往往類似,但是刀具發生崩刃的異常情況卻各不相同,因為沒有包含所有斷刀形式的數據集,所以使用普通CN N很難擬合負樣本情況。針對這類問題,提出了一種不同于一般CNN方法的異常檢測卷積神經網絡(convolutional neural network using anomaly detection,CNN-AD)方法。在訓練階段,CNN-AD只使用正常樣本訓練,而在測試階段,通過設定閾值判斷網絡的損失值是正樣本還是負樣本。在實驗中,CNN-AD的結構與之前設計的CNN結構相同,不同的是在網絡的訓練集中只有正樣本,即CNN-AD 訓練階段只對正樣本進行擬合。在測試階段,CNN 通過softmax層輸出的是概率,而CNN-AD取消了softmax層,最終的輸出為網絡的損失函數值。本文設定了一個閾值(如設置閾值為1),用以根據損失值劃分正負樣本。在測試階段,加工前期的正常樣本輸入網絡中產生的損失函數的值極低,接近于 0;而加工后期,刀具崩刃的異常樣本輸入網絡中產生的損失函數的值與正常樣本的差異巨大,通過閾值很容易將其區分開。在訓練階段,網絡只對正樣本進行訓練,因此所有參數都用于擬合正樣本數據。在測試階段,異常樣本與正樣本差異較大,網絡沒有訓練負樣本的“經驗”,從而產生較大的損失函數的值。這樣就可以使用閾值很好地將正負樣本區分開。

除了對CNN-AD進行測試以外,本文還構建了其他網絡作為比較,包括CNN、BP、SVM。其中BP和CNN的架構和模型數據與第3 .4節中的一樣,不同的是通過PCA方法SVM的輸入數據維度從7 200×4 降到了1×4。同樣使用準確率作為主要度量標準,但是引入了召回率和F1-Score作為參考,其實驗結果見表5。


刀具破損檢測是典型的異常檢測問題。因此,選擇召回率和F1-Score作為評估標準更為合適。從表5可以看出,CNN-AD表現最佳,準確率為100%,這可能是由正樣本與負樣本差異較大并且數據集不全面導致的。CNN、BP 和SVM的性能不如CNN-AD,這可能是由正負樣本比引起的。因為與正常加工相比,刀具崩刃的時間非常短,1把刀具的完整生命周期中往往只有少數幾個負樣本,但是卻有幾十個正樣本。另外,每把刀具崩刃在電流信號中的表現(例如電流幅度的差異或變化趨勢)不同。這些原因使得網絡不能很好地擬合負樣本。SVM在正樣本判斷中表現良好,但在異常情況檢測中表現不佳,負樣本檢測全部錯誤,筆者分析可能是因為正樣本和負樣本之間的差異不足以讓SVM找到最佳分割點。

在實驗中,CNN-AD收斂速度最快,BP次之,CNN需要花費更多的迭代次數才能完成收斂。CNN-AD只用了不到10次的迭代就完成了收斂,這是因為CNN-AD只使用正樣本進行訓練,而不需要考慮對負樣本的擬合,不同正樣本之間差異不大,網絡不需要太多的參數就可以完成擬合,因此只需要很少的迭代次數就達到擬合收斂。BP收斂速度快于CNN,但 BP的測試結果卻在波動,其準確性有時超過 8 0%,有時卻低于 6 0%,這是由于BP的參數較少,不能很好地提取出崩刃和正常樣本之間的關鍵特征。相比 BP的結果,CNN較為穩定,CNN在網絡收斂之后,準確率穩定在9 5%以上。這是由于 CN N更復雜且參數數量超過 BP,能夠擬合更多的數據情況,而BP的結構相對簡單,易于收斂。


3.6 討論

在C N N 的方法中,網絡的準確率主要表現在對正樣本的識別效果很好,而對負樣本的識別效果不佳,于是本文提出了CNN-AD,利用正負樣本之間的差異,不使用負樣本進行訓練,以這種方式減少負樣本對預測準確率的影響,但是該方法依賴于正負樣本之間的差異性,因此該方法存在局限性。神經網絡的效果依然還有較大的提升空間,而這些提升空間主要表現在減小網絡方差上。從目前機器學習領域內可以了解到有兩個方向有助于網絡擬合負樣本,同時也將是筆者進一步的研究方向。

(1)生成模型

生成式對抗網絡( generative adversarial network,GAN是目前機器學習領域的研究熱點之一,G A N 得到了很大的擴展,例如:CGA NInfoGAN、DCGAN、WGAN等,學術界已經出現了GAN 變種方法,能夠取得很好的生成效果。筆者期望通過GAN生成類似于負樣本分布的數據,從而間接地增加負樣本數量,使網絡更好地擬合負樣本。

(2)遷移學習

遷移學習主要包括同構遷移和異構遷移,而很多方法采用的將源域分布空間與目標域分布空間映射到一個共同潛在空間,或者使源域映射空間與目標域映射空間優化,使其盡可能相似的思想,也被稱為對稱變換和非對稱變換。對于不同的加工環境,電流數據的分布也不同,這也叫作數據集偏差,直接使用這些數據有可能使網絡效果更差。筆者希望通過遷移學習將不同的機床數據變為可利用的數據,這樣就間接增加了數據量,也增強了網絡的頑健性和適應性。


4 結束語

本文介紹了大數據與智能制造的概況,并且通過一個智能制造的實際案例讓大家認識到在實際工業場景中使用深度學習進行智能化的生產制造是可行的。筆者發現,對于過去需要依靠工人的知識與經驗進行判斷的場景,現在可以用大數據技術來代替,可擁有更高的性能提升并節約成本。雖然本文的本研究仍然有進一步提升的空間,但是本文的研究邁出了深度學習在智能制造運用中的重要一步,為智能制造的發展提供了新的研發思路。


?

《大數據》期刊

《大數據(Big?Data?Research,BDR)》雙月刊是由中華人民共和國工業和信息化部主管,人民郵電出版社主辦,中國計算機學會大數據專家委員會學術指導,北京信通傳媒有限責任公司出版的科技期刊。

關注《大數據》期刊微信公眾號,獲取更多內容

總結

以上是生活随笔為你收集整理的结合深度学习的工业大数据应用研究的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。