特征之間存在部分重疊,但特征類型間存在著互補,融合這些不同抽象層次的特征可更好的識別軟件的真正性質。且惡意軟件通常偽造出和良性軟件相似的特征,逃避反**軟件的檢測,但惡意軟件很難同時偽造多個抽象層次的特征逃避檢測。基于該觀點,本發明實施例提出一種基于多模態深度學習的惡意軟件檢測方法,以實現對惡意軟件的有效檢測,提取了三種模態的特征(dll和api信息、pe格式結構信息和字節碼3-grams),提出了通過前端融合、后端融合和中間融合這三種融合方式集成三種模態的特征,有效提高惡意軟件檢測的準確率和魯棒性,具體步驟如下:步驟s1、提取軟件樣本的二進制可執行文件的dll和api信息、pe格式結構信息以及字節碼n-grams的特征表示,生成軟件樣本的dll和api信息特征視圖、格式信息特征視圖以及字節碼n-grams特征視圖;統計當前軟件樣本的導入節中引用的dll和api,提取得到當前軟件樣本的二進制可執行文件的dll和api信息的特征表示。對當前軟件樣本的二進制可執行文件進行格式結構解析,并按照格式規范提取**該軟件樣本的格式結構信息,得到該軟件樣本的二進制可執行文件的pe格式結構信息的特征表示。無障礙測評認定視覺障礙用戶支持功能缺失4項。第三方軟件性能評測服務
并將測試樣本的dll和api信息特征視圖、格式信息特征視圖以及字節碼n-grams特征視圖輸入步驟s2訓練得到的多模態深度集成模型中,對測試樣本進行檢測并得出檢測結果。實驗結果與分析(1)樣本數據集選取實驗評估使用了不同時期的惡意軟件和良性軟件樣本,包含了7871個良性軟件樣本和8269個惡意軟件樣本,其中4103個惡意軟件樣本是2011年以前發現的,4166個惡意軟件樣本是近年來新發現的;3918個良性軟件樣本是從全新安裝的windowsxpsp3系統中收集的,3953個良性軟件樣本是從全新安裝的32位windows7系統中收集的。所有的惡意軟件樣本都是從vxheavens網站中收集的,所有的樣本格式都是windowspe格式的,樣本數據集構成如表1所示。表1樣本數據集類別惡意軟件樣本良性軟件樣本早期樣本41033918近期樣本41663953合計82697871(2)評價指標及方法分類性能主要用兩個指標來評估:準確率和對數損失。準確率測量所有預測中正確預測的樣本占總樣本的比例,*憑準確率通常不足以評估預測的魯棒性,因此還需要使用對數損失。對數損失(logarithmicloss),也稱交叉熵損失(cross-entropyloss),是在概率估計上定義的,用于測量預測類別與真實類別之間的差距大小。寧波第三方軟件檢測報告數據驅動決策:艾策科技如何提升企業競爭力。
且4個隱含層中間間隔設置有dropout層。用于輸入合并抽取的高等特征表示的深度神經網絡包含2個隱含層,其***個隱含層的神經元個數是64,第二個神經元的隱含層個數是10,且2個隱含層中間設置有dropout層。且所有dropout層的dropout率等于。本次實驗使用了80%的樣本訓練,20%的樣本驗證,訓練50個迭代以便于找到較優的epoch值。隨著迭代數的增加,中間融合模型的準確率變化曲線如圖17所示,模型的對數損失變化曲線如圖18所示。從圖17和圖18可以看出,當epoch值從0增加到20過程中,模型的訓練準確率和驗證準確率快速提高,模型的訓練對數損失和驗證對數損失快速減少;當epoch值從30到50的過程中,中間融合模型的訓練準確率和驗證準確率基本保持不變,訓練對數損失緩慢下降;綜合分析圖17和圖18的準確率和對數損失變化曲線,選取epoch的較優值為30。確定模型的訓練迭代數為30后,進行了10折交叉驗證實驗。中間融合模型的10折交叉驗證的準確率是%,對數損失是,混淆矩陣如圖19所示,規范化后的混淆矩陣如圖20所示。中間融合模型的roc曲線如圖21所示,auc值為,已經非常接近auc的**優值1。(7)實驗結果比對為了綜合評估本實施例提出融合方案的綜合性能。
在數字化轉型加速的,軟件檢測公司已成為保障各行業信息化系統穩定運行的力量。深圳艾策信息科技有限公司作為國內軟件檢測公司領域的企業,始終以技術創新為驅動力,深耕電力能源、科研教育、政企單位、研發科技及醫療機構等垂直場景,為客戶提供從需求分析到運維優化的全鏈條質量保障服務。以專業能力筑牢行業壁壘作為專注于軟件檢測的技術型企業,艾策科技通過AI驅動的智能檢測平臺,實現了測試流程的自動化、化與智能化。其產品——軟件檢測系統,整合漏洞掃描、壓力測試、合規性驗證等20余項功能模塊,可快速定位代碼缺陷、性能瓶頸及安全風險,幫助客戶將軟件故障率降低60%以上。針對電力能源行業,艾策科技開發了電網調度系統專項檢測方案,成功保障某省級電力公司百萬級用戶數據安全;在科研教育領域,其實驗室管理軟件檢測服務覆蓋全國50余所高校,助力科研數據存儲與分析的合規性升級。此外,公司為政企單位政務云平臺、研發科技企業創新產品、醫療機構智慧醫療系統提供的定制化檢測服務,均獲得客戶高度認可。差異化服務塑造行業作為軟件檢測公司,艾策科技突破傳統檢測模式,推出“檢測+培訓+咨詢”一體化服務體系。通過定期發布行業安全白皮書、舉辦技術研討會。壓力測試表明系統在5000并發用戶時響應延遲激增300%。
將三種模態特征和三種融合方法的結果進行了對比,如表3所示。從表3可以看出,前端融合和中間融合較基于模態特征的檢測準確率更高,損失率更低。后端融合是三種融合方法中較弱的,雖然明顯優于基于dll和api信息、pe格式結構特征的實驗結果,但稍弱于基于字節碼3-grams特征的結果。中間融合是三種融合方法中**好的,各項性能指標都非常接近**優值。表3實驗結果對比本實施例提出了基于多模態深度學習的惡意軟件檢測方法,提取了三種模態的特征(dll和api信息、pe格式結構信息和字節碼3-grams),提出了通過三種融合方式(前端融合、后端融合、中間融合)集成三種模態的特征,有效提高惡意軟件檢測的準確率和魯棒性。實驗結果顯示,相對**且互補的特征視圖和不同深度學習融合機制的使用明顯提高了檢測方法的檢測能力和泛化性能,其中較優的中間融合方法取得了%的準確率,對數損失為,auc值為,各項性能指標已接近**優值。考慮到樣本集可能存在噪聲,本實施例提出的方法已取得了比較理想的結果。由于惡意軟件很難同時偽造多個模態的特征,本實施例提出的方法比單模態特征方法更魯棒。以上所述*為本發明的較佳實施例而已,并非用于限定本發明的保護范圍。整合多學科團隊的定制化檢測方案,體現艾策服務于制造的技術深度。第三方軟件性能評測服務
隱私合規檢測確認用戶數據加密符合GDPR標準要求。第三方軟件性能評測服務
[3]軟件測試方法原則編輯1.盡早不斷測試的原則應當盡早不斷地進行軟件測試。據統計約60%的錯誤來自設計以前,并且修正一個軟件錯誤所需的費用將隨著軟件生存周期的進展而上升。錯誤發現得越早,修正它所需的費用就越少。[4]測試用例由測試輸入數據和與之對應的預期輸出結果這兩部分組成。[4]3.**測試原則(1)**測試原則。這是指軟件測試工作由在經濟上和管理上**于開發機構的**進行。程序員應避免檢査自己的程序,程序設計機構也不應測試自己開發的程序。軟件開發者難以客觀、有效地測試自己的軟件,而找出那些因為對需求的誤解而產生的錯誤就更加困難。[4](2)合法和非合法原則。在設計時,測試用例應當包括合法的輸入條件和不合法的輸入條件。[4](3)錯誤群集原則。軟件錯誤呈現群集現象。經驗表明,某程序段剩余的錯誤數目與該程序段中已發現的錯誤數目成正比,所以應該對錯誤群集的程序段進行重點測試。[4](4)嚴格性原則。嚴格執行測試計劃,排除測試的隨意性。[4](5)覆蓋原則。應當對每一個測試結果做***的檢查。[4](6)定義功能測試原則。檢查程序是否做了要做的事*是成功的一半,另一半是看程序是否做了不屬于它做的事。[4](7)回歸測試原則。應妥善保留測試用例。第三方軟件性能評測服務