3)pe可選頭部有效尺寸的值不正確,(4)節之間的“間縫”,(5)可疑的代碼重定向,(6)可疑的代碼節名稱,(7)可疑的頭部***,(8)來自,(9)導入地址表被修改,(10)多個pe頭部,(11)可疑的重定位信息,(12)把節裝入到vmm的地址空間,(13)可選頭部的sizeofcode域取值不正確,(14)含有可疑標志。存在明顯的統計差異的格式結構特征包括:(1)無證書表;(2)調試數據明顯小于正常文件,(3).text、.rsrc、.reloc和.rdata的characteristics屬性異常,(4)資源節的資源個數少于正常文件。生成軟件樣本的字節碼n-grams特征視圖,是統計了每個短序列特征的詞頻(termfrequency,tf),即該短序列特征在軟件樣本中出現的頻率。先從當前軟件樣本的所有短序列特征中選取詞頻tf**高的多個短序列特征;然后計算選取的每個短序列特征的逆向文件頻率idf與詞頻tf的乘積,并將其作為選取的每個短序列特征的特征值,,表示該短序列特征表示其所在軟件樣本的能力越強;**后在選取的詞頻tf**高的多個短序列特征中選取,生成字節碼n-grams特征視圖。:=tf×idf;tf(termfrequency)是詞頻,定義如下:其中,ni,j是短序列特征i在軟件樣本j中出現的次數,∑knk,j指軟件樣本j中所有短序列特征出現的次數之和。用戶隱私測評確認數據采集范圍超出聲明條款3項。信息系統軟件測試多少錢
后端融合模型的10折交叉驗證的準確率是%,對數損失是,混淆矩陣如圖13所示,規范化后的混淆矩陣如圖14所示。后端融合模型的roc曲線如圖15所示,其顯示后端融合模型的auc值為。(6)中間融合中間融合的架構如圖16所示,中間融合方式用深度神經網絡從三種模態的特征分別抽取高等特征表示,然后合并學習得到的特征表示,再作為下一個深度神經網絡的輸入訓練模型,隱藏層的***函數為relu,輸出層的***函數是sigmoid,中間使用dropout層進行正則化,防止過擬合,優化器(optimizer)采用的是adagrad,batch_size是40。圖16中,用于抽取dll和api信息特征視圖的深度神經網絡包含3個隱含層,其***個隱含層的神經元個數是128,第二個隱含層的神經元個數是64,第三個隱含層的神經元個數是32,且3個隱含層中間間隔設置有dropout層。用于抽取格式信息特征視圖的深度神經網絡包含2個隱含層,其***個隱含層的神經元個數是64,其第二個隱含層的神經元個數是32,且2個隱含層中間設置有dropout層。用于抽取字節碼n-grams特征視圖的深度神經網絡包含4個隱含層,其***個隱含層的神經元個數是512,第二個隱含層的神經元個數是384,第三個隱含層的神經元個數是256,第四個隱含層的神經元個數是125。CNAS軟件評測報告價格能耗評估顯示后臺服務耗電量超出行業基準值42%。
圖2是后端融合方法的流程圖。圖3是中間融合方法的流程圖。圖4是前端融合模型的架構圖。圖5是前端融合模型的準確率變化曲線圖。圖6是前端融合模型的對數損失變化曲線圖。圖7是前端融合模型的檢測混淆矩陣示意圖。圖8是規范化前端融合模型的檢測混淆矩陣示意圖。圖9是前端融合模型的roc曲線圖。圖10是后端融合模型的架構圖。圖11是后端融合模型的準確率變化曲線圖。圖12是后端融合模型的對數損失變化曲線圖。圖13是后端融合模型的檢測混淆矩陣示意圖。圖14是規范化后端融合模型的檢測混淆矩陣示意圖。圖15是后端融合模型的roc曲線圖。圖16是中間融合模型的架構圖。圖17是中間融合模型的準確率變化曲線圖。圖18是中間融合模型的對數損失變化曲線圖。圖19是中間融合模型的檢測混淆矩陣示意圖。圖20是規范化中間融合模型的檢測混淆矩陣示意圖。圖21是中間融合模型的roc曲線圖。具體實施方式下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例**是本發明一部分實施例,而不是全部的實施例。基于本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬于本發明保護的范圍。
保留了較多信息,同時由于操作數比較隨機,某種程度上又沒有抓住主要矛盾,干擾了主要語義信息的提取。pe文件即可移植文件導入節中的動態鏈接庫(dll)和應用程序接口(api)信息能大致反映軟件的功能和性質,通過一個可執行程序引用的dll和api信息可以粗略的預測該程序的功能和行為。belaoued和mazouzi應用統計khi2檢驗分析了pe格式的惡意軟件和良性軟件的導入節中的dll和api信息,分析顯示惡意軟件和良性軟件使用的dll和api信息統計上有明顯的區別。后續的研究人員提出了挖掘dll和api信息的惡意軟件檢測方法,該類方法提取的特征語義信息豐富,但*從二進制可執行文件的導入節提取特征,忽略了整個可執行文件的大量信息。惡意軟件和被***二進制可執行文件格式信息上存在一些異常,這些異常是檢測惡意軟件的關鍵。研究人員提出了基于二進制可執行文件格式結構信息的惡意軟件檢測方法,這類方法從二進制可執行文件的pe文件頭、節頭部、資源節等提取特征,基于這些特征使用機器學習分類算法處理,取得了較高的檢測準確率。這類方法通常不受變形或多態等混淆技術影響,提取特征只需要對pe文件進行格式解析,無需遍歷整個可執行文件,提取特征速度較快。用戶體驗測評中界面交互評分低于同類產品均值15.6%。
生成取值表。3把取值表與選擇的正交表進行映射控件數Ln(取值數)3個控件5個取值5的3次冪混合正交表當控件的取值數目水平不一致時候,使用allp**rs工具生成1等價類劃分法劃分值2邊界值分析法邊界值3錯誤推斷法經驗4因果圖分析法關系5判定表法條件和結果6流程圖法流程路徑梳理7場景法主要功能和業務的事件8正交表先關注主要功能和業務流程,業務邏輯是否正確實現,考慮場景法需要輸入數據的地方,考慮等價類劃分法+邊界值分析法,發現程序錯誤的能力**強存在輸入條件的組合情況,考慮因果圖判定表法多種參數配置組合情況,正交表排列法采用錯誤推斷法再追加測試用例。需求分析場景法分析主要功能輸入的等價類邊界值輸入的各種組合因果圖判定表多種參數配置正交表錯誤推斷法經驗軟件缺陷軟件產品中存在的問題,用戶所需要的功能沒有完全實現。整合多學科團隊的定制化檢測方案,體現艾策服務于制造的技術深度。溫州第三方軟件檢測機構
自動化測試發現7個邊界條件未處理的異常情況。信息系統軟件測試多少錢
特征之間存在部分重疊,但特征類型間存在著互補,融合這些不同抽象層次的特征可更好的識別軟件的真正性質。且惡意軟件通常偽造出和良性軟件相似的特征,逃避反**軟件的檢測,但惡意軟件很難同時偽造多個抽象層次的特征逃避檢測。基于該觀點,本發明實施例提出一種基于多模態深度學習的惡意軟件檢測方法,以實現對惡意軟件的有效檢測,提取了三種模態的特征(dll和api信息、pe格式結構信息和字節碼3-grams),提出了通過前端融合、后端融合和中間融合這三種融合方式集成三種模態的特征,有效提高惡意軟件檢測的準確率和魯棒性,具體步驟如下:步驟s1、提取軟件樣本的二進制可執行文件的dll和api信息、pe格式結構信息以及字節碼n-grams的特征表示,生成軟件樣本的dll和api信息特征視圖、格式信息特征視圖以及字節碼n-grams特征視圖;統計當前軟件樣本的導入節中引用的dll和api,提取得到當前軟件樣本的二進制可執行文件的dll和api信息的特征表示。對當前軟件樣本的二進制可執行文件進行格式結構解析,并按照格式規范提取**該軟件樣本的格式結構信息,得到該軟件樣本的二進制可執行文件的pe格式結構信息的特征表示。信息系統軟件測試多少錢