《Web安全之机器学习入门》笔记第一章
第一章:通向智能安全的旅途
1.1? ?人工智能、機器學習與深度學習
機器學習是實現人工智能的主要方式,人類基于機器學習和海量的數據,逐步實現人工智能,深度學習是機器學習的一個分支。
1.2? ?人工智能的發展
A. 谷歌大腦: 是“Google X實驗室”一個主要研究項目,科學家們通過將1.6萬臺電腦的處理器相連起來,使之成為一個大型中樞網絡系統,它能夠自主學習。
B. 百度無人車:項目起始于2013年,由百度研究院主導研發,技術核心是“百度汽車大腦”,包括高精度地圖、定位、感知、智能決策與控制4大板塊。
?C. AlphaGo:? 是一款圍棋智能程序,隸屬Google公司,主要工作原理是“深度學習”,曾經擊敗多名頂尖職業棋手。
1.3 國內外網絡安全形勢
A. 國內部分網站存在Ramnit惡意代碼攻擊
B. 2.7億Gmsil、雅虎、Hotmail賬號泄露
C. 2016年10月,提供動態DNS服務的DynDNS遭到大規模DDOS攻擊,導致多個大型網絡癱瘓
D. 希拉里“郵件門事件”
1.4 人工智能在安全領域的應用
人工智能在安全領域的應用還屬于起步階段
?A. 惡意代碼圖像:?這個概念最早是2011年由加利福尼亞大學的Nataraj和Karthikeyan在他們的論文?Malware Images: Visualization and Automatic Classification?中提出來的,思路非常新穎,把一個二進制文件以灰度圖的形式展現出來,利用圖像中的紋理特征對惡意代碼進行聚類。
B.OpCode n-gram:是自然語言處理領域的概念,早期的語音識別技術和統計語言模型與它密不可分。n-gram可應用于惡意代碼檢測,王磊團隊對APK的特征提取主要分為三大特征:
·結構化特征:包括APK申請的權限的個數,資源文件中包含的圖像文件個數和參數大于20的函數的個數等
·統計類特征
·長期惡意APK檢測的經驗總結的特征,包括資源文件中是否包含可執行文件,assets文件夾中是否包含APK文件等
參看:?利用機器學習進行惡意代碼分類 (bindog.github.io)
1.5 算法和數據的辯證關系
算法和數據是機器學習解決實際問題不可或缺的兩大因素,早期的機器學習十分依賴特征的提取。在實際工作中,不同算法的檢測效果可能會差別很大。
1.6 本章小結
略
總結
以上是生活随笔為你收集整理的《Web安全之机器学习入门》笔记第一章的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python 实现RFID串口数据读取
- 下一篇: 遥感学习笔记(八)——遥感影像