网易首页 > 网易号 > 正文 申请入驻

利用机器学习&AI判定未知恶意程序

0
分享至

在上一篇ML&AI如何在云态势感知产品中落地中介绍了,为什么我们要预测未知恶意程序,传统的安全产品已经无法满足现有的安全态势。那么我们要使用新的技术手段武装我们的安全产品,通过大数据的手段更好的解决未知恶意程序给我们带来的危害。

一、如何检测

上篇文章讲了大致的落地方法,本文主要是给大家暴露更多的技术细节。

1、IDS Agent还原文件会计算一下MD5hash值与FIleHash缓存系统对比一下,如果有则直接报告为恶意软件,并且附上恶意软件家族分类,如果没有根据聚类算法分成不同的未知分类,不存储该文件,更新缓存,把发生的时间和次数记录一下,为下一步流行度统计使用。

2、如果没有这个文件,那么存储到对象存储(公有云IAAS组件,OSS)。存储完成后向下一个环节投递,发出kafka Topic消息给主程序。设计这个是因为在公有云环境下需要鉴定的文件是海量的,需要一套大数据流转系统缓存。

3、主程序使用多线程的方式启动多个处理单元。接收到kafka消息后,从消息中取出OSS的文件路径,然后下载文件到本地,然后调用动态沙箱的文件送检API接口传递到下一个环节。然后等待沙箱回调函数,有回调消息后,获取沙箱的report,然后把相关信息填充到kafka Topic中向下传递。当然中间可以加数据补齐的流程等。在这有两个分支

分支一:把APICall信息传递给SparkMlib库做动态文件二分类器判断。这里主要是使用GBDT、XGBOOST (具体使用哪个算法需要看准确率、召回率 、F1_score 最终的结果选定)

分支二:网络流量从沙箱镜像出来,然后向网络重放一下。通过异常流量检测引擎,这四个检测又是4个ML&AI判断模型。

恶意SSL流量检测

特征工程,有具体意义特征->CNN

·flowMetadata[上行字节数/下行字节数/上行报数/下行包数/持续时间]

·sequence of packet[长度序列/间隔时间序列]

·Byte distribution[字节分布概率]

·TLS header[TLS加密套件/TLS扩展/公钥长度]

前N个包payload 直接转化成图像CNN

合并两个检测结果判断恶意SSL流量

DNS异常域名检测

通过LSTM聚类的方法,找出高度关联的域名和独立点。孤立点设为可疑域名。

DGA域名检测

特征工程主要包含以下3点

·域名随机性(随机性和熵)

·域名长度较长

·n-gram(bigram(相邻双字) )

隐藏通讯信道检测

使用随机森林算法

4、主程序同时需要做静态文件检测,根据不同文件类型送入到不同的类型静态文件分类器。

针对PE/ELF文件处理流程

需要通过yara文件简单判断一下是否加壳&加密。

未加壳&加密经过静态反编译服务中,计算出汇编序列,然后送入到静态PE/ELF分类器判断。

针对其它类型文件,需要不同的ML学习模型判断。

比如说脚本文件powershell,调研一般都有不同的操作码。这都需要深耕细作。

还有比如说webshell检测,也需要对不同的webshell做不同的处理。php马是一个很典型的例子,还有菜刀等。

5、检测结果都发往决策中心。根据多类决策树判断。得出最终结果发往恶意文件家族分类器。

恶意文件家族分类一般使用两种多分类器方法。

机器学习算法推荐使用k-means

深度学习方法建议使用卷积神经网络CNN算法

最后建议再过一遍聚类,找出孤立点。

6、形成恶意文件家族和未知恶意分类。最终存储到ElasticSearch方便提供给前端用户展示。

二、如何训练

通过上述全栈机器学习和深度学习算法的描述,所有模型加起来15+。那么这么多模型如何训练,如何更新是本次换“芯”最重要的部分。

1、那么针对机器学习部分,我们需要保存所提交的样本,无论什么形式都通过流量的形式发送到kafka最终存储到HIVE重,然后导入到spark mlib中进行模型计算。当然,还有一些公网中加入的黑白样本,也是通过同样的形式进入到这个循环中。

2、那些针对深度学习的模型,需要我们建立深度计算GPU服务集群,设备需求规格:24核128G内存/流量50Gbps(20% https流量) NVidia GeForceGTX1080 GPU https:7000QPS计算文本和图像加起来需要8台物理服务器。恶意软件病毒家族分类看规模大约8台可以满足目前带宽情况下的文件还原速度(25万个样本/day)。

3、在有限的资源下,大约1周更新一次所有模型。

通过以上描述,大家可以基本了解未知威胁检测的ML&AI的大致原理。剩下的就是如何代码实现其功能。当然算法调优也是一个漫长的过程。最终实现提升态势感知产品自动化程度,以及实现安全能力的智能化输出。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
年前100多元一斤,年后价格腰斩!有湖北人已迫不及待下单

年前100多元一斤,年后价格腰斩!有湖北人已迫不及待下单

环球网资讯
2026-02-27 09:52:19
关键谈判前,鲁比奥、万斯对伊朗发出警告

关键谈判前,鲁比奥、万斯对伊朗发出警告

参考消息
2026-02-26 19:51:14
巴拿马强收港口仅3天,李嘉诚再度“出手”,原来他早留退路

巴拿马强收港口仅3天,李嘉诚再度“出手”,原来他早留退路

谛听骨语本尊
2026-02-27 13:21:32
这种饮料正在摧毁你的胰岛细胞!很多糖尿病,都和这种饮料有关!

这种饮料正在摧毁你的胰岛细胞!很多糖尿病,都和这种饮料有关!

蜉蝣说
2026-01-29 14:46:50
240万转错账户,浙江女子崩溃:对方欠银行700万,还是被执行人,钱一直拿不回来

240万转错账户,浙江女子崩溃:对方欠银行700万,还是被执行人,钱一直拿不回来

犀利辣椒
2026-01-12 06:40:13
伊官员:若美国犯错 伊朗将对其造成重大伤亡

伊官员:若美国犯错 伊朗将对其造成重大伤亡

财联社
2026-02-25 00:06:27
我国停产消失的25个汽车品牌,你还记得几个?

我国停产消失的25个汽车品牌,你还记得几个?

蓝色海边
2026-02-26 02:11:42
原来每个省过年都有专属饮品!河北露露是标配,江西才需8毛钱

原来每个省过年都有专属饮品!河北露露是标配,江西才需8毛钱

北纬的咖啡豆
2026-02-27 17:05:06
孔乙己排出九文大钱,相当于现在多少钱?网友:终于算清楚了

孔乙己排出九文大钱,相当于现在多少钱?网友:终于算清楚了

长风文史
2026-02-27 11:00:36
马杜罗的辩护律师指责美国政府阻止委政府向他支付律师费 要求主审法官撤销案件

马杜罗的辩护律师指责美国政府阻止委政府向他支付律师费 要求主审法官撤销案件

每日经济新闻
2026-02-28 00:04:30
新娘长相富态,和新郎同框宛如母子,网友:兄弟你是真不想上班啊

新娘长相富态,和新郎同框宛如母子,网友:兄弟你是真不想上班啊

梅子的小情绪
2026-01-22 11:02:13
戏子误国!春节刚过就有3位明星相继塌房,走到这一步不值得同情

戏子误国!春节刚过就有3位明星相继塌房,走到这一步不值得同情

牛牛叨史
2026-02-28 00:40:54
严重泄漏后仍不停止生产,应急管理部点名包钢板材厂爆炸事故

严重泄漏后仍不停止生产,应急管理部点名包钢板材厂爆炸事故

南方都市报
2026-02-27 13:59:00
高人预测:十年后长沙,真正值钱的不是房子,而是这5个地段!

高人预测:十年后长沙,真正值钱的不是房子,而是这5个地段!

林子说事
2026-02-27 20:37:40
人老了,决定寿命的是5种病,没有多半可以活到90岁,特别第5种

人老了,决定寿命的是5种病,没有多半可以活到90岁,特别第5种

医学原创故事会
2026-02-27 21:07:04
湖南一女子在网吧骚扰男性玩家,涉事网吧回应:一开始以为情侣争吵,了解清楚立即制止了

湖南一女子在网吧骚扰男性玩家,涉事网吧回应:一开始以为情侣争吵,了解清楚立即制止了

大象新闻
2026-02-26 18:53:03
大家不知道的是,妈祖乩童的真实待遇,不只是荣耀这么简单

大家不知道的是,妈祖乩童的真实待遇,不只是荣耀这么简单

观察鉴娱
2026-02-25 10:17:00
哭穷的闫学晶,意外炸出中戏惊天腐败!三大招生大佬相继自首...

哭穷的闫学晶,意外炸出中戏惊天腐败!三大招生大佬相继自首...

细雨中的呼喊
2026-02-15 11:00:48
严查!事关北京所有中小学生!

严查!事关北京所有中小学生!

美丽大北京
2026-02-26 19:13:25
难怪高市搞事,原来中国历史上最大的错误就是:总习惯性低估日本

难怪高市搞事,原来中国历史上最大的错误就是:总习惯性低估日本

议纪史
2026-02-26 20:25:06
2026-02-28 04:20:49
嘶吼RoarTalk incentive-icons
嘶吼RoarTalk
不一样的互联网安全新视界
8178文章数 10545关注度
往期回顾 全部

科技要闻

狂揽1100亿美元!OpenAI再创融资神话

头条要闻

特朗普警告伊朗:“有时候不得不打”

头条要闻

特朗普警告伊朗:“有时候不得不打”

体育要闻

一场必须要赢的比赛,男篮何止击败了裁判

娱乐要闻

郭晶晶霍启刚现身香港艺术节尽显恩爱

财经要闻

沈明高提共富建议 百姓持科技股国家兜底

汽车要闻

岚图泰山黑武士版3月上市 搭载华为四激光智驾方案

态度原创

房产
旅游
手机
本地
时尚

房产要闻

重磅!海南“十五五”规划出炉!未来五年,方向定了!

旅游要闻

蜜雪冰城主题乐园来了 选址已"出炉"!在河南总部

手机要闻

荣耀600系列再次被确认:9000mAh+两亿像素,处理器有悬念!

本地新闻

津南好·四时总相宜

舒淇最爱穿的裙子搭配,真的很适合春天!

无障碍浏览 进入关怀版