今天周五,来到实验室后,基本就是在进行电脑检查,一天都是如此,到了晚上后继续检查电脑,顺便帮忙去
取光盘,然后在办公室里面等着最后将电脑的清理完成。
今天周五,总结一下这周的进度:
1月29号,周一:
仔细思考了一下关联规则相关的分析方法和库函数的使用,希望通过关联规则对日志流量特征进行分析。 一天的调研,我发现Orange3的关联规则库 是比较适合进行关联分析的库函数,然后把相关的接口函数研究出来了。
Orange3
的关联分析模块安装时需要在Anaconda
的命令行窗口中输入以下命令
pip install orange3-associate
本周周末进行关联规则算法程序的总结。
1月30号,周二:
今天上午进行关联规则的测试,发现了一个bug————生成器只能使用一次! 搞定后关联规则库的使用上基本上没有什么问题了。
今天下午把日志相关的模式解释全部完成
今天关于论文的思考有了写眉目,记录下来:
未来关于日志相关的论文可以进行如下方向的研究:
-
关联分析————日志关联分析可以仿照计算所老师带领团队发的Apriori关联分析方法进行分析,然后继续进行异常检测(两篇论文)
-
异常检测————根据主成分分析方法进行异常检测(一篇论文)
-
聚类————可以从不同角度进行分析,创新出不同的距离度量方法,然后对用户行为进行分析,也可进行异常检测(一篇论文)
1月31号,周三
今天上午用了Orange3框架将日志数据成功带入, 得到了关于日志类型的关联分析规则。后期可以一次为基础继续研究 日志相关的关联规则
2月1号,周四
今天上午,查找设备序列号。
下午总结最近关于异常检测方法的步骤,开始做PPT
2月2号,周五
上午完成PPT后发给赵老师
下午进行一周总结。
最近一周一直进行安全检查,小事不断,因此效率较低
思考了一下关于模式分类方法的有效性,如下表格:
日志分类程序 | 速度 | 精度 |
---|---|---|
SLCT | ++ | + |
Logcluster | + | + |
LogHunt | + | ++ |
LCS | ++ | ++ |