You must promise me that you’ll survive, that you won’t give up, no matter what happens, no matter how hopeless. 你必须向我保证,无论发生什么无论多么绝望,你都会活着,你不会放弃。 ————《泰坦尼克号》
今天早晨,久违的组会开始了,首先,新同学介绍,然后我们就开始听各位老师介绍最近工作进展,最后提前
结束了,本来我想讲讲最近做的东西,但是显然大家都比较忙。下次吧。然后肖老师想问我有什么问题,最后我
没有提出来,主要是我的问题估计也不是什么技术上的问题,是那种比较抽象的,分类定义具体类别的问题,不太容易
有什么解答,还是我自己考虑吧。最后,也不知怎么了,在我吧最近所有看的的字符串比较算法回顾一遍后,我突然
灵光一闪,感觉可以把Most frequent k characters这篇论文中的思想用到我的最后类别提取上!具体思路在后面介绍。
通过这样,我最近思考的问题终于有了一个完整的解答,真是非常高兴!
晚上,吃饭的时候,遇到了宿舍的同学,和他聊了很久。原来他早就接触到机器学习啦!以后要多向他请教!
回答实验室后,发现头疼!看了我颈椎有问题了,今天就早点回去休息吧!
今天,关键字符串模式匹配,我想到最近看的的一篇论文《A Novel String Distance Function based on Most Frequent K Characters》, 使用的是一个字符串的最高频次出现的前k个字母作为一个字符串识别的标志。这个思路完全可以用在我这里的顺序 类型匹配上,我只需要将所有的同种类型的序列中所有日志类型出现的次数统计出来,得到的就是给类型的各类型出现均值,然后 找到所有类别中和这个均值最靠近的序列,就有理由相信该序列就是这种模式的最终日志序列!
这个想法真的是非常有意思,今天下午我就把这个方法实现啦!哈哈,明天测试!