冬之晓

冬天的拂晓~

整理屋子

2018/07/28 思考

今天周六,经过上一周的实践,终于把keras理解的比较深入了,感受到了keras的强大后,我觉得继续通过 这个框架进行attention机制的研究。但是怎么都研究不出来,只能通过阅读layer层的源码了! 下午终于决定整理一下行李,因为下周就要回家了,整理宿舍真的是非常花时间,弄了一下午,把所有的东西 分类,不用的东西都带回家算了!

Keras不同层会自动变化维度

2018/07/27 变维

今天周五,仔细研究了一下keras里面一些常用层的作用,比如Embeding层,这个层主要作用是降维,但是实际 使用的时候这一层是直接增加了一个维度,即输入的数据不需要首先进行one-hot编码,这样真的是非常有用,仅仅 输入本身的类型数即可!其次我发现了LSTM层如果需要返回全部序列的内容,需要只定return_sequences为True,否 则仅仅返回最后一个时间步输出的内容,...

搞懂了精度的意义

2018/07/26 测试

今天周四,进过昨天师兄给我的提醒,今天我决定仔细研究一下准确度,翻开源码,发现准确度在keras文件 夹下的mertics.py文件里面,而在之前的keras/engine/文件夹下面的training.py里面搜索accuracy关键字, 就能够找到其逻辑是在给定'accuracy'或者'acc'字符串的情况下,选择准确度函数的准则是根据最后一个维度的 长度和损失函数决定的,跟我我...

多种网络对比试验

2018/07/25 对比

今天,我继续研究使用Keras搭建神经网络模型,今天我根据Keras的文档,搭建了一层、两层的基本RNN 网络,然后还搭建了一层、两层的LSTM网络。在对比的时候,我使用了相同的dropout比率,优化器选取的是 文档推荐的对于RNN专用的RMS优化器。之后我还发现在训练的时候可以有回调函数,在回调函数中有好几个 自定义的类可以使得结果更加有利,比如使用tensorboard的回调函...

学习使用Keras

2018/07/24 码代码

今天周二,为了将keras放入到程序里面,我仔细研究学习了Keras,并且发现使用Keras搭建神经网络确实 非常简单!并且最重要的是Keras里面具有一个metrics属性,通过给属性传递各种参数就可以实现每一批次显示 相关计算结果,但是我发现说明文档中并没有写清楚到底支持多少种字符串属性。不过accuracy这个属性是绝对 支持的,经过测试,通过传入这个属性,就会显示相关的精度,...

改进绘图结果

2018/07/23 修改

今天周一,我把上周老师让我修改的绘图方式给修改了一下,即图中的数字标签改成内容标签,然后将结果 发给赵老师。中午吃饭的时候,顺便和赵老师聊了下我接下来准备做的内容,同时赵老师建议我把结果给王老师 看看,让她提点意见,下午,我就把结果发个王老师,她建议我把这个绘图的结果简化。因此我就思考简化的方 法,通过观察,我发现图中多次出现重复的节点,因此想到一个方法,就是相同的节点增加一个循环,...

实验室休息

2018/07/22 超级热

今天周日,我一早就出门吃早饭,发现昨天经过一夜的大雨,今天的天气凉爽了一点,看了去实验室应该 不会太热,因此我就去实验室,然后就把一周学到的代码再次复习一遍,不知不觉一天就过去了,晚上理个发 然后休息休息吧~ 今天继续总结本周学习到的知识: 周四周五 库函数调研 在成功得到序列的预测模型后,面临一个输入显示结果的情况,因此我决定使用树的数据结构进行操作。 然后使用一种工具进...

宿舍休息

2018/07/21 超级热

今天周六,早晨出门吃饭,全身汗湿透。天气真的是太热了!我决定一天不出门,在屋子里面休息! 晚上,腾飞给我说了他暑假的计划,决定去长沙、成都去转一圈,并邀请我去,还顺便叫我晚上去吃饭。 最后我们就一起吃了一顿饭,不过我估计我休息的时间是下下周,因此可能不能和他一起去了。 今天总结一下本周学习到的知识: 周一 在进行神经网络序列输入的时候,发现了一个很好的文件代码用来数据预处理。 ...

修理宿舍

2018/07/20 修理

今天早晨,我把研究LSTM神经网络绘制的预测树形结果自己修改后得到了一些不错的结果发给老师,之后在 准备将最近的研究成果仔细梳理一下写出来的时候突然接到王霞老师的消息,让我去找石国帅老师。我明白,肯定 是修水管的事情。 事情的起因是这样的:昨天早晨,我正在床上休息,就听到有人在敲门。开门发现是物业和楼下的住户,他们 说我们的房子漏水,把楼下的住户的墙壁上粉刷的漆都给弄掉了。还...

实践树形图像绘制

2018/07/19 绘制

今天,我把研究LSTM神经网络的结果告诉老师,赵老师说让我将结果绘制成树形图。我听了以后感觉这是非常 好的建议,因此就准备进行试验。首先需要找到一个树的数据结构进行数据的存储,其次需要找到一个好的代码进行 图形的绘制。通过github上面的查找,很容易就找到了满足要求的库。分别是treelib和graphviz。经过一天的研究, 我把这两个库的api学会了,分别使用了两个递归函数实现...

实践精度图像绘制

2018/07/18 代码实践

今天,我继续研究LSTM神经网络,通过实践,把用户行为的数据转换成为神经网络的输入,最终成功的进行了预测。 然后我发现需要测试一下数据的精度,同时,我希望能够通过tensorboard将结果绘制出来,因此我仔细研究了一下如何 使用相关数据,最后得到了几个输出的接口。最终的实践显示效果不错。不过我无法绘制出召回率和ROC曲线, 原因是我的样本中没有正确和错误的概念。仅仅是进行序列预测。...

测试实验代码

2018/07/17 代码

今天,我继续研究LSTM神经网络,根据昨天阅读的经验,今天主要根据昨天阅读的源码,修改一下输入的接口, 然后就使用昨天的代码进行了实验,最后得到了损失函数降低的结果,然后继续研究如何保存训练好的权重,如何 使用训练好的权重进行预测,在使用的过程中学到了新的知识: 1. 训练好的网络在进行预测的时候要修改输入的网络结构,可以改为仅输入一个序列,然后输入第一个序列的 时候仅需要保...

阅读源码

2018/07/16 代码

今天,我继续研究LSTM神经网络,想看看如何才能运用到我需要的任务中来。经过努力思考,我发现实在是 有很多细节想不清楚,因此无奈的我只能直接阅读一个例子的源代码,结果在阅读源代码的时候通过断点调试和 调用其中的函数进行试验,发现理解的东西比直接阅读相关技术书籍快的多!并且对于LSTM的输入有了更为深刻 的理解,周末我要总结一下相关的输入数据的工具函数和类。

特价水果

2018/07/15 撑死了

今天,门口开了新的一家水果店!我买了一堆水果,吃的好饱!然后又看了论文,发现论文需要多读几遍,每次 阅读都能发现自己没有理解的地方!

生成对抗网络的损失函数

2018/07/14 看书入迷

今天是周六,埋头看交叉熵的概念和生成对抗网络的损失函数忘记了时间,中午吃饭的时候和师弟讨论了下, 他告诉我说实际上对交叉熵求损失函数,使得损失函数下降的过程就是一个最大似然估计法。这句话需要我理解 好久,结果还是不太清楚,看来我还需要继续努力啊! 今天真的是太浪费了时间了!以后不能看书随便就忘记时间了……

仔细思考

2018/07/13 行为分析

今天是周五,通过最近的论文阅读,我今天仔细思考了一下可以做的方向。最后发现如果想要把深度学习的知识 运用到用户行为分析上的话,可以仿照类别序列预测的方法。如果想要继续研究无监督分类问题的话,可以增加时间 的特征。如果想要进行异常检测的话可以仿照通过最后输出的误差打分的方法。这个方法让我感到非常有意思,我觉得 所有带有回归性质的模型应该都能够用类似的方法进行异常检测!

继续神经网络论文阅读

2018/07/12 DL

今天是周四,“张海阔”师兄说下午跟我会面,我就抓紧时间阅读了发表在CCF-A类会议17年CCS的文章《DeepLog: Anomaly Detection and Diagnosis from System Logs through Deep Learning》。该论文通过自己的分类方法 对日志进行分类,然后核心是增加了日志类型里面的变量的影响,类别单独作为神经网络进行训练,然后进...

神经网络论文阅读

2018/07/11 DL

今天是周三,因为本周收到“张海阔”师兄的回复,要更他讨论深度学习相关的方法,因此我觉定提前把相关的论文 阅读一下,防止到时候完全不会。今天主要阅读两篇关于神经网络的日志分析论文。这两篇论文是同一个作者先后完成 的工作。 (1)第一篇是《Recurrent Neural Network Language Models for Open Vocabulary Event-Leve...

继续昨天论文阅读

2018/07/10 MMH

今天是周二,继续昨天论文的第二部分。如果昨天的论文仅仅使用了马尔科夫模型,内容并不算多,效果也不算好,文章中在实际中加入了 时间的因素,因为每个动作都对于这一个时间,因此动作直接的时间大小也对模型起着很大的作用。在对时间进行建模时,作者假设每个动作直接 的时间分布满足gamma分布。因此在给定多个样本的情况下,就可以根据最大似然估计得到时间分布的参数估计值。这样就可以增加时间的因素进...

用户行为分析论文

2018/07/09 MMH

今天是周一,在没有什么想法的情况下我只能阅读论文,今天阅读的论文名叫《Beyond DCG: User Behavior as a Predictor of a Successful Search》发表在2010年的WSBM会议上,属于CCFB类里面关于数据挖掘类比较好的会议。本文主要说明传统搜索引擎根据一次查询进行的评价 方式的缺陷:用户一次同样的查询也许需要不同的信息。本文对用户...

散点图的绘制

2018/07/08 画图

周末了,又一次懒床了,哎,自己真的是太懒了!下午,准备开始进行散点图的绘制,目标是把所有用户对应 的单次登录的使用情况画出来。

论文阅读上升为第一要务

2018/07/07 阅读论文

今天,开始阅读论文,首先需要下载“用户行为”的相关论文,因此在百度学术里面检索了相关的关键词,得到了 相关论文的研究趋势等一系列结果,然后就是下载阅读,未来主要工作重心转移到论文上了!

关于用户行为分析的讨论

2018/07/06 编程

今天,我把最近用户行为的结果给赵老师看了,他建议我从用户命令中下手,我仔细研究了用户命令,发现并不能够 很理解里面的内容,因此就问了一些进行用户命令封装的王老师,王老师告诉我用户命令他进行了封装,因此我得到的用户 命令数据并不是真正用户的操作内容,因此我必须再想其他办法进行分析。所以之后我觉得读点论文看看有什么值得参考的 地方。

关于用户行为分析的程序实现

2018/07/03 编程

最近几天,一直在进行用户行为模式的分析,在分析的过程中,我又一次深深的体会到了数据预处理的重要性, 因为在进行聚类算法分析的时候,发现结果并不理想,最后通过分析发现原因在于数据对齐。因此过滤方法就非常 重要,最后在过滤后得到的结论对于分析非常有帮助! 5号的晚上,师弟请我去看了场电影《我不是药神》,感觉非常感人!

周一的开会

2018/07/02 开会

今天进行了年中总结,在总结的过程中发现牛老师的课题组和张老师的课题组实力的挺强的,研究出了很多有价值 的东西。这也激励我要努力多读论文,争取也能出一些有价值的成果,为我们课题组尽一份力量! 中午去交电费时,发现显然时间晚了……没办法只能下午去,结果按照上面写的上班时间1:30去发现并没有上班!只能 等到2:00,好无语,真希望物业能够准时上班啊!

周日休息

2018/07/01 休息

今天周日,因为宿舍的屋子快没有电了,因此我就在实验室凉快,顺便还把这个消息告诉了师兄和师弟,结果 他们今天一天也没怎么用电,好有负罪感。 今天准备整理一下最近关于TensorFlow的使用经验。今天肖老师过来加班了! TensorFlow的使用经验 形状变化函数的使用 TensorFlow进行卷积层神经网络的使用时,需要用到函数tf.reshape(tensor, s...

周六休息

2018/06/30 休息

今天周六,到实验室研究一下深度学习相关的应用程序,等到了晚上,邀请杭杰一起去吃小吃。杭杰欣然同意,但是 出门发现天气闷热,马上就要下雨了,所以我就把伞带上。果然,我们在去“呷哺呷哺”的路上就下起了大雨,不过则并没有 打击我吃放的热情。在吃饭的过程中,杭杰给我说了他刚发表一篇sci的经验。杭杰果然是太厉害了,看来我需要好好努力了!

服务器的寝室

2018/06/29 好大

今天早晨,需要把服务器运送到专门的地方,我就过去帮忙安装服务器了。在安装服务器的过程中,感慨服务器 真的是非常昂贵,一台就要十多万,所以搬起来特别小心,害怕稍微手滑一下就完蛋了…… 下午,进行了党建的节目赏析,实际上我就是去评分打酱油的……

和老师一起讨论

2018/06/28 序列

今天出差的赵老师回来了,我终于有机会和赵老师讨论一下。在讨论的过程中,我得知了原来数据中已经有了 一次会话信息的标签,这样子我就可以直接得到会话数据进行后续的分析讨论了。然后在老师的建议一下我决定先 进行client相关用户的分析,因此后续我就从这个数据开始下手进行分析。

学习RNN

2018/06/26 序列

今天我仔细学习了一下深度学习中的RNN,因为我发现日志本质上是一个序列,因此要从序列的角度考虑这个 问题有可能会有一些好的结果。然后在第二天研究了一下关于时间序列的预测分析问题,不过最后还是不了了之, 因为感觉还是不知道如何运用,没办法……

周一的分析数据

2018/06/25 分析

今天周一,开始进行用户行为模式的分析。研究了一天,根据数据的特点把数据读入到系统内存中。

周六休息

2018/06/23 休息

今天周六,开始休息

阅读论文

2018/06/21 阅读

最近一直阅读论文

翻译论文

2018/06/20 翻译

今天继续进行论文的翻译工作,到了晚上终于把论文翻译完成了。

瞬间就周二

2018/06/19 数据整理

今天是工作的第一天,我主要进行了资料的总结,因为我发现大家在进行日志研究的论文中,大部分都在实验的 部分进行了大量数据的的对比,因此今天我把网上开源的数据都给下载下来,准备以后分析的时候使用。整理的过程 中又发现了许多好的论文,以后慢慢阅读。

端午节

2018/06/18 异常

今天是端午休息的第三天,我跑到实验室读论文,最近在读论文的过程中,发现了好多有意思的异常检测方法, 下面总结一下。 异常检测方法 实际上,异常检测相关方法的发展挺有意思的! 最早的关于异常检测的方法是聚类。

庆祝腾飞生日

2018/06/17 聚会

今天是端午休息的第二天,早晨下起了大雨,久违的凉爽的天气令人非常舒服,我懒在屋子里的床上不想起来, 早晨八点多的时候,雨停了,我就准备出门去实验室读论文。这时,腾飞突然给我打电话叫请我中午一起到生命科学 园吃饭,我本想拒绝,因为今天还想读好多论文,但是腾飞说要跟我讨论算法相关的问题,成功的调动了我的积极性。 于是我就整理东西,出发前往生命科学院。路上碰到了豪哥。跟他到了那里之后,在腾...

端午休息

2018/06/16 休息

今天是端午休息的第一天,我准备来实验室读论文,最近发现了好多非常棒的论文,估计要花好多时间来阅读。 日志处理 说道日志处理,我最大的体会是我以前编程从来不用日志,每次都是cout、System.out.println或者 print这种直接控制台输出语句调试程序,但是最近我研究的方向是日志处理,于是只能仔细看看为啥 还需要日志。 比如我上面的代码,在except后面打印的是l...

放假前的一天

2018/06/15 学习

今天,我调用了相关word2vec的资料,准备把相关内容自己学习一下,这样才能理解该方法的含义。 下午,发现3点就放假了,真爽!

开始进行编程

2018/06/14 尝试

今天开始,我要讲昨天想的的方法进行尝试,首先就是要使用word2vec方法,经一天的尝试,终于实现了该方法, 中间用到了一个python库,叫做gensim,非常不错的库,直接把word2vec方法实现了!我基本只是按照日志序列处理好 输入输出,其他都没关心。不得不说,想着python的相关库实在是太方便强大了!

思考新的研究方法

2018/06/13 思考

今天,继续读论文,顺便思考新的研究方法。因为最近根据赵老师项目里面的内容,是要研究关联分析,在结合最近的 神经案例的论文,我想到了两个方向: 1. 关联:类似于word2vec方法,将高维的日志类型向量降低到低维空间上,然后对低维空间上的数据聚类,找到不同 类型日志之间的关联关系 2. 安全:使用LSTM方法,虽然方法跟最近读到的论文一致,但是我觉得可以跟着自己数据的...

读论文

2018/06/12 修改

今天,不想再修改论文了,感觉写英文论文非常不符合自己,因此今天就开始读一下论文,就是把上周搜的关于 使用神经网络算法进行异常检测分析的论文仔细阅读了一下,发现异常检测方法的研究过程是有意思的,这周末总结 一下。

修改论文

2018/06/11 修改

今天又是新的一周,上周已经把中文的论文发了出去,这周开始着重于投英文论文。但是自己的英文不好,所以 这篇论文需要大量时间进行修改润色!

休息的周末

2018/06/10 周末

今天早晨,来到实验室,开始学习深度学习的知识,看了一上午,感觉有点理解怎么编程了,但是缺的东西 在于如何运用日志相关的数据进行分析。 下午,通过尝试,终于进行了一下简单数据的操作。下面总结一下。 首先是最近的数据读取,我们可以使用Keras自带的数据集: # -*- coding: utf-8 -*- """ Spyder Editor This is a tempor...

和小明一起探讨问题

2018/06/09 区块链

今天早晨,和师兄、师弟一起去健身,感觉不错,我们就约定以后都要周末早晨去健身一次。回来后,下起了 雨。因此我打算就在屋子里休息,但是下午小明给我聊天,说最近的研究出现了不明白的问题,想让我帮帮忙,所 以我就和他相约在实验室一起讨论问题。 我们见面之后,他给我提出了他的问题,我发现原来他现在遇到的问题是区块链的环境配置问题,之后我就和 他一起研究了一下如何配置区块链,最后我们通...

修改/投论文

2018/06/08 发送

今天早晨,吃掉饭盒里面的食物当早餐!希望我不会拉肚子!! 然后今天修改了一天论文,赵老师也给我提供了很大的帮助,最后在晚上,在同学小明的帮助下我第一次投了 一篇小论文,好激动!

久违的月报

2018/06/07 月报

今天,久违进行的月报,这次月报的时隔三个月!不过这三个月也有一定的进展,虽然进展不大,主要是自己 以前没有写过小论文,现在第一次写花费了不少时间。一上午的月报,感觉大家都做了好多东西,非常佩服!中午 为大家筹备开会的徐薇老师给大家预定了午饭,大家一起大吃了一顿,非常满足! 下午继续修改论文!晚上何荣老师告诉我中午订的盒饭还剩下一盒,然后我就给吃掉了当晚饭。之后继续修改论文, ...

修改论文做PPT

2018/06/06 准备

今天主要做了两件事情:1. 为明天月报的PPT做准备;2. 将赵老师帮我修改后第二版中文投稿的期刊内容基本完成。

建议和讨论

2018/06/05 建议

今天早晨,我正在翻译论文,王老师过来给我建议说可以投一篇中文的文章,然后在其基础上增加超过30%的 内容,投其他期刊就不算一稿多投,我听了以后,感觉非常好,因此中午就和赵老师讨论了一下,他也说可以,因此 今天我就开始先把中文论文修改一下。

冗长的翻译

2018/06/04 翻译

不得不说,好无奈啊,翻译论文的过程真的是非常累!哎,我发誓,以后论文一定要直接写英文!!

休息的周末

2018/06/03 周末

今天早晨,肖老师又来加班啦!下午我和师弟一起去健身,回来喝了好多食堂的汤!

和杭杰吃晚饭

2018/06/02 晚饭

早晨,来到实验室翻译论文,发现肖老师也过来了! 下午,迟老师以前的毕业生出现了,似乎是师姐,她现在定居国外! 晚上,杭杰来找我玩,给我带来很多鱿鱼丝,然后我们晚上一起去了超市。回来后师弟又给我了许多荔枝和杨梅,非常美味!

六一儿童节

2018/06/01 六一

今天是六一儿童节!预示着今天是愉快的一天! 中午,吧热水管给修了下,竟然花了72块钱! 下午,老师的孩子们都过来玩啦,我本来准备的巧克力没有拿出来,主要是肖老师给的也是巧克力! 让我们一起画一个小猪佩奇庆祝六一儿童节吧~ #!/usr/bin/env python2 # coding=utf-8 import turtle as t ...

听讲座

2018/05/31 时空

Better to light one candle than to curse the darkness. 与其诅咒黑暗,不如燃起蜡烛。 今天早晨,赵老师建议我去听听讲座。我听到了很多知识,回来周末总结下! 晚上,师弟让我带他去健身,结果他办了张健身卡……冲动消费啊!!

赵老师的建议

2018/05/30 建议

今天早晨,赵老师找我聊天了,他把我论文中需要改进的地方都告诉我了,然后建议我先翻译成英文,然后再 看看有哪些期刊可以投稿。看了后期我主要的任务是先翻译论文啦! 中午,修热死器的师傅来了,一共花了300元,上门维修确实不便宜!

继续修改论文

2018/05/29 修改

今天继续修改论文,一天下来,终于把上次赵老师说的内容改好啦!

阅读论文

2018/05/28 阅读

Where there is life, there is hope. 生命必有希望。 今天,我仔细读了一下深度学习的论文,但是发现仅仅根据论文里面写的是在是不理解怎么应用,看来还是要从 代码实践入手深度学习的内容!

周末休息

2018/05/27 休息

今天是周末,因此决定好好休息一下,早晨到实验室整理最近的日志,看到卢老师过来加班了,卢老师真的是 太辛苦啦! 今天,准备总结一下Qt调用子程序的方法,比如SPMF库。 SPMF库 非常好用的关于序列分析和关联分析的库,该库实现了很多相关的算法,补全了weka库的不足。 最重要的是,这个库的接口非常清晰易懂,具有很好的命令行接口。里面的jar包通过java命令 即可直接运行! ...

和老友聚会

2018/05/26 大餐

今天,和腾飞一起吃饭,顺便给他拷贝一下人工智能相关视频。他也把乾坤叫上一起。乾坤是腾飞的朋友, 在机器学习和数据挖掘方面具有深厚的知识背景,我跟他聊了很多,并学习了很多。 下午,小崔的女朋友晓涵问我一些问题,我感觉她天天学习真的非常刻苦,她的老师确实非常严格! 晚上,宿舍师弟晏华给我讲了下神经网络的相关,知识,我感觉收益匪浅,果然本科就开始学习程序的同学 就是不一样!...

完成输入并进行实验

2018/05/25 输出

今天,主要把SPMF输出的程序完成了,之后,我又进行了测试,发现结果没有问题,剩下的就是分析的问题了, 这个问题我决定下周和赵老师讨论后再进行相关实验。然后我想是否将实验过程集成到我的程序中,最后想想还是算了! 因为SPMF本身就有界面功能,我集成到我的程序里面没啥意义!

实现SPMF接口输入

2018/05/24 输入

今天,主要进行编程,完成了日志数据的输出。这个输出专门为了变成SPMF调用时可以使用的数据。好久没编写Java 程序了,让我编了一天也没有实现这个小程序,明天继续!

和肖老师一起吃饭

2018/05/23 吃饭

今天,主要研究了一下序列挖掘相关的方法。并且发现关联规则和序列挖掘都可以用于日志的操作,晚上。肖老师 邀请我和他一起吃饭,然后我把自己相关的想法说下,他说让我都可以进行试验分析。我决定明天开始实现相关方法。 注意:cmd命令中如果使用路径命令,需要加上双引号!

学习使用python的子程序方法

2018/05/22 子程序

今天,主要研究了一下如何使用python调用具有命令行功能的其他程序,即调用子程序的方法。经过实践, 感觉相关方法非常简单,但是用处非常大,因为只要涉及到调用其他子程序,都可以使用该方法,周末要总结一下。

调研SPMF库

2018/05/21 新的库

Where there is life, there is hope. 有生命必有希望。 今天,开始阅读日志关联分析相关的论文,在阅读的过程中,发现了大部分人使用的方法都是关联规则和序列模式 挖掘的方法,然后发现大部分人在使用这些算法的时候调用的都是SPMF这个库,打开这个库后,发现确实非常好用,而且 还是一个Java的库,同时是一个命令行工具。今天仔细学习了一下这个库。

休闲的周末

2018/05/20 休闲

一到周末,我就不想动了。想到今天估计老师也在加班,因此就在屋子里躺了一天,顺便把机器学习相关的视频 在看一遍,果然周末的生活真是太没劲了! 今天,总结一下这周学的的matplotlib保存和字体大小相关的操作。 保存图片 matplotlib保存如果在子线程中画图,就不会在主线程中显示,因此在子线程中将图片保存下来, 然后在主线程中在打开就是很好的解决方案! #保存层级聚类...

腾飞同事请客吃饭

2018/05/19 吃自助

今天中午,樊伟琪邀请我们一起去吃自助餐,中午,大吃了一顿,非常美味。非常感谢樊伟琪的邀请。期间,腾飞 还邀请了他地理所认识的同学,这位同学已经完成了2片SCI3区的论文啦,而且她马上就可以去丹麦访问留学半年。 真的非常厉害。一吃完饭,她就立刻要去实验室做实验,我真的非常佩服她!所以我也拖着疲惫的身体去往实验室,但是 发现肖老师,曹老师和卢老师都在实验室加班。算了,我还是不去,回去休息...

调研关联分析

2018/05/18 搜论文

今天早晨,我把论文发给赵老师,同时和他讨论了一下下一步的研究计划,他说让我调研一下关联分析相关的 论文,因此今天我主要开始搜索相关的论文,最后发现了几篇好的文章,最近准备学习一下。

完成论文修改

2018/05/17 完成

今天修改了一天的论文,终于将结论部分完全改好了。

健身的体会

2018/05/16 锻炼

时间过得好快!一转眼距离我办健身卡已经一周了,不过看卡时间是上周末,今晚,和师兄一起去了健身房,最近 锻炼身体使我身体有了很大的变化,本来周一开始就有点感冒,结果完全没有发展起来,现在就是有点不舒服,但是 感觉很快就能好,这说明锻炼身体使得我的抵抗力明显增强!

定义重要结论

2018/05/15 定义

今天,天气非常的热,我继续修改论文,思考出日志类型的有序排列定义异常日志流量模式!

修改图例

2018/05/14 改图

Nothing is impossible to a willing heart. 心之所愿,无事不成 今天,仔细修改了一下图例字体的大小。过程中学习到了如果调整matplotlib的字体大小。这周要总结一下。

继续工作

2018/05/13 思考研究

今天,腾飞邀请一堆朋友来我们所食堂吃饭,大家吃的非常愉快! 今天,总结一下层次聚类的评价问题。层次聚类根据结果计算其对应的共表性相关系数(Cophenetic Correlation Coefficient)进行评价。共表相关系数越大,表明效果越好。 下面是计算共表相关系数的API Y = scipy.spatial.distance.pdist((X,'cityblock'...

和同学出门

2018/05/12 买礼物

今天,杭杰邀请我出门给他女朋友买礼物,我们就出去了。下午请我吃了大餐————呷哺呷哺!

实践自适应高度

2018/05/11 实践

今天,主要讲自适应高度实践到secure日志里面。

确定权重

2018/05/10 权重

Nothing is impossible to a willing heart. 心之所愿,无事不成。 今天,我尝试了各种方法,终于决定使用以10为底数的log对日志类别进行计算,从而得到权重。因为这样的想法 可以使得数量在10~1000内不会有太大的变化,满足我心中的要求,结果也非常好!

汇报结果

2018/05/09 结论

今天,我通过一天的努力,差不多完成相关的实验,晚上将结果报告给赵老师,在对应高度的计算上,老师 给我了一个解答,因为高度问题想要跟类数量挂钩,因此可以加上一个权重,而且权重可以跟类别相关,这让我很受启发 ,明天实现一下试试!

开始码代码

2018/05/08 编程

今天我按照昨天对说明文档的理解,开始实现相关代码,最终将距离度量分开计算,这样有助于后续计算共表相关 系数。然后得到的结论也很符合我心中的想法!

继续工作

2018/05/07 思考研究

While there is life there is hope. 一息若存,希望不灭。 今天,主要思考根据上一周研究的API如何进行相关操作。发现matlab里面的说明文档写的非常好,让我明白了 以后在python中找到相关函数如果看不明白,可以到matlab里面查找学习!matlab里面还有关于层次聚类选择簇间 距离度量相关的函数,让我非常高兴,这样一下子节解决了我心...

周末的休闲

2018/05/06 休息

今天早晨,师兄约我去健身,早晨我吃的比较少,结果健身的时候感觉胃不舒服,果然健身的话还是要多吃点! 中午回来后,和杭杰一起吃了顿午饭,下午就睡了一大觉。 今天,主要研究一下层次聚类在进行数据运算的时候,对数据结果进行自然簇分离而需要分析的API————inconsistent() 该函数是计算层次聚类不一致系数的,不一致系数越大,表明使用该阈值进行聚类的偏差越大。这样按照该不一致...

朋友那里搬运器材

2018/05/05 访友

今天就是周六,早晨休息了一下,下午帮助王老师传了一些数据,同时发现曹老师又来加班了。到了晚上,腾飞让我 去沙堡站的前锋家,他下周就要离开北京去上海发展了,我们一起过了一个难忘的晚上,吃了很多美味,并且还体验了和 马蜂大战的过程,真是惊心动魄! 晚上,我拿着40斤的杠铃回来了,很感谢前锋!