今天是中秋节,我早晨来的办公室,这时候霍老师发来消息,让我和小崔帮忙做一个日期减法的Excel,小崔回答
的很快,然后就没声了。我查了下Excel里面有日期减法的函数还有得到当前天的函数TODAY()。
进行总结一下上周五听到的关于知识图谱的汇报
知识图谱
介绍
今天是复旦大学教授为我们做汇报。他讲的主要内容是知识图谱的构建和应用相关的东西。
背景
知识图谱的构建实际上就是构建大规模的语义网。大规模的语义网通过结构关系即可得到知识库。 知识库是富裕机器语言理解能力的的核心要素。
实例
现在已经完成的知识库构建实例就是DBPedia
和CN-DBPedia
。其中CN-DBPedia
就是做汇报老师
现在带领老师和学生们完成的。该项目可以实时更新,也开发了API接口让大家可以免费调用。
构建知识图谱可能遇到的问题
- 补全问题,可以使用协同过滤处理。
- 常识很少能够通过爬虫搜集到,通过动态top-K算法得到
- 语义飘移问题,通过基于推断的补全方法完成
- 数据量少的问题,通过自动弱标注算法解决(重要创新点)
错误知识库重构
完成知识库的构成后,需要进行错误的减少,通常情况小知识库的连接关系是有向无环图,因此 检测到环就需要激进行判断,如何破坏需要通过假设检验,即破坏后置信度低的才行。
更新知识库
由于知识是时刻更新的,因此如何保证知识的新鲜正确是一个关键的问题,根据经验,大部分词条 都是固定的,通常更新的只有少量,因此使用泊松分布来统计通常更新的词条,然后进行知识库的 更新,这样可以减少爬虫量,同时可以更新大量新的知识。
可研究方向
- 可解释人工智能
- 大规模常识获取与理解