中秋佳节

2018/09/24 中秋

Posted by WangXiaoDong on September 24, 2018
    今天是中秋节,我早晨来的办公室,这时候霍老师发来消息,让我和小崔帮忙做一个日期减法的Excel,小崔回答
的很快,然后就没声了。我查了下Excel里面有日期减法的函数还有得到当前天的函数TODAY()。

进行总结一下上周五听到的关于知识图谱的汇报

知识图谱

介绍

今天是复旦大学教授为我们做汇报。他讲的主要内容是知识图谱的构建和应用相关的东西。

背景

知识图谱的构建实际上就是构建大规模的语义网。大规模的语义网通过结构关系即可得到知识库。 知识库是富裕机器语言理解能力的的核心要素。

实例

现在已经完成的知识库构建实例就是DBPediaCN-DBPedia。其中CN-DBPedia就是做汇报老师 现在带领老师和学生们完成的。该项目可以实时更新,也开发了API接口让大家可以免费调用。

构建知识图谱可能遇到的问题

  • 补全问题,可以使用协同过滤处理。
  • 常识很少能够通过爬虫搜集到,通过动态top-K算法得到
  • 语义飘移问题,通过基于推断的补全方法完成
  • 数据量少的问题,通过自动弱标注算法解决(重要创新点)

错误知识库重构

完成知识库的构成后,需要进行错误的减少,通常情况小知识库的连接关系是有向无环图,因此 检测到环就需要激进行判断,如何破坏需要通过假设检验,即破坏后置信度低的才行。

更新知识库

由于知识是时刻更新的,因此如何保证知识的新鲜正确是一个关键的问题,根据经验,大部分词条 都是固定的,通常更新的只有少量,因此使用泊松分布来统计通常更新的词条,然后进行知识库的 更新,这样可以减少爬虫量,同时可以更新大量新的知识。

可研究方向

  • 可解释人工智能
  • 大规模常识获取与理解