2015 KDD TOPTRAC: Topical Trajectory Pattern Mining (精读)

今天分享一篇论文:Kim Y, Han J, Yuan C. TOPTRAC: Topical Trajectory Pattern Mining[C]//Proceedings of the 21th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. ACM, 2015: 587-596.

第二作者为数据挖掘的巨牛Jiawei Han,第一作者和第三作者分别是来自韩国汉阳大学的Younghoon和来自北航的Cangzhou。

论文下载:https://pan.baidu.com/s/1slPcLVf

Ruiyuan讲解的PPT:https://pan.baidu.com/s/1hsibN72

做什么?

社交网络中,如Twitter、微博,用户经常会发一些带有地理位置的状态。这篇文章主要是从历史轨迹数据(其实是check in的数据)中找出带有语义信息的轨迹模式。这里特定指长度为2的轨迹模式。原文为:To discover semantic trajectory patterns with respect to ‘latent topics’ of geo-tagged messages. 具体方法请看前文的ppt链接。


不足之处

Ruiyuan认为此文章的不足之处包括:

(1) 未提及此方法在实际场景的应用。我们为其想了一下应用场景,包括:地点推荐,活动推荐,好友推荐

(2) 作者的方法基于LDA,未介绍LDA的基本知识,以及他们提出的模型与LDA模型的映射关系。作者可能假设读者都对LDA模型非常熟悉。

(3) 觉得作者提出的模型过于复杂,有点杀鸡用牛刀的感觉。

(4) 因为方法过于复杂,导致在处理大规模数据时可能会出现问题(效率太慢)。论文实验部分只用到了少量的数据(6天的Twitter数据)。

(5) 只能挖掘出长度为2的模式

0 条评论

    发表评论

    电子邮件地址不会被公开。 必填项已用 * 标注