微博中用户标签的研究

被引:40
|
作者
邢千里
刘列
刘奕群
张敏
马少平
机构
[1] 清华大学计算机科学与技术系
关键词
微博; 用户标签; 主题模型; 关注关系预测;
D O I
10.13328/j.cnki.jos.004655
中图分类号
TP393.092 [];
学科分类号
摘要
微博环境中用户可以为自己添加标签,用户所添加的标签往往被视为是对自身特点和兴趣的重要描述信息.标签中所包含的信息可能有助于建立精确的用户描述,因此在个性化推荐、专家检索、影响力分析等应用中有潜在的应用价值.首先,在大规模数据上分析和研究了微博中用户添加标签的行为及标签内容分布的特点;之后,通过主题模型对用户的微博内容进行分析,实验结果表明:用户的标签越相似,微博内容也越相似,反之亦然;随后,分析了用户关注关系与微博和标签内容之间的联系,实验结果显示,有关注关系的用户之间微博和标签的内容越相似;基于这个发现,分别使用标签内容和微博内容对真实微博数据中的用户关注关系进行预测,结果表明:基于标签的预测方法其效果明显优于基于微博内容的预测方法,显示出用户标签在描述用户兴趣方面的价值.
引用
收藏
页码:1626 / 1637
页数:12
相关论文
共 2 条
  • [1] 一种面向微博用户的标签推荐方法
    陈渊
    林磊
    孙承杰
    刘秉权
    [J]. 智能计算机与应用, 2011, 1 (05) : 21 - 26
  • [2] ON INFORMATION AND SUFFICIENCY
    KULLBACK, S
    LEIBLER, RA
    [J]. ANNALS OF MATHEMATICAL STATISTICS, 1951, 22 (01): : 79 - 86