基于条件随机场的敏感话题检测模型研究

被引:7
作者
翟东海 [1 ,2 ]
崔静静 [1 ]
聂洪玉 [1 ]
于磊 [1 ]
杜佳 [2 ]
机构
[1] 西南交通大学信息科学与技术学院
[2] 西藏大学工学院
关键词
敏感话题检测; 条件随机场; 特征函数; 特征词项; Viterbi算法; 敏感性标注;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
敏感话题通常包含态度倾向性,且具有一定的先验知识,如何有效利用这些先验知识来判断网络文本的敏感性是敏感话题检测的研究难点和热点。在充分利用条件随机场强大知识拟合能力的基础上,提出一种基于条件随机场的敏感话题检测模型。抽取特征词项,并结合敏感词汇库,将待检测文档和敏感话题类别分别表示为条件随机场中的观察序列和状态序列,再利用敏感话题类别中的先验知识来构造特征函数,从而使观察序列和状态序列建立联系。将待测文档中的特征项根据概率标注为敏感话题类别中的词项,在此过程中采用Viterbi算法对观察序列的可信度进行估计,并依据估计所得的概率值对待测文档中的特征项进行敏感性标注。实例验证结果表明,该算法能够得到较好的准确率、召回率和F度量值。
引用
收藏
页码:158 / 162+167 +167
页数:6
相关论文
共 4 条
[1]   一种基于文本语义的网络敏感话题识别方法 [J].
刘霁 ;
周亚东 ;
高峰 ;
赵俊舟 ;
薛峰 .
深圳信息职业技术学院学报, 2011, 9 (03) :33-37
[2]   中文名词性谓词语义角色标注 [J].
李军辉 ;
周国栋 ;
朱巧明 ;
钱培德 .
软件学报, 2011, 22 (08) :1725-1737
[3]   基于层叠条件随机场模型的中文机构名自动识别 [J].
周俊生 ;
戴新宇 ;
尹存燕 ;
陈家骏 .
电子学报, 2006, (05) :804-809
[4]  
Hot topic detection on BBS using aging theory .2 D.H. Zheng,F. Li. Proceedings ofInternational Conference on Web Information Systems and Mining . 2009