基于本体的话题检测与跟踪技术

被引:3
作者
刘炜 [1 ]
李明 [1 ]
杨合立 [2 ]
机构
[1] 兰州理工大学计算机与通信学院
[2] 兰州理工大学教务处
关键词
TDT; 本体; WordNet; 文本相似度; 新事件检测; 语义矢量;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
基于前人在TDT中对语义矢量的相似性计算研究,以及本体和语法结构在文本相似性研究方面的应用成果,提出了以词频分析作为辅助手段,将新闻中的关键要素归纳为时间、空间、参与事件的主客体、行为等几个语义类;借助WordNet与本体技术计算文档特征词的相似度,并且结合文本的语法结构特点,共同应用于文本的相似度计算,并以此作为新事件检测中相似度计算的基础,提高新事件检测的准确性。
引用
收藏
页码:42 / 45
页数:4
相关论文
共 3 条
[1]   一种基于主谓宾结构的文本检索算法 [J].
黄承慧 ;
印鉴 ;
侯昉 .
计算机科学, 2010, 37 (09) :173-176
[2]   基于WordNet的概念语义相似度研究 [J].
李熙 ;
徐德智 .
湖南科技学院学报, 2008, (12) :115-116
[3]  
A Concept-based Model for Enhancing Text Categorization .2 SHEHATA S,KARRAY F,KAMEL M. Proceedings of KDD 2007 . 2007