动态热门话题的“特征词条本体”自动构建与进化研究

被引:3
作者
马静
何雪枫
简旭文
机构
[1] 南京航空航天大学经济与管理学院
关键词
特征词条; 本体生成; 本体进化; 话题跟踪;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
【目的】设计一种"特征词条本体"的自动构建及进化算法。【应用背景】热门话题产生的时间和话题演化往往是快速的,且涉及领域广泛,而现有的本体自动构建研究局限于具体领域的知识表达,无法有效地对这种动态热门话题进行本体语义支持,也不能进行有效跟踪与优化。【方法】通过对热门话题中关键事件的内容分析并由特征词组合而成的"特征词条本体"来描述热门话题的方法,设计一种快速自动生成"特征词条本体"的算法;在初始本体指导下,利用话题跟踪结果进行"特征词条本体"进化算法的设计,以满足不断更新的话题语义表述需求。【结果】针对热门话题"魏则西百度推广事件",使用爬虫工具采集11 174条新浪微博作为语料库进行实验,抽取生成拥有7 421个特征词条、39个特征词节点、781个特征词关系的初始本体,基于话题跟踪结果进化为拥有24 564个特征词条,67个特征词节点,1 818个特征词关系的进化本体,其漏报率、误报率、损耗代价分别为0.1261,0.0964,0.5985,优于TF-IDF算法。【结论】"特征词条本体"的表述方式明显比单个词汇的本体表述准确率高,且语义相似度更容易计算,比较符合动态热门话题的快速语义处理。
引用
收藏
页码:33 / 41
页数:9
相关论文
共 14 条
[1]   基于知识管理的本体自动构建算法研究 [J].
郑学伟 .
计算机技术与发展, 2014, 24 (12) :64-68
[2]   话题跟踪中静态和动态话题模型的核捕捉衰减 [J].
洪宇 ;
仓玉 ;
姚建民 ;
周国栋 ;
朱巧明 .
软件学报, 2012, 23 (05) :1100-1119
[3]   国外本体构建方法比较分析 [J].
尚新丽 .
图书情报工作, 2012, 56 (04) :116-119
[4]   面向知识与信息管理的领域本体自动构建算法 [J].
侯鑫 ;
张旭堂 ;
金天国 ;
彭高亮 ;
刘文剑 .
计算机集成制造系统, 2011, 17 (01) :159-170
[5]   知网的话题更新与跟踪算法研究 [J].
焦健 ;
瞿有利 .
北京交通大学学报, 2009, (05) :132-136
[6]   特定领域本体自动构造方法 [J].
何婷婷 ;
张小鹏 .
计算机工程, 2007, (22) :235-237
[7]   话题检测与跟踪的评测及研究综述 [J].
洪宇 ;
张宇 ;
刘挺 ;
李生 .
中文信息学报, 2007, (06) :71-87
[8]   学科领域本体的构建与进化——以经济学领域本体为例 [J].
杜小勇 ;
马文峰 ;
武文娟 .
现代图书情报技术, 2007, (03) :7-12
[9]   本体学习研究综述 [J].
杜小勇 ;
李曼 ;
王珊 .
软件学报, 2006, (09) :1837-1847
[10]   领域本体进化研究 [J].
马文峰 ;
杜小勇 .
图书情报工作, 2006, (06) :71-75