一种基于Subject-Action-Object三元组的知识基因提取方法

被引:15
作者
许琦 [1 ,2 ]
顾新建 [1 ]
机构
[1] 浙江大学机械工程学系工业工程中心
[2] 台州职业技术学院机电一体化技术实验室
关键词
知识基因; subject-action-object三元组; 专利引证网络; 知识进化; 语义相似度;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
以专利引证网络为载体,从知识基因稳定性、遗传性以及变异性等基本特征出发,提出一种基于subject-action-object三元组的知识基因提取方法.应用连接度算法分析专利引证关系,挖掘引证专利和被引专利之间继承和发展的知识流,建立知识进化轨迹;利用文本语法分析技术,从专利权利要求书中提取subject-action-object三元组;基于语义词库WordNet进行语义加工,计算语义相似度,合并同义的subject-action-object三元组,绘制知识基因图谱.从美国专利数据库中采集了5 073项1975—1999年授权的数据挖掘领域的相关专利,分析了专利的地区分布情况和年度分布情况.从NBER(National Bureau of Economic Research)的专利数据集中查询得到专利引证关系,利用网络分析软件Pajek构建专利引证网络,作为实验数据样本,对所提出的知识基因提取方法进行验证.实验结果表明:所提取的subject-action-object三元组具备了知识基因稳定性、遗传性和变异性等特征,可以作为知识基因的一种表现形式.
引用
收藏
页码:385 / 399
页数:15
相关论文
共 19 条
[1]   知识基因探索(十二) [J].
刘植惠 .
情报理论与实践, 1999, (06) :459-462
[2]   知识基因探索(十一) 第十一讲 知识的变异运动 [J].
刘植惠 .
情报理论与实践, 1999, (05) :380-383
[3]   知识基因探索(十) 第十讲 知识的遗传运动 [J].
刘植惠 .
情报理论与实践, 1999, (04)
[4]   知识基因探索(九) 第九讲 科学学科 [J].
刘植惠 .
情报理论与实践 , 1999, (03) :77-81
[5]   知识基因探索(八) [J].
刘植惠 .
情报理论与实践 , 1999, (02) :78-81
[6]   知识基因探索(七) [J].
刘植惠 .
情报理论与实践, 1999, (01) :62-65
[7]   知识基因探索(六) 第六讲 知识基因原理在情报分析研究中的应用 [J].
刘植惠 .
情报理论与实践, 1998, (06) :63-65
[8]   知识基因探索(五) 第五讲 知识的繁衍表(下) [J].
刘植惠 .
情报理论与实践 , 1998, (05) :62-64
[9]   知识基因探索(三) 第三讲 基于进化时序的知识分类 [J].
刘植惠 .
情报理论与实践 , 1998, (03) :60-62
[10]   知识基因探索(二) [J].
刘植惠 .
情报理论与实践, 1998, (02) :63-65