我国专利数据中发明家姓名消歧算法研究

被引:15
作者
刘斌 [1 ]
赵升 [1 ]
孙笑明 [2 ]
裴云龙 [3 ,4 ]
机构
[1] 北京化工大学经济管理学院
[2] 西安建筑科技大学管理学院
[3] 西安交通大学管理学院中国管理问题研究中心
[4] 过程控制与效率工程教育部重点实验室
关键词
专利数据; 发明家; 姓名消歧; 阈值;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; G255.53 [专利];
学科分类号
081203 ; 0835 ; 1205 ; 120501 ;
摘要
专利数据是分析企业创新网络和技术情报的重要信息来源,基于专利数据资源进行著录项信息整合、分析和挖掘在企业创新实践中有着重要应用。然而,由于形近字和同音字的存在,在基于汉字的某些输入法向我国专利数据库中录入著录项信息时,很容易产生发明家姓名歧义问题,这些歧义会影响企业对优秀发明家的识别、挖掘和培养,而且还会影响到发明家及其合作关系作用等的考察。鉴于此,针对发明家姓名中可能产生的歧义,本文在大规模专利数据环境下设计了一套发明家姓名消歧算法。最后以国内医药企业的专利信息为实例,验证了消歧算法的有效性和科学性,揭示了该算法对提高专利信息清洗效率的重要作用。
引用
收藏
页码:405 / 414
页数:10
相关论文
共 24 条
[1]   文献数据库中作者名消歧算法研究 [J].
郭舒 .
现代图书情报技术, 2013, (Z1) :69-74
[2]   基于专利分析的企业研发人员管理 [J].
张善杰 ;
陈伟炯 ;
陆亦恺 .
经营与管理, 2012, (07) :83-85
[3]   一种面向篇级数据的作者名消歧规则和算法 [J].
肖晶 ;
梁冰 ;
张晓丹 ;
吕世炅 .
现代图书情报技术, 2012, (05) :55-59
[4]   中文数据清洗研究综述 [J].
叶鸥 ;
张璟 ;
李军怀 .
计算机工程与应用 , 2012, (14) :121-129
[5]   基于层次聚类算法的中文人名消歧 [J].
章顺瑞 ;
游宏梁 .
现代图书情报技术, 2010, (11) :64-68
[6]   基于专利地图的R&D联盟专利战略制定方法研究 [J].
王珊珊 ;
田金信 .
科学学研究, 2010, 28 (06) :846-852
[7]   企业竞争情报中的专利策略研究 [J].
梁莹 ;
徐福缘 .
情报理论与实践, 2010, 33 (03) :84-86+83
[8]   一种基于Token匹配的中文数据清洗方法 [J].
刘嘉 ;
张璟 ;
李军怀 .
计算机应用与软件, 2009, 26 (11) :43-45+53
[9]   专利的相关性检索与集成应用研究 [J].
叶作亮 ;
高千惠 ;
陈国海 .
科研管理, 2009, 30 (05) :40-46
[10]   基于拼音索引的中文模糊匹配算法 [J].
曹犟 ;
邬晓钧 ;
夏云庆 ;
郑方 .
清华大学学报(自然科学版), 2009, 49 (S1) :1328-1332