共 24 条
我国专利数据中发明家姓名消歧算法研究
被引:15
作者:
刘斌
[1
]
赵升
[1
]
孙笑明
[2
]
裴云龙
[3
,4
]
机构:
[1] 北京化工大学经济管理学院
[2] 西安建筑科技大学管理学院
[3] 西安交通大学管理学院中国管理问题研究中心
[4] 过程控制与效率工程教育部重点实验室
来源:
关键词:
专利数据;
发明家;
姓名消歧;
阈值;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
G255.53 [专利];
学科分类号:
081203 ;
0835 ;
1205 ;
120501 ;
摘要:
专利数据是分析企业创新网络和技术情报的重要信息来源,基于专利数据资源进行著录项信息整合、分析和挖掘在企业创新实践中有着重要应用。然而,由于形近字和同音字的存在,在基于汉字的某些输入法向我国专利数据库中录入著录项信息时,很容易产生发明家姓名歧义问题,这些歧义会影响企业对优秀发明家的识别、挖掘和培养,而且还会影响到发明家及其合作关系作用等的考察。鉴于此,针对发明家姓名中可能产生的歧义,本文在大规模专利数据环境下设计了一套发明家姓名消歧算法。最后以国内医药企业的专利信息为实例,验证了消歧算法的有效性和科学性,揭示了该算法对提高专利信息清洗效率的重要作用。
引用
收藏
页码:405 / 414
页数:10
相关论文

