学术文本的结构功能识别——基于段落的识别

被引:38
|
作者
黄永
陆伟
程齐凯
桂思思
机构
[1] 武汉大学信息管理学院信息检索与知识挖掘研究所
关键词
结构功能; 文本分类; 文本挖掘;
D O I
暂无
中图分类号
G353.1 [情报资料的分析和研究];
学科分类号
摘要
学术文本的结构功能识别是学术文本章节层次的文本分类问题,其本质就是识别章节的结构功能。本文将基于段落的学术文本结构功能识别分为两个子问题:段落位置识别及基于段落投票的章节结构功能识别。在自动构建的大规模数据集上的实验结果表明,虽然基于段落的结构功能识别效果不如基于章节整体内容的识别,但仍然取得了不错的效果。本文结合实验结果着重分析了影响基于段落的识别效果的两个重要因素:段落长度及章节中段落数量,并在最后对学术文本结构功能识别的三个层次做了总结,指出了拟进一步探讨的问题和方向。
引用
收藏
页码:530 / 538
页数:9
相关论文
共 8 条
  • [1] 学术文本的结构功能识别——功能框架及基于章节标题的识别
    陆伟
    黄永
    程齐凯
    [J]. 情报学报, 2014, 33 (09) : 979 - 985
  • [2] Measuring academic influence: Not all citations are equal[J] . Xiaodan Zhu,Peter Turney,Daniel Lemire,André Vellino.J Assn Inf Sci Tec . 2015 (2)
  • [3] Where are citations located in the body of scientific articles? A study of the distributions of citation locations
    Hu, Zhigang
    Chen, Chaomei
    Liu, Zeyuan
    [J]. JOURNAL OF INFORMETRICS, 2013, 7 (04) : 887 - 896
  • [4] The distribution of references across texts: Some implications for citation analysis[J] . Ying Ding,Xiaozhong Liu,Chun Guo,Blaise Cronin.Journal of Informetrics . 2013 (3)
  • [5] Grasping the structure of journal articles: Utilizing the functions of information units[J] . LeiZhang.J. Am. Soc. Inf. Sci. . 2012 (3)
  • [6] The Schematic Structure of Computer Science Research Articles[J] . Santiago Posteguillo.English for Specific Purposes . 1998 (2)
  • [7] The medical research paper: Structure and functions[J] . Kevin Ngozi Nwogu.English for Specific Purposes . 1997 (2)
  • [8] Position-aligned translation model for citation recommendation .2 He Jing,Nie Jian Yun,Lu Yang,et al. String Processing and Information Retrieval . 2012