倾向性文本判别相关特征的研究

被引:1
作者
吴明芬 [1 ,2 ]
陈涛 [1 ,2 ]
曹存根 [1 ]
机构
[1] 中国科学院计算技术研究所
[2] 五邑大学计算机学院
基金
广东省自然科学基金; 广东省科技计划;
关键词
倾向性文本; 依存关系; 词性; 特征集;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
通过大规模语料实验和分析,揭示倾向性文本与普通文本在词性特征、依存关系、依存关系中的词性特征、邻接依存关系以及邻接依存关系中的词性特征等五个方面客观存在的差异。总结出若干有意义的结论,如:名词、副词、拟声词、状中结构、副词动词序列等在有倾向性文本中占有率明显高于普通文本;地理名、专有名词、定中关系、名词名词序列等在有倾向性文本中占有率明显低于普通文本等等。这些结论可以作为使用机器学习方法进行本文倾向性判断与分析的特征集使用。
引用
收藏
页码:44 / 48
页数:5
相关论文
共 12 条
[1]  
Support Vector Learning for Semantic Argument Classification[J] . Sameer Pradhan,Kadri Hacioglu,Valerie Krugler,Wayne Ward,James H. Martin,Daniel Jurafsky. &nbspMachine Learning . 2005 (1)
[2]  
知识工程语言学[M]. 清华大学出版社 , 鲁川, 2010
[3]  
The FrameNet Project. Collin Baker. https://framenet.icsi.berkeley.edu/fndrupal . 2012
[4]   Automatic Labeling of semantic roles [J].
Gildea, D ;
Jurafskyy, D .
COMPUTATIONAL LINGUISTICS, 2002, 28 (03) :245-288
[5]   基于最大熵分类器的语义角色标注 [J].
刘挺 ;
车万翔 ;
李生 .
软件学报, 2007, (03) :565-573
[6]   汉语语句主题语义倾向分析方法的研究 [J].
姚天昉 ;
娄德成 .
中文信息学报, 2007, (05) :73-79
[7]  
The Penn-CU Chinese Treebank Project. Linguistic Data Consortium. http://verbs.colorado.edu/chinese/ctb.html/ . 2000
[8]   文本情感分析 [J].
赵妍妍 ;
秦兵 ;
刘挺 .
软件学报, 2010, 21 (08) :1834-1848
[9]   基于句法路径的情感评价单元识别 [J].
赵妍妍 ;
秦兵 ;
车万翔 ;
刘挺 .
软件学报, 2011, 22 (05) :887-898
[10]  
From lexical semantics to argument realization. Levin, Beth,Rappaport, M. Hovav. . 1996