基于神经网络的蛋白质二级结构预测

被引:7
作者
解筱
杨波
陈月辉
机构
[1] 济南大学信息科学与工程学院
关键词
神经网络; 粒子群算法(PSO); 蛋白质二级结构预测;
D O I
10.13349/j.cnki.jdxbn.2008.02.005
中图分类号
Q51-3 [];
学科分类号
071010 ; 081704 ;
摘要
提出一种蛋白质二级结构预测的新方法。该方法首先对数据集中的氨基酸序列利用PSI-BLAST程序进行同源序列搜索,得到相应的PSSM矩阵,然后利用滑动窗口方法对矩阵进行编码,得到分类器的输入。采用分类器集成,将所有的样本划分成9个互斥训练集对单个子分类器进行训练。然后,9个单独的0-1子分类器通过最大投票法进行集成,形成识别一种特定的蛋白质二级结构的0-1分类器。这样3个0-1分类器模型通过串行集成,可以对蛋白质的三种二级结构(H/E/C)进行识别。通过对标准数据集RS126,CB396,CB513进行测试发现,对于同一分类器,利用PSSM矩阵作为分类器输入的预测准确率要高于直接将蛋白质序列作为输入的预测率。
引用
收藏
页码:111 / 115
页数:5
相关论文
共 11 条
[1]  
Orthogonal least squares learning algorithms for radial basis function networks. Chen S,Cowan C F N,Grant P M. IEEE ACM Transactions on Networking . 1991
[2]   一种改进的支持向量机NN-SVM [J].
李红莲 ;
王春花 ;
袁保宗 .
计算机学报, 2003, (08) :1015-1020
[3]   粒子群优化算法 [J].
李爱国 ;
覃征 ;
鲍复民 ;
贺升平 .
计算机工程与应用, 2002, (21) :1-3+17
[4]   基于支持向量机与无监督聚类相结合的中文网页分类器 [J].
李晓黎 ;
刘继敏 ;
史忠植 .
计算机学报, 2001, (01) :62-68
[5]  
生物信息学[M]. 清华大学出版社[美]AndreasD.Baxevanis[美]B.F.FrancisOuellette著, 2000
[6]  
统计学习理论的本质[M]. 清华大学出版社 , (美)VladimirN.Vapnik著, 2000
[7]  
蛋白质的结构预测与分子设计[M]. 北京大学出版社 , 来鲁华等编著, 1993
[8]  
The SWISS-PORTprotein sequence data-base and its supplement TrEMBL. Bairoch A,Apweiler R. Nucleic Acids Research . 2005
[9]  
View-based 3D object recognition withSupport Vector Machines. Roobaert D,Van Hulle. 1999 IEEE Workshop onNeural Networks for Signal Processing . 1999
[10]  
How initial conditions affect generalization performance in large networks. Atiya A,Ji C Y. IEEE Transactions on Neural Networks . 1997