Generating peptide candidates from amino-acid sequence databases for protein identification via mass spectrometry

被引：0

作者：

Edwards, N ^{[1
]}

Lippert, R ^{[1
]}

机构：

[1] Celera Genom, Rockville, MD USA

来源：

ALGORITHMS IN BIOINFORMATICS, PROCEEDINGS | 2002年 / 2452卷

关键词：

D O I：

暂无

中图分类号：

Q81 [生物工程学（生物技术）]; Q93 [微生物学];

学科分类号：

071005 ; 0836 ; 090102 ; 100705 ;

摘要：

Protein identification via mass spectrometry forms the foundation of high-throughput proteomics. Tandem mass spectrometry, when applied to a complex mixture of peptides, selects and fragments each peptide to reveal its amino-acid sequence structure. The successful analysis of such an experiment typically relies on amino-acid sequence databases to provide a set of biologically relevant peptides to examine. A key sub-problem, then, for amino-acid sequence database search engines that analyze tandem mass spectra is to efficiently generate all the peptide candidates from a sequence database with mass equal to one of a large set of observed peptide masses. We demonstrate that to solve the problem efficiently, we must deal with substring redundancy in the amino-acid sequence database and focus our attention on looking up the observed peptide masses quickly. We show that it is possible, with some preprocessing and memory overhead, to solve the peptide candidate generation problem in time asymptotically proportional to the size of the sequence database and the number of peptide candidates output.

引用

页码：68 / 81

页数：14

共 50 条

[31] VERIFICATION OF THE DNA PREDICTED AMINO-ACID SEQUENCE OF BACTERIOPHAGE-P22 TAIL PROTEIN BY MASS-SPECTROMETRY
BECKNER, CF
CAPRIOLI, RM
BIOMEDICAL MASS SPECTROMETRY, 1985, 12 (08): : 393 - 398
[32] PROTEIN IDENTIFICATION IN DNA DATABASES BY PEPTIDE MASS FINGERPRINTING
JAMES, P
QUADRONI, M
CARAFOLI, E
GONNET, G
PROTEIN SCIENCE, 1994, 3 (08) : 1347 - 1350
[33] Peptide identification via tandem mass spectrometry
Wu, Xue
Edwards, Nathan
Tseng, Chau-Wen
ADVANCES IN COMPUTERS , VOL 68: COMPUTATIONAL BIOLOGY AND BIOINFORMATICS, 2006, 68 : 253 - 278
[34] IDENTIFICATION OF PROTEINS IN SEQUENCE DATABASES FROM AMINO-ACID-COMPOSITION DATA
SIBBALD, PR
SOMMERFELDT, H
ARGOS, P
ANALYTICAL BIOCHEMISTRY, 1991, 198 (02) : 330 - 333
[35] Probability-based protein identification by searching sequence databases using mass spectrometry data
Perkins, DN
Pappin, DJC
Creasy, DM
Cottrell, JS
ELECTROPHORESIS, 1999, 20 (18) : 3551 - 3567
[36] AMINO-ACID SEQUENCE OF THE PEPTIDE MOIETY OF THE PSEUDOMUREIN FROM METHANOBACTERIUM-THERMOAUTOTROPHICUM
KONIG, H
KANDLER, O
ARCHIVES OF MICROBIOLOGY, 1979, 121 (03) : 271 - 275
[37] MASS SPECTROMETRIC DETERMINATION OF AMINO-ACID SEQUENCE OF PEPTIDES
SHEMYAKIN, MM
OVCHINNIKOV, YA
KIRYUSHKIN, AA
VINOGRADOVA, EI
MIROSHNIKOV, AI
ALAKHOV, YB
LIPKIN, VM
SHVETSOV, YB
WULFSON, NS
ROSINOV, BV
BOCHKAREV, VN
BURIKOV, VM
NATURE, 1966, 211 (5047) : 361 - +
[38] ASSESSMENT OF PROTEIN SEQUENCE IDENTITY FROM AMINO-ACID COMPOSITION DATA
CORNISHBOWDEN, A
JOURNAL OF THEORETICAL BIOLOGY, 1977, 65 (04) : 735 - 742
[39] CALCULATION OF PROTEIN EXTINCTION COEFFICIENTS FROM AMINO-ACID SEQUENCE DATA
GILL, SC
VONHIPPEL, PH
ANALYTICAL BIOCHEMISTRY, 1989, 182 (02) : 319 - 326
[40] FAST ATOM BOMBARDMENT TANDEM MASS-SPECTROMETRY FOR AMINO-ACID SEQUENCE DETERMINATION IN TRIPEPTIDES
KULIK, W
HEERMA, W
BIOMEDICAL AND ENVIRONMENTAL MASS SPECTROMETRY, 1989, 18 (10): : 910 - 917

← 1 2 3 4 5 →