An Objective Reduction Technique of Proteomic Mass Spectra Based on Multi-Scale Fuzzy Thresholding. Technique Objective de Traitement des Spectres de Masse Protéomiques Basée sur le Seuillage Flou Multi-Échelle

An Objective Reduction Technique of Proteomic Mass Spectra Based on Multi-Scale Fuzzy Thresholding

Technique Objective de Traitement des Spectres de Masse Protéomiques Basée sur le Seuillage Flou Multi-Échelle

N. M. Nafati J.-M. Guigonis  B. Rossi  M. Samson 

IFR50, Plate-Forme Protéomique Nice-Pasteur, Faculté de Médecine, Nice, France

Page: 
225-239
|
Received: 
1 September 2005
|
Accepted: 
N/A
|
Published: 
30 June 2007
| Citation

OPEN ACCESS

Abstract: 

A proteomic approach offers a powerful and complementary tool to genomics.It allows to index and characterize proteins,and,for example,to compare their levels of expression between healthy and pathological states.Proteomic analyses are mainly based on the separation of proteins by two-dimensional gel electrophoresis and their subsequent identification by comparing the data from Mass Spectrometry (SM) analyses to the theoretical ones contained in databases.

In mass spectrometry,the detector noise,the electronic and chemical noise,sometimes the small amount of peptides that has to be treated and finally the spectrum reduction noise (due to bad filtering and/or thresholding),can induce Parasitic Mass Peaks (PMP) and/or hide some Useful Mass Peaks (UMP) of low intensities.The immediate consequence is that the presence of the PMP and the absence of the UMP will be detrimental to the protein identification quality.In this article,we propose an original algorithm eliminating the PMP,detecting and amplifying those which are useful.The preprocessing principle uses a multi-scale analysis technique coupled to a fuzzy thresholding (multi-scale fuzzy thresholding),a local amplification of the UMP,and finally an adaptive Base Line Correction.

The associated frequencies with the PMP are distributed on all the spectrum pass bandwidth.This leads us to a dyadic tree structure subband decomposition.The algorithm principle consists of dividing the frequential pass bandwidth of each masses spectrum into two subbands,a Low and High Frequency (LF,HF) subband,then each subband is in turn divided into two subbands etc.The HF subbands are then thresholded according to the minimization criterion of the Shannon fuzzy entropy,and then amplified locally; the base line is calculated in an adaptive way and subtracted from reconstructed spectrum.To evaluate the quality of this algorithm,we present a comparison of the results obtained by our algorithm,and those obtained by the DataExplorer software.The latter is a reduction software provided within the MALDI-TOF spectrometer software package.

Résumé

La protéomique offre une approche puissante et complémentaire à la génomique. Elle permet de répertorier et caractériser les protéines,de comparer leur niveau d’expression entre un état physiologique sain et malade par exemple. L’analyse protéomique se fait essentiellement par l’utilisation de la technique d’électrophorèse bidimensionnelle couplée à la technique d’analyse par Spectrométrie de Masse (SM). La première,aidée par l’imagerie protéomique,conduit à la localisation des protéines candidates à une analyse par SM. La comparaison des spectres de masses obtenus à des bases de données protéiques,conduit à l’identification des protéines d’intérêt en terme de peptides. Le problème qui se pose souvent est que les spectres sont bruités et pauvres en masses. En effet,le bruit du détecteur,le bruit électronique et chimique,la présence de peu de matériel protéique et enfin le bruit de la réduction des spectres (mauvais filtrage et/ou seuillage),tous ces bruits peuvent induire des Pics de Masses Parasites (PMP) et/ou supprimer des Pics de Masses Utiles (PMU) de faible intensité. La conséquence immédiate est que la présence des PMP et l’absence des PMU seront utilisées au dépens de la qualité d’identification de la protéine. 

Dans cet article,nous proposons un algorithme original éliminant les PMP,détectant et amplifiant ceux utiles. Le principe du pré-traitement utilise une Analyse Multirésolution (AM) couplée à un seuillage basé sur la logique floue (seuillage flou multi-échelle),une amplification locale des PMU,et enfin une correction adaptative de la Ligne de Base (LB). Les fréquences associées aux PMP sont réparties sur toute la bande passante du spectre,ce qui nous conduit à une AM dite en arbre. Le principe consiste à découper la bande passante fréquentielle de chaque spectre de masses en deux sous-bandes,une Basse Fréquence (BF),l’autre Haute Fréquence (HF),ensuite chaque sous-bande est à son tour découpée en deux sous-bandes etc. Les sous-bandes HF sont seuillées selon le critère de minimisation de l’entropie floue de Shannon et amplifiées localement,la ligne de base est calculée automatiquement et soustraite du spectre reconstruit. Pour évaluer la qualité de cet algorithme,nous présentons une comparaison des résultats obtenus par notre algorithme,et ceux fournis par le spectromètre MALDI-TOF (Matrix Assisted Laser Desorption/Ionisation-Time Of Flight),qui utilise le logiciel « DataExplorer » comme logiciel de réduction. 

Keywords: 

Proteomic approch,Two-dimensional electrophoresis,Mass Spectrometry,Proteinic databases,Multi-scale Fuzzy Thresholding,Adaptive Base Line Correction,Shannon Fuzzy Entropy,DataExplorer Software,MALDI-TOF.

Mots clés

Protéomique,Electrophorèse bidimensionnelle,Spectrométrie de Masse (MS),Bases de données protéiques, Seuillage flou multi-échelle,Amplification locale,Correction adaptative de la ligne de base,Entropie floue de Shannon,MALDI-TOF,DataExplorer.

1. Introduction
2. Approche Protéomique
3. Principe d’Identification Protéomique par Spectrométrie de Masse
4. Algorithme Proposé
5. Résultats
6.Conclusion
Annexe I
Annexe II
Annexe III
Annexe IV
  References

[1] Applied Biosystems. Data Explorer™ Software. User Guide. Version 4.0 Software. Printed in the United States of America. Part Number 4317717 Rev. A, 08/2000. 

[2] Applied Biosystem. Removing Chemical Background from QSTAR® XL System Spectra Using a Fast Fourier Transformation Filter: Technical Note 115155. 

[3] A. ABBOTT A Post-Genomic Challenge: Learning to Read Patterns of Protein Synthesis. Nature 402, 1999, pp. 715-720. 

[4] NL. ANDERSON. Proteome and Proteomics. New Technologies, new concepts, and new words. Electrophoresis. 1998, pp. 1853-1861. 

[5] P. BERNDT, U. HOBOHM , H. LANGEN. Reliable Automatic Protein Identification From Matrix-Assisted Laser Desorption/Ionization Mass Spectrometric Peptide Fingerprints. Electrophoresis 20, 1999, pp. 3521-3526. 

[6] K.L. BUSCH. Chemical noise in mass spectrometry - Part I. Mass Spectrometry Forum Issue of Spectroscopy. October, 2002. 

[7] G. CHANG, B. YU, and M. VETTERLI. Adaptive wavelet thresholding for image denoising and compression. IEEE Trans. Image Processing 9: pp. 1532-1546, 2000. 

[8] J. GODOVAC-ZIMMERMANN, L. R. BROWN. Perspectives For Mass Spectrometry and Functional Proteomics. Mass Spectrometry Reviews, 2001, Rev. 20, pp. 1-57. 

[9] S. GOLOTVIN,A. WILLIAMS, Improved Baseline Correction of FT NMR Spectra. Advanced Chemistry Development, NMR Newsletter Advanced Chemistry Development, 1999.

[10] S. GRACE, B. YU, M. VETTERLI, Adaptive wavelet Thresholding for Denoising and Compression, IEEE Transactions on image processing, Vol. 9, NO.9, 2000, pp. 1532-1546. 

[11] H. HAUSSECKER, H. R. TIZHOOSH. Fuzzy Image Processing. I. Handbook of Computer Vision Application. Edited by B. Jagne, H. Haussecker, and P. Geisster,Academic Press 1999. 

[12] E. D. JANSING, T. A. ALBERT, D. L. CHENOWETH, Two Dimensional Entropy Segmentation. Pattern Recognition Letters 20, Letters 20, 1999, pp. 329-336. 

[13] H. LIM, J. ENG, J.R. YATES, S.L TOLLAKSEN, C.S. GIOMETTI, J.F HOLDEN, M.W.W. ADAMS, C.I. REICH, G.J. OLSEN, L.G. HAYS. Identification of 2D-gel proteins: A comparison of MALDI/TOF peptide mass mapping to LC-ESI tandem mass spectrometry. Journal of the American Society for Mass Spectrometry, Volume 14, Issue 9, 2003, pp. 957-970. 

[14] A. LINDEGREN, Analysis of Proteomic Patterns for Detection of Prostate Cancer. Master Thesis. 2004. 

[15] P. LIO, Wavelets in bioinformatics and computational biology: state of and perspectives, Bioinformatics, Vol. 19, 2003, pp. 2-9. 

[16] B. LIU, Y. SERA, N. MATSUBARA, K. OTSUKA, S. TERABE. Signal Denoising by Wavelets for Microchip Electrophoresis, TokyoSociety for Chromatograpghic Sciences, Vol. 23, 2002, pp. 59-60. 

[17] D.I. MALYARENKO, W.E. COOKE, B.L. ADAM, G. MALIK, H. CHEN, E.R. TRACY, M.W. TROSSET, M. SASINOWSKI, O.J Semmes, and D. M. MANOS. Enhancement of sensitivity and resolution of Surface-Enhanced Laser Desorption/Ionisation Time-ofFlight Mass Spectrometric Records for Serum Peptides Using Times Series Analysis Technique, Proteomics and Protein Markers, Clinical Chemistry, 2005, pp. 65-74.

[18] M. MANN. Quantitative proteomics, Nat Biotechnol. 17, 1999, pp. 954-955. 

[19] N. NAFATI. Synthèse itérative et simultanée de banc de filtres bi orthogonaux de reconstruction parfaite avec des critères adaptés aux applications de codage de la parole et de l’image, GRETSI Grenoble France. 1997, pp. 1085-1088. Septembre. 

[20] P. NUGUES. Interprétation de Gels d’Electrophorèses 2D, Thèse de Doctorat, Université de Nancy, 1989. 

[21] F. PARISI. Analysis of SELDI mass spectra of ovarian cancer blood serum samples. Thesis for the Degree of Master of Science. Master’s Programme in Bioinformatics. Chalmers University of Technology and Göteborg University. Sweden. March 2004. 

[22] T. D. PHAM. A New Approach for Calculating Implications of Fuzzy Rules. IEEE International Conference on Artificial Intelligence Systems, 2002, pp. 71.

[23] J. POLEC, J. PAVLOVIEOVA, T. KARLUBIKOVA. Application Of Shape-independent Orthogonal Transform For Image Inerpolation, Radio-Engineering, Vol. 11, No. 1,April 2002. 

[24] E. G. SÁNCHEZ, Y.A. DIMITRIADIS, M. SANCHEZ-REYES MAS, P. S. GARCÍA, J.M. CANO IZQUIERDO, J. LOPEZ CORONADO, On-Line Character Analysis and Recognition With Fuzzy Neural Networks, Intelligent Automation and Soft Computing, Vol. 7, No. 3,1998, pp. 161-162. 

[25] M. SCHREINER, K. STRUPAT, F. LOTTSPEICH, C. ECKERSKORN. Ultraviolet matrix assisted laser desorption ionization mass spectrometry of electroblotted proteins. Electrophoresis 17, 1996, pp. 954-961. 

[26] John R. YATES. Mass Spectrometry and the Age of the Proteome. Journal of Mass Spectrometry, Vol. 33, pp. 1-19,1998. 

[27] R. ZENOBI, R. KNOCHENMUSS, Ion formation in MALDI Mass Spectrometry. Mass Spectrometry 1998, Rev. 17, pp. 337-66.