Currently, a large community effort focuses on protein interaction data as a mean to explore uncharacterized proteins function, discover new pathways and identify potential drug targets. However, the redundant screenings carried out in the past four years in Saccharomyces cerevisae show a very weak overlap and underline the need of protein interaction data validation. Here we propose a new comparative genomic validation approach based on the conservation of binding sequences within orthologs alignments of fifteen closely related yeast species. Taking the 14-3-3 domains as a study case we explore the binding specificities of their ligand peptides taking advantage of mutagenesis analysis carried out by PepSpot experiments. Using these experimental results we create a prediction tool based on regular expression combined with position specific scoring matrix able to screen the full in S. cerevisae proteome and identify putative 14-3-3 domain ligands. The comparative genomic method together with other well established protein interaction validation approaches are benchmarked as filters to increase the accuracy of this prediction. We show that the conservation across several yeast species of 14-3-3 interacting sequences successfully discriminates binding sites from spurious regions matching by chance ligand consensus and increase the prediction accuracy of a four fold. Key words : 14-3-3 domain ; Interaction networks; Protein-Protein interaction Regular expressions, PSSM, protein interaction validation Riassunto : Ad oggi una grande attenzione e’ stata dedicata ai dati di interazioni proteina-proteina che promettono di essere un mezzo molto efficace per la caratterizzazione di proteine a funzione non nota, per la scoperta di nuovi pathways metabolici ed infine per l’identificazione di potenziali bersagli farmaceutici. Ciò nonostante le successive esplorazioni dell’interattoma di Saccharomyces cerevisae pubblicate in questi ultimi anni hanno mostrato una scarsissima sovrapposizione di risultati e sottolineano il bisogno di sistemi di validazione dei dati di interazioni proteiche. In questo lavoro proponiamo un nuovo approccio per questa validazione basato sulla conservazione delle sequenze interagenti in allineamenti di proteine ortologhe derivate dai genomi di quindici specie prossime a S. cerevisae. Prendendo in considerazione le interazioni mediate dai domini 14-3-3 di lievito, abbiamo cominciato la nostra analisi esplorando la loro specificità di legame con esperimenti di mutagenesi effettuati con il metodo di PepSpot. Con questi risultati sperimentali abbiamo creato uno strumento predittivo basato su una espressione regolare e una matrice di punteggi in grado di identificare in tutto il proteoma di lievito le potenziali sequenze leganti i domini 14-3-3. Il nostro metodo di genomica comparativa insieme ad altri approcci comunemente utilizzati per la validazione delle interazioni proteina-proteina sono saggiati per la loro capacità di migliorare l’accuratezza della nostra predizione. In questo lavoro dimostriamo che la conservazione delle sequenze che legano i domini 14-3-3 permette di distinguere chiaramente i veri siti di legame da regioni che per caso contengo il consenso di legame. Infatti il criterio della conservazione migliora di un fattore quattro l’accuratezza della predizione dei ligandi delle proteine contenti domini 14-3-3 in lievito. Parole chiave : domini 14-3-3, reti di interazioni, interazioni proteina-proteina, espressioni regolari, matrice di punteggi, validazione interazioni proteiche

Montecchi-Palazzi, L. (2006). Comparative genomic approach for protein-protein interaction validation.

Comparative genomic approach for protein-protein interaction validation

2006-03-10

Abstract

Currently, a large community effort focuses on protein interaction data as a mean to explore uncharacterized proteins function, discover new pathways and identify potential drug targets. However, the redundant screenings carried out in the past four years in Saccharomyces cerevisae show a very weak overlap and underline the need of protein interaction data validation. Here we propose a new comparative genomic validation approach based on the conservation of binding sequences within orthologs alignments of fifteen closely related yeast species. Taking the 14-3-3 domains as a study case we explore the binding specificities of their ligand peptides taking advantage of mutagenesis analysis carried out by PepSpot experiments. Using these experimental results we create a prediction tool based on regular expression combined with position specific scoring matrix able to screen the full in S. cerevisae proteome and identify putative 14-3-3 domain ligands. The comparative genomic method together with other well established protein interaction validation approaches are benchmarked as filters to increase the accuracy of this prediction. We show that the conservation across several yeast species of 14-3-3 interacting sequences successfully discriminates binding sites from spurious regions matching by chance ligand consensus and increase the prediction accuracy of a four fold. Key words : 14-3-3 domain ; Interaction networks; Protein-Protein interaction Regular expressions, PSSM, protein interaction validation Riassunto : Ad oggi una grande attenzione e’ stata dedicata ai dati di interazioni proteina-proteina che promettono di essere un mezzo molto efficace per la caratterizzazione di proteine a funzione non nota, per la scoperta di nuovi pathways metabolici ed infine per l’identificazione di potenziali bersagli farmaceutici. Ciò nonostante le successive esplorazioni dell’interattoma di Saccharomyces cerevisae pubblicate in questi ultimi anni hanno mostrato una scarsissima sovrapposizione di risultati e sottolineano il bisogno di sistemi di validazione dei dati di interazioni proteiche. In questo lavoro proponiamo un nuovo approccio per questa validazione basato sulla conservazione delle sequenze interagenti in allineamenti di proteine ortologhe derivate dai genomi di quindici specie prossime a S. cerevisae. Prendendo in considerazione le interazioni mediate dai domini 14-3-3 di lievito, abbiamo cominciato la nostra analisi esplorando la loro specificità di legame con esperimenti di mutagenesi effettuati con il metodo di PepSpot. Con questi risultati sperimentali abbiamo creato uno strumento predittivo basato su una espressione regolare e una matrice di punteggi in grado di identificare in tutto il proteoma di lievito le potenziali sequenze leganti i domini 14-3-3. Il nostro metodo di genomica comparativa insieme ad altri approcci comunemente utilizzati per la validazione delle interazioni proteina-proteina sono saggiati per la loro capacità di migliorare l’accuratezza della nostra predizione. In questo lavoro dimostriamo che la conservazione delle sequenze che legano i domini 14-3-3 permette di distinguere chiaramente i veri siti di legame da regioni che per caso contengo il consenso di legame. Infatti il criterio della conservazione migliora di un fattore quattro l’accuratezza della predizione dei ligandi delle proteine contenti domini 14-3-3 in lievito. Parole chiave : domini 14-3-3, reti di interazioni, interazioni proteina-proteina, espressioni regolari, matrice di punteggi, validazione interazioni proteiche
10-mar-2006
2004/2005
Settore BIO/11 - BIOLOGIA MOLECOLARE
en
Tesi di dottorato
Montecchi-Palazzi, L. (2006). Comparative genomic approach for protein-protein interaction validation.
File in questo prodotto:
File Dimensione Formato  
Tesi_Montecchi.pdf

accesso aperto

Dimensione 3.16 MB
Formato Adobe PDF
3.16 MB Adobe PDF Visualizza/Apri

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/2108/243
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact