ProteinCenter - Protéomique Toulouse

yokeenchantingΒιοτεχνολογία

29 Σεπ 2013 (πριν από 3 χρόνια και 10 μήνες)

72 εμφανίσεις

L’exploitation
des
données protéomiques
L’outil
ProteinCenter
Proxeon Bioinformatics
Michel Rossignol
-
plateforme protéomique toulouse IPBS
-
IFR40(CNRS)
Les données sont issues à la fois de l’expérimentation personnelle
et de celles qui ont été mises à la disposition de la communauté.
L’essentiel des données qui concernent les protéines proviennent des banques
génomiques (séquences) complétées par les analyses en spectrométrie de masse
(identifications, modifications post
-
traductionnelles, quantification)
Les approches à grande échelle comme la
protéomique
conduisent par définition à
l’accumulation d’un grand nombre de données.
Pour utiliser cette masse de données, on peut formuler une double
interrogation :
?
-
Quelles sont les protéines d’intérêt cachées dans cet ensemble?
-
Est
-
ce que l’ensemble ou des groupes de résultats portent une information
sur le système biologique étudié ?
-
Quelles sont les données qui sont redondantes?
(Entrées dans les bases de données, séquençage partiel insuffisant pour distinguer les
isoformes)
-
Quelles sont les données qui sont vraiment spécifiques?
(
protéines uniquement présentes dans un échantillon par rapport à d’autres
).
-
Les données recueillies correspondent
-
elles au compartiment
cellulaire attendu ?
(qualité de la préparation biologique, pureté de l’échantillon)
-
Reproductibilité des expériences ?
-
??
En plus de ces 2 questions, on peut s’interroger sur la masse de données elle
-
même.
Pour analyser les données, plusieurs outils existent et parmi ceux
-
ci le
logiciel ProteinCenter édité par la société Proxeon Bioinformatics.
Pour tous ces logiciels, le principe de base est le même et comprend 3 étapes :
http://www.proxeon.com/home/index.html
En bref, 4 caractéristiques du logiciel
-
Filtrage et assemblage des données
dans une base non
redondante avec le numéro d’accession IPI (International Protein Index) quand il
existe.
-
Fonctionnement simple de l’ensemble des opérations
nécessaires
à l’exploitation des données.
-
Pour chaque protéine
, l’ensemble des informations est groupé
dans une fenêtre.
-
Une seule interface
pour le traitement des données.
Importation des données
Groupage
(clusters)
(élimination de la redondance,
simplification)
Comparaisons et sélections
(filtres)
Exportation des données
IMPORTATION
DES
DONNÉES
2 modes de groupages
qui peuvent être utilisés séquentiellement.
GROUPEMENT
L’autre fondé sur l’identité
entre séquences peptidiques
L’un fondé sur le niveau d’identité entre
les différentes séquences protéiques
A
-
FT1
-
5187 accessions
Exemple de groupement
Groupement selon l’identité d’un peptide au
moins
A
-
FT1
-
(592 groupes)
dont celui de la RuBisco
(3013 protéines)
A
-
FT1
-
(554 groupes)
Puis groupement selon 60% d’identité au moins pour les
protéines qui n’ont pas été précédemment groupées
Répertoires
hiérarchisés
(windows)
Supprimer
Copier
-
coller
Renommer
COMPARAISON
Assembler
Comparer
COMPARAISON
Les comparaisons et les filtres peuvent s’appuyer sur les classifications effectuées
par gene ontology
COMPARAISON

The Ontologies

Cellular component

Biological process

Molecular function
Mais également sur la base des données introduites par l’utilisateur
(Nombre de peptides, couverture de séquence, nombre MS/MS, etc ..)
Copie d’écrans
L’EXPORT
Fichiers «
pdf
»
L’onglet
«
REPORT
»
0
5
10
15
20
25
AT

AT

AT

AT

AT

AT

AT

AT

AT

AT

Nombre de
MS/MS
L’onglet
«
EXPORT»
Fichiers EXCEL
Cet organite dérive d’un organite plus simple le
proplaste, et sa structure peut évoluer dans certaines
cellules au cours du développement.
C’est le cas au cours de la maturation de nombreux fruits comme
la tomate, où le
chloroplaste
perd la plupart de ses fonctions de
photosynthèse et où il se déstructure. De nouveaux composés vont
s’accumuler et ceux ci donnent au fruit sa couleur et une partie de
ses saveurs
.
Dans le fruit mur et rouge, les
chloroplastes
sont devenus des
chromoplastes.
Le système photosynthétique chez les plantes
supérieures est contenu dans les organites cellulaires
nommées
chloroplastes
particulièrement bien structurés
pour assurer leur fonction.
Exemple
La caractérisation d’un compartiment cellulaire végétal :
le chromoplaste.
Les fractions
solubles (S)
et
membranaires (M)
de la
fraction la plus pure sont
analysés en SDS
-
PAGE
S
M
Découpage des pistes
Digestion
par
la trypsine
Analyse par
LC
-
MS/MS
(Orbitrap)
Recherche avec MASCOT sur la base de données SGN
(contigs de solanacées)
Filtrage et validation des fichiers
(1% FDR).
(logiciel MFPAQ)
L’étude protéomique a été effectuée
sur des
chromoplastes
de fruits de
tomate (rouge) purifiés par gradient
de densité discontinue de
saccharose.
EXPORT de 2 listes de protéines
Solubles
et
Membranes
Fichiers EXCEL, csv.
IMPORT
dans
ProteinCenter
1
ère
question :
La séparation des fractions protéiques solubles et
membranaires du
chromoplaste
apporte t’elle une information ?
Après regroupement
(identité à 60% sur la séquence
protéique)
-
1732 groupes
-
437
910
385
Processus biologiques
Spécifiques aux
fractions
«
SOLUBLES
»
Spécifiques aux
fractions
«
MEMBRANES
»
Communes aux
2 fractions
Avant regroupement
-
2009 entrées
-
497
1071
441
MEMBRANES
SOLUBLES
2
ème
question :
Est
-
ce que les protéines impliquées dans le transport sont
particulièrement modifiées dans le
chromoplaste
?
Comparaison de la liste des protéines spécifiques du
chromoplaste
impliquées dans le transport
au protéome total d’Arabidopsis ( Banque TAIR, 30707 protéines)
Ce groupe n’apparait pas
lorsque l’on confronte les
protéines du transport chez
le
chloroplaste
au protéome
entier d’Arabidopsis.
Le groupe de protéines
relativement le plus
représenté dans les
protéines spécifiques
chromoplaste
et
impliquées transport est
constitué de 42 protéines
pouvant lier le GTP.
Les caractéristiques de chaque protéine sont représentées
sur une fenêtre où de nombreux liens peuvent être utilisés.
Exemple : la protéine la plus représentée du groupe protéines du chromoplaste associées au transport
( nombre de MS/MS )
ARA3, small GTP
-
binding protein.
CONCLUSION
D’autres questions ?
Plus que des réponses, l’exploitation des données conduit à des informations
qui doivent être validées par des expériences complémentaires
……………..qui soulèveront de nouvelles questions……….
Merci à Emmanuelle et David
de la plateforme
protéomique
toulousaine
MERCI A VOUS TOUS POUR VOTRE ATTENTION