Diapositive 1 - CIAM - Inra

yokeenchantingΒιοτεχνολογία

29 Σεπ 2013 (πριν από 4 χρόνια και 3 μήνες)

121 εμφανίσεις

PARIS : un syst
PARIS : un syst
è
è
me pour
me pour
l
l


analyse
analyse
«
«
collaborative
collaborative
»
»
de
de
donn
donn
é
é
es prot
es prot
é
é
omiques
omiques
http://w3.jouy.inra.fr/unites/miaj/public/imaste/paris/
juhui.wang@jouy.inra.fr
Plan
Plan

Contexte de travail

Problématique

Etat de l’art

Objectifs propres ànous

Système PARIS

Architecture

Fonctionnalités

Exemples d’utilisation

Au delàde PARIS

ce qui a étéfait

ce qui va être fait àcourt-terme
•Formats divers et variés, et échelle
d’observation différente :
Expression (oui/non), Traitement (numérique), Protocole (textuel)
MALDI-TOF, MS/MS (signaux), 2-DE (image), Microscope (image).
•Sources hétérogènes et dispersées dans l’espace
spatio-temporel :
-
Protéine (Swiss-Prot), Métabolome (Kegg), Gel ( maison).
-Connaissance acquise progressivement dans le temps.
Contexte du travail
Contexte du travail
L’informatique permet de relier les données, de
faciliter leur analyse!
Contexte scientifique de PARIS
Contexte scientifique de PARIS

Démarche descendante

HTML

MGED (MicroarrayGene Expression Database)

PSI (ProteomStandard Initiative) et FuGE

Démarche ascendante

proteomeWeb(G. Babnigg, 2003).

Tambis(P.G. Baker, 1998).

ISYS (A.S. Siepel2001)

YPRC-PDB (Y.K. Paik, 2002)

Contexte national

AFP-db(M. Rossignol, Plateforme ProtéomiqueàMontpellier)

Protic-DB (J. Joets, M. Zivy, Plateforme Protéomiqueàla ferme du Moulon)

Pims(Ch. Bruley, CEA-Grenoble)
Objectifs de PARIS
Objectifs de PARIS
•Outils communs àun ensemble de communautés:
-gestion des droits d’accès.
-architecture 3-tier
•Rendre les informations accessibles et utilisables:
-LIMS
-donnéessous forme utilisable par des non protéomiciens
-interconnexionavec d’autres bases de données.
•Développer des outils permettant d’interconnecter les
expériences et les expérimentateurs:
-outil d’analyse intégré
-base de données diachroniques.
•Permettre la validation et la rétro-analyse des données:
--outild’annotation.
--outil de contrôle et d’exploration des données
Architecture Générale
Common Services
2DE
MS
2DE centered dataMS centered data
Architecture du module 2DE
Architecture du module 2DE
Web Services
Web Services
D
D
é
é
ploiement de PARIS
ploiement de PARIS
A
Organisation de donn
Organisation de donn
é
é
es
es
Gel : résultat d’une expérience réalisée
selon un protocole défini et dans une
gamme de pH donnée.
Spot : tache détectéavec une méthode de
détection sur une image. Les spots se
distinguent par leur numéro.
spot 33
spot 53
spot 33
isoforme
matching
Image
Gel
Spot
Relation
Matching
Isoforme
B
C
A
B
C
Sch
Sch
é
é
ma de base du module 2DE
ma de base du module 2DE
Int
Int
é
é
gration des donn
gration des donn
é
é
es
es
Int
Int
é
é
gration des donn
gration des donn
é
é
es
es
Organisme
+
Souche
+
Protéine
HTTP
HTTP
HTTP
R
R
é
é
utilisation de donn
utilisation de donn
é
é
es
es
Int
Int
é
é
gration de donn
gration de donn
é
é
es
es

Liste de requêtes réalisées:

par auteur

par milieu

par mots-clés

par nom de gel

par date

par comparaison différentielle

par protéine
Int
Int
é
é
gration de donn
gration de donn
é
é
es
es

Liste de relations prises en compte:

Matching manuel

Association par nom de protéine

Isoformes

Allèle

Relations déduites
Relation de Matching
Relation de Matching
Relation
Relation
«
«
Homonyme
Homonyme
»
»
Relation
Relation
«
«
Isoforme
Isoforme
»
»
Exploration de donn
Exploration de donn
é
é
es
es

Déductionet inférence.

Contrôle de cohérence.

Recherche de pattern.
Exploration des donn
Exploration des donn
é
é
es
es
Matching manuel
Matching manuelMatching déduit
Int
Int
é
é
gration des donn
gration des donn
é
é
es
es
Module MS
Module MS
MS data
manager
data analysis
data loading
JDBC
JDBC
Sch
Sch
é
é
ma de base du module MS
ma de base du module MS
Connexion avec le module 2DE
Données spectrales
Identification de protéine
Importer les donn
Importer les donn
é
é
es
es
•Gestion d’accès
•Gestion du contexte biologique
•Gestion de données brutes
•Procédure de traitement de données
•Paramètres pour l’identification de
protéine
•Paramètres utilisés dans l’interprétation
de données
Analyser et exporter les donn
Analyser et exporter les donn
é
é
es
es
•Visualisation et modification de données
•MIAPE compliant export des données
•Connexion avec le module 2DE
Utilisation de PARIS
Utilisation de PARIS
PARIS
Analyse
d’image
Analyse
statistique de
données
Kegg
Swiss-Prot
D
D
é
é
ploiement
ploiement
Client:

Pas besoin de compétence en informatique.

Java 2 version 1.4+ (WebStart).
Serveur :

PostgreSQL 7.3.2

Java 2 version 1.4+

Apache 2+

Perl

SAX-COM

XML-DBMS
javaws
launching
Petites fonctions pratiques
Petites fonctions pratiques

Affichage d’information

Récupération d’information

Centrage d’information

Gestion de sécurité

Opération de traitement d’image
Evolution de PARIS
Evolution de PARIS
PARIS
Analyse statistique
•Expression différentielle (ANOVA)
•Sélection de variables (PLS)
Analyse d’image
•Comparaison de gels inter-milieu
•Annotation par apprentissage
probabiliste
Indexation de données
•Recherche par le contenu
(empreinte protéomique)
•Ontologie
Intégration de données
•PSI (Proteome Standard Initiative)
•Outil d’exploration de données
inter-espèces
•Web Service
Contextes Biologiques
Bilan et perspectives pour PARIS
•Publication : (Licence CeCILLII, déposéàl’APP en 2007)
•Bioinformatics(04), Journal of IntegrativeBioinformatics(05), Appl. Envir. Microbiol. (05)
•Chapitre dans l’ouvrage collectif (06)
•Conférences: HUPO (02,04), ECCB (03), IntegrativeBioinformatics(05)
•Utilisation :
•Local : BIOBAC, FLEC
•National: PARIS 13,
•International: Institute of food(GB), Univ. Libre de Bruxelle(BE)
•Réseaux de contacte :
•Club Protéomiquede Jouy, Réseaux des plateformsprotéomiquesde l’INRA
•SFEAP, RENABI, RNG, PSG.
•PSI
•Financement :
•Inter-EPST (01->03)MIAjet BioBac; Inter-EPST (02->04)MIAj, BioBac,UEPSD, CBiB, etc.
•IMPBIO BioAlgome(04)MIAj, BioBac, UBLO, MIG, LRI, PRiSME, LAMI (Refusé)
•ProteHome(07-09)MIAj, MIG, CEA, INRIA
•ANR MIGADI (08-10)MIG, MIAj
•BD-DIFAG (08)MIAj, BDR (en attente du CDD d’amorçage)
•Crédit :
•Ch. Caron, J. Wang, A. Trubuil,M.Y. Mistou, Ch. Gitton, A. Guillot, P.Anglade, R. Joubert-Caron,Alain
Viari, Yves Vandenbrouck,S. Huet, H. Chiapello, J.F. Gibrat, etc.
•Perspectives : 1)Dimension européenne; 2) Dimension statistique;3) Dimension génome entier.