Sujet : Contexte de l'étude : Objectif : Compétences ... - Lirmm

yokeenchantingΒιοτεχνολογία

29 Σεπ 2013 (πριν από 3 χρόνια και 10 μήνες)

72 εμφανίσεις

Sujet
 

 
Mise en place d’un module d’analyse qualitative et quantitative de données d’expression 
issues de la technologie de séquençage 454
 
Contexte de l’étude
 
:
 
L’équipe bioinformatique du CIRAD a mis en place un outil de traitement et d’analyse à 
haut dé
bit des données de séquences de type ESTs issues de techniques de séquençage 
«
 
traditionnelles
 
»
 
:  EST
tik
  (Expressed  Sequence  Tag  Treatment  and  Investigation  Kit). 
Cet outil se décline en 3 parties
 

 


un  pipeline  (ou  chaine  de  traitement  automatisée)  organ
isé  sous  forme  de 
modules  permettant  de  réaliser  le  traitement  des  séquences  (nettoyage, 
assemblage, annotation…)
 


une base de données pour le stockage des données générées par le pipeline
 


une application Web pour la consultation des résultats
 
EST
tik
 a d’or
es et déjà été utilisée pour le traitement et l’annotation de plus d’un million 
de  séquences  provenant  essentiellement  du  transcriptome  de  plantes  tropicales 
(Cacaoyer,  Agrume,  Bananier,  Hévéa,  …)  mais  également  d’animaux  (Tilapia).  Ces 
travaux ont été pub
lié
s
 ou sont en cours de publication dans des revues internationales 
à comité de lecture.
 
L’équipe  IRD/CIRAD  «
 
biologie  du  développement  des  palmiers
 
»  produit  actuellement 
des  données  de  séquences  utilisant  les  dernières  technologies  de  pyroséquençage  afi
n  
d’analyser l’ensemble des gènes exprimés dans les fruits du palmier à huile pour rendre 
compte  des 
étapes  clés  associées  à  la  synthèse,  le  stockage  et  la  dégradation  des 
réserves lipidiques.
 
Objectif
 
:
 
L’objectif  de  ce  stage  et  de  mettre  en  place  des  ou
tils  de  traitement  et  d’analyse  de
s
 
données 
«
 
très  haut  débit
 
»
 
produites  par  la
  technologie  de  pyroséquençage  454.  Le 
stagiaire  devra  intégrer  dans  le  pipeline  existant  de  nouveaux  modules  de  nettoyage, 
assemblage et annotation des séquences, modifier le 
schéma de la base de données afin 
d’intégrer  les  résultats  et  modifier  les  interfaces  pour  permettre  aux  utilisateurs 
d’analyser les données.
 
 
Compétences développées
 
:
 
Programmation
 

Perl, BioPerl
, CGI
 
Base de données
 
: MySQL 
 
Environnement de travail Li
nux
 
Modélisation
 
: UML, Merise
 
Notion de base sur le génome/transcriptome/protéome.
 
Notion de base en biochimie et biologie moléculaire.
 
 
Encadrement
 
Le stage se déroulera au sein d
e l’équipe Intégration des Données 
du C
IRAD
 à 
Montpellier
 

 
Les études ent
reprises se feront en étroite collaboration avec l’équipe IRD

C
IRAD
 
«
 
Biologie du développement des Palmiers
 
».
 
Personnes à contacter : 
 
Bioinformatique
 
: Xavier Argout
 

xavier.argout@cirad.fr
; 04 67 61 58 00
 (ext 54 45)
 
Biologie
 
: Fabienne Morcillo
 

fabienne.morcillo@ird.fr
; 04 67 41 62 35
 
 
Accueil du stagiaire
 
Indemnités  de  stage  et  de  logement  (pour  les  étudiants  nécessitant  un    second 
logement), participati
on de l’institut aux repas.
 
 
Liens
 
CIRAD
 

http://www.cirad.fr
 
Equipe ID
 

http://umr

dap.cirad.fr/equipes/id_integration_des_donnees
 
IRD
 

http://www.mpl.ird.fr
 
UMR DIAPC
 

http://www.umr

diapc.fr/
 
 
Publications
 
Argout  et  al.,  T
owards  the  understanding  of  the  cocoa  transcriptome:  Production  and 
analysis of an exhaus
tive dataset of ESTs of Theobroma cacao L. generated from various 
tissues and under various conditions. BMC genomics 2008
 
Terol J.
 et al
. 2007. Analysis of 13000 unique Citrus clusters associated with fruit quality, 
production and salinity tolerance. BMC G
enomics, 8 (31).
 
Dereeper  A.
  et  al. 
2007.  SAT,  a  flexible  and  optimized  Web  application  for  SSR  marker 
development.. BMC Bioinformatics, 8 (465).