première partie - LRI

yokeenchantingΒιοτεχνολογία

29 Σεπ 2013 (πριν από 4 χρόνια και 1 μήνα)

87 εμφανίσεις

Université Paris-Sud 11 2006-2007
Master de Bioinformatique et Biostatistiques 2ème année

Examen de Combinatoire et Algorithmique des Structures Moléculaires
partie « Algorithmique »

mardi 28 novembre 2006

Durée : 1h30. Tous documents (sauf larticle en question) sont autorisés.

Le travail proposé se fonde sur larticle suivant, paru dans Bioinformatics en janvier 2006 :



Il sagit de développer une variante de lalgorithme de Zuker et Stiegler pour prédire la
structure secondaire dun ARN circulaire.

Dans la première partie de larticle, les auteurs rappellent les récurrences utilisées dans le
Vienna RNA package pour la prédiction de structure secondaire dun brin dARN ordinaire
selon lalgorithme de Zuker et Stiegler. Ces récurrences sont différentes de celles vues en
cours, tout en leur étant équivalentes. (Les différences sont dues au fait quici, contrairement à
récurrence vue en cours, tous les cas sont mutuellement exclusifs.)

La séquence est notée x, et x[i,j] désigne la partie de la séquence située entre les nucléotides i
et j (inclus). Quatre matrices sont mises en oeuvre :




Voici les relations de récurrence :


Ici, H(i,j) désigne lénergie dune boucle terminale délimité e par un appariement i-j, et
I(i,j,k,l) désigne lénergie dune boucle interne (non multi ple) délimitée par un appariement i-j
et un appariement k-l, avec i<k<l<j.

Question 1. A la lumière de la figure ci-dessous, expliquez en détail les relations de
récurrence ci-dessus.


Question 2. Montrez que le modèle de calcul dénergie sous-jacent à cette récurrences est tel
que lénergie dune boucle multiple vaut :


+

+
cba

, où

est la longueur de la
boucle (cest-à-dire le nombre de bases non appariées quelle contient) et

est égal au
nombre de paires de bases qui la ferment moins un.
Question 3. Brièvement (en une ou deux phrases), quest-ce qui empêche dutiliser ces
récurrences « telles quelles » sur un brin dARN ci rculaire ?

Question 4. Expliquez et commentez le paragraphe suivant :



Question 5. Les auteurs de larticle proposent donc une autre méthode que celle ci-dessus. On
note F
o
1,n
lénergie libre de la structure optimale du brin c irculaire dARN de longueur n. La
« fin » (nucléotide n) et le « début » (nucléotide 1) du brin sont deux nucléotides consécutifs
choisis arbitrairement. Les matrices C, M et M
1
ont les mêmes définitions que précédemment.
La matrice M
2
est ainsi définie : M
2
kn
contient lénergie optimale de x[ k,n] sachant que cet
intervalle de séquence est contenu dans une boucle multiple, quil a exactement deux
composants et que k est apparié à un nucléotide dans lintervalle.

En vous aidant de la figure ci-dessous, écrivez et expliquez en détail :

· la formule de récurrence pour F
o
1,n
,
· la formule de récurrence pour M
2
kn
.