εδοµένα RDC

yakcombsBiotechnology

Sep 29, 2013 (3 years and 10 months ago)

102 views

Protein Structure Prediction using
Protein Structure Prediction using
Sparce
Sparce
Dipolar Coupling Data
Dipolar Coupling Data
Youxing
Youxing
Qu
Qu
, Jun
, Jun
-
-
tao
tao
Guo
Guo
, Victor
, Victor
Olman
Olman
and Ying
and Ying
Xu
Xu
Nucleic Acids Research, 2004, Vol. 32, No. 2, 551
Nucleic Acids Research, 2004, Vol. 32, No. 2, 551
-
-
561
561
Αλγεβρικοί
Αλγεβρικοί
και
και
Γεωµετρικοί
Γεωµετρικοί
Αλγόριθµοι
Αλγόριθµοι
στη
στη
Μοριακή
Μοριακή
Βιολογία
Βιολογία
Αναπληρωτής
Αναπληρωτής
Καθηγητής
Καθηγητής
Ι
Ι
.
.
Εµίρης
Εµίρης
Μ∆Ε
Μ∆Ε
Βιοπληροφορικής
Βιοπληροφορικής
Χαρίση
Χαρίση
Άννα
Άννα
12
12
Μαΐου
Μαΐου
2005
2005
Ποιο
Ποιο
είναι
είναι
το
το
πρόβληµα
πρόβληµα
;
;


∆οµή
∆οµή


Λειτουργία
Λειτουργία


Εύρεση
Εύρεση
της
της
δοµής
δοµής
της
της
πρωτεΐνης
πρωτεΐνης


Κρυσταλλογραφία
Κρυσταλλογραφία
ακτίνων
ακτίνων
Χ
Χ


Μαγνητικός
Μαγνητικός
Συντονισµός
Συντονισµός
Πυρήνων
Πυρήνων
(
(
NMR
NMR
)
)


Chemical Shifts
Chemical Shifts


NOESY
NOESY


Residual Dipolar Coupling (RDC)
Residual Dipolar Coupling (RDC)
RDC
RDC
D = Da
(3cos²θ
-
1) + 1.5 Dr
(sin²θ
cos2φ)
∆εδοµένα
∆εδο
µένα
RDC
RDC


Πρωτεϊνική
Πρωτεϊνική
∆οµή
∆οµή


De Novo methods
De Novo methods
Συναρµολόγηση
Συναρµολόγηση
τµηµάτων
τµηµάτων
δοµών
δοµών
µε
µε
γνωστά
γνωστά
δεδοµένα
δεδοµένα
RDC
RDC


Whole
Whole
Protein Structural Homology search
Protein Structural Homology search
-
-
based methods
based methods
Αναζήτηση
Αναζήτηση
για
για
γνωστές
γνωστές
δοµές
δοµές
µε
µε
δεδοµένα
δεδοµένα
RDC
RDC
που
που
«
«
ταιριάζουν
ταιριάζουν
»
»
µε
µε
τα
τα
πειραµατικά
πειραµατικά
RDC
RDC
Προσέγγιση
Προσέγγιση
Άρθρου
Άρθρου


RDC
RDC
-
-
PROSPECT
PROSPECT
RDC
RDC
PROtein
PROtein
Structure
Structure
PrEdiCtion
PrEdiCtion
Toolkit
Toolkit
Assigned
Assigned
Backbone RDC data
Backbone RDC data
+
+
Predicted Secondary Structure
Predicted Secondary Structure
=
=
Structure Prediction
Structure Prediction
∆εδοµένα
∆εδοµένα
RDC
RDC
από
από
τα
τα
ΝΜ
ΝΜ
R
R
πειρά
µατα
πειράµατα

Για
κάθε
δεσµόΝ

υπολογίζεται:
D = Da
(3cos²θ
-
1) + 1.5 Dr
(sin²θ
cos2φ)

θ
: η
γωνία
ανάµεσα
στο
δεσµό
NH
και
τον
άξονα
Ζ
του
κύριου
άξονα
στοίχισης
(x,y,z)

φ
: η
γωνία
ανάµεσα
στην
προβολή
του
δεσµού
ΝΗ
στο
x-y
επίπεδο
και
τον
άξονα
X

D
a
: το
µέτρο
(ένταση) του
axial άξονα
της
στοίχισης
(tensor)

D
r : το
µέτρο
(ένταση) του
rhombic άξονα
της
στοίχισης
(tensor)
Experiment
Experiment
RDC
RDC
PDB
PDB
D
Da
a, D
, D
r
r
:
:
D
Dzz
zz
= 2D
= 2Da
a
D
Dyy
yy
=
=
-
-
D
D
a
a(1+1.5D
(1+1.5Dr
r
/D
/Da
a)
)
D
Dzz
zz
,D
,Dyy
yy
= max {experiment D}
= max {experiment D}
γωνίες
γωνίες
φ
φ
,
, θ
θ
υπολογίζονται
υπολογίζονται


Περιστροφή
Περιστροφή
(

α,
, β
β,
,
γ
γ
ανά
ανά
30
30º
º)
)
H,E,C
H,E,C
µε
µ
ε
χρήση
χρήση
DSSPcont
DSSPcont
Περιστροφή
Περιστροφή
min
min
σκορ
σκορ
Τ
Τ
Γνωστά
Γνωστά
D
D
H,E,C,U
H,E,C,U
µε
µε
χρήση
χρήση
PSIPRED
PSIPRED
Στοίχιση
Στοίχιση
20
20 δοµές
δοµές
µε
µε
min
min
σκορ
σκορ


Περιστροφή
Περιστροφή
(
(
α
α
,
,
β
β
,
, γ
γ
ανά
ανά
10
10º
º)
)
Στοίχιση
Στοίχιση
Υπολογισµός
Υπολ
ογισµός
Ζ
Ζ
σκορ
σκορ
Σειρά
Σειρά
20
20
νικητές
νικητές
µε
µε
βάση
βάση
σκορ
σκορ
στοίχισης
στοίχισης
Στοίχιση
Στοίχιση
∆εδοµένων
∆εδοµένων
RDC
RDC
Έστω:
assigned
πειραµατικά
D της
πρωτεΐνης
-
στόχου
υπολογισ
µένα
D*
της
πρωτεΐνης
-
αναφοράς
Τότε
βρες:
στοίχιση
τέτοια
ώστε
σκορ
Τ:
min {Σ
[w1 |Di
-D
*
A(i)|/σ
+ w2
M (Si
, S*A(i))] + Σ
pGj
}
Όπου:
-
σ
απόκλιση
των
πειραµατικών
D
-S
i
και
S*A(i) τύπος
2ους
δοµής
για
τη
θέση
i
-
M (Si
, S*A(i))
= -1, 1, 0
-p
G
j
συνολική
ποινή
κενού
για
το
j-οστό
κενό
-w
1 ,
w2
= 1
Πρόγνωση
Πρόγνωση
Στοιχείων
Στοιχείων
∆ευτεροταγούς
∆ευτεροταγούς
∆οµής
∆οµής


Για
Για
πρωτεΐνη
πρωτεΐνη


στόχο
στόχο


PSIPRED
PSIPRED
(
(
http://
http://
bioinf.cs.ucl.ac.uk/psipred/psiform.html
bioinf.cs.ucl.ac.uk/psipred/psiform.html
)
)
Αµινοξική
Αµινοξική
ακολουθία
ακολουθία


Πρόβλεψη
Πρόβλεψη


αµινοξύ
αµινοξύ
αν
αν
ανήκει
ανήκει
σε
σε
Η
Η
(
(Helix)
Helix)
,
, Ε
Ε
(Strand), C (Coil)
(Strand), C (Coil)
ένα
ένα
επίπεδο
επίπεδο
εµπιστοσύνης
εµπιστοσύνης
0
0 -
-
9
9
Conf: 9888888887889997527357753568999999986078764679999999970588
Conf: 988888888788999752735775356899999998607876467999999997058829
29
Pred
Pred: CCCCCCCCCHHHHHHHHCCCCCCCCCHHHHHHHHHHHCCCCCCHHHHHHHHHHHCCCCCH
: CCCCCCCCCHHHHHHHHCCCCCCCCCHHHHHHHHHHHCCCCCCHHHHHHHHHHHCCCCCH
AA: MEPAMEPETLEARINRATNPLNKELDWASINGFCEQLNEDFEGPPLATRLLAHKIQSP
AA: MEPAMEPETLEARINRATNPLNKELDWASINGFCEQLNEDFEGPPLATRLLAHKIQSP
QE
QE
10 20 30 40 50
10 20 30 40 50 60
60


∆έχονται
∆έχονται
µόνο
µόνο
όταν
όταν
εµπιστοσύνη
εµπιστοσύνη


8
8


Όταν
Όταν
εµπιστοσύνη
εµπιστοσύνη
< 8
< 8


U (Uncertain)
U (Uncertain)


Για
Για
πρωτεΐνη
πρωτεΐνη


αναφορά
αναφορά


Πρόβλεψη
Πρόβλεψη
στοιχείων
στοιχείων
δευτεροταγούς
δευτεροταγούς
δοµής
δοµής
µε
µε
τη
τη
χρήση
χρήση
του
του
DSSPcont
DSSPcont
Επιπλέον
Επιπλέον
Περιορισ
µοί
Περιορισµοί


Αν
Αν
RDC(i
RDC(i
) unassigned
) unassigned


σκορ
σκορ
στοίχισης
στοίχισης
= 0
= 0


Ποινή
Ποινή
για
για
κενά
κενά
στην
στην
αρχή
αρχή
και
και
το
το
τέλος
τέλος
= 0
= 0


Όχι
Όχι
κενό
κενό
στη
στη
µέση
µέση
µίας
µίας
έλικας
έλικας
ή
ή
ενός
ενός
β
β
-
-
κλώνου
κλώνου
για
για
πρωτεΐνη
πρωτεΐνη
-
-
αναφορά
αναφορά


Σκορ
Σκορ
στοίχισης
στοίχισης
µόνο
µόνο
για
για
έλικες
έλικες
και
και
β
β
-
-
κλώνους
κλώνους


Για
Για
Coil
Coil
ποινή
ποινή
από
από
διαφορά
διαφορά
µηκών
µηκών
αντιστοίχων
αντιστοίχων
περιοχών
περιοχών
(
(
Οι
Οι
οµόλογες
οµόλογες
πρωτεΐνες
πρωτεΐνες
είναι
είναι
διατηρηµένες
διατηρηµένες
περισσότερο
περισσότερο
στις
στις
περιοχές
περιοχές
ελίκων
ελίκων
και
και
β
β
-
-
κλώνων
κλώνων
πάρα
πάρα
στις
στις
τυχαίες
τυχαίες
περιοχές
περιοχές
)
)
Ζ
Ζ
σκορ
σκορ


Αξιολόγηση
Αξιολόγηση
της
της
στοίχισης
στοίχισης
µε
µε
σκορ
σκορ
Τ
Τ
0
0
µε
µε
χρήση
χρήση
Z
Z
σκορ
σκορ
:
:
Ζ
Ζ
= (
= (
Τ
Τ
a
a
-
-
Τ
Τ
0
0
)/
)/
σ
σ
όπου
όπου
Τ
Τ
a
a
:
:
το
το
µέσο
µέσο
σκορ
σκορ
στοίχισης
στοίχισης
σ
σ
:
:
η
η
τυπική
τυπική
απόκλιση
απόκλιση
των
των
σκορ
σκορ


Τυχαίο
Τυχαίο
ανακάτεµα
ανακάτεµα
των
των
RDC
RDC
δεδοµένων
δεδοµένων
για
για
τη
τη
στόχο
στόχο
-
-
πρωτεΐνη
πρωτεΐνη
(500
(500
φορές
φορές
)
)
Αλγόριθµος
Αλγόριθµος
1.
1.


πρωτεΐνη
πρωτεΐνη
-
-
αναφορά
αναφορά


Για
Για
α
α
,
,
β
β
,
,
γ
γ
µε
µε
0
0


α
α
,
,
β
β
,
,
γ
γ


180
180
°
°
,
,
ανά
ανά
30
30
°
°


Στοίχιση
Στοίχιση
των
των
πειραµατικών
πειραµατικών
RDC
RDC
µε
µε
των
των
υπολογισµένων
υπολογισ
µένων
RDC
RDC


Υπολογισµός
Υπολογισµός
σκορ
σκορ
στοίχισης
στοίχισης


Εύρεση
Εύρεση
της
της
περιστροφής
περιστροφής
µ
ε
µε
το
το
min
min
σκορ
σκορ
2.
2.


20
20
πρωτεΐνες
πρωτεΐνες
-
-
αναφορά
αναφορά
(
(
µε
µε
min
min
σκορ
σκορ
)
)


Για
Για
α
α
,
,
β
β
,
,
γ
γ
ανά
ανά
10
10
°
°
µε
µε
0
0


α
α,
,
β
β,
,
γ
γ


180
180
°
°
,
,
ανά
ανά
1
1
0
0
°
°


Στοίχιση
Στοίχιση
και
και
υπολογισµός
υπολογισ
µός
σκορ
σκορ
στοίχισης
στοίχισης


Εύρεση
Εύρεση
της
της
περιστροφής
περιστροφής
µ
ε
µε
min
min
σκορ
σκορ


Υπολογισµός
Υπολογισµός
Z
Z
-
-
σκορ
σκορ
γωνίες
γωνίες
Πειράµ
ατα
Πειράµατα
-
-
Αποτελέσ
µατα
Αποτελέσµατα


58
58
σύνολα
σύνολα
δεδοµένων
δεδοµένων
RDC
RDC
για
για
43
43
πρωτεΐνες
πρωτεΐνες


> 20
> 20
διπλώµατα
διπλώµατα


µήκος
µήκος
53
53


263
263
κατάλοιπα
κατάλοιπα


∆εδοµένα
∆εδοµένα
RDC
RDC
: 11.3
: 11.3


95.5%
95.5%


Πρόβλεψη
Πρόβλεψη
δευτεροταγούς
δευτεροταγούς
δοµής
δοµής
9.9
9.9


76.3%
76.3%


83.7% (36 / 43)
83.7% (36 / 43)
σωστή
σωστή
πρόβλεψη
πρόβλεψη
δοµής
δοµής


98.1%
98.1%
ακρίβεια
ακρίβεια
της
της
στοίχισης
στοίχισης
(
(
σε
σε
περιοχή
περιοχή
4
4
καταλοίπων
καταλοίπων
)
)
Βιβλιογραφία
Βιβλιογραφία


Residual Dipolar Coupling in NMR Structure Analysis,
Residual Dipolar Coupling in NMR Structure Analysis,
Rebecca S. Lipsitz
Rebecca S. Lipsitz
and
and
Nico Tjandra
Nico Tjandra,
, Annu. Rev. Biophys.
Biomol. Struct. 2004. 33:387
Annu. Rev. Biophys. Biomol. Struct. 2004. 33:387


413
413


Us
e of Residual
Use of Residual
Dipolar
Dipolar
Couplings as Restraints in
Couplings as Restraints in
Ab
Ab
Initio
Initio
Protein
Protein
Structure
Structure
Prediction
Prediction
,
,
Turkan Haliloglu
Turkan Haliloglu,
, Andrzej Kolinski,
Andrzej Kolinski,
Jeffrey Skolnick
Jeffrey Skolnick
,
,
Biopolymers, Vol. 70, 548
Biopolymers, Vol. 70, 548


562 (2003
562 (2003
)
)


3D Structural Homology Detection via
3D Structural Homology Detection via
Unassigned
Unassigned
Residual
Residual
Dipolar
Dipolar
Couplings
Couplings
,
,
Christopher James Langmead Bruce Randall Donald
Christopher James Langmead Bruce Randall Donald
,
,
The
The
IEEE
IEEE
Computer Society Bioinformatics Conference (CSB),Stanford Univer
Computer Society Bioinformatics Conference (CSB),Stanford University,
sity,
Palo Alto, CA August 11
Palo Alto, CA August 11
-
-
15, 2003
15, 2003


http://www.cis.rit.edu/htbooks/nmr/inside.htm
http://www.cis.rit.edu/htbooks/nmr/inside.htm


NMR dipolar couplings for the st
ructure determination of biopoly
NMR dipolar couplings for the structure determination of biopoly
mers in
mers in
solution
solution
,
,
Eva
Eva
de
de
Alba
Alba
and
and Nico
Nico
Tjandra
Tjandra
Volume
Volume
40,
40,
Issue
Issue
2
2
, 25
, 25
February
February
2002,
2002,
Pages
Pages
175
175
-
-
197
197