🗊Презентация Множественные выравнивания

Нажмите для полного просмотра!
Множественные выравнивания, слайд №1Множественные выравнивания, слайд №2Множественные выравнивания, слайд №3Множественные выравнивания, слайд №4Множественные выравнивания, слайд №5Множественные выравнивания, слайд №6Множественные выравнивания, слайд №7Множественные выравнивания, слайд №8Множественные выравнивания, слайд №9Множественные выравнивания, слайд №10Множественные выравнивания, слайд №11Множественные выравнивания, слайд №12Множественные выравнивания, слайд №13Множественные выравнивания, слайд №14Множественные выравнивания, слайд №15Множественные выравнивания, слайд №16Множественные выравнивания, слайд №17Множественные выравнивания, слайд №18Множественные выравнивания, слайд №19Множественные выравнивания, слайд №20Множественные выравнивания, слайд №21Множественные выравнивания, слайд №22Множественные выравнивания, слайд №23Множественные выравнивания, слайд №24Множественные выравнивания, слайд №25Множественные выравнивания, слайд №26Множественные выравнивания, слайд №27Множественные выравнивания, слайд №28Множественные выравнивания, слайд №29Множественные выравнивания, слайд №30

Содержание

Вы можете ознакомиться и скачать презентацию на тему Множественные выравнивания. Доклад-сообщение содержит 30 слайдов. Презентации для любого класса можно скачать бесплатно. Если материал и наш сайт презентаций Mypresentation Вам понравились – поделитесь им с друзьями с помощью социальных кнопок и добавьте в закладки в своем браузере.

Слайды и текст этой презентации


Слайд 1





Множественные выравнивания
Зачем все это нужно?
Глобальные множественные выравнивания – основы алгоритма, программы
Где искать на Web?
Можно ли редактировать множественное выравнивание?
Локальные множественные выравнивания
Описание слайда:
Множественные выравнивания Зачем все это нужно? Глобальные множественные выравнивания – основы алгоритма, программы Где искать на Web? Можно ли редактировать множественное выравнивание? Локальные множественные выравнивания

Слайд 2





Что такое множественное выравнивание?
Несколько гомологичных последовательностей, написанных друг под другом оптимальным способом:
Гомологичные остатки один под другим
Остатки в одинаковом пространственном положении один под другим
Остатки, имеющие одинаковую функциональную нагрузку, один под другим
Одинаковые или похожие остатки один под другим
Описание слайда:
Что такое множественное выравнивание? Несколько гомологичных последовательностей, написанных друг под другом оптимальным способом: Гомологичные остатки один под другим Остатки в одинаковом пространственном положении один под другим Остатки, имеющие одинаковую функциональную нагрузку, один под другим Одинаковые или похожие остатки один под другим

Слайд 3





Какое выравнивание интереснее?
Описание слайда:
Какое выравнивание интереснее?

Слайд 4





Какие бывают выравнивания?
Описание слайда:
Какие бывают выравнивания?

Слайд 5





Зачем нужно множественное выравнивание?
Перенос аннотации
Предсказание функции каждого остатка (например, выявление остатков, составляющих активный центр фермента)
Моделирование 3D – структуры
Реконструкция эволюционной истории последовательности (филогения)
Выявление паттерна функциональных семейств и сигналов в ДНК
Построение доменных профайлов
Аккуратный дизайн праймеров для PCR анализа
Описание слайда:
Зачем нужно множественное выравнивание? Перенос аннотации Предсказание функции каждого остатка (например, выявление остатков, составляющих активный центр фермента) Моделирование 3D – структуры Реконструкция эволюционной истории последовательности (филогения) Выявление паттерна функциональных семейств и сигналов в ДНК Построение доменных профайлов Аккуратный дизайн праймеров для PCR анализа

Слайд 6





Как выбрать последовательности для множественного выравнивания?
Выравнивайте белки, а не ДНК, если есть выбор
Последовательностей лучше много, но не слишком (~ 10-15)
В выборке лучше избегать:
слишком похожих последовательностей (>90% id)
слишком разных последовательностей (<30% id c большинством)
неполных последовательностей (фрагментов)
тандемных повторов
Описание слайда:
Как выбрать последовательности для множественного выравнивания? Выравнивайте белки, а не ДНК, если есть выбор Последовательностей лучше много, но не слишком (~ 10-15) В выборке лучше избегать: слишком похожих последовательностей (>90% id) слишком разных последовательностей (<30% id c большинством) неполных последовательностей (фрагментов) тандемных повторов

Слайд 7





Изучая новую последовательность
Выборка на основе BLAST
Подробно охарактеризованные последовательности - аннотация
Совсем неохарактеризованные (hypothetical proteins) – достаточный уровень разнообразия
 Выравнивание по всей длине
 e-value – 10 -40 – 10 -6
 Избегать partial sequences
Описание слайда:
Изучая новую последовательность Выборка на основе BLAST Подробно охарактеризованные последовательности - аннотация Совсем неохарактеризованные (hypothetical proteins) – достаточный уровень разнообразия Выравнивание по всей длине e-value – 10 -40 – 10 -6 Избегать partial sequences

Слайд 8





Подготовка выборки
BLAST => сохранить все последовательности разом в FASTA формате или сразу на выравнивание
	Имена последовательностей:
	не более 15 символов
	без пробелов
	как можно меньше служебных символов – можно “_”
	нельзя использовать одинаковых имен!
Описание слайда:
Подготовка выборки BLAST => сохранить все последовательности разом в FASTA формате или сразу на выравнивание Имена последовательностей: не более 15 символов без пробелов как можно меньше служебных символов – можно “_” нельзя использовать одинаковых имен!

Слайд 9





Как можно строить глобальное множественное выравнивание?
Описание слайда:
Как можно строить глобальное множественное выравнивание?

Слайд 10





Алгоритм ClustalW – пример эвристического прогрессивного алгоритма
Описание слайда:
Алгоритм ClustalW – пример эвристического прогрессивного алгоритма

Слайд 11





Современные методы построения множественного выравнивания 
(MSA, multiple sequence alignment):
Алгоритм ClustalW (реализации ClustalX, emma из EMBOSS) – до сих пор самый популярный, но уже устаревший метод (на Web – например, http://www.ebi.ac.uk/Tools/clustalw/index.html)
Muscle – быстрее и немного точнее, самый новый и довольно модный (http://phylogenomics.berkeley.edu/cgi-bin/muscle/input_muscle.py)
T-COFFEE – заметно точнее, но существенно медленнее
	(http://www.igs.cnrs-mrs.fr/Tcoffee/tcoffee_cgi/index.cgi)
Описание слайда:
Современные методы построения множественного выравнивания (MSA, multiple sequence alignment): Алгоритм ClustalW (реализации ClustalX, emma из EMBOSS) – до сих пор самый популярный, но уже устаревший метод (на Web – например, http://www.ebi.ac.uk/Tools/clustalw/index.html) Muscle – быстрее и немного точнее, самый новый и довольно модный (http://phylogenomics.berkeley.edu/cgi-bin/muscle/input_muscle.py) T-COFFEE – заметно точнее, но существенно медленнее (http://www.igs.cnrs-mrs.fr/Tcoffee/tcoffee_cgi/index.cgi)

Слайд 12





Использование ClustalW
Описание слайда:
Использование ClustalW

Слайд 13





Какие output-форматы бывают
Post-script, pdf, html – только графика
FASTA – последовательности отдельно, но с пробелами (PIR – аналогично)
MSF (ALN, Phylip, Selex …) – наглядно. Сверху – описание выборки: программа, название последовательностей, их длина, вес в выравнивании; потом само выравнивание блоками по 60 остатков
Описание слайда:
Какие output-форматы бывают Post-script, pdf, html – только графика FASTA – последовательности отдельно, но с пробелами (PIR – аналогично) MSF (ALN, Phylip, Selex …) – наглядно. Сверху – описание выборки: программа, название последовательностей, их длина, вес в выравнивании; потом само выравнивание блоками по 60 остатков

Слайд 14





Перевод форматов: READSEQ
(http://www-bimas.cit.nih.gov/molbio/readseq/)
Описание слайда:
Перевод форматов: READSEQ (http://www-bimas.cit.nih.gov/molbio/readseq/)

Слайд 15





ClustalW - output
Описание слайда:
ClustalW - output

Слайд 16





JalView – редактирование выравниваний
Описание слайда:
JalView – редактирование выравниваний

Слайд 17





TCoffee
Построение множественных выравниваний
Оценка достоверности существующего выравнивания
Использование 3-D структуры при построении выравнивания
Сравнение и комбинирование выравниваний
Описание слайда:
TCoffee Построение множественных выравниваний Оценка достоверности существующего выравнивания Использование 3-D структуры при построении выравнивания Сравнение и комбинирование выравниваний

Слайд 18





TCoffee
Описание слайда:
TCoffee

Слайд 19





Как использовать TCoffee для других целей
Множественное выравнивание на основе 3D-структуры (Expresso): надо заменить 1 или более имен в FASTA формате последовательностей на PDB-идентификатор соответствующей структуры. Тест – “Template file” (число структур). Если не в PDB – “Advanced”
Alignment evaluation – готовое выравнивание на вход. На выходе – раскрашенное выравнивание (score.html, score.pdf): каждый столбец покрашен в соответствии с качеством – красный/оранжевый/желтый - хорошо
Описание слайда:
Как использовать TCoffee для других целей Множественное выравнивание на основе 3D-структуры (Expresso): надо заменить 1 или более имен в FASTA формате последовательностей на PDB-идентификатор соответствующей структуры. Тест – “Template file” (число структур). Если не в PDB – “Advanced” Alignment evaluation – готовое выравнивание на вход. На выходе – раскрашенное выравнивание (score.html, score.pdf): каждый столбец покрашен в соответствии с качеством – красный/оранжевый/желтый - хорошо

Слайд 20





Как “читать” множественное выравнивание?
Хорошее выравнивание – высоко-консервативные блоки, перемежающиеся блоками с инсерциями/делециями
ДНК – консервативные “островки”
Качество – score, локально важно
“consensus” – строка с символами “*”, “:”, “.” – консервативный, похожие по размеру и гидропатичности, похожие по размеру ИЛИ гидропатичности, соответственно
Описание слайда:
Как “читать” множественное выравнивание? Хорошее выравнивание – высоко-консервативные блоки, перемежающиеся блоками с инсерциями/делециями ДНК – консервативные “островки” Качество – score, локально важно “consensus” – строка с символами “*”, “:”, “.” – консервативный, похожие по размеру и гидропатичности, похожие по размеру ИЛИ гидропатичности, соответственно

Слайд 21





Если консервативны только отдельные столбцы
W, Y, F – консервативное гидрофобное ядро, стабилизирующая роль в ядре. Если и мутируют, то между собой
G,P  - фланкируют бета-стренды и альфа-спирали
С – участвует в образовании дисульфидных мостиков – одинаковое расстояние между
H,S – каталитические центры протеаз
K, R, D, E – заряженные аминокислоты, участвуют в связывании лигандов
L – редко консервативны. Формируют leucine zipper – белок-белковые взаимодействия
Описание слайда:
Если консервативны только отдельные столбцы W, Y, F – консервативное гидрофобное ядро, стабилизирующая роль в ядре. Если и мутируют, то между собой G,P - фланкируют бета-стренды и альфа-спирали С – участвует в образовании дисульфидных мостиков – одинаковое расстояние между H,S – каталитические центры протеаз K, R, D, E – заряженные аминокислоты, участвуют в связывании лигандов L – редко консервативны. Формируют leucine zipper – белок-белковые взаимодействия

Слайд 22





Локальное множественное выравнивание – постановка задачи
Ряд последовательностей, в каждой из которых есть интересное слово (либо точно, либо с небольшим количеством замен) известной длины
 => Найти и описать это слово
Идея. Будем искать перепредставленное слово. Стартуем со всех слов в выравнивании, ищем лучшее его представление в каждой из последовательностей и потом уточняем по полученному профайлу
Описание слайда:
Локальное множественное выравнивание – постановка задачи Ряд последовательностей, в каждой из которых есть интересное слово (либо точно, либо с небольшим количеством замен) известной длины => Найти и описать это слово Идея. Будем искать перепредставленное слово. Стартуем со всех слов в выравнивании, ищем лучшее его представление в каждой из последовательностей и потом уточняем по полученному профайлу

Слайд 23





Как это выглядит
dnaN     ACATTATCCGTTAGGAGGATAAAAATG
gyrA      GTGATACTTCAGGGAGGTTTTTTAATG
serS      TCAATAAAAAAAGGAGTGTTTCGCATG
bofA          CAAGCGAAGGAGATGAGAAGATTCATG
csfB       GCTAACTGTACGGAGGTGGAGAAGATG
xpaC         ATAGACACAGGAGTCGATTATCTCATG
metS      ACATTCTGATTAGGAGGTTTCAAGATG
gcaD      AAAAGGGATATTGGAGGCCAATAAATG
spoVC     TATGTGACTAAGGGAGGATTCGCCATG
ftsH     GCTTACTGTGGGAGGAGGTAAGGAATG
pabB         AAAGAAAATAGAGGAATGATACAAATG
rplJ      CAAGAATCTACAGGAGGTGTAACCATG
tufA       AAAGCTCTTAAGGAGGATTTTAGAATG
rpsJ      TGTAGGCGAAAAGGAGGGAAAATAATG
rpoA         CGTTTTGAAGGAGGGTTTTAAGTAATG
rplM        AGATCATTTAGGAGGGGAAATTCAATG
Cons          tacataaaggaggtttaaaaat
Описание слайда:
Как это выглядит dnaN ACATTATCCGTTAGGAGGATAAAAATG gyrA GTGATACTTCAGGGAGGTTTTTTAATG serS TCAATAAAAAAAGGAGTGTTTCGCATG bofA CAAGCGAAGGAGATGAGAAGATTCATG csfB GCTAACTGTACGGAGGTGGAGAAGATG xpaC ATAGACACAGGAGTCGATTATCTCATG metS ACATTCTGATTAGGAGGTTTCAAGATG gcaD AAAAGGGATATTGGAGGCCAATAAATG spoVC TATGTGACTAAGGGAGGATTCGCCATG ftsH GCTTACTGTGGGAGGAGGTAAGGAATG pabB AAAGAAAATAGAGGAATGATACAAATG rplJ CAAGAATCTACAGGAGGTGTAACCATG tufA AAAGCTCTTAAGGAGGATTTTAGAATG rpsJ TGTAGGCGAAAAGGAGGGAAAATAATG rpoA CGTTTTGAAGGAGGGTTTTAAGTAATG rplM AGATCATTTAGGAGGGGAAATTCAATG Cons tacataaaggaggtttaaaaat

Слайд 24





Gibbs sampler
Let’s A be a signal (set of sites), and I(A) be its information content.
At each step a new site is selected in one sequence with probability 
P ~ exp [(I(Anew)]
For each candidate site the total time of occupation is computed.
(Note that the signal changes all the time)
Описание слайда:
Gibbs sampler Let’s A be a signal (set of sites), and I(A) be its information content. At each step a new site is selected in one sequence with probability P ~ exp [(I(Anew)] For each candidate site the total time of occupation is computed. (Note that the signal changes all the time)

Слайд 25





Соответствующие программы
Описание слайда:
Соответствующие программы

Слайд 26





Представление результатов  таких программ – Logos
Описание слайда:
Представление результатов таких программ – Logos

Слайд 27





Greedy algorithms (MEME)
 Find a signal among all k-words (assuming that we know the length signal). 
For all k-words it’s too time-consuming (k~16). So initially we consider only k-words that were present in the fragments. 
For each k-word construct a matrix of “sites”: alignment of best “copies” of the k-word from every sequence fragment.
Select the best k-word. What is the measure for comparison of matrices? Information content!
Описание слайда:
Greedy algorithms (MEME) Find a signal among all k-words (assuming that we know the length signal). For all k-words it’s too time-consuming (k~16). So initially we consider only k-words that were present in the fragments. For each k-word construct a matrix of “sites”: alignment of best “copies” of the k-word from every sequence fragment. Select the best k-word. What is the measure for comparison of matrices? Information content!

Слайд 28





Greedy algorithms. Cont’d
 Select the k-word with maximal information content
Problem. We considered only k-words from our sequences => may select not the signal (the consensus word), but only its best representative in our sample
Solution. For each k-word from the sample construct PWM and reconstruct the frequency matrix based on it. Repeat until stabilization of the matrix. Use the consensus of this matrix.
Описание слайда:
Greedy algorithms. Cont’d Select the k-word with maximal information content Problem. We considered only k-words from our sequences => may select not the signal (the consensus word), but only its best representative in our sample Solution. For each k-word from the sample construct PWM and reconstruct the frequency matrix based on it. Repeat until stabilization of the matrix. Use the consensus of this matrix.

Слайд 29





Limitation of greedy algorithms
 Started from k-words in our sequences and increase the information content at each step => find a local (not global) maximum of the functional. 
We need an alternative algorithm that will not be “greedy”!
Описание слайда:
Limitation of greedy algorithms Started from k-words in our sequences and increase the information content at each step => find a local (not global) maximum of the functional. We need an alternative algorithm that will not be “greedy”!

Слайд 30





Frequency matrix
Описание слайда:
Frequency matrix



Похожие презентации
Mypresentation.ru
Загрузить презентацию