Метод построения вторичной структуры РНК на основе принципов самоорганизации
Описан метод компьютерного построения вторичной структуры РНК на основе последовательности нуклеотидов. Алгоритм использует метод Монте-Карло для моделирования самоорганизации РНК при последовательном образовании новых спиральных участков. Метод может быть использован для расчетов структур достаточн...
Збережено в:
Дата: | 1990 |
---|---|
Автори: | , |
Формат: | Стаття |
Мова: | Russian |
Опубліковано: |
Інститут молекулярної біології і генетики НАН України
1990
|
Назва видання: | Биополимеры и клетка |
Онлайн доступ: | http://dspace.nbuv.gov.ua/handle/123456789/154119 |
Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
Цитувати: | Метод построения вторичной структуры РНК на основе принципов самоорганизации / А.П. Гультяев, Ю.Н. Монаков // Биополимеры и клетка. — 1990. — Т. 6, № 6. — С. 31-36. — Бібліогр.: 13 назв. — рос. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of Ukraineid |
irk-123456789-154119 |
---|---|
record_format |
dspace |
spelling |
irk-123456789-1541192019-06-16T01:26:54Z Метод построения вторичной структуры РНК на основе принципов самоорганизации Гультяев, А.П. Монаков, Ю.Н. Описан метод компьютерного построения вторичной структуры РНК на основе последовательности нуклеотидов. Алгоритм использует метод Монте-Карло для моделирования самоорганизации РНК при последовательном образовании новых спиральных участков. Метод может быть использован для расчетов структур достаточно длинных РНК (вплоть до 5000 нуклеотидов) на персональном компьютере без использования больших объемов памяти. Описано метод комп’ютерної побудови вторинної структури РНК на основі послідовності нуклеотидів. Алгоритм використовує метод Монте-Карло для моделювання самоорганізації РНК при послідовному утворенні нових спіральних ділянок. Метод може бути використаний для розрахунків структур досить довгих РНК (аж до 5000 нуклеотидів) на персональному комп’ютері без використання великих обсягів пам'яті. The method for computer calculation of RNA secondary structure is described. The algorithm is based on successive formation of helices in the RNA self-organization process with the generation of random structure sets by the Monte-Carlo mehtod. This way permits constructing RNA secondary structures for rather long sequences (up to 5000 nucleotides) by means of the personal computer without using large memory volumes. 1990 Article Метод построения вторичной структуры РНК на основе принципов самоорганизации / А.П. Гультяев, Ю.Н. Монаков // Биополимеры и клетка. — 1990. — Т. 6, № 6. — С. 31-36. — Бібліогр.: 13 назв. — рос. 0233-7657 DOI: http://dx.doi.org/10.7124/bc.00029C http://dspace.nbuv.gov.ua/handle/123456789/154119 577.323.435 ru Биополимеры и клетка Інститут молекулярної біології і генетики НАН України |
institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
collection |
DSpace DC |
language |
Russian |
description |
Описан метод компьютерного построения вторичной структуры РНК на основе последовательности нуклеотидов. Алгоритм использует метод Монте-Карло для моделирования самоорганизации РНК при последовательном образовании новых спиральных участков. Метод может быть использован для расчетов структур достаточно длинных РНК (вплоть до 5000 нуклеотидов) на персональном компьютере без использования больших объемов памяти. |
format |
Article |
author |
Гультяев, А.П. Монаков, Ю.Н. |
spellingShingle |
Гультяев, А.П. Монаков, Ю.Н. Метод построения вторичной структуры РНК на основе принципов самоорганизации Биополимеры и клетка |
author_facet |
Гультяев, А.П. Монаков, Ю.Н. |
author_sort |
Гультяев, А.П. |
title |
Метод построения вторичной структуры РНК на основе принципов самоорганизации |
title_short |
Метод построения вторичной структуры РНК на основе принципов самоорганизации |
title_full |
Метод построения вторичной структуры РНК на основе принципов самоорганизации |
title_fullStr |
Метод построения вторичной структуры РНК на основе принципов самоорганизации |
title_full_unstemmed |
Метод построения вторичной структуры РНК на основе принципов самоорганизации |
title_sort |
метод построения вторичной структуры рнк на основе принципов самоорганизации |
publisher |
Інститут молекулярної біології і генетики НАН України |
publishDate |
1990 |
url |
http://dspace.nbuv.gov.ua/handle/123456789/154119 |
citation_txt |
Метод построения вторичной структуры РНК на основе принципов самоорганизации / А.П. Гультяев, Ю.Н. Монаков // Биополимеры и клетка. — 1990. — Т. 6, № 6. — С. 31-36. — Бібліогр.: 13 назв. — рос. |
series |
Биополимеры и клетка |
work_keys_str_mv |
AT gulʹtâevap metodpostroeniâvtoričnojstrukturyrnknaosnoveprincipovsamoorganizacii AT monakovûn metodpostroeniâvtoričnojstrukturyrnknaosnoveprincipovsamoorganizacii |
first_indexed |
2025-07-14T05:39:43Z |
last_indexed |
2025-07-14T05:39:43Z |
_version_ |
1837599643273265152 |
fulltext |
3. Burns P. Α., Gordon A. I. E., Glickman B. W. I n f l u e n c e of n e i g h b o u r i n g b a s e s equen -
ce on N - m c t h y l - N ' - n i t r o - X - n i t r o s o g u a n i d i n e m u t a g e n e s i s in the Iacl g e n e Escherichia
coli Ц і. Мої . Biol .— 1087,— 194, N 4 , — P . 385—390
4. Golding G. B., Glickman B. W. Sequence-d i rec ted m u t a g e n e s i s : ev idence f r o m a
p h y l o g e n e t i c h i s t o r y of h u m a n α - i n t e r f e r o n g e n e s / / P roc . N a t . Acad . Sci. U S A . —
1985 — 82. N 12,— P . 8577—8581.
5. Drake J. W., Baltz R. H. The b i o c h e m i s t r y of m u t a g e n e s i s / / A n n u . Rev . B iochem.—
1976 — 4 5 , — P . M — 3 7 .
6. Индукция п о в т о р я ю щ и х с я нуклеотидных последовательностей . В е р о я т н ы е механиз -
мы эволюции генома и генной конверсии / Р . И. Салганик , А. В. М а з и н , Г. Л . Д и а -
IioBt Л . П. Овчинникова / / Г е н е т и к а , — 1984,—20, № 8 — С . 1244—1252.
7. Льюин Б. Гены,— М. : Мир, 1987,— 398 с.
8. Уотсон Дж. М о л е к у л я р н а я биология гена .— М. : Мир, 1978.— 467 с.
9. Meselson M., Radding С. A g e n e r a l mode l for gene t i c r e c o m b i n a t i o n / / P r o c . N a t .
Acad. Sci. U S A . — 1975,—72, N 5 , — P . 3&8—361.
10. Kunkel T. A. The m u t a t i o n a l speci f ic i ty of D N A p o l y m e r a s e s - α and -γ d u r i n g in
vitro D N A s y n t h e s i s / / J . Biol . C h e m . — 1985 — 260, N 2 6 . — P . 12866—12879.
11. Topal M. D., Eadie J. S., Conrad M. O 6 - M e t h y l g u a n i n e m u t a t i o n and r epa i r is n o n u n i -
f o r m / / Ib id .— 1986 ,—261, N 21,— P . 9879—9885.
12. Gearhart P. J., Bogenhagen D. F. C l u s t e r s of po in t m u t a t i o n s a r e f o u n d exc lus ive ly
a r o u n d r e a r r a n g e d a n t i b o d y v a r i a b l e g e n e s / / P roc . Na t . Acad . Sci. U S A . — 1983.—
80, N 16,— P. 3439—3443.
13. A hyperconversion m e c h a n i s m g e n e r a t e s the chicken l ight cha in p r e i m m u n e r epe r to i -
re / C.-A. R e y n a u d , V. A n q u e z , H . Gr ima l , J .-C. Wei l l / / Cel l .— 1967.— 48, N 2.—
P. 379—388.
14. Рогозин И. Б., Соловьев В. В., Колчанов Н. А. К о н т е к с т н а я п р е д е т е р м и н и р о в а н н о с т ь
м у т а ц и о н н о г о процесса (соматические, спонтанные и и н д у ц и р о в а н н ы е точковые му-
тации .— Новосибирск , 1988.— 54 с.— (Препринт / Сиб. отд-ние А Н С С С Р , Ин-т ци-
тологии и генетики, № 08031) .
15. Berek С., Griffiths G. M., Milstain С. M o l e c u l a r even t s d u r i n g m a t u r a t i o n of t he im-
m u n e r e s p o n s e to o x a z o l i n e / / N a t u r e . — 1985.— 316.— P. 412—418.
16. Rabbits T. N., Hamlyn P. H., Baer R. Al te red nuc leo t ide s equences of a t r a n s l o c a t e d
c-myc g e n e in Burk i t t l y m p h o m a / / Ib id .— 1983.— 306.— P . 760—765.
17. Hauser J., Levine A. S., Dixon K- U n i q u e p a t t e r n of po in t m u t a t i o n s a r i s i n g a f t e r ge -
ne t r a n s f e r in to m a m m a l i a n c e l l s / / E M B O J .— 1987 — 6, N 1 . — P . 63—67.
Ин-т цитологии и генетики Сиб. отд -ния А Н С С С Р , П о л у ч е н о 06.04.90
Н о в о с и б и р с к
УДК 577.323.435
А. П. Гультяев, Ю. II. Монаков
МЕТОД ПОСТРОЕНИЯ ВТОРИЧНОЙ СТРУКТУРЫ РНК
НА ОСНОВЕ ПРИНЦИПОВ САМООРГАНИЗАЦИИ
Описан метод компьютерного построения вторичной структуры РНК на основе после-
довательности нуклеотидов. Алгоритм использует метод Монте-Карло для моделиро-
вания самоорганизации РНК при последовательном образовании новых спиральных
участков. Метод может быть использован для расчетов структур достаточно длинных
РНК (вплоть до 5000 нуклеотидов) на персональном компьютере без использования
больших объемов памяти.
Введение. Известно, что молекулы Р Н К имеют тенденцию к образо-
ванию двунитчатых участков с уотсон-криковскими парами нуклеоти-
дов, связывая друг с другом отдельные фрагменты молекулы. Образу-
ющаяся структура именуется вторичной структурой Р Н К (этот термин
используется также для описания молекулярной геометрии Р Н К и
Д Н К , т. е. А, В, С-структур и т. д., но в нашем случае мы под вторич-
ной структурой будем понимать только наличие определенных двунит-
чатых участков в данной молекуле Р Н К ) . Вторичная структура Р Н К
играет важную роль во многих процессах [1].
Зачастую экспериментальное определение вторичной структуры
Р Н К затруднено, поэтому большое значение имеют теоретические мето-
© А. П. ГУЛЬТЯЕВ, ю . Н. МОНАКОВ, 1990
ISSN 0233-7657. Б И О П О Л И М Е Р Ы И КЛЕТКА. 1990. Т. 6. № 6 3 — 0-569 3 1
ды построения вторичной структуры по известной нуклеотидной после-
довательности. В настоящее время разработан ряд алгоритмов и про-
грамм, решающих эту задачу, однако до сих пор не удается найти та-
кого способа построения, который давал бы результаты, полностью
соответствующие известным экспериментальным данным.
Наиболее приемлемыми по энергетике являются алгоритмы, ис-
пользующие метод динамического программирования и его модифика-
ции [2, 3], при котором проводится поиск одной оптимальной структу-
ры с минимальной свободной энергией. Такая детерминированность
является и существенным ограничением этих методов. Предсказывае-
мая структура может быть лишенной биологического смысла. К этому
можно добавить, что при исследовании последовательностей различной
длины время анализа растет пропорционально N3 (N — число нуклео-
тидов). Последнее обстоятельство может создать большие практичес-
кие трудности. Д л я длинных молекул Р Н К был предложен ряд мето-
дов расчета вторичной структуры, τ которых поиск минимума энергии
не является главным. В их основе всегда лежит принцип, позволяющий
устанавливать приоритеты при отборе возможных элементов во вторич-
ную структуру. Возникающая при этом свобода выбора относительно
конечного результата, с одной стороны, может быть оправдана при
сравнении расчета с данными экспериментов, а с другой —вполне ком-
пенсируется сокращением времени анализа до величины, пропорцио-
нальной N2. Методы такого типа основаны на контекстном анализе
исследуемых последовательностей и на различных принципах самоор-
ганизации Р Н К [4—7]. Д л я длинных (более 500 нуклеотидов) Р Н К
они представляются довольно перспективными, так как, по-видимому,
молекула Р Н К при формировании своей структуры и стремлении к ми-
нимуму свободной энергии, соответствующему состоянию термодинами-
ческого равновесия, будет проходить через ряд состояний, имеющих
локальные энергетические минимумы, причем время перехода к рав-
новесному может быть весьма значительным.
В данной работе предложен метод построения вторичной структу-
ры Р Н К , опирающийся на принцип последовательной самоорганизации
молекулы Р Н К .
Он учитывает как энергетические параметры элементов вторичной
структуры, так и топологические эффекты конкурирующих за образо-
вание стэкинг-областей потенциальных двунитчатых участков. Процесс
самоорганизации моделируется методом Монте-Карло.
Методы. О п и с а н и е а л г о р и т м а . Основой алгоритма является процесс са-
моорганизации молекулы Р Н К , состоящей в последовательности этапов, на к а ж д о м из
которых образуются определенные двунитчатые участки (спирали). Фактически этот
процесс заключается в некоторой конкуренции потенциальных спиралей за право быть
включенными во вторичную структуру. Построение всех потенциальных спиралей, ко-
торые могут быть реализованы на данной последовательности, не представляет труд-
ности, однако построение вторичной структуры Р Н К , собственно говоря, и состоит
в выборе небольшого числа спиралей из огромного множества. Таким образом, мы при-
ходим к вопросу о критерии, которым следует руководствоваться при выборе. Как у ж е
отмечалось выше, поиск глобального минимума свободной энергии не всегда дает удов-
летворительные результаты. Ясно, что в процессе самоорганизации при альтернатив-
ном выборе из всего набора конкретной спирали д л я включения ее во вторичную струк-
туру, кроме величины ее энергии (с учетом дестабилизирующей энергии образующихся
петель), принципиально важной является характеристика конкурентоспособности дан-
ной спирали по отношению ко всем остальным за включение во вторичную структуру
на данном этапе анализа . Ясно также, что преимуществом обладают спирали, наименее
препятствующие образованию других. Физически это можно представить как образова-
ние и нарушение (возможно, частичное) неких структур из данного набора спиралей, в
результате которого образуются спирали, наиболее часто встречающиеся в этих дина-
мических структурах. Такой процесс можно смоделировать методом Монте-Карло. В
рамках определенного набора спиралей генерируется некоторое число случайных струк-
тур и после этого вычисляется частота встречаемости к а ж д о й спирали /. Эту величи-
32 ISSN 0233-7657. Б И О П О Л И М Е Р Ы И КЛЕТКА. 1990. Т. 6. № 6 3 — 0-569 32
ну вместе со свободной энергией спирали можно использовать при выработке правил
отбора спиралей для включения во вторичную структуру. В настоящей работе в каче-
стве критерия выбран параметр f-AG. При расчетах использовали значения энергий
стэкинг-взаимодействий и петель, приведенные в работе [в]. Существенным моментом
построения вторичной структуры является то, что изначально рассматривается непол-
ный набор возможных спиралей. На первых этапах строили наборы наиболее энерге-
с двух сторон при наличии внутренних петель с максимальным размером два нуклео-
тида по к а ж д о й нити, если это приносит выигрыш в энергии. Н а этом вычисляют энергию
к а ж д о й спирали с учетом всех петель, которые образуются или разрушаются в у ж е
имеющейся после предыдущих этапов структуре Р Н К .
2. П о с т р о е н и е с л у ч а й н ы х с т р у к т у р и з н а б о р а с п и р а л е й . Эти
структуры строятся следующим образом: из данного набора спиралей с помощью мето-
д а Монте-Карло выбирают первую спираль данной структуры, отбрасывают все спи-
рали, с ней несовместимые, и из оставшихся выбирают случайную вторую и так до тех
пор, пока есть совместимые с у ж е отобранными. Таким образом, строится определен-
ное число структур, и для к а ж д о й спирали вычисляется ее частота встречаемости в этих
структурах.
Д а л е е спирали, встречающиеся менее чем в половине построенных случай-
ных структур, из рассмотрения отбрасывают. Затем вычисляют произведение частоты
встречаемости данной спирали на ее свободную энергию.
3. Величину произведения частоты и энергии использовали д л я отбора спиралей,
которые образуются на данном этапе. Д л я этого выбирают спираль с максимальной ве-
личиной, отбрасывают несовместимые с ней, из оставшихся выбирают имеющую мак-
симальную величину и т. д.
Этот процесс заканчивается тогда, когда либо исчерпывается количество спиралей,
имеющих частоту, большую половины числа случайных структур, либо в том случае,
когда количество отобранных спиралей достигает определенной величины, являющейся
функцией числа спиралей в исходном наборе.
Эти блоки — основные части алгоритма, и после их выполнения в структуру строя-
щейся Р Н К включают новые спирали. Затем предел энергии, определяющий набор спи-
ралей, увеличивается (по абсолютной величине уменьшается) , строится новый набор
спиралей (естественно, совместимых с у ж е построенными) и выполняется новый цикл.
Общее количество спиралей является, в принципе, т а к ж е функцией длины последо-
вательности.
Программа , реализующая приведенный алгоритм, написана на языке СИ. Вычис-
ления выполняли на П К «Амстрад 1640».
ISSN 0233-7657. Б И О П О Л И М Е Р Ы И КЛЕТКА. 1990. Т. 6. № 6 3 — 0-569 33
тичных спиралей, а затем — с меньшей энергией, учитывая, что
структура Р Н К уже частично сформирована, т. е. некоторым
образом моделировали процесс самоорганизации РНК, состоя-
щий из отдельных этапов.
Основная схема алгоритма приведена на рис. 1. В соответ-
ствии с вышеизложенным он разбивается на несколько главных
блоков.
1. П о с т р о е н и е н а б о р а с п и р а л е й . На этом этапе
строятся все спирали, стэкинг-энергия которых меньше опреде-
ленной величины. Очевидно, что эта величина является функ-
цией длины последовательности. В данной работе эту функцию
определяли эмпирически по наилучшим результатам для извест-
ных структур. Спирали строятся с дефектами, т. е. допускается
наличие внутренних петель. Д л я этого вначале строится без-
дефектная спираль, затем (если это возможно) она удлиняется
Рис. 1. Основные этапы расчета вторичной структуры
Fig. !. The main s t ages of RNA secondary s t ruc ture calculat ion.
Результаты и обсуждение. При оценке любого алгоритма расче-
та вторичной структуры Р Н К первым является вопрос: насколько ре-
зультат расчета близок к структуре, наблюдающейся в эксперименте.
Д л я проверки мы выбрали несколько Р Н К принципиально различной
длины, для которых имеется наибольший объем экспериментальных
данных. Это известный мидивариант Р Н К фага Qp, в стабильности ко-
торого важную роль играет вторичная О700
структура, длиной 218 нуклеотидов [9], / Ч
а также 16S и 23S рибосомные Р Н К а
Escherichia coli длиной 1542 и 2904 нук- f j л
800
Рис. 2. Вторичная структура мидиварианта Р Н К фага Qp 1 предсказываемая по предло-
женному алгоритму (а) , и приведенная в обзоре [10] (б)
Fig . 2. The secondary s t ruc tu res of Q p h a g e mid iva r i an t RNA, predicted by presented al-
go r i thm (a) and f rom review [10]
Рис. 3. Вторичная структура фрагмента 587—905 16S р Р Н К Ε. coli по предсказанию
(а) и по модели [11] (б)
F ig . 3. The secondary structures of fragment 587—905 f r o m E. coli 16S-rRNA: predicted
(a) and in model [11] (6).
леотида соответственно. Следует сразу отметить, что модели вторичных
структур этих молекул все же допускают некоторые разночтения.
Мидивариант Р Н К фага Qp, по-видимому, может существовать в
двух формах: закрытой, т. е. со спариванием 5'- и З'-концов, и откры-
той [9]. Алгоритм, предложенный в нашей работе, с достаточно боль-
шой точностью дает закрытую форму (рис. 2) . Видно, что за исключе-
нием пары спиралей, соединенных в одну, расчет соответствует дан-
ным, приведенным в литературе [9, 10].
Естественно, при увеличении длины исследуемой Р Н К точность
расчета падает. Так, соответствие расчета вторичной структуры 16S
р Р Н К Е. coli уже составляет 55—60 % (в зависимости от модели, с
которой проводится сравнение). Однако все же эта величина достаточ-
но велика по сравнению с другими методами, которые проверяли на
этой последовательности. Так, расчет, выполненный при работе с фраг-
ментом 16S р Р Н К размером 574 нуклеотида, дает около 50 % соответ-
ствия д а ж е при введении в программу данных экспериментов [2]. В
нашем же случае программа, работающая с полной последовательно-
стью, для достаточно протяженных участков дает результат, практиче-
ски полностью совпадающий с моделями, выведенными из эксперимен-
тальных и филогенетических данных. Д л я примера на рис. 3 приведе-
ны структуры фрагмента 587—905 16S р Р Н К Е. coli по модели [11]
и по расчету.
Обращают на себя внимание некоторые особенности расчета по
описываемому алгоритму. Программа практически полностью предска-
зывает спиральные участки, образующие шпилечные петли, и спирали,
34 ISSN 0233-7657. Б И О П О Л И М Е Р Ы И КЛЕТКА. 1990. Т. 6. № 6 3 — 0-569 34
торого важную роль играет вторичная
структура, длиной 218 нуклеотидов [9],
а также 16S и 23S рибосомные Р Н К
Escherichia coli длиной 1542 и 2904 нук-
образующие внутренние петли с первыми. Спирали, образующие раз-
ветвленные (сложные) петли, предсказываются хуже. Спирали, обра-
зующие шпилечные петли, при проведении расчета образуются раньше, и
в том случае, если не задаваться целью построить полную вторичную
структуру РНК, а выявить наиболее стабильные участки структу-
ры, можно ограничиться только этими фрагментами. Точность такого
расчета будет достигать 70—80 %.
При сравнении модели вторичной структуры 16S р Р Н К с резуль-
татом расчета видно также, что целый ряд участков, образующих спи-
рали в модели, в расчете также образуют спирали, но другие. Не ис-
ключено, что этот результат демонстрирует некоторые альтернативные
формы вторичной структуры [12], однако это может быть только пред-
положением.
При расчете более длинных молекул точность падает и составляет
для 23S р Р Н К Е. coli [13] (2904 нуклеотида) 40—45 %. Здесь т а к ж е
более точно предсказываются структуры фрагментов, не образующие
сложных петель, и если ограничиваться первым 25—30 спиралями в
расчете, то точность составляет около 75 %.
Интересно, что точность расчета для длинных (более 2000 нуклео-
тидов) молекул Р Н К можно повысить, предположив, что сворачивание
вторичной структуры начинается еще в процессе синтеза Р Н К . Про-
грамма по уже описанному алгоритму, но построенная таким образом,
что определенное количество спиралей вычисляется из последователь-
но увеличивающихся по длине фрагментов общей Р Н К вплоть до пол-
ной длины, дает более высокую точность. Этот вопрос, по-видимому,
требует дальнейшего специального исследования.
T H E M E T H O D FOR RNA SECONDARY S T R U C T U R E C O N S T R U C T I O N
ON THE BASIS O F S E L F - O R G A N I Z A T I O N P R I N C I P L E S
A. P. Gultyaev, Yu. N. Monakov
All-Union Ins t i tu te of In f luenza ,
Min is t ry of Publ ic Hea l th of the USSR Len ingrad
S u m m a r y
The method for computer ca lcula t ion of RNA secondary s t ruc ture is described. The al-
gor i thm is based on successive fo rmat ion of helices in the RNA se l f -o rgan iza t ion pro-
cess with the genera t ion of r andom s t ruc ture sets by the Monte -Car lo mehtod. This w a y
permi t s cons t ruc t ing RNA secondary s t ruc tures for ra ther long sequences (up to SO1OO
nucleot ides) by m e a n s of the personal computer wi thout u s ing l a rge memory vo lumes .
С П И С О К Л И Т Е Р А Т У Р Ы
1. Wada Α., Suyama A. Local s tabi l i ty of DNA and R N A secondary s t ruc ture and i t s
re lat ion to biological f u n c t i o n / / P r o g r . Biophvs. and Мої. Biol.— 1986.— 47.—
P. 113—167.
2. Zuker M., Stiegler P. Opt imal compute r fo ld ing of l a rge RNA sequences u s i n g ther-
modynamics and auxi l iary i n f o r m a t i o n / / N u c l . Acids Res.— 19>81 -—9, N il.— P 133—
148.
3. Some s imple computa t iona l me thods to improve the fo ld ing of l a rge RNAs / А . B. J a -
cobson, L. Good, J. Simonet t i , M. Z u k e r / / I b i d . — 1 9 β 4 . — 1 2 , N 1 ,—P. 45—51.
4. Колчанов Η. Α., Соловьев В. В., Жарких А. А. Контекстные методы теоретического
анализа генетических макромолекул ( Д Н К , Р Н К и белков) / / Итоги науки и техни-
к и , — М . : В И Н И Т И , 1985,—С. 6—37 (Молекуляр. биология; Т. 21).
5. Martinez Η. Μ. An RiNA fo ld ing rule / / N u c l . Acids Res.— 1984.— 12, N 1 — P 323—
334.
6. Миронов А. А., Дьяконов JI. П., Киетер А. Э. Предсказание ансамблей вторичных
структур Р Н К . Кинетический анализ с а м о о р г а н и з а ц и и / / М о л е к у л я р . биология —
1984,— 18, № 6 ,—С. 1686—1694.
7. Nusstnov R., Pieezenik G. S t ruc tu ra l and combina tor ia l cons t r a in t s on base p a i r i n g
in l a rge nucleot ide sequences / / J. Theor. Biol.—-1084.— 106, N 3.— P. 246—259.
8. Improved f r ee -energy pa r ame te r s for predict ions of RNA duplex s tabi l i ty / S. M. Freier ,
R. Kierzek, J. A. J aege r et a l . / / P r o c . Nat . Acad. Sci. U S A — 1986.— 83 N 12 —
P. 9373—9377.
ISSN 0233-7657. Б И О П О Л И М Е Р Ы И КЛЕТКА. 1990. Т. 6. № 6 3 — 0-569 35
9. Mills D. R., Kramer F. R., Spiegelman S. C o m p l e t e n u c l e o t i d e sequence of a repl i -
c a t i n g R N A m o l e c u l e / / S c i e n c e . — 1973,— 180, N 4 0 8 9 , — P . 916—927.
10. Эйген M., Шустер П. Гиперцикл . Принципы самоорганизации молекул.— М . : Мир,
1 9 8 2 , — 2 7 0 с.
11. Detailed a n a l y s i s of the h i g h e r - o r d e r s t r u c t u r e of 16S-l ike r i b o s o m a l r ibonuc le ic
a c i d s / C . R. Woese , R. Gute l l , R. G u p t a , H . F. No l l e r / / M i c r o b i o l Rev .— 1983 ,—47,
N 4 , — P . 621—669.
.12. Williams A. L., Tinoco I. A d y n a m i c p r o g r a m m i n g a l g o r i t h m for f i n d i n g a l t e r n a -
t ive R N A s e c o n d a r y s t r u c t u r e s / / N u c l . Ac ids Res .— 1986.— 14, N 1 . — P . 299—315.
13. Gutell R. R., Fox G. E. A c o m p i l a t i o n of l a r g e s u b u n i t R N A sequences p r e s e n t e d in a
s t r u c t u r a l f o r m a t / / I b i d . — 1988,— 18, s u p p l . — P . 175—185.
В Н И И гриппа М З С С С Р , Л е н и н г р а д Получено 29.05.90
УДК 577.112
П. А. Жилкин, А. М. Ерошкин "
МЕТОД ПОИСКА
ФУНКЦИОНАЛЬНО ВАЖНЫХ ОБЛАСТЕЙ БЕЛКОВ И ПЕПТИДОВ
ПО АМИНОКИСЛОТНОЙ ПОСЛЕДОВАТЕЛЬНОСТИ
Предлагается эмпирический метод предсказания функционально важных областей бел-
ков и пептидов. Рассматриваются только такие функционально важные участки, остат-
ки которых располагаются близко в последовательности (линейные или непрерывные
функционально важные участки). В основе метода лежит ранее обнаруженная корре-
ляция между локализацией известных непрерывных функционально важных областей
в последовательностях белков и низкими значениями профилей сходства этих после-
довательностей с последовательностями белков человека [7]. Применение предлагаемого
метода к большому набору белков позволяет правильно предсказать более половины из
известных непрерывных функциональных центров.
• 20 W 60
Введение. В работе [1] было предложено для анализа полипептидных
последовательностей использовать профиль сходства последовательно-
сти исследуемого белка или пептида с последовательностями белков
человека. Профиль строится
следующим образом. Д л я ис-
следуемого белка и каждого
белка из выборки белков че-
ловека рассчитывается карта
Рис . 1. Схема построения п р о ф и л я
сходства исследуемого белка с одним
из белков в ы б о р к и белков человека по
к а р т е л о к а л ь н о г о сходства (горизон-
т а л ь н а я ось соответствует исследуе-
м о м у белку, в е р т и к а л ь н а я — белку вы-
борки) . О т р е з к и на к а р т е сходства —
с о в п а д а ю щ и е участки; внизу — соот-
ветствующий п р о ф и л ь сходства S,
I — его д л и н а
F ig . 1. C o n s t r u c t i o n scheme of resem-
b l a n c e p ro f i l e f o r i n v e s t i g a t e d p ro t e in
v e r s u s one p ro t e in f r o m set of h u m a n
p r o t e i n s a s ba sed on the m a p of local
r e s e m b l a n c e ( a c r o s s — i n v e s t i g a t e d
p ro te in d o w n — p ro t e in f r o m h u m a n
p ro t e in s e t ) . L ines on t he r e s e m b l a n c e
m a p — c o i n c i d i n g r e g i o n s . U n d e r t he
m a p is t he r e s e m b l a n c e p ro f i l e S ; I —
i n v e s t i g a t e d p ro t e in sequence l e n g t h .
Π
20 AO 80 I
© П. А. ЖИЛКИН, A. M. ЕРОШКИН, 1990
36 ISSN 0233-7657. Б И О П О Л И М Е Р Ы И КЛЕТКА. 1990. Т. 6. № 6 3 — 0-569 36
|