Метод поиска функционально важных областей белков и пептидов по аминокислотной последовательности
Предлагается эмпирический метод предсказания функционально важных областей белков и пептидов. Рассматриваются только такие функционально важные участки, остатки которых располагаются близко в последовательности (линейные или непрерывные функционально важные участки). В основе метода лежит ранее обна...
Збережено в:
Дата: | 1990 |
---|---|
Автори: | , |
Формат: | Стаття |
Мова: | Russian |
Опубліковано: |
Інститут молекулярної біології і генетики НАН України
1990
|
Назва видання: | Биополимеры и клетка |
Онлайн доступ: | http://dspace.nbuv.gov.ua/handle/123456789/154120 |
Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
Цитувати: | Метод поиска функционально важных областей белков и пептидов по аминокислотной последовательности / П.А. Жилкин, А.М. Ерошкин // Биополимеры и клетка. — 1990. — Т. 6, № 6. — С. 36-42. — Бібліогр.: 33 назв. — рос. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of Ukraineid |
irk-123456789-154120 |
---|---|
record_format |
dspace |
spelling |
irk-123456789-1541202019-06-16T01:27:31Z Метод поиска функционально важных областей белков и пептидов по аминокислотной последовательности Жилкин, П.А. Ерошкин, А.М. Предлагается эмпирический метод предсказания функционально важных областей белков и пептидов. Рассматриваются только такие функционально важные участки, остатки которых располагаются близко в последовательности (линейные или непрерывные функционально важные участки). В основе метода лежит ранее обнаруженная корреляция между локализацией известных непрерывных функционально важных областей в последовательностях белков и низкими значениями профилей сходства этих последовательностей с последовательностями белков человека [7]. Применение предлагаемого метода к большому набору белков позволяет правильно предсказать более половины из известных непрерывных функциональных центров. Пропонується емпіричний метод передбачення функціонально важливих областей білків і пептидів. Розглядаються лише такі функціонально важливі ділянки, залишки яких розташовані близько в послідовності (лінійні або безперервні функціонально важливі ділянки). В основі методу лежить раніше виявлена кореляція між локалізацією відомих безперервних функціонально важливих областей в послідовностях білків і низькими значеннями профілів подібності цих послідовностей з послідовностями білків людини [7]. Застосування запропонованого методу до великого набору білків дозволяє правильно передбачити більше половини з відомих безперервних функціональних центрів. An empirical method for predicting functionally important regions in protein and peptide sequences is suggested. It concerns only linear or continues regions (those consisting of residues closely placed in the sequence). The method is based on an already obtained correlation between continuous protein regions known to be functionally important and corresponding resemblance profile low values. The method allows predicting correctly more than a half of the known continuous functional centers for the large protein set. 1990 Article Метод поиска функционально важных областей белков и пептидов по аминокислотной последовательности / П.А. Жилкин, А.М. Ерошкин // Биополимеры и клетка. — 1990. — Т. 6, № 6. — С. 36-42. — Бібліогр.: 33 назв. — рос. 0233-7657 DOI: http://dx.doi.org/10.7124/bc.00029D http://dspace.nbuv.gov.ua/handle/123456789/154120 577.112 ru Биополимеры и клетка Інститут молекулярної біології і генетики НАН України |
institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
collection |
DSpace DC |
language |
Russian |
description |
Предлагается эмпирический метод предсказания функционально важных областей белков и пептидов. Рассматриваются только такие функционально важные участки, остатки которых располагаются близко в последовательности (линейные или непрерывные функционально важные участки). В основе метода лежит ранее обнаруженная корреляция между локализацией известных непрерывных функционально важных областей в последовательностях белков и низкими значениями профилей сходства этих последовательностей с последовательностями белков человека [7]. Применение предлагаемого метода к большому набору белков позволяет правильно предсказать более половины из известных непрерывных функциональных центров. |
format |
Article |
author |
Жилкин, П.А. Ерошкин, А.М. |
spellingShingle |
Жилкин, П.А. Ерошкин, А.М. Метод поиска функционально важных областей белков и пептидов по аминокислотной последовательности Биополимеры и клетка |
author_facet |
Жилкин, П.А. Ерошкин, А.М. |
author_sort |
Жилкин, П.А. |
title |
Метод поиска функционально важных областей белков и пептидов по аминокислотной последовательности |
title_short |
Метод поиска функционально важных областей белков и пептидов по аминокислотной последовательности |
title_full |
Метод поиска функционально важных областей белков и пептидов по аминокислотной последовательности |
title_fullStr |
Метод поиска функционально важных областей белков и пептидов по аминокислотной последовательности |
title_full_unstemmed |
Метод поиска функционально важных областей белков и пептидов по аминокислотной последовательности |
title_sort |
метод поиска функционально важных областей белков и пептидов по аминокислотной последовательности |
publisher |
Інститут молекулярної біології і генетики НАН України |
publishDate |
1990 |
url |
http://dspace.nbuv.gov.ua/handle/123456789/154120 |
citation_txt |
Метод поиска функционально важных областей белков и пептидов по аминокислотной последовательности / П.А. Жилкин, А.М. Ерошкин // Биополимеры и клетка. — 1990. — Т. 6, № 6. — С. 36-42. — Бібліогр.: 33 назв. — рос. |
series |
Биополимеры и клетка |
work_keys_str_mv |
AT žilkinpa metodpoiskafunkcionalʹnovažnyhoblastejbelkovipeptidovpoaminokislotnojposledovatelʹnosti AT eroškinam metodpoiskafunkcionalʹnovažnyhoblastejbelkovipeptidovpoaminokislotnojposledovatelʹnosti |
first_indexed |
2025-07-14T05:39:45Z |
last_indexed |
2025-07-14T05:39:45Z |
_version_ |
1837599645908336640 |
fulltext |
9. Mills D. R., Kramer F. R., Spiegelman S. Comple te nucleot ide sequence of a repli-
ca t ing RNA m o l e c u l e / / S c i c n c e — 1973.— 180, N 4 0 8 9 , — P . 916—927.
10. Эйген M., Шустер П. Гиперцикл. Принципы самоорганизации молекул.— М . : Мир,
1982,—270 с.
11. Detailed ana lys i s of the h igher -order s t ruc tu re of 16S-like r ibosomal r ibonucleic
a c i d s / C . R. Woese, R. Gutel l , R. Gupta , H. F. Nol ler / / M i c r o b i o l Rev.— 1983.—47,
N 4 , — P . 621—669.
12. Williams A. L., Tinoco I. A dynamic p r o g r a m m i n g a lgor i thm for f i n d i n g a l t e rna-
t ive R N A secondary s t r u c t u r e s / / N u c l . Acids Res.— 1986.— 14, N 1 . — P . 299—315.
13. Gutell R. R., Fox G. E. A compi la t ion of l a rge subuni t RNA sequences presented in a
s t ruc tu ra l f o r m a t / / I b i d . — 1988,— 18, suppl .— P. 175—1'85.
В Н И И гриппа М З СССР, Ленинград Получено 29.05.90
УДК 577.112
П. А. Жилкин, А. М. Ерошкин "
МЕТОД ПОИСКА
ФУНКЦИОНАЛЬНО ВАЖНЫХ ОБЛАСТЕЙ БЕЛКОВ И ПЕПТИДОВ
ПО АМИНОКИСЛОТНОЙ ПОСЛЕДОВАТЕЛЬНОСТИ
Предлагается эмпирический метод предсказания функционально важных областей бел-
ков и пептидов. Рассматриваются только такие функционально важные участки, остат-
ки которых располагаются близко в последовательности (линейные или непрерывные
функционально важные участки). В основе метода лежит ранее обнаруженная корре-
ляция между локализацией известных непрерывных функционально важных областей
в последовательностях белков и низкими значениями профилей сходства этих после-
довательностей с последовательностями белков человека [7]. Применение предлагаемого
метода к большому набору белков позволяет правильно предсказать более половины из
известных непрерывных функциональных центров.
Введение. В работе [1] было предложено для анализа полипептидных
последовательностей использовать профиль сходства последовательно-
сти исследуемого белка или пептида с последовательностями белков
человека. Профиль строится
следующим образом. Д л я ис-
следуемого белка и каждого
белка из выборки белков че-
ловека рассчитывается карта
Рис. 1. Схема построения профиля
сходства исследуемого белка с одним
из белков выборки белков человека по
карте локального сходства (горизон-
тальная ось соответствует исследуе-
мому белку, вертикальная — белку вы-
борки) . Отрезки на карте сходства —
совпадающие участки; внизу — соот-
ветствующий профиль сходства S,
I— его длина
Fig. 1. Cons t ruc t ion scheme of resem-
blance prof i le for inves t iga ted prote in
versus one prote in f rom set of h u m a n
pro te ins as based on the m a p of local
resemblance (across — inves t iga ted
protein down — prote in f rom h u m a n
prote in se t ) . Lines on the resemblance
m a p — coinciding reg ions . U n d e r the
map is the resemblance prof i le S; I —
inves t iga ted prote in sequence length .
© П. А. Ж И Л К И Н , A. M. Е Р О Ш К И Н , 1990
36 ISSN 0233-7657. Б И О П О Л И М Е Р Ы И КЛЕТКА. 1990. Τ. 6. № 6
локального сходства, на основании которой строится профиль сходства
этих двух белков (рис. 1). Суммируя профили сходства для всех пар,
получаем профиль сходства исследуемого белка с набором белков че-
ловека (ниже этот профиль будем называть просто профилем сход-
ства) . На наборе белков с различными функциональными свойствами
была найдена корреляция между локализацией районов с низким зна-
чением профилей сходства, мутабильности и альфа-спиральности и
положением в последовательностях непрерывных функционально важ-
ных областей. В данной работе на основе этих результатов построен
эмпирический метод предсказания непрерывных функционально важ-
ных участков белка или пептида по его аминокислотной последова-
тельности.
О п и с а н и е а л г о р и т м а . Д л я исследуемого белка или пептида строится про-
филь сходства и анализируется расположение его минимумов. Пусть главный минимум
профиля сходства приходится на остаток с номером M1. Формируем область (Mi—К\
М\-\-К) длиной 2К+1 остатков, которая будет первой предсказанной функционально
важной областью исследуемого белка (число К — параметр метода, определяющий раз-
мер предсказываемой области) . Затем ищем следующий по величине минимум. Пусть
он приходится на остаток с номером M2 . Формируем область (M 2 —К; М 2 + І С ) . Если
данная область пересекается с ранее определенными областями (в данном случае с об-
ластью (Mi—К; Mi-f^C)) , то она не рассматривается. Иначе фиксируем, что область
(M 2 —К; М 2 - \ -К) является второй предсказанной функционально важной областью ис-
следуемого белка и т. д. Д л я белка предсказывается одна или несколько областей. Их
количество мы определим зависящим от длины последовательности следующим образом:
N = [ l / 50 ] + 1,
где I — длина аминокислотной последовательности, [ / / 5 0 ] — ц е л а я часть от деления.
Т а к а я формула выбрана исходя из того, что средний размер экзонов — около 50 остат-
ков [32], и один экзон обычно соответствует одному функциональному домену. Так
как число функционально важных участков в белках, очевидно, невелико, д л я длин-
ных аминокислотных последовательностей количество предсказываемых областей будем
ограничивать некоторым числом N0 (второй параметр метода) .
Н а б о р б е л к о в ч е л о в е к а и б е л к о в с и з в е с т н ы м и ф у н к ц и о -
н а л ь н ы м и ц е н т р а м и . Набор белков человека, используемый в данной работе,
существенно расширен по сравнению с набором в работе [1]. Он содержит^ 330 белков
различных функциональных классов, различных семейств общей длиной более 110 000
остатков. Из близкородственных белков в набор включали лишь одного представителя.
В выборке белков и пептидов с известными непрерывными функционально в а ж -
ными участками (таблица) использовано большинство белков, приведенных в работе
[1]. Исключен из рассмотрения ряд белков, таких как калмодулин, кальций-связываю-
щий белок и некоторые другие, функционально в а ж н ы е участки которых являются
ценрами связывания ионов или простых молекул. Такие участки скорее являются «био-
химическими центрами», а не функционально важными областями, связанными с уни-
кальными свойствами конкретной молекулы. Выборка пополнена новыми структура-
ми, данные о которых получены в последнее время [2—7, 10—13, 15—20]. Всего в этом
наборе 35 белков, содержащих в целом 39 функционально в а ж н ы х областей. В выборку
включены как зрелые формы белков и пептидов, так и некоторые предшественники.
Отличие этих двух наборов состоит в том, что в составе предшественника пептид-про-
дукт часто неактивен. Тем не менее с точки зрения основной задачи — выделения в ами-
нокислотных последовательностях ограниченных участков, в а ж н ы х для целевой функции
некоторой большей последовательности,— эти два случая мы разделять не будем.
В ы б о р п а р а м е т р о в м е т о д а . Предлагаемый метод имеет два варьируемых
параметра : К, определяющий размер предсказываемой области, и N0 •—максимальное
количество предсказываемых областей. Будем считать, что экспериментальный функцио-
нальный центр найден, если предсказываемый район пересекается с ним хотя бы по
одному остатку. Назовем полнотой предсказания функциональных центров белков вы-
борки отношение числа найденных экспериментальных функциональных участков ко
всему их числу в выборке; долей правильно предсказанных областей— отношение числа
правильно предсказанных областей к числу всех предсказанных областей
37 ISSN 0233-7657. Б И О П О Л И М Е Р Ы И КЛЕТКА. 1990. Τ. 6. № 6
Белки с экспериментально локализованными функционально важными участками
Proteins with experimentally localised functionally important regions
Белок Длина Участок Свойства участка
Ссыл-
Kil
Иммуноглобулин G, т я ж е л а я 208 52-- 5 5 Тафцин, обладает иммуно- [2]
цепь, константная область, стимулирующими свойствами
фрагмент 238—446 (человек)
Сайт связывания со специ-Предшественник атриального 151 131-- 1 5 0 Сайт связывания со специ- [3]
натриуретического фактора фическим рецептором
(человек)
Предшественник гонадотропин- 92 24-- 3 3 Активная форма гормона [4]
релизинг гормона (человек)
40-- 4 9 Участок, стимулирующий
освобождение гонадотропина
40-- 4 9 Участок, стимулирующий
освобождение гонадотропина
Ингибитор а 2 -плазмина 491 40-- 4 4 Пептид, ингибирующий пе- [5]
(человек) рекрестную реакцию ингиби-
тора с фибрином
473-- 4 9 1 Сайт связывания с плаз-
мином
[6]
Предшественник интерлейки- 269 163-- 1 7 1 Пептид активирует [7]
на-1 В (человек) Т-клетки
Тимопоэтин 2 49 32-- 3 6 Активный фрагмгнт [8]
Гемагглютинин вируса гриппа 221 1-- 2 0 Пептид слияния [9]
A / A i c h i / 2 / 6 8 ,
НА а -цепь
Предшественник P2-микрогло- 119 33-- 3 9 Пептид усиливает цитоток- [2]
булина (человек) сичность лимфоцитов
Предшественник соматостатина 116 109-- И З Сайт связывания с рецепто- [ Ю]
1 (человек) ром
Предшественник холецистоки- 115 96-- 1 0 3 Биологически активный пеп- [ И ]
нина (человек) тид
Предшественник ангиотензино- 485 34-- 4 1 Ангиотензин 2 [12]
гена (человек)
[13] Пептид, освобождающий 27 21-- 2 7 Активный фрагмент [13]
гастрин
[14] Пропаратиреоидный гормон 90 7-- 3 6 Синтетический пептид ими- [14]
(человек) тирует активность гормона
[15] Предшественник ксенопсина 80 73-- 8 0 Биологически активный
пептид
[15]
Иммуноглобулин Е, С-область 429 272-- 2 8 6 Пептид ингибирует связыва- [16]
{крыса) ние IgE с тучными клетками
Предшественник аполипопро- 317 162-- 1 6 5 , Участки связывания гепа- [17]
теина E (человек) 229-- 2 3 6 рина
[18] Термостабильный цАМФ-зависи- 75 11-- 3 0 Сайт связывания с субъеди- [18]
мый ингибитор протеинкиназы ницей после диссоциации
(кролик) голофермента с цАМФ
[19] Предшественник основного 400 21-- 4 7 Сайт связывания с клеточ- [19]
поверхностного антигена вируса ным рецептором
гепатита В
C3d белок системы комплемента 302 226-- 2 3 1 Сайт связывания с C3d-ре- [20]
(человек) цептором
[33] Предшественник фибриногена, 437 426-- 4 3 7 Сайт узнавания тромбоцитов [33]
•у-цепь (человек)
[21] Большой гастрин (человек) 34 31-- 3 4 Пептид обладает активно-
стью интактной молекулы
[21]
Препромелиттин 70 44-- 6 9 Активный мелиттин [22]
Нейротоксин 1 длинный 74 26-- 3 7 Участвует в проявлении [22]
(Fornwsan banded krait) нейротоксической активности
[22] Нейротоксин 1 короткий 60 25-- 3 2 То же [22]
(черная кобра)
[23] Трансформирующий фактор 50 34-- 4 3 Основная часть области свя- [23]
роста альфа (человек) зывания рецептора
[24] Тиоредоксин (Corinebacterium 105 23-- 3 7 Активный центр [24]
nephridii)
[25] Предшественник кальцитонина 136 85-- 1 1 6 Активная форма гормона [25]
(крыса)
[26] Фибронектин, домен, связыва- 108 84-- 8 8 Синтетический пептид про- [26]
ющий клетку (человек) являет активность всего
домена
Основной ингибитор протеаз 58 13-- 1 8 , Области контакта с фермен- [27]
(бык) 37 - 3 9 том
[28] Ингибитор Куница (соя) 181 61-- 6 6 Петля связывания с фермен- [28]
том
38 ISSN 0233-7657. Б И О П О Л И М Е Р Ы И КЛЕТКА. 1990. Τ. 6. № 6
Продолжение таблицы
Свойства у ч а с т к а Белок Длина Участок Свойства у ч а с т к а ка
Редуктаза (Pseudomonas aeru- 561 130-- 1 4 3 Активный центр [29]
ginosa)
[30] <3-белок вируса везикулярного 517 17-- 4 1 Пептид—рН-зависимый гемо- [30]
стоматита лизин
Антитромбин 3 (человек) 423 385-- 4 2 3 Активный сайт ингибитора [31]
β-липотропин (человек) 88 58-- 6 2 Область, соответствующая
метэнкефалину
[21]
Субтилизиновый ингибитор И З 67-- 7 5 Петля связывания с фермен- [27]
На этапе обучения мы пытались как можно полнее предсказать функциональные
центры белков выборки и в то же время обеспечить минимум перепредсказанных обла-
стей. С этой целью анализировали зависимость полноты предсказания и доли правильно
Рис. 2. Зависимость полноты предсказания функциональных центров выборки белков
(вверху) и доли правильно предсказанных областей (внизу) от максимального числа
анализируемых минимумов профиля сходства N0 при различных значениях параметра К
(указаны справа от соответствующих кривых)
F ig . 2. Corre la t ion between p len i tude of func t iona l ly impor tan t r eg ions predic t ion (up)
and por t ion of correct ly predicted reg ions (down) as depend ing upon m a x i m u m number
N0 of ana lysed resemblance prof i le m i n i m u m s wi th d i f fe ren t va lues of pa rame te r K
( shown to the r ight of co r respond ing curve ) .
Рис. 3. Отношение количества правильно предсказанных функциональных центров вы-
борки белков (таблица) предлагаемым методом к количеству функциональных центров,
выбранных случайным образом в зависимости от размера предсказываемых областей
при различных значениях параметра N0 (указаны справа от соответствующих кривых)
Fig. 3. Ratio of the number of correct ly predicted func t iona l ly impor t an t r eg ions for pro-
tein set ( table) by sugges t ed method to the number of func t iona l ly impor t an t r eg ions
selected r andomly accord ing to size of predicted region wi th d i f fe ren t va lues of N0
parame te r (shown to the r ight of co r respond ing curve)
предсказанных областей от максимального числа анализируемых минимумов N0. Н а
рис. 2 приведены два набора графиков. Верхний представляет собой зависимость полно-
ты предсказания функциональных центров выборки от максимального числа анализи-
руемых минимумов Nо при различных значениях параметра К. Нижний — долю пра-
вильно предсказанных областей. Если требуется, синтезируя несколько пептидов (либо
другим способом), локализовать функционально в а ж н у ю область белка, то наиболее
вероятными кандидатами д л я экспериментальной проверки могут являться участки,
соответствующие нескольким основным минимумам профиля сходства. По-видимому,
наиболее оптимально определить значение параметра Л'о, равное 3 или 4. При больших
39 ISSN 0233-7657. Б И О П О Л И М Е Р Ы И КЛЕТКА. 1990. Τ. 6. № 6
значениях этого параметра количество перепредсказанных областей растет, а количество-
правильно предсказанных областей практически не изменяется.
Теперь рассмотрим влияние на качество предсказания параметра К, определяюще-
го размер предсказываемой области. Очевидно, что чем больше размер предсказываемых
областей, тем больше функциональных центров выборки будет найдено предлагаемым
методом. Но при этом большая часть остатков, относимых методом к функционально
значимым, в действительности таковыми являться не будет. Малые размеры областей
уменьшают полноту предсказания функциональных центров выборки белков и долю·
правильно предсказанных областей.
Мы остановились на значении параметра К, равном 4, при этом размер предсказы-
ваемой области составляет 9 остатков (рис. 3).
Попытка использовать д л я предсказания, кроме профиля сходства, другие профи-
ли, указанные в работе [1], а также суперпозицию профилей (с некоторыми весовыми
коэффициентами) не привела к улучшению качества предсказания. Оптимизация весо-
вых коэффициентов с целью улучшения качества предсказания т а к ж е не дала ощутимых
результатов.
Результаты применения метода. Предсказание функционально
важных областей выборки белков (таблица) с использованием пара-
метров N0 = 3 и К—4 дало следующие результаты: предсказано 89 по-
тенциальных функциональных центров, из них 26 указали на экспери-
ментально локализованные, т. е. доля правильно предсказанных облас-
тей составила около 30 %. При этом правильно предсказано 24 функ-
циональных центра из 39 (или 61 %) . Использование профиля мута-
бильности вместо профиля сходства в предлагаемом методе дает
худшие результаты.
Д о л я правильно предсказанных областей составляет 22,5 %, а пол-
нота предсказания выборки белков — 4 8 , 7 % . Использование ж е дру-
гих профилей (альфа-спиральности и бета-поворота) дает еще более
низкие результаты.
Несмотря на то, что расчет профиля сходства требует построения
нескольких сотен карт локального сходства двух белков, используемый
алгоритм быстрого сравнения последовательностей позволяет провести
расчет за несколько минут процессорного времени ЭВМ ЕС-1060.
Д л я оценки достоверности метода проводилось предсказание функ-
циональных центров на основе стохастического профиля, полученного
с помощью генератора случайных чисел. Таким способом моделировали
случайный выбор потенциального функционального центра. Естествен-
но, использовали те же значения параметров метода, что описаны вы-
ше. После 100 предсказаний (каждый раз для всех белков выборки,,
таблица) оказалось, что в среднем из 89 предсказанных областей 12,98·
(с дисперсией 2,46) указали на известные функциональные центры.
Таким образом, предлагаемый метод позволяет практически в два раза
точнее предсказывать функционально важные области белков и пепти-
дов по сравнению со случайным выбором. Если имеются некоторые
предположения об особенностях структурной организации функцио-
нального центра (конформация, физико-химические свойства и пр.), то
целесообразно из участков, соответствующих выделенным минимумам
профиля сходства, рассмотреть в первую очередь те, которые обладают
данными свойствами.
Изучение структурно-функциональной организации пептидов и бел-
ковых молекул является дорогостоящей и трудоемкой задачей. Пред-
лагаемый метод наряду с другими подходами к анализу структурно-
функциональной организации белков может ускорить и упростить
проведение подобных исследований.
Авторы выражают свою искреннюю признательность В. А. Кулич-
кову за помощь в работе и А. Е. Никулину — за предоставление про-
граммы быстрого сравнения последовательностей.
40 ISSN 0233-7657. Б И О П О Л И М Е Р Ы И КЛЕТКА. 1990. Т. 6. № &
P R O T E I N AND P E P T I D E FUNCTIONALY I M P O R T A N T R E G I O N S S E A R C H
M E T H O D BY A M I N O A C I D S E Q U E N C E
P. A. Zh i lk in , A. M. Eroshkin
All-Union Research Ins t i tu te of Molecular Biology,
Koitsovo, Novosibirsk Region
S u m m a r y
An empirical method for predic t ing func t iona l ly impor tan t reg ions in protein and peptide
sequences is sugges ted . It concerns only l inear or con t inuos reg ions ( those cons i s t ing
of res idues closely placed in the sequence) . The method is based on an a l ready obta ined
corre la t ion between cont inuous protein reg ions known to be func t iona l ly impor tan t and
co r respond ing resemblance prof i le low values . The method a l lows pred ic t ing correct ly
more than a half of the known cont inuous func t iona l centers for the la rge protein set.
С П И С О К Л И Т Е Р А Т У Р Ы
1. Структурные и физико-химические свойства аминокислот функционально в а ж н ы х
участков белков / А. М. Ерошкин, П. А. Жилкин , И. К. Попков, В. А. Куличков / /
Биофизика ,— 1987,—32, № 6 ,—С. 972—981.
2. Werner G. Η. Syn thes i s and biological act ivi ty of a l inear f r a g m e n t of the atr ia l n a t -
riuretic fac tor (ANF) / / I m m u n o l . Lett .— 1987.— 16, N 3 — 4 , — P . 363—370.
3. Natural and synthet ic pept ides (other t han neuropept ides) endowed with immunomo-
du l a t i ng activit ies / P . \V. Shiller, L. Maziak , T. M.-D. Nguyen et a l . / / B i o c h e m .
and Biophys. Res. C o m m u n s . - 1985,— 131, N 3 , — P . 1056—1062.
4. LH-releasing act ivi ty and receptor b ind ing of r H G n R H 14—26 a n a l o g u e s / S. C. F.
Mil ton, R. P. Mil lar , R. C. de L. Mil ton et al. / / Ibid.— 1987,— 143, N 3 , — P . 872—
879.
5. Oeusada S., Kawasaki K., Sugiyama N. Amino acids peptides. VI . Syn thes i s of the N-
terminal pentapept ide of p lasmin inhibitor and i ts a n a l o g u e / / Ghem. P h a r m . Bul l .—
1985.— 33, N 8.— P. 3484—3487.
6. Binding site of p lasmin inhibitor to p l a sminogen / N. Sug iyama , T. Sasaki , M. Iwa-
moto et al. / / Biochim. et biophys. acta .— 1988.— 952, N 1 . — P . 1—7.
7. A short synthet ic pept ide f r a g m e n t of h u m a n interleukin-,1 wi th immunos t imu la to ry ,
but not i n f l a m m a t o r y act ivi ty / G. Antoni , R. Present in i , F. Per in et a l . / / J . I m m u -
nol.— 1986,— 137, N 10 .—P. 3201—3204.
8. In vitro e f fec ts of thymopoie t in f r a g m e n t s on active E- rose t te f o r m i n g c e l l s / L . De-
nes, A. Rill, 0 . Nyeki et a l . / / Ann. Immunol , h u n g . — 1985 ,—25 ,—P. 177—187.
9. pH-depending m e m b r a n e fus ion activi ty of synthet ic twen ty acid pept ide wi th the
same sequence as tha t of the hydrophobic segment ot in f luenza v i rus h e m a g g l u t i n i n /
M. M u r a t a , Y. S u g a h a r a , S. Takahash i et . a l . / / J . Biochem.—1987.— 102, N 4,—
P. 957—962.
10. Rose G. D., Gieraseh L. M., Smith J. A. Tu rns in pept ides and p r o t e i n s / / Adv. P ro t .
Chem.— 1985.— 37,— P. 1—109.
11. Rehfeld / . F. Neurona l cholecystokinin: one or mul t ip le t r a n s m i t t e r s ? / / J . Neuro-
chem.— 19'85.— 44, N 1,— P. 1 — 10.
12. Kun-hwa Hsieh, Marshall G. R. Role of the C- te rmina l ca rboxyla te in ang io tens in II
activity: alcohol, ketone, and es ter a n a l o g u e s of ang io tens in I I / / J . Med Chem.—·
1986,—29, N 10,— P. 1968^—1972.
13. Zachary I., Woll P. I., Rosengurt E. A role for neuropept ides in the cont ro l of cell
p r o l i f e r a t i o n / / D e v e l o p . Biol.— 1987,— 124, N 2 , — P . 295—308.
14. FrelCnger A. L. Ill, Zull }. E. The role of the meth ion ine res idues in the s t ruc tu re
and func t ion of pa ra thyro id h o r m o n e / / A r c h . Biochem. and Biophys.— 1986.— 244,
N 2 , — P . 641—649.
15. Sures I., Crippa M. Xenopsin: the neurotensin- l ike oc tapept ide f rom Xenopus skin a t
the carboxyl t e rminus of its p r e c u r s o r / / P r o c . Nat . Acad. Sci. U S A — 1984 — 81
N 22,— P. 380—384.
16. Burt D. S., Stanworth D. R. Inhibi t ion of b ind ing of ra t I g E to r a t m a s t cells by syn-
thetic I g E p e p t i d e s / / E u r . J. Immunol .— 1987 — 17, N 3 . — P . 437—440.
17. Binding of a h igh react ive hepar in to h u m a n apol ipoprotein E: ident i f ica t ion of t w o
hepar in -b ind ing d o m a i n s / A . D. Cardin , N. Hirose, D. T. B lankensh ip et a l . / / B i o -
chem. and Biophys. Res. C o m m u n s - 1986,— 134, N 2 , — P . 783—789.
18. Identification of an inhibi tory region of the hea t - s t ab le prote in inhibi tor of the
cAMP-dependen t protein kinase / J. D. Scott , E. H. Fisher, J. G. Demai l l e et a l . / /
Proc. Nat . Acad. Sci. USA.— I9>85.— 82, N ,13.—P. 4379—4383.
19. Identification and chemical synthes is of a host cell receptor b ind ing site on hepa t i t i s
B v i r u s / A. R. Neura th , S. В. H. Kent , N. Strick et a l . / / C e l l . — 1 0 8 6 , — 4 6 —
P. 429—436.
20. Mapping of the CZd receptor (CR2) -b ind ing site and a neoan t igen ic site in the C3d
domain of the thi rd component of complement / J. D. Lambr is , V. S. Ganu S Hi ran i
et a l . / / P r o c . Nat. Acad. Sci. USA.— 1986.—82, N 12 ,—P. 4235—4239
41 ISSN 0233-7657. Б И О П О Л И М Е Р Ы И КЛЕТКА. 1990. Τ. 6. № 6
21. Якубке Х.-Д-, Ешкайт X. Аминокислоты. Пептиды. Белки.— М. : Мир, 1985.— 455 с.
22. Dayhoff М. О. A t l a s of prote in sequence and s t ruc ture .— W a s h i n g t o n : Nat . Biomed.
Res. Found , 1978,— V. 5 ,—414 p.
23. Eppsiein D. A., March Υ. V., Schreiber A. B. Ep idermal g rowth factor receptor occu-
pancy inhibi ts vaccinia v i rus i n f e c t i o n / / N a t u r e . — il9<85.— 318, N 6047.— P. 663—665.
24. Meng M., Hogenkamp H. P. Pur i f ica t ion, charac te r iza t ion and amino acid sequence of
thioredo.xin f rom Corynebacterium nephridii / / J. Biol. Chem.— 19β1.— 256, N 17.—
P. 9174—9178.
25. Calcitonin mes senge r RNA encodes mul t ip le polypept ides in a s ingle precursor /
I. W. Jacob, R. H. Goodman , W. W. Chin et al. / / ' Science.— 1981.— 213, N 4506.—
P. 457—459.
26. Pierschbacher M O., Ruoslahti E. Cell a t t achmen t act ivi ty of f ibronect in can be dubli-
cated by smal l synthet ic f r a g m e n t s of m o l e c u l e / / N a t u r e . — 1'9'84.— 309, N 5963.—
P. 3C—33.
27. The protein da ta bank: a computer -based archival file for macromolecu la r s t ructu-
res / F. C. Berns te in , T. F. Koetzle, G. J. B. Wi l l ams et a l . / / J . Мої. Biol.— 1977.—
112, N 3 , — P . 535—542.
28. Janin J., Cholia C. S tabi l i ty and specificity of prote in-prote in in terac t ions : the case
of the t ryps in - t ryps in inhibitor complexes / Ibid.—1976,— 100, N 2 , — P . 197—211.
29. Fox B. S., Walsh C. T. Mercur ic reductase : homology to g lu ta th ione reduc tase and
l ipoamid degydrogenase . Iodoace tamide a lkvla t ion and sequence of the active site
pept ide / / B i o c h e m i s t r y . — 19-83 — 22, ;N 17 .—P. 4082—4088.
30. Schlegel R., Wade M. Biological ly active pept ides of the vesicular s tomat i t i s v i rus
g l y c o p r o t e i n / / J . Virol.— 1985,—53, N 1,— P. 319—323.
31. Griffith M. /., Noyes C. M., Church F. C. React ive site pept ide s t ruc tu ra l s imi lar i ty
between hepar in cofac tor II and an t i th rombin I I I / / J . Biol. Chem.— 1985. — 260,
N 4 , — P . 2218—2225.
32. Traut T. W, Do exons code for s t ruc tu ra l or func t iona l un i t s in prote ins? / / Proc.
Nat . Acad. Sci. USA.— 19'88.— 85, N 9 , — P . 2944—2948.
33. Hantgan R. R. Local iza t ion of the domains of f ibrin involved in b ind ing to pla te-
l e t s / / B i o c h i m . et biophys. acta .— 1988,—968, N 1 , — P . 36—44.
В Н И И молекуляр. биологии Н П О «Вектор» Получено 11.12.89
минмедбиопрома СССР, пос. Кольцово, Новосиб. обл.
У Д К 577.112
Е. В. KJHHHJ К'. М. Чумаков, А. Е. Горбаленя
М Е Т О Д П О И С К А С Т Р У К Т У Р Н Ы Х М О Т И В О В
В А М И Н О К И С Л О Т Н Ы Х П О С Л Е Д О В А Т Е Л Ь Н О С Т Я Х .
П Р О Г Р А М М А « S I T E » П А К Е Т А « G E N B E E »
Предложен метод поиска структурных мотивов в аминокислотных последовательностях,
основанный на построении частотного профиля группы выравненных фрагментов после-
довательностей. На примере сканирования банка аминокислотных последовательностей
мотивом, характерным для широкого класса NTР-связывающих белков, рассмотрена ра-
бота программы «SITE», написанной на основе предложенного алгоритма. Продемонст-
рированы преимущества предложенного подхода по сравнению со стандартными програм-
мами поиска паттернов в отношении полноты и избирательности извлечения из банка
последовательностей, содержащих участки, сходные с рассматриваемым мотивом. Пред-
ставлена предположительная идентификация NTP-связывающих центров в нескольких
белках, где они ранее не были обнаружены. Обсуждается применение разработанного
алгоритма для классификации банков аминокислотных последовательностей.
Введение. Один из основных эвристических приемов, используемых
при теоретическом анализе структуры и функций биополимеров, — поиск
в аминокислотных (нуклеотидных) последовательностях так называе-
мых структурных мотивов и паттернов. В данной работе мы будем
рассматривать только мотивы (паттерны), заданные на уровне первич-
ной структуры. Мотив можно определить как относительно короткую
аминокислотную последовательность (о нуклеотидных последовательно-
© Е. В. КУНИН, к . М. ЧУМАКОВ, А. Е. Г О Р Б А Л Е Н Я , 1990
42 ISSN 0233-7657. Б И О П О Л И М Е Р Ы И КЛЕТКА. 1990. Τ. 6. № 6
|