Пакет прикладных программ для классификации белков по их аминокислотному составу и первичной структуре
В работе предложен метод классификации белков по аминокислотным составам и первичным структурам на основе нового попарного расстояния. Описан пакет прикладных программ для реализации этого метода на IBM-совместимой персональной ЭВМ. Входящие в пакет программы дают возможность сопоставлять полученные...
Gespeichert in:
Datum: | 1991 |
---|---|
Hauptverfasser: | , , , , |
Format: | Artikel |
Sprache: | Russian |
Veröffentlicht: |
Інститут молекулярної біології і генетики НАН України
1991
|
Schriftenreihe: | Биополимеры и клетка |
Schlagworte: | |
Online Zugang: | http://dspace.nbuv.gov.ua/handle/123456789/155907 |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
Zitieren: | Пакет прикладных программ для классификации белков по их аминокислотному составу и первичной структуре / И.И. Парилис, Е.Ю. Казанов, Р.С. Салихов, Л.Я. Юкельсон, Д.Х. Хамидов // Биополимеры и клетка. — 1991. — Т. 7, № 6. — С. 88-91. — Бібліогр.: 10 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraineid |
irk-123456789-155907 |
---|---|
record_format |
dspace |
spelling |
irk-123456789-1559072019-06-18T01:28:28Z Пакет прикладных программ для классификации белков по их аминокислотному составу и первичной структуре Парилис, И.И. Казанов, Е.Ю. Салихов, Р.С. Юкельсон, Л.Я. Хамидов, Д.Х. Структура и функции биополимеров В работе предложен метод классификации белков по аминокислотным составам и первичным структурам на основе нового попарного расстояния. Описан пакет прикладных программ для реализации этого метода на IBM-совместимой персональной ЭВМ. Входящие в пакет программы дают возможность сопоставлять полученные для нового расстояния результаты с традиционными. Приводится достаточный критерий для классификации белков. В роботі запропоновано метод класифікації білків по амінокислотному складу та первинній структурі на основі нової попарної відстані. Описано пакет прикладних програм для реалізації цього методу на IBM-сумісній персональній ЕОМ. Програми, що входять в пакет, дають можливість співставляти одержані для нової відстані результати з традиційними. Приведено достатній критерій для класифікації білків. A method of protein classification by their amino acid composition and primary structures using a new distance is proposed. A program for realization of this method for an IBM-compatible personal computer is described. Presented software package allows to compare the results obtained by the new method with the traditional ones. A sufficient criteria for protein classification have been developed. 1991 Article Пакет прикладных программ для классификации белков по их аминокислотному составу и первичной структуре / И.И. Парилис, Е.Ю. Казанов, Р.С. Салихов, Л.Я. Юкельсон, Д.Х. Хамидов // Биополимеры и клетка. — 1991. — Т. 7, № 6. — С. 88-91. — Бібліогр.: 10 назв. — рос. 0233-7657 DOI: http://dx.doi.org/10.7124/bc.000304 http://dspace.nbuv.gov.ua/handle/123456789/155907 577.112.5.087 ru Биополимеры и клетка Інститут молекулярної біології і генетики НАН України |
institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
collection |
DSpace DC |
language |
Russian |
topic |
Структура и функции биополимеров Структура и функции биополимеров |
spellingShingle |
Структура и функции биополимеров Структура и функции биополимеров Парилис, И.И. Казанов, Е.Ю. Салихов, Р.С. Юкельсон, Л.Я. Хамидов, Д.Х. Пакет прикладных программ для классификации белков по их аминокислотному составу и первичной структуре Биополимеры и клетка |
description |
В работе предложен метод классификации белков по аминокислотным составам и первичным структурам на основе нового попарного расстояния. Описан пакет прикладных программ для реализации этого метода на IBM-совместимой персональной ЭВМ. Входящие в пакет программы дают возможность сопоставлять полученные для нового расстояния результаты с традиционными. Приводится достаточный критерий для классификации белков. |
format |
Article |
author |
Парилис, И.И. Казанов, Е.Ю. Салихов, Р.С. Юкельсон, Л.Я. Хамидов, Д.Х. |
author_facet |
Парилис, И.И. Казанов, Е.Ю. Салихов, Р.С. Юкельсон, Л.Я. Хамидов, Д.Х. |
author_sort |
Парилис, И.И. |
title |
Пакет прикладных программ для классификации белков по их аминокислотному составу и первичной структуре |
title_short |
Пакет прикладных программ для классификации белков по их аминокислотному составу и первичной структуре |
title_full |
Пакет прикладных программ для классификации белков по их аминокислотному составу и первичной структуре |
title_fullStr |
Пакет прикладных программ для классификации белков по их аминокислотному составу и первичной структуре |
title_full_unstemmed |
Пакет прикладных программ для классификации белков по их аминокислотному составу и первичной структуре |
title_sort |
пакет прикладных программ для классификации белков по их аминокислотному составу и первичной структуре |
publisher |
Інститут молекулярної біології і генетики НАН України |
publishDate |
1991 |
topic_facet |
Структура и функции биополимеров |
url |
http://dspace.nbuv.gov.ua/handle/123456789/155907 |
citation_txt |
Пакет прикладных программ для классификации белков по их аминокислотному составу и первичной структуре / И.И. Парилис, Е.Ю. Казанов, Р.С. Салихов, Л.Я. Юкельсон, Д.Х. Хамидов // Биополимеры и клетка. — 1991. — Т. 7, № 6. — С. 88-91. — Бібліогр.: 10 назв. — рос. |
series |
Биополимеры и клетка |
work_keys_str_mv |
AT parilisii paketprikladnyhprogrammdlâklassifikaciibelkovpoihaminokislotnomusostavuipervičnojstrukture AT kazanoveû paketprikladnyhprogrammdlâklassifikaciibelkovpoihaminokislotnomusostavuipervičnojstrukture AT salihovrs paketprikladnyhprogrammdlâklassifikaciibelkovpoihaminokislotnomusostavuipervičnojstrukture AT ûkelʹsonlâ paketprikladnyhprogrammdlâklassifikaciibelkovpoihaminokislotnomusostavuipervičnojstrukture AT hamidovdh paketprikladnyhprogrammdlâklassifikaciibelkovpoihaminokislotnomusostavuipervičnojstrukture |
first_indexed |
2025-07-14T08:07:19Z |
last_indexed |
2025-07-14T08:07:19Z |
_version_ |
1837608929912160256 |
fulltext |
8. Pajot P. Fluorescence of protein in 6M guanidine hydrochloride. A method for the
quantitative determination of tryptophan / /Eur . J. Biochem.—1976.—63, N 1.—
P. 263—270.
9. Burstein Ε. A., Vedenkina N. S., Ivkova M. N. Fluorescence and the location of tryp-
tophan residues in protein molecules / / Photochemistry and Photobiology.— 1973.—
18, N 2.—P. 263—279.
10. Демченко A. Tl. Люминесценция и динамика структуры белков.— Киев : Наук, дум-
ка, 1988.—278 с.
Ин-т молекуляр. биологии и генетики АН УССР, Киев Получено 10.06.91
УДК 577.112.5.087
И . И . П а р и л и с , Е . Ю. К а з а н о в , Р . С. Салихов,
Л. Я . Юкельсон , Д . X . Х а м и д о в
П А К Е Т П Р И К Л А Д Н Ы Х П Р О Г Р А М М
Д Л Я К Л А С С И Ф И К А Ц И И Б Е Л К О В
П О И Х А М И Н О К И С Л О Т Н О М У С О С Т А В У
И П Е Р В И Ч Н О Й С Т Р У К Т У Р Е
В работе предложен метод классификации белков по аминокислотным составам и пер-
вичным структурам на основе нового попарного расстояния. Описан пакет прикладных
программ для реализации этого метода на IBM-совместимой персональной ЭВМ. Вхо-
дящие в пакет программы дают возможность сопоставлять полученные для нового рас-
стояния результаты с традиционными. Приводится достаточный критерий для класси-
фикации белков. !
В настоящее время накоплено большое количество данных о первич-
ных структурах белков и пептидов в различных атласах и банках [1].
Например, в банке P I R (США) более 1,5 миллиона аминокислотных
остатков. Сопоставление этих структур для ориентировочного опреде-
ления функциональной принадлежности белка и восстановления фило-
генетического древа производится обычно по двум типам расстояний:
1) попозиционное сравнение аминокислот (расчет числа различий
в парах гомологично расположенных аминокислотных последователь-
ностей) — расстояние по матрице 0—1;
2) мутационное расстояние (минимальное количество замещений
нуклеотидных остатков в цепи Д Н К для замены каждой аминокислоты
на другую в соответствующей позиции белковой молекулы) — рассто-
яние по матрице 0—З [1, 2] .
При определении этих расстояний для белков различной длиньг
более короткий приходится искусственно «вытягивать» за счет введе-
ния в определенные позиции делеций, т. е. «разрывать» исходную струк-
туру. Нами было введено новое расстояние, при расчете которого не
приходится «перекраивать» нативную структуру, так как используется
не аминокислотная последовательность, а аминокислотный состав-
сравниваемых белков. Это расстояние, названное «эвклидовым», рас-
считывается как квадратный корень из суммы квадратов разности про-
центного содержания одноименных аминокислот в составах белков.
В этом случае каждый белок можно определить в двадцатимерном про-
странстве точкой, координатами которой являются процентные содер-
жания каждой из 20 аминокислот. Такое унифицированное признако-
вое пространство было использовано нами для классификации большой
выборки (порядка 100) токсических полипептидов и для идентифика-
ции новых белков с применением алгоритмов теории распознавания
образцов [3—5].
Другим важным преимуществом такого подхода является возмож-
ность сопоставления белков с нерасшифрованной первичной структурой
© И. И. ПАРИЛИС, Е. Ю. КАЗАНОВ, Р. С. САЛИХОВ, Л. Я. ЮКЕЛЬСОН, Д. X. ХАМИДОВ, 199£.
8 8 ISSN 0233-7657. БИОПОЛИМЕРЫ И КЛЕТКА. 1991. Т. 7. № (Ь
д а ж е в случае малой выборки. Д о сих пор попытки классификации по-
липептидов с неизвестной первичной структурой осуществлялись на ос-
нове данных электрофореза и иммунологии [6].
Вычисленные попарные расстояния могут использоваться для вос-
становления эволюционной истории рассматриваемых белков (в виде
филогенетических деревьев) по любому из существующих алго-
ритмов [5].
Д л я автоматизации анализа информации с целью классификации,
идентификации и выявления функциональной близости белков и поли-
пептидов, а также получения данных для построения филогенетического-
2 3 4 5 6 7 8 9 10 It 12 13 14 2 3 4 5 6 7 8 9 Ю 11 12 13 14
/ 4.5 45 4.3 8.4 18.9 18.4 24.8 22.520.1 21.5 21.4 14.5 16.1 1 13 18 21 43 115 1/4 114 116 ИЗ 114 115117 116
2 2.0 4.0 90 18.3 17.8 24.2 22.219.8 20.9 21.1 14.6 15.0 2 в 16 41 115 115 114 116 113 113 114 117 116
3 3.38.2 17.8 17.223.3 21.719.220.32Q4 14.6 14.7 3 17 42 116 116 115 117114 114 115 1(7 116
и 7.6 16.8 16.522.420.9 18.6 192 193 13.5 14.1 4 39 ИЗ 113 113 115 112 112 113 115 114
5 18.7 18.923.520320.1 21.220.8 17.0 17.8 5 112 112 113 114 111 111 114 115 114
6 3.6 10.3 9.0 7.5 8.2 7.5 11.6 11.6 6 4 51 58 16 40 47 95 97
7 10.1 10.1 6.1 7.8 6.7 11.3 11.2 7 50 59 15 39 46 96 97
8 M Ю.0 6.5 6.9 17.6 16.5 8 48 5030 39 94 96
9 10.4 9.6 9.3 164 16.9 9 56 50 54 95 97
10 83 7.0 йб 13.7 Ю 39 41 95 97
11 46 13.7 12.9 11 38 96 97
12 13.4 12.8 12 9597
13 65 13 19
Рис. 1. Попарные эвклидовы расстояния, рассчитанные по аминокислотным составам
для факторов роста нервов (NGF) (1 — мыши; 2— человека; 3 — быка; 4 — цыпленка;
5 — змеи), проинсулинов (PI) (6, 7 — крысы; 8 — лошади; 9 — утки; 10— человека;
11 — быка; 12 — свиньи) и инсулиноподобных факторов роста человека (ILGF)
(13, 14)
Рис. 2. Количество попарных различий в аминокислотных последовательностях (здесь
и на рис. 3 обозначения, как на рис. 1)
древа нами написана программа для IBM-совместимого персонального
компьютера.
Программа выполнена в виде системы иерархического меню.
Главное меню содержит четыре альтернативных субменю: а) рабо-
та с записями; б) расчет расстояний; в) печать отчетов; г) вы-
ход в DOS.
Субменю «Работа с записями» позволяет вводить, редактировать,
просматривать, удалять записи, рассчитывать аминокислотный состав
белков и пептидов.
Субменю «Расчет расстояний» позволяет: 1) определять общие
участки двух белков (при этом альтернативные аминокислоты в вариа-
бельных позициях замещаются звездочками) с вычислением всех трех
расстояний; 2) определять консенсус для белков одного семейства;
3) вычислять все три расстояния для белков нескольких семейств, при
этом результат работы может выводится как на принтер, так и в файл
для последующего редактирования, печати и хранения. Расстояния вы-
водятся в виде треугольной матрицы. Расстояние по матрице 0—3 во
всех случаях рассчитывается со «штрафом за делецию», равным 3;
4) определять попозиционное процентное содержание аминокислот (для
одного семейства), что может быть использовано для прогнозирования
аминокислотных последовательностей изофункциональных поли-
пептидов.
Субменю «Печать отчетов» позволяет выводить на принтер первич-
ные структуры, количественные и процентные составы белков.
Программа написана для С У Б Д « F o x B a s e + » и реализована на
персональном компьютере «Amstrad 1640» с жестким диском на 32 ме-
габайта и матричным принтером «Amstrad DMP4000».
В качестве примера работы приводятся значения всех трех рас-
стояний, вычисленные с помощью данной программы для факторов
88 ISSN 0233-7657. Б И О П О Л И М Е Р Ы И КЛЕТКА. 1991. Т. 7. № (Ь
роста нервной ткани (NGF) [7], проинсулинов (PI) и инсулиноподоб-
ных факторов роста человека ( ILGF) [1] (рис. 1—3).
Д л я определения функциональной принадлежности того или иного
белка вычисляются максимумы попарных расстояний внутри каждого
класса и минимум для белков из различных классов. Из их сопостав-
ления делается вывод о разделении белков на непересекающиеся
классы.
Достаточным условием для кластеризации является выполнение
неравенства:
min D (х, у) > (шах D (х, х), max D (у, у)},
где т а χ D (ху х)—максимальное значение расстояния для белков од-
ного класса; max D (у, у) — для белков другого класса; min D(x, у) —
минимальное расстояние между белками разных классов.
Д л я эвклидова расстояния (см. рис. 1):
m a x ( N G F , NGF) = 9 , 0 ; m a x ( P I , P I ) = 10,6; m a x ( I L G F , I L G F ) = 6 , 5 ;
min (NGF, P I ) = 16,5; m i n ( N G F , ILGF) = 13,5; min (PI , ILGF) = 11,2.
Д л я количества различий (см. рис. 2) :
m a x ( N G F , N G F ) = 4 3 ; m a x ( P I , P I ) = 5 9 ; m a x ( I L G F , ILGF) = 19;
m i n ( N G F , P I ) = 111; m i n ( N G F , ILGF) = 114; m i n ( P I , I L G F ) = 9 4 .
Д л я мутационных расстояний (см. рис. 3) :
m a x ( N G F , NGF) = 6 4 ; m a x ( P I , P I ) = 105; m a x ( I L G F , I L G F ) = 3 7 ;
min (NGF, P I ) = 2 2 4 ; m i n ( N G F , I L G F ) = 2 5 0 ; min (PI, I L G F ) = 2 2 0 .
Из приведенных рисунков видно, что введенное нами новое рассто-
яние между аминокислотными составами является адекватным при раз-
делении белков по функциям, т. е. д л я
их классификации, а т а к ж е для иден-
тификации новых белков. К этому за-
ключению приводит аналогичный вы-
числительный эксперимент, проведен-
ный для ряда групп изофункциональ-
ных белков: длинных и коротких
нейротоксинов, цитотоксинов, сарафо-
токсинов и эндотелеинов, анемоноток-
синов [8—10].
Рис. 3. Попарные мутационные расстояния для
аминокислотных последовательностей
Данный метод позволяет идентифицировать функциональную при-
надлежность белков со значительно отличающейся длиной. Так, нами
была установлена функциональная близость токсинов RTX-I—RTX-V
из актинии RacLianthus macrodactylus к длинным нейротоксинам. Ами-
нокислотные последовательности анемонотоксинов содержат 47—48 ос-
татков, в то время как нейтротоксины имеют длину от 60 до 75, что
исключает возможность их попозиционного сравнения.
Р е з ю м е
В роботі запропоновано метод класифікації білків по амінокислотному складу та пер-
винній структурі на основі нової попарної відстані. Описано пакет прикладних програм
для реалізації цього методу на IBM-сумісній персональній ЕОМ. Програми, що вхо-
дять в пакет, дають можливість співставляти одержані для нової відстані результати
з традиційними. Приведено достатній критерій для класифікації білків.
S u m m a r y
A method of protein classification by their amino acid composition and primary structu-
res using a new distance is proposed. A program for realization of this method for an
2 3 4 5 6 7 8 9 10 11 12 13 14
J 14 19 29 64 231 229228 247 228227226 264256
2 8 22 62 233 231 229245 226 228 226 266 258
3 23 63 234 232 231 245 227230 228 267259
4 58 231 229 234246 228231 228 259 251
5 227226228246 224226227258250
6 4 87 104 18 66 72 221220
7 85 105 16 64 70 221220
8 83 84 43 68 222225
9 103 91 98 231230
10 63 66 220220
И 67224 227
12 221222
13 37
88 ISSN 0233-7657. Б И О П О Л И М Е Р Ы И КЛЕТКА. 1991. Т. 7. № (Ь
IBM-compatible personal computer is described. Presented software package allows to
compare the results obtained by the new method with the traditional ones. A sufficient
criteria for protein classification have been developed.
СПИСОК ЛИТЕРАТУРЫ
1. Dayhoff Μ. О. Atlas of protein sequence and structure.—Washington, 1973.— SuppL
1.— P. 112.
2. Fitch W. MMargoliash E. Construction of phylogenetic trees / / Science — 1967.—
155, N 2 .—P. 279—284.
3. Вапник В. H. Восстановление зависимостей по эмпирическим данным.— Μ . : Наука,
1979.—340 с.
4. Классификация и идентификация токсических полипептидов методом распознавания
образов / И . И. Парилис, Г. Jl. Буссель, JL Я. Юкельсон, Д. X. Х а м и д о в / / М о л е к у -
ляр. биология.— 1988.—22, № 6.—С. 1697—1701.
5. Сравнительный анализ факторов роста нервов (ФРН) с применением компьютер-
ных программ / И . И. Парилис, Р. С. Салихов, Д. Б. Мирходжаев и д р . / / Д о к л .
АН УзССР.— 1990.— 11, № 1.—С. 53—55.
6. Aihta Ф. Дж. Эволюция : Молекулярная биология предлагает эффективные методы
реконструкции филогении / / Журн. общ. биологии.— 1986.— 47, № 4.— С. 479—493.
7. Selhy М. J., Edwards R. H., Rutter W. J. Cobra NGF : structure and evolutionary com-
parison /"/ Neurosci. Res.— 1987,— 18, N 2.— C. 293—298.
8. Homology between snake venom sarafotoxins and mammalian endothelins / D. Graur,
A. Bdolah, Z. Wollberg, E. K o c h v a / / I s r . J. Zool.— 1988/1989.—35.—P. 171 — 175.
9. Tnmiya N., Maeda N., Cogger H. G. Neurotoxins from the venoms of the sea snakes
Hydrophis ornatus and Hydrophis lapemoides /./ Biochem. J.— 1983.— 213, N 1.—
P. 30—38.
10. Зыкова Τ. Α., Козловская Э. П. Аминокислотная последовательность нейротоксина
1 из актинии Radianthus macrodactylus / / Биоорг. химия.— 1989.— 15, № 10.—
С. 1301 — 1306.
Ин-т биохимии АН УзССР, Ташкент Получено 26.03.91
УДК 577.15
Е. О. Кальчсва, Μ. М. Файзиев, С. С. Малюта
УРИДИІЇДИФОСФАТ-N-
А Ц Е Т И Л МУРАМИ Л- L-АЛАНИЛ-D -Г Л ЮТ AM AT:
ME Ό 2, 6 -ДИАМИНОПИМЕЛАТЛИГАЗНАЯ АКТИВНОСТЬ
В ЭКСТРАКТАХ КЛЕТОК BACILLUS SUBTILIS,
STREPTOCOCCUS BOVIS И ENTEROCOCCUS FAECIUM
В экстрактах клеток В. subtilis, S. bovis, Ε. faecium обнаружена УДФ-Ы-ацетилмура-
мил-Ь-аланил-О-глютамат: мезо-2,6-ДАП-лигазная активность. УДФ-Ы-ацетилмурамил-
Ь-аланил-В-глютамат: мезо-2,6-ДАП-лигаза В. subtilis выделена и очищена гель-фильт-
рациеч и ионообменной хроматографией. Молекулярная масса фермента, определенная
методом гель-фильтрации, составляет 120 000.
Введен ие. Мезо-диаминопимелиновая кислота (мезо-ДАП) является не-
посредственным предшественником лизина в его биосинтетическом пу-
ти и в то же время — важным компонентом пептидогликана бактери-
альной клеточной стенки (рис. 1). Декарбоксилирование мезо-ДАП
в лизин осуществляется ферментом мезо-ДАП-декарбоксилазой (ЕС
4.1.1.20), а включение мезо-ДАП в состав УДФ-К-ацетилмурамил-три-
пептида катализируется УДФ-К-ацетилмурамил-^ :аланил-Ь-глютамат:
мезо-2,6-ДАП-лигазой (ЕС 6. 3. 2. 13). ДАП-лигазная активность обна-
руживается в клетках бактерий, клеточная стенка которых содержит
мезо-ДАП [1, 2] . В настоящее время указанный фермент выделен из
Corynebacterium xerosis [3], В. eereus [4], Escherichia coli [5]; пока-
зана его способность функционировать как в прямом, так и в обратном
С) Е. о . КАЛЬЧЕВА, Μ. М. ФАЙЗИЕВ, С. С. МАЛЮТА, 1991
88 ISSN 0233-7657. БИОПОЛИМЕРЫ И КЛЕТКА. 1991. Т. 7. № (Ь
|