Triander – новая программа для визуального анализа нуклеотидных последовательностей

Aims. Our project aimed to work out the interactive software for nucleotide sequence visualization. Methods. The program named as “Triander” was worked out under Free Pascal RAD IDE Lazarus. Source code and compiled for Windows binaries are freely accessible at http://icbge.org.ua/ukr/Triander. Resu...

Повний опис

Збережено в:
Бібліографічні деталі
Дата:2015
Автори: Дуплий, В.П., Дуплий, С.А.
Формат: Стаття
Мова:Russian
Опубліковано: Інститут молекулярної біології і генетики НАН України 2015
Назва видання:Фактори експериментальної еволюції організмів
Теми:
Онлайн доступ:http://dspace.nbuv.gov.ua/handle/123456789/177449
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Triander – новая программа для визуального анализа нуклеотидных последовательностей / В.П. Дуплий, С.А. Дуплий // Фактори експериментальної еволюції організмів: Зб. наук. пр. — 2015. — Т. 17. — С. 51-54. — Бібліогр.: 14 назв. — рос.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id irk-123456789-177449
record_format dspace
spelling irk-123456789-1774492021-02-16T01:26:02Z Triander – новая программа для визуального анализа нуклеотидных последовательностей Дуплий, В.П. Дуплий, С.А. Молекулярна генетика та геноміка рослин Aims. Our project aimed to work out the interactive software for nucleotide sequence visualization. Methods. The program named as “Triander” was worked out under Free Pascal RAD IDE Lazarus. Source code and compiled for Windows binaries are freely accessible at http://icbge.org.ua/ukr/Triander. Results. This program can produce four types of plots. It is possible to build three DNA walks done independently for each nucleotide position in triplets. The usage of not equal in modulus nucleotide vectors lead to significant reduction of visual information loss in DNA walks. Conclusions. The program can be used in the investigation of fine structure of sequences and find in them standard patterns and nontrivial regions for further detail analysis. 2015 Article Triander – новая программа для визуального анализа нуклеотидных последовательностей / В.П. Дуплий, С.А. Дуплий // Фактори експериментальної еволюції організмів: Зб. наук. пр. — 2015. — Т. 17. — С. 51-54. — Бібліогр.: 14 назв. — рос. 2219-3782 http://dspace.nbuv.gov.ua/handle/123456789/177449 577.212.3+004.9 ru Фактори експериментальної еволюції організмів Інститут молекулярної біології і генетики НАН України
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
language Russian
topic Молекулярна генетика та геноміка рослин
Молекулярна генетика та геноміка рослин
spellingShingle Молекулярна генетика та геноміка рослин
Молекулярна генетика та геноміка рослин
Дуплий, В.П.
Дуплий, С.А.
Triander – новая программа для визуального анализа нуклеотидных последовательностей
Фактори експериментальної еволюції організмів
description Aims. Our project aimed to work out the interactive software for nucleotide sequence visualization. Methods. The program named as “Triander” was worked out under Free Pascal RAD IDE Lazarus. Source code and compiled for Windows binaries are freely accessible at http://icbge.org.ua/ukr/Triander. Results. This program can produce four types of plots. It is possible to build three DNA walks done independently for each nucleotide position in triplets. The usage of not equal in modulus nucleotide vectors lead to significant reduction of visual information loss in DNA walks. Conclusions. The program can be used in the investigation of fine structure of sequences and find in them standard patterns and nontrivial regions for further detail analysis.
format Article
author Дуплий, В.П.
Дуплий, С.А.
author_facet Дуплий, В.П.
Дуплий, С.А.
author_sort Дуплий, В.П.
title Triander – новая программа для визуального анализа нуклеотидных последовательностей
title_short Triander – новая программа для визуального анализа нуклеотидных последовательностей
title_full Triander – новая программа для визуального анализа нуклеотидных последовательностей
title_fullStr Triander – новая программа для визуального анализа нуклеотидных последовательностей
title_full_unstemmed Triander – новая программа для визуального анализа нуклеотидных последовательностей
title_sort triander – новая программа для визуального анализа нуклеотидных последовательностей
publisher Інститут молекулярної біології і генетики НАН України
publishDate 2015
topic_facet Молекулярна генетика та геноміка рослин
url http://dspace.nbuv.gov.ua/handle/123456789/177449
citation_txt Triander – новая программа для визуального анализа нуклеотидных последовательностей / В.П. Дуплий, С.А. Дуплий // Фактори експериментальної еволюції організмів: Зб. наук. пр. — 2015. — Т. 17. — С. 51-54. — Бібліогр.: 14 назв. — рос.
series Фактори експериментальної еволюції організмів
work_keys_str_mv AT duplijvp triandernovaâprogrammadlâvizualʹnogoanalizanukleotidnyhposledovatelʹnostej
AT duplijsa triandernovaâprogrammadlâvizualʹnogoanalizanukleotidnyhposledovatelʹnostej
first_indexed 2025-07-15T15:36:34Z
last_indexed 2025-07-15T15:36:34Z
_version_ 1837727792662315008
fulltext © ДУПЛИЙ В.П., ДУПЛИЙ С.А. ISSN 2219-3782. Фактори експериментальної еволюції організмів. 2015. Том 17 51 Triander – новая программа для визуального анализа нуклеотидных последовательностей Д уп ли й В .П ., Д уп ли й С .А . Windows 7 64-bit. Исходные тексты и скомпили- рованный бинарный код программы для работы в Windows свободно доступны по адресу http:// icbge.org.ua/ukr/Triander . Результаты и обсуждение Хорошо известно, что сложность визуаль- ного анализа генетических текстов, записанных четырехбуквенным алфавитом, значительно воз- растает с увеличением длины текста. Человечес- кий глаз устроен так, что либо читает каждую бу- кву отдельно, не замечая нуклеотидных паттер- нов, либо отбрасывает последовательности букв, не встречающиеся в привычных словах [4]. Распо- ложение оснований на нотном стане [4] позволяет после некоторой тренировки легче узнавать от- дельные паттерны, однако разрыв паттернов при переносе создает гораздо больше проблем, чем при обычном чтении. К тому же, довольно трудно охватить большую последовательность целиком. В отличие от вышеупомянутых способов ви- зуализации, мы предлагаем естественное пред- ставление нуклеотидных последовательностей в виде кривых, где в соответствие основаниям по- ставлены разнонаправленные векторы. В даль- нейшем такие векторы будем называть нуклео- тидными векторами, а кривые, образованные ими, нуклеотидными кривыми. Введенные в [5] «H-кривые» дают одно- значное представление последовательности в трехмерном пространстве и, возможно, были бы идеальными при анализе их на трехмерных устройствах отображения, однако из-за крайне малого распространения таких устройств при- ходится работать с двухмерными проекциями кривых, что приводит к частичной потере визу- альной информации. Двухмерный вариант данно- го метода [6] получил широкое распространение и оказался полезным для обнаружения в геномах сайтов инициации репликации [7]. Однако из-за отказа от обязательного смещения по вертикали кривая часто проходит по одним и тем же местам диаграммы. Потери информации при этом могут быть значительными, на отдельных участках ча- сти кривой сливаются в пятна (рис. 1 а, б). УДК 577.212.3+004.9 ДУПЛИй В.П.1, ДУПЛИй С.А.2 1 Институт клеточной биологии и генетической инженерии НАН Украины, Украина, 03143, г. Киев, ул. Академика Заболотного, 148, e-mail: duplijv@icbge.org.ua 2 Mathematical Institute, University of Muenster, Germany, 48149, Muenster, Einsteinstrasse, 62, e-mail: duplijs@uni-muenster.de TRIANDER – НОВАЯ ПРОГРАММА ДЛЯ ВИЗУАЛьНОГО АНАЛИЗА НУКЛЕОТИДНыХ ПОСЛЕДОВАТЕЛьНОСТЕй Прогресс в молекулярной биологии, связан- ный секвенированием генов и геномов живых организмов, привел к лавинообразному росту ко- личества данных о молекуле, определяющей все разнообразие жизни. Возможность определения последовательности ДНК в сочетании со статис- тическими методами дает чрезвычайно важный инструмент для извлечения скрытой информации о динамике процесса эволюции, особенно после того, как стали доступны полные геномы орга- низмов [1]. Наряду с необходимостью создания программного обеспечения для компьютерного анализа накопленных генетических текстов поя- вилась и необходимость в удобном их представ- лении для человека. В настоящее время имеет- ся множество систем визуализации генетической информации. Большинство из них не показывает тем или иным способом саму последовательно- сть, а только отображает взаимное расположение генов, регуляторных единиц, кодирующих и не- кодирующих участков. С другой стороны, использование способ- ности человека к распознаванию образов, при наличии соответствующих инструментов ренде- ринга сиквенсов, могло бы, благодаря непосред- ственному восприятию исследователем данных, помочь быстрее выявлять неожиданные фено- мены эволюции и даже могло бы изменить стиль работы с такими данными. Нашей задачей было создание оригиналь- ной программы рендеринга нуклеотидных по- следовательностей (несколькими различными способами) и предоставление пользователю ин- терактивных возможностей управления визуали- зацией (масштабирование, выбор участка после- довательности и т.д.) в реальном времени. Материалы и методы Программа для интерактивной визуализа- ции нуклеотидных последовательностей была создана в свободно распространяемой среде разработки программного обеспечения Lazarus версии 1.2.6 [2], использующей компилятор Free Pascal версии 2.6.4 [3]. Программа «Triander» тестировалась под операционными системами Windows XP 32-bit и 52 ISSN 2219-3782. Фактори експериментальної еволюції організмів. 2015. Том 17 Дуплий В.П., Дуплий С.А. Среди возможных комбинаций направлений нуклеотидних векторов, т.е. векторов, которые представляют тот или иной нуклеотид на диа- грамме, нами была выбрана такая: С – Север, G – Юг, T – Восток, a – запад (рис. 2). Так как сте- пень детерминации, а значит и длина нуклеотид- ного вектора составляет для С – 4, для G – 3, для T – 2, для a – 1, то диаграмма обхода последо- вательности случайно выбранных нуклеотидов в нашем случае распространяется в северо-восточ- ном направлении. Это направление, как и четыре основных, указывается на диаграмме. Обычно диаграммы обхода ДНК строят- ся однопиксельными ква- дратами, поэтому поми- мо потерь информации из- за прохождения кривой по одним и тем же координа- там добавляются потери от слияния лежащих рядом участков кривой. Пробле- ма становится острее при переходе от анализа гено- мов и хромосом к анализу отдельных генов и регуля- торных последовательно- стей. Мы реализовали во- зможность задавать длину единичного вектора боль- Рис. 1. Диаграммы обхода ДНК последовательности гена нитрат редуктазы Nia1;2 Physcomitrella patens (Ген- банк aB232049): а – полная последовательность; б–г – фрагмент aB232049:2601-26300. Для построения ис- пользовались нуклеотидные векторы равной длины (а, б) и пропорциональные степени детерминации нуклео- тида (в, г). Длина единичного вектора: а–в – равна ширине нуклеотидной кривой, г – больше ширины кривой В системе визуализации, где нуклеотиды передаются векторами различными не только по направлению, но и по длине [8], в значительной мере эта проблема снимается (рис. 1 в, г). Ме- тод основывается на использовании в качестве длины нуклеотидного вектора его «внутреннюю абстрактную характеристику – степень детерми- нации» [9]. Степень детерминации – это число- вая характеристика нуклеотида, связанная с его способностью определять аминокислоту в за- висимости от положения в кодоне, а также с так называемым эволюционным «давлением». Кро- ме того, принимается во внимание число водо- родных связей. Важным является построение именно трех нуклеотидных кривых, которые соответствуют каждому положению в кодоне, что дает построе- ние трех обходов для каждого положения нуклео- тида в триплете[10]. При учете степени детерми- нации такая диаграмма называется триандром [9]. В вышеупомянутой работе также показано, что гипотетическое количество нуклеотидов в кодо- не, отличное от трех, а также случайно сгенери- рованные нуклеотидные последовательности во- обще не приводят к появлению таких визуальных структур, как триандры. До настоящего времени не существовало программ для интерактивного построения триандров и диаграмм обхода после- довательностей неравными по модулю векторами. Рис. 2. Направление и длина нуклотид- ных векторов ISSN 2219-3782. Фактори експериментальної еволюції організмів. 2015. Том 17 53 Triander – новая программа для визуального анализа нуклеотидных последовательностей ше ширины нуклеотидной кривой (рис. 1 г), что с одной стороны сделало диаграммы более чита- емыми, а с другой стороны дает возможность та- ким способом их правильно масштабировать. Кроме того, большие диаграммы можно сме- щать по осям координат и задавать для отображе- ния только определенную часть последователь- ности. Последовательность может быть отобра- жена как в виде триандра (рис. 3 а), ветви которо- го отображаются кривыми разной толщины, так и обычным методом обхода ДНК, названным в про- грамме по аналогии «монандром». Есть также во- зможность представить последовательность век- торами равной длины. Нужно заметить, что ско- рости построения диаграмм достаточно для того, чтобы наблюдать анимацию при удерживании кнопки увеличения длины отображаемой после- довательности или кнопок смещения ее начала. Созданная нами программа «Triander» (рис. 3б) визуализирует нуклеотидные последователь- ности, хранящиеся в файлах формата FaSTa и GenBank, а также в обычных текстовых файлах. После загрузки файл доступен для просмотра и редактирования. Диаграммы обхода ДНК строят- ся в широко распространенном формате вектор- ной графики SVG [11], реализована возможность сохранения диаграмм в этом формате. Наибольшую популярность среди мето- дов графического представления ДНК получи- ли двухмерные диаграммы, построенные об- ходом последовательности векторами равной длины. Для их построения можно использовать как отдельные программы [12, 13], так и встроен- ные возможности более крупных проектов [14]. Такие диаграммы хорошо передают структуру больших последовательностей, например хромо- сом или геномов микроорганизмов. Однако по- тери визуальной информации из-за наложения частей нуклеотидной кривой друг на друга пре- пятствует эффективному анализу на нуклеотид- ном уровне. На сегодняшний день наша программа един- ственная способна строить триандры и диаграм- мы обхода ДНК неравными по длине нуклеотид- ными векторами. Это позволяет получить как об- щее представление о последовательности, так и различать отдельные паттерны. Выводы Разработанная нами программа «Triander» позволяет строить несколько вариантов диа- грамм понуклеотидного обхода ДНК. Примене- ние внутренней абстрактной характеристики ос- нования, называемой степенью детерминации, в качестве длины нуклеотидного вектора позво- ляет проводить как общий визуальный анализ на уровне хромосом и геномов, так и выявлять от- дельные нуклеотидные паттерны. а б Рис. 3. Диаграммы обхода последовательности DQ157859 в зависимости от положения основания в кодоне: а – триандр кодирующей области гена сахарозо-фосфат-синтаза 2 Physcomitrella patens (PpSPS2); б – главное окно программы «Triander», представляющее обход последовательности равными по модулю нуклеотидными векторами 54 ISSN 2219-3782. Фактори експериментальної еволюції організмів. 2015. Том 17 Дуплий В.П., Дуплий С.А. ЛИТЕРАТУРА 1. Nakamura Y., Gojobori T., Ikemura T. Codon usage tabulated from international DNa sequence databases: Status for the year 2000 // Nucl. acds. res. – 2000. – 28. – P. 292. 2. Lazarus – The professional Free Pascal raD IDE [Электронный ресурс]. – 2015. – Режим доступа: http://www.lazarus-ide.org. 3. Free Pascal [Электронный ресурс]. – 2015. – Режим доступа: http://www.freepascal.org. 4. Cowin J.E., Jellis C.H., rickwood D. a new method of representing DNa sequences which combines ease of visual analysis with machine readability // Nucleic acids res. – 1986. – 14, N 1. – P. 509–515. 5. Hamori E., ruskin J.H., Curves a Novel Method of representation of Nucleotide Series Especially Suited for Long DNa Sequences // J. Biol. Chem. – 1983. – 258, N 2. – P. 1318–1327. 6. Gates M.a. Simpler DNa sequence representations // Nature. – 1985. – 316. – P. 219–219. 7. Lobry J.r. Genomic landscapes // Microbiology Today. – 1999. – 26. – P. 164–165. 8. Duplij D., Duplij S. DNa sequence representation by trianders and determinative degree of nucleotides // J Zhejiang Univ Sci B. – 2005. – 6, N 8. – P. 743–755. 9. Duplij D., Duplij S. Symmetry analysis of genetic code and determinative degree // Biophysical Bull. Kharkov Univ. – 2000. – 488. – P. 60–70. 10. Cebrat S., Dudek M. The effect of DNa phase structure on DNa walks // The European Physical Journal B – Condensed Matter and Complex Systems. EDP Sciences. – 1998. – 3, N 2. – P. 271–276. 11. Scalable Vector Graphics (SVG) 1.1 (Second Edition) l [Электронный ресурс]. – 2015. – Режим доступа: http://www.w3.org/ Tr/SVG. 12. GenPatterns [Электронный ресурс]. – 2015. – Режим доступа: http://math.nist.gov/~FHunt/GenPatterns/. 13. DNa walking with Icarus [Электронный ресурс]. – 2015. – Режим доступа: http://www.cs.nott.ac.uk/~jvb/icarus/. 14. arakawa K., Tamaki S., Kono N., Kido N., Ikegami K., Ogawa r., Tomita M. Genome Projector: zoomable genome map with multiple views // BMC Bioinformatics. – 2009. – 10 – EP. 31. DUPLIj V.P. 1, DUPLIj S.A. 2 1 Institute of Cell Biology and Genetic Engineering of Natl. Acad. Sci. of Ukraine, Ukraine, 03143, Kyiv, Akademika Zabolotnoho str., 148, e-mail: duplijv@icbge.org.ua 2 Mathematical Institute, University of Muenster, Germany, 48149, Muenster, Einsteinstrasse, 62, e-mail: duplijs@uni-muenster.de TRIANDER – A NEW PROGRAM FOR THE VISUAL ANALYSIS OF THE NUCLEOTIDE SEquENCE Aims. Our project aimed to work out the interactive software for nucleotide sequence visualization. Methods. The program named as “Triander” was worked out under Free Pascal raD IDE Lazarus. Source code and compiled for Windows binaries are freely accessible at http://icbge.org.ua/ukr/Triander. Results. This program can produce four types of plots. It is possible to build three DNa walks done independently for each nucleotide position in triplets. The usage of not equal in modulus nucleotide vectors lead to significant reduction of visual information loss in DNa walks. Conclusions. The program can be used in the investigation of fine structure of sequences and find in them standard patterns and nontrivial regions for further detail analysis. Keywords: DNa walk, triander, determinative degree, software.