Понимаю, что вопрос сугубо специальный, но вдруг мне повезёт...
Может кто-то знает, из каких соображений выбирается начало координат в кольцевой ДНК бактерий при аннотировании в крупных базах данных типа GenBank? И ещё: если ДНК двухцепочечная - как выбирается одна из двух цепей? Или в обоих случаях имеет место совершенный произвол?
Примечание:
ilyushachishe, вероятно, я неудачно сформулировал вопрос; поясню на примере.
Берём какой-нибудь геном, например, этот:
ftp://ftp.ncbi.nlm.nih.gov/genomes/Bacteria/Escherichia_coli_HS/NC_009800.gbk
В нём имеется 4643538 нуклеотидов, занумерованных от единицы до 4643538. Вопрос состоит в том, как выбирается нуклеотид с номером 1. Например, в данном случае первый упоминаемый ген - thrL - имеет координаты начала и конца - 190..255; случайно ли начало отсчёта попало за 190 нуклеотидов до начала этого гена, или нуклеотид с номером 1 как-то естественным образом выделяется среди всех остальных? В некоторых геномах начало координат попадает внутрь одного из генов, что вызывает некоторые технические неудобства. В связи с этим и возник вопрос: является ли такая нумерация естественной или произвольно заданной?
Надеюсь, пояснил.
RPI.su - самая большая русскоязычная база вопросов и ответов. Наш проект был реализован как продолжение популярного сервиса otvety.google.ru, который был закрыт и удален 30 апреля 2015 года. Мы решили воскресить полезный сервис Ответы Гугл, чтобы любой человек смог публично узнать ответ на свой вопрос у интернет сообщества.
Все вопросы, добавленные на сайт ответов Google, мы скопировали и сохранили здесь. Имена старых пользователей также отображены в том виде, в котором они существовали ранее. Только нужно заново пройти регистрацию, чтобы иметь возможность задавать вопросы, или отвечать другим.
Чтобы связаться с нами по любому вопросу О САЙТЕ (реклама, сотрудничество, отзыв о сервисе), пишите на почту [email protected]. Только все общие вопросы размещайте на сайте, на них ответ по почте не предоставляется.