yindel локус что это

Особенности анализа генотипа лица мужского генетического пола без детекции «Y» при исследовании гена амелогенина

Е.С. Потеряйкин, В.С. Якубович, С.В. Игнатова

Экспертно-криминалистический отдел СУ СК России по Хабаровскому краю и Еврейской автономной области, г. Хабаровск
Кафедра биологии и генетики (зав. – к.б.н. Е.В. Млынар) ФГБОУ ВО ДВГМУ Минздрава России, г. Хабаровск

Особенности анализа генотипа лица мужского генетического пола без детекции «Y» при исследовании гена амелогенина / Потеряйкин Е.С., Якубович В.С., Игнатова С.В. // Избранные вопросы судебно-медицинской экспертизы. — Хабаровск, 2019. — №18. — С. 172-174.

библиографическое описание:
Особенности анализа генотипа лица мужского генетического пола без детекции «Y» при исследовании гена амелогенина / Потеряйкин Е.С., Якубович В.С., Игнатова С.В. // Избранные вопросы судебно-медицинской экспертизы. — Хабаровск, 2019. — №18. — С. 172-174.

код для вставки на форум:

При использовании современных наборов химических реагентов для генотипоскопического исследовании ДНК проводится анализ гена амелогенина, по одной копии которого локализовано как на X-, так и на Y-хромосоме, в обоих случаях на коротком плече.

После электрофореза в исследуемых объектах должны отчетливо выявляться следующие специфические пики на электрофореграммах: один – для женской половой принадлежности (106 п.н., AmelX) и две – для мужской половой принадлежности (106 п.н. AmelX и 112 п.н. AmelY).

Наиболее современные наборы реактивов для амплификации аутосомных STR-локусов, таких производителей, как Promega Corporation, Applied Biosystems, QIAGEN, включают дополнительные гендерные локусы, локализованные на Y-хромосоме. Данные локусы (Y-Indel, DYS391 и пр.) расположены на длинном плече Y-хромосомы и добавлены в наборы реагентов для более корректной диагностики генетического пола в случае появления «ошибок» при анализе гена амелогенина, связанных с делециями в коротком плече Y-хромосомы.

Нами был изучен образец крови трупа гражданина К. (мужчина 50 лет, фенотипически – телосложение по мужскому типу, наружные и внутренние половые органы развиты в соответствии с соматическим полом). Для исследования локусов ядерной ДНК, выделенной из образца крови гражданина К., применяли полимеразную цепную реакцию, используя набор реагентов AmpFlSTR® GlobalFiler™, производства фирмы Applied Biosystems, США, в соответствии с прилагаемой к набору инструкцией. Реакцию амплификации проводили с помощью прибора GeneAmpPCRsystem 9700 фирмы Applied Biosystems, США. Разделение и детекцию флуоресцентно меченных амплифицированных фрагментов проводили с использованием прибора капиллярного электрофореза 3500 GeneticAnalizer, производства фирмы Applied Biosystems, США, в среде полимера POP4. Определение длин амплифицированных фрагментов и установление номеров аллелей проводили на основе внутреннего стандарта длины (GeneScan-600 LIZ Size Standard v 2.0) и входящего в набор реагентов аллельного леддера с помощью программного комплекса GeneMapper ID-Х.

При исследовании ДНК, выделенной из образца крови гражданина К., выявлены однои двуаллельные сочетания, в результате исследования пол специфичного сегмента амелогенинового гена (Amelogenin) выявлен только Х-специфичный фрагмент, что характерно для лица женского генетического пола, но при этом детектировались аллели локусов Y-Indel, DYS391. В зарубежной литературе данное явление описано как AMELY-negative males (AMELY-отрицательные мужчины).

Можно предположить два варианта для объяснения данного явления: мутацией в области посадки используемого праймера или делецией короткого плеча Y-хромосомы. В отечественной литературе частота затрагивающих ген AMELY делеций, их характеристики практически не описаны.

Для более полного установления генетических признаков гражданина К. нами использовался набор реактивов AmpF/STR® Yfller™ Plus PCR Amplification Kit (Applied Biosystems, США), который включает следующие локусы: DYS576, DYS389I, DYS635, DYS389II, DYS627, DYS460, DYS458, DYS19, YGATAH4, DYS448, DYS391, DYS456, DYS390, DYS438, DYS392, DYS518, DYS570, DYS437, DYS385 a/b, DYS449, DYS393, DYS439, DYS481, DYF387S1, DYS533.

При этом в коротком плече локализованы такие локусы, как DYS576, DYS458, DYS456, DYS570, DYS393, DYS481, DYS449, DYS19; последний расположен ближе к центромере.

При анализе гаплотипа Y-хромосомы у гражданина К. установлено, что отсутствуют аллели в локусах DYS576, DYS458, DYS481, DYS449, при условии, что аллели некоторых локусов, расположенных в коротком плече, и аллели локусов, расположенных в длинном плече Y-хромосомы, детектировались на электрофореграмме без особенностей. Таким образом, можно сделать вывод, что у гражданина К. отсутствует участок Y-хромосомы между расположением локуса DYS570 с одной стороны и DYS19 с другой стороны, включающий локализацию гена амелогенина.

Приведенный нами пример из экспертной практики при дополнительном изучении с набором реагентов для анализа STR-локусов Y-хромосомы следует описать в исследовательской части экспертного заключения как вариант делеции фрагмента короткого плеча Y-хромосомы. С точки зрения прикладного значения, стоит отметить, что подобные делеции значительно ограничивают возможности популяционных исследований при установлении территориальноэтнической принадлежности субъекта, поскольку число исследованных локусов существенно ограничивается. Данное явление встречается довольно редко в практике экспертно-криминалистических исследований, что дает возможность в более категоричной форме высказываться о тождестве (след–след или след–лицо) при сравнительном исследовании объектов, генотипы которых установлены только по STR-локусам Y-хромосомы. Нам представляется актуальным дальнейшее накопление подобных примеров с целью уточнения сведений о частотах встречаемости делеций Y-хромосомы в отдельно взятых регионах Российской Федерации.

Источник

Yindel локус что это

Различные системы генетических маркеров, применяемые для установления родства:

— Системы STR-локусов аутосом

— Системы STR-локусов Y-хромосомы

— Полиморфные локусы митохондриальной ДНК

На Рис. 4 показаны системы, используемые различными международными организациями, а также созданные на их основе коммерческие наборы. Как видно из рисунка, наборы AmpFlSTR Identifiler (фирма Applied Biosystems) и PowerPlex®16 (фирма Promega), используемые в Центре Молекулярной Генетики, содержат полный набор локусов, утвержденных как европейскими, так и американскими стандартами. Кроме того, указанные наборы включают локус AMELOGENIN, анализ которого позволяет установить половую принадлежность образца. Таким образом, данные, полученные при использовании упомянутых наборов, совместимы с любым из существующих стандартов.

Системы на основе аутосомных локусов используются при установлении различных степеней родства:

Брат (сестра) – брат (сестра);

Бабка, дед – внук (внучка);

Y-хромосома – это небольшая по размеру (около 58 млн. нуклеотидных пар) хромосома человека, которая присутствует только в ядрах мужских клеток в единственном числе. Y-хромосома почти не рекомбинирует в мейозе. Рекомбинация с X-хромосомой происходит только на небольших участках, расположенных на концах Y-хромосомы и занимающих около 5% её длины. Таким образом, Y-хромосома передается из поколения в поколение от отца к сыну, практически в неизменном виде. Описанные свойства обуславливают использование генетических маркеров, лежащих на Y-хромосоме, как для целей идентификации личности (например, при расследовании половых преступлений), так и для установления родства по мужской линии.
К настоящему времени известно более двухсот STR-локусов Y-хромосомы, причем некоторые из них присутствуют на хромосоме в двух, и даже в трех экземплярах. Как и в случае с аутосомными локусами, требования унификации и совместимости растущих национальных баз данных частот гаплотипов Y-хромосомы, привело к созданию международных стандартов. В 1997 году, усилиями европейской организации ISFG (International Society of Forensic Genetics) был определен так называемый «минимальный гаплотип», включающий в себя локусы DYS19, DYS385a/в, DYS389I, DYS389II, DYS390, DYS391, DYS392 и DYS393. В 2003 году американской организацией SWGDAM (Scientific Working Group on DNA Analysis Methods), в дополнение к упомянутым 8 локусам, было предложено использовать локусы DYS438 и DYS439.

На Рис. 5 показаны системы, используемые различными международными организациями, а также созданный на их основе коммерческий набор PowerPlex® Y (фирма Promega). Как видно из рисунка, набор PowerPlex® Y, применяемый в Центре Молекулярной Генетики, содержит полный набор локусов, утвержденных как европейскими, так и американскими стандартами. Таким образом, результаты типирования по STR-локусам Y-хромосомы, проведенного в нашем Центре, могут быть использованы для сравнительного анализа зарубежными лабораториями.

Типирование по маркерам Y-хромосомы используется при установлении таких родственных связей как:

Родство по мужской линии;

X-хромосома – это средняя по размеру (около 154 млн. нуклеотидных пар) хромосома человека, присутствующая в единственном числе в ядрах мужских клеток, и в виде двух гомологичных хромосом в ядрах клеток женщин. У мужчин X-хромосома практически не рекомбинирует в мейозе с Y-хромосомой и передается дочерям в неизменном виде. Именно эта особенность X-хромосомы чаше всего используется при установлении родства.
Использование полиморфных маркеров X-хромосомы для задач идентификации личности и установления родства не имеет такого широкого распространения, как в случае с аутосомными маркерами и маркерами Y-хромосомы. В настоящее время, в мире не существует общепринятой для установления родства системы STR-локусов X-хромосомы. В правой части Рис. 6 показано относительное расположение на X-хромосоме восемнадцати STR-локусов, наиболее часто использующихся в мире для установления родства.
В Центре Молекулярной Генетики, при проведении анализов на установление родства, используется собственная уникальная система STR-локусов X-хромосомы, состоящая из 12 маркеров (DXS1192, DXS1226, DXS1237, DXS7161, DXS8020, DXS8060, DXS8087, DXS8089, STR49, SH2DIA, NDPCA, Humara).

Относительное расположение этих локусов на X-хромосоме показано на Рис. 6 слева. При необходимости анализ может быть проведен по дополнительным локусам Х-хромосомы, не представленным на рисунке.

Типирование по маркерам X-хромосомы чаще всего используется при установлении таких родственных связей как:

Бабка по отцу – внучка.

Митохондриальная ДНК представляет собой сравнительно небольшие (

16,5 тысяч пар нуклеотидов) замкнутые в кольцо молекулы. Одна митохондрия, в среднем, содержит 4-5 идентичных копий таких молекул. Поскольку в клетке несколько сотен митохондрий, то количество молекул митохондриальной ДНК на одну клетку может достигать, например, в яйцеклетках, нескольких тысяч, однако среднее значение колеблется в районе 500.
Генотип человека по локусам митохондриальной ДНК называется митотипом. Для обозначения аллельных вариантов, при описании митотипа, указывается отличие последовательности нуклеотидов аллеля конкретного митотипа от стандартной последовательности. В качестве стандартной последовательности нуклеотидов молекулы митохондриальной ДНК человека используется так называемая пересмотренная Кембриджская референсная последовательность (revised Cambridge Reference Sequence или rCRS) опубликованная в 1999 году. Две нуклеотидные цепи молекулы имеют различный суммарный нуклеотидный состав и обозначаются как L-цепь (light, легкая) и Н-цепь (heavy, тяжелая). Нуклеотиды L-цепи референсной последовательности пронумерованы, начиная с точки начала репликации H-цепи.
Большая часть молекулы митохондриальной ДНК содержит консервативные кодирующие последовательности. Только небольшой не кодирующий участок размером 1122 нуклеотидные пары, так называемый «контрольный регион», содержит гипервариабельные (имеющие большое число вариантов) участки HV1 (342 пары нуклеотидов), HV2 (268 пар нуклеотидов) и HV3 (137 пар нуклеотидов).

Расположение данных участков показано на Рис. 7.
В настоящее время, в качестве стандартных локусов для установления родства, во всем мире приняты участки HV1 и HV2. Типирование митохондриальной ДНК по данным локусам осуществляется путем секвенирования, то есть непосредственного определения полной нуклеотидной последовательности локусов HV1 и HV2.

Типирование митохондриальной ДНК используется при установлении таких родственных связей как:

Источник

Как определить биологическое отцовство?

Большинство людей считают, что поводом для сомнения в биологическом отцовстве является несовпадение групп крови. Насколько обоснованы эти сомнения? Для решения таких спорных вопросов еще совсем недавно суды требовали представления свидетельских показаний, документов, справок, отзывов и характеристик, чтобы решить, является мужчина биологическим отцом ребенка или нет. Однако все это не могло гарантировать истинного правосудия. Вопрос заключался не в поиске истины, а в том, какая из сторон насобирает больше компромата на другую. В результате иногда даже бесплодные мужчины по решению суда оказывались отцами чужих детей. Сегодня самым надежным и точным методом установления факта биологического отцовства и идентификации личности признан ДНК-анализ, который позволяет полностью исключить подобного рода ошибки.

До возникновения ДНК-анализа для определения биологического отцовства или материнства, а также идентификации людей использовались биологические методы. Эти методы были основаны на определении групп крови, серологическом тестировании и т.п. Группа крови – это генетически наследуемый признак, не изменяющийся в течение жизни при естественных условиях. В крови человека в разных ее составляющих находятся антигены, которые получены каждым человеком по наследству от родителей в равных долях. У разных людей эти, в принципе, похожие антигены по некоторым своим свойствам отличаются друг от друга. Антигены одного типа, но несколько отличающиеся по свойствам, составляют систему. На сегодняшний день известно более десятка такого рода систем. Например, по наиболее широко распространенной системе АВ0 людей принято делить на 4 основные группы. Частота встречаемости этих групп составляет примерно: I – 35%; II – 35%; III – 20%; IV – 10%. В основе закономерностей наследования групп крови системы АВ0 лежат следующие понятия: группа крови определяется одним геном, который обнаруживается в трех различных вариантах, то есть аллелях, называемых А, В и 0 (ноль). Аллель – это одна из возможных альтернативных форм гена, каждая из которых характеризуется уникальной последовательностью нуклеотидов.

Если известны группы крови родительской пары, то с помощью элементарной комбинаторики можно определить «допустимые» и «невозможные» сочетания группы крови у детей. Для понимания вышеизложенного разберем данные, приведенные в таблице N 1. Например, если оба родителя имеют первую группу крови 0(I), то все дети могут иметь кровь только этой группы. В случае когда один из родителей имеет третью группу крови В(III), а другой – вторую А(II), то дети могут иметь любую из четырех групп крови и т.д.

Группы крови системы АВ0, возможные у ребенка в зависимости от группы крови его родителей

Группа крови матери

Группа крови отца

Понимание закономерностей наследования групп крови помогает разрешить некоторые проблемы, например снять необоснованные подозрения. Однако в ряде случаев использование системы группы крови для установления родства является неэффективным, так как вероятность случайного совпадения очень высока.

В наши дни вопросы установления биологического родства решаются путем применения значительно более информативной системы, основанной на молекулярно-генетических методах исследования ДНК. Что же такое ДНК?

Дезоксирибонуклеиновая кислота (ДНК) – высокополимерное природное соединение, содержащееся в ядрах клеток всех живых организмов, носитель генетической информации. ДНК локализована в ядре каждой клетки, состоит из двух цепей и имеет структуру двойной спирали. Она точно воспроизводится при делении клеток, что обеспечивает в ряду поколений клеток и организмов передачу наследственных признаков. Общая длина молекул ДНК в каждой клетке составляет около 2 метров, а число пар нуклеотидов – более 3 млрд.

Интересно заметить, что молекулы ДНК любых двух людей (не родственников) отличаются в среднем только одним нуклеотидом из каждых 300–400. Теоретически это означает, что если у сотни человек проанализировать фрагмент ДНК длиной 300–400 нуклеотидов для одного и того же гена, то 99 человек вполне могут оказаться не отличимыми друг от друга. Индивидуализирующие признаки, определяемые на уровне ДНК, характеризуются почти абсолютной устойчивостью, то есть сохраняются в организме человека неизменными всю его жизнь и неизменными отображаются в его биологических следах. Идентификационная значимость генетических признаков чрезвычайно высока. Поэтому для установления биологического родства или же для идентификации личности используют отнюдь не любые гены, а только полиморфные, то есть те, у которых много аллельных форм.

На ранних этапах развития ДНК-анализа конечный этап всей сложной многостадийной процедуры сводился к анализу специфических графических изображений, условно говоря, «отпечатков пальцев» наследственного материала человека. В конце 90-х годов прошлого столетия с появлением генетических анализаторов стало возможным получать результаты ДНК-анализа в виде специфического набора цифр, то есть определять уникальный генетический «паспорт» или «удостоверение личности» человека, которое нельзя ни скрыть, ни изменить, ни подделать.

В настоящее время во многих передовых молекулярно-генетических лабораториях установление биологического родства проводят по 16 аутосомным STR-маркерам. Для этого получают генотипы образцов, каждый из которых представляет собой комбинацию из 30 цифр и 2 буквенных обозначений, где «ХХ» указывает принадлежность к женскому, а «ХY» – к мужскому генетическому полу (см. таблицы NN 2 и 3). В случае подтверждения биологического родства по каждому исследованному локусу один из аллельных вариантов в генотипе ребенка должен совпасть с одним из материнских аллельных вариантов, а другой – с одним из отцовских.

Результаты теста, подтверждающие биологическое отцовство

Объекты

Локусы

Генотип
предполагаемого отца
объект N 1

Генотип
ребенка
объект N 3

Генотип
матери
объект N 2

D8S1179

14;15

10 ; 14

Источник

Антибабский форум

Мужской форум, где мужчины протестуют против бабской сущности в женщинах и их стервозности. Различные истории из жизни, общение, мнения и, конечно же, юмор в отношении женской части населения. Медицинские консультации. Сoветы психолога.

Сообщение mikola » 27.02.14 21:15

Сообщение Генетик » 28.02.14 00:07

Сообщение mikola » 28.02.14 17:29

почитал ваш faq и самого заинтересовало кол. лоскутов использованных для сравнения, попытаюсь нати эту информацию.

Сообщение Генетик » 28.02.14 18:04

Сообщение Obormot » 28.02.14 20:21

Сообщение Генетик » 02.03.14 00:15

Сообщение BON » 02.03.14 02:50

Сообщение Obormot » 02.03.14 20:30

то есть, насколько я понял:

2. если стоит задача доказать отцовство, и/или есть хоть малейшее подозрение об участии в зачатии кровных родственников-мужчин, то нужен самый дорогой тест (максимальное количество локусов).

Сообщение Генетик » 03.03.14 13:54

Сообщение svetofor » 08.07.14 17:42

Сообщение Obormot » 08.07.14 19:03

так можно еще раз сделать, в другой лаборатории.

взять образцы и отправить.
потом сравнить «цыферки»

насколько я помню, «официальный, для суда» днк тест стоит гораздо дороже.
но тут могу ошибаться.

Сообщение svetofor » 08.07.14 23:14

Сообщение svetofor » 08.07.14 23:15

Сообщение Obormot » 09.07.14 15:07

Сообщение svetofor » 09.07.14 18:15

Сообщение Senang » 16.05.15 23:47

Сообщение Генетик » 17.05.15 20:46

Сообщение noev » 17.05.15 23:51

Сообщение Генетик » 18.05.15 09:38

Сообщение noev » 18.05.15 10:31

Сообщение Senang » 18.05.15 12:17

Сообщение uzoom » 18.05.15 13:16

посмотрел я табличку как определяется отцовство, и что то метод совсем не радует. вот например если.
будет человек (например родственник) с генами
15/x
15.3/y
11/z
.
ну и так далее, то он тоже может быть признан отцом. насколько у родственников похожи цифры? да и вообще у людей в целом. даже вон у матери с отцом цифры примерно похожи. вот исключить отцовство точно 100% дает, если цифры не одной в локусе нет то не отец (2 локуса как я понял в рф).
если устанваливать отцовство без данных матери, так длин, с которыми может совпасть отцовская цифра, у ребенка в локусе вообще 2. тут вообще можно, каждого десятого отцом назвать?

в общем как я понял: если результат отцовства отрицательный то это сто процентов не отец. а если положительный, то это только вероятность (возможно отец, а возможно и нет)

и что значит столбец PI??

Сообщение noev » 22.05.15 11:25

Сообщение Генетик » 31.05.15 00:54

Источник

Yindel локус что это

Как наследуются заболевания и какими бывают мутации – сложные темы. Но без понимания, что такое аллель и где именно образуются поломки в генах не обойтись, если вы хотите анализировать результаты секвенирования. Эта теория тесно связана с практикой.

Что и как секвенируют?

ДНК для секвенирования выделяют из биологических материалов, которые мы отправляем в лабораторию. Это может быть щеточка с буккальным соскобом ребенка (эпителий с внутренней стороны щеки), кровь в пробирке или кровь, высушенная на фильтровальной бумаге (для удобства почтовой пересылки).

Если выделенной ДНК окажется достаточно и она пройдет контроль качества, то вам могут сообщить, что ваш образец принят. Далее он ждет своей очереди, чтобы с десятками других пройти секвенирование. Чем больше образцов обрабатывают одновременно и чем дольше продолжается секвенирование, тем дешевле его себестоимость.

Так что же конкретно читает секвенатор?

Представим, что наш генетический код (генотип) – это чертежи, записанные четырехбуквенным языком. По этим чертежам внутри клеток из аминокислот собираются белки. А с белками прямо или косвенно связаны все процессы в нашем организме.

Информация чертежей закодирована лишь четырьмя буквами A, T, G, C, точнее, молекулами из которых состоит ДНК. Но и четырех букв вполне достаточно.

Чтобы лучше понимать, что такое ДНК, рекомендую посмотреть это видео.

Технология секвенирования – это автоматическое чтение под микроскопом последовательности молекул A, T, G или C, помеченных так, чтобы они стали отличимыми друг от друга.

Сначала ДНК режется на множество отрезков. Их длина достаточна для того, чтобы не перепутать между собой. Затем каждый из этих отрезков копируется множество раз. Чтение происходит параллельно для многих копий отрезка сразу с двух сторон. Благодаря такому масштабированию и одновременности секвентатор может быстро прочитать геном или экзом. Многократное дублирование позволяет снизить вероятность ошибок.

Если вы хотите поглубже познакомиться с технологией секвенирования Illumina, рекомендую посмотреть это видео на английском языке.

После секвенирования компьютер находит место прочитанных отрезков относительно эталонного генома, то есть «выравнивает» фрагменты. Прочтения могут накладываются друг на друга, поэтому у каждой конкретной молекулы ДНК будет свое количество прочтений, которое называется «покрытие».

В этом определении нет устоявшегося термина и могут быть разные переводы с английского. Слова «покрытие», «глубина прочтения», «охват», «глубина секвенирования» могут означать одно и то же. Например, в следующих главах покрытие для конкретного нуклеотида будет обозначаться DP (DePth).

Среднее число прочитанных молекул участка (локуса), экзома или генома – называется «среднее покрытие».

Поскольку процесс чтения – случайный, всегда найдутся участки с настолько низким DP, что будут отброшены при контроле качества. Если речь идет о постановке диагноза, то таких «некачественных» прочтений, особенно в кодирующей части ДНК, должно быть немного и требования к среднему покрытию, соответственно, растут. Среднее покрытие экзома или генома определяет себестоимость и конечную цену секвенирования.

Как правило, если секвенируют целый геном, то приемлемым считают покрытие выше х20. Это означает, что каждый участок ДНК был в среднем прочитан не менее 20 раз. Экзом составляет около 2% от генома и ему можно уделить, по крайней мере, втрое больше внимания – здесь приемлемым будет покрытие x75 и более.

Дождавшись результатов секвенирования, вы получите флешку, внешний жесткий диск или email со ссылками на медицинский отчет и файлы с данными секвенирования. Оптимальным будет, если вы получите FASTQ файлы, BAM (или SAM) файл, VCF-файл и pdf-отчеты. Все их желательно сохранить у себя.

1) Исходный материал – это большой по размеру многотомный архив с FASTQ файлами, которые содержат, по сути, сырые и неупорядоченные данные секвенирования. Для экзома их размер будет составлять около 10GB. Эти файлы важны тем, что на их основе можно будет создавать новые отчеты со свежими уточнениями. Также по этим файлам можно достоверно оценивать качество секвенирования.

2) BAM-файл или SAM-файл с выровненными относительно эталонного генома данными. То есть, с уже упорядоченной информацией о ДНК, которую можно просматривать с помощью специальных ДНК-броузеров.

3) Самое интересное для клинического анализа – это выявление различий между геномом пациента и эталонным геномом человека (variant calling). Выявленные различия записывают в сравнительно небольшой VCF-файл. С помощью специальных программ его анализируют для выявления нарушений.

Аллели и наследственные менделевские заболевания

Считается, что ДНК двух людей идентичны на 99.9% и лишь 0.1% отличий определяет разницу между нами. Но самое интересное то, что различие ДНК существует и внутри наших клеток. По сути, в них содержится информация о двух разных людях, то есть две парных хромосомы. Благодаря этому, даже несмотря на множество мутаций у каждого из нас, мы обычно не заболеваем тяжелыми наследственными заболеваниями. Если на одной хромосоме есть дефектный ген, то вторая хромосома продолжает работать как надо. И обычно одного из двух «работников» бывает достаточно, чтобы произвести нужное количество «правильных» белков.

Чтобы лучше понять, как происходит наследование признаков, рекомендую познакомиться с этим видео.

Двое разных людей в наших генах – это, конечно же, мама и папа. После оплодотворения материнские и отцовские хромосомы соединяются и обмениваются различными участками. Перемешивание генов происходит не отдельными молекулами ДНК, а большими блоками, которые обмениваются как единое целое (их называют гаплотипами). В итоге почти все наши гены состоят из двух копий-половинок, унаследованных от обоих родителей (за исключением генов половых хромосом).

Кстати, иногда, варианты генов не наследуются. Под действием внешних факторов могут происходить мутации de novo, то есть вариант гена, которого не было ни у кого из родителей.

Аллели – это различные формы одного и того же гена, расположенные в одинаковой позиции (локусе) хромосомы. Если эти участки совпадают, их называют гомозиготными, если различаются, тогда их называют гетерозиготными.

Если аллели гомозиготные, то белки получаются одинаковые и эффект такого варианта на функцию гена одинаков – тут более-менее все понятно. Но при гетерозиготном варианте, один аллель может подавлять другой во внешних проявлениях. Такие отношения между аллелями называют доминантностью. Доминантный аллель будет проявляться в фенотипе – характеристике человека (цвет волос, непереносимость продукта и т.п.), а рецессивный никак не будет себя проявлять, оставляя играть роль доминантному.

Конечно, степени подавления могут быть разными, например, может быть и смешанный тип, когда свои особенности проявляют оба аллеля.

Вспомним школьный урок биологии про законы Грегора Менделя, рисунки с белыми и красными тюльпанами, а также варианты потомства, которое они дают при различных типах наследования. Следующие поколения тюльпанов при скрещивании могут оставаться красными и белыми, быть промежуточными по окрасу (розовыми) или даже с разными цветами отдельных лепестков.

Так и большинство генетических нарушений – моногенные и имеют понятные закономерности наследования в соответствии с законами Менделя. Поэтому они называются менделевскими заболеваниями.

Отсюда, два основных типа менделевских заболеваний. Оба могут быть предсказаны по законам генетики с определенной вероятностью, если известны варианты генов отца и матери.

Аутосомно-доминантное наследование, при котором болезнь может проявиться в случае, если у человека есть хотя бы один «дефектный» ген, унаследованный от отца или матери.

Если хотя бы у одного из родителей есть соответствующий генетический дефект, то не только у него развивается заболевание, но с вероятностью 50% это заболевание передастся ребенку. Выраженность заболевания будет зависеть от степени доминирования и степени повреждения гена, а она может меняться при передаче. Нарушения у родителя могут быть с очень «смазанными» симптомами (низкая пенетрантность) или проявиться уже в зрелом возрасте. Также аутосомно-доминантное наследование часто связано с мутациями de novo.

Аутосомно-рецессивное наследование, при котором болезнь проявляется только в том случае, если «дефектный» ген был унаследован от обоих родителей. То есть, обе парные хромосомы содержат мутацию на одном и том же участке.

Мы все носим множество редких «дефектных» генов. Но человек, имеющий только одну копию «дефектного» гена (а другую – «нормального» гена), при этом типе наследования является полностью или почти полностью здоровым. Он лишь носитель. Если же оказалось, что оба родителя ребенка являются носителями одной и той же болезни, то с вероятностью 25% ребенок унаследует генетический дефект от обоих родителей, а ни одной нормальной копии соответствующего гена у него не будет. В этом случае развивается заболевание.

Сцепленное с полом наследование связано с непарными половыми хромосомами. Правда непарные (XY) они только у мужчин, а у женщин они парные (XX), как и остальные хромосомы.

Некоторые заболевания передаются только от отца к сыну (когда «плохой» ген находится на мужской Y-хромосоме) или же от матери детям обоего пола (когда вызывающая болезнь мутация происходит на женской Х-хромосоме).

Этот тип заболеваний чаще всего проявляется у мужчин. Ведь, если «плохой» аллель находится на Y-хромосоме, то женщина, в принципе, не может его получить, так как обе половые хромосомы у женщин – это Х-хромосомы. Если болезнь связана с мутацией в женской половой хромосоме, то мужчина, получивший «плохую» хромосому, будет болен (так как у него в геноме нет «здоровой» пары).

У девочки-носителя действие мутантного аллеля обычно маскируется его здоровым напарником, и болезнь проявляется только в том случае, если обе ее Х-хромосомы несут мутацию.

Понятно, что редкое наследственное заболевание означает, что соответствующий аллель мало распространен. Частота аллеля (AF) – ключевой параметр, с которым мы будем работать. Она измеряется в процентах или как число от нуля до единицы. Частота аллеля определяется, как доля всех хромосом в популяции, которые несут эту аллель. Их расчетом занимается популяционная генетика.

Что может поломаться в гене?

Путь от гена до образования белка – это удивительно красивый процесс. Он состоит из двух основных этапов – транскрипции и трансляции, который происходит по цепочке: Ген –> РНК-полимераза –> мРНК (она же иРНК) –> рибосома –> белок.

Образование белка хорошо описано в этих видео [тут и тут].

Наши белки состоят из 20 аминокислот. Каждая аминокислота белка кодируется тремя идущими подряд буквами ДНК. Эта тройка называются триплетом (или кодоном). Подробнее о кодировании на английском можно почитать тут.

Большинство генетических вариаций – это точечные замены одной буквы ДНК на другую. Они называются однонуклеотидный полиморфизм – SNP или SNV (Single nucleotide polymorphism/variant). Но также распространены индели (indel) – это короткие вставки лишних молекул ДНК или наоборот выпадения тех нуклеотидов, которые должны быть (делеции).

Ошибки даже в одной из букв триплета могут привести ко вставке неправильной аминокислоты. А это, в свою очередь, может привести к неправильному образованию белка, когда его функция будет снижена или вообще утрачена.

Иногда SNP становятся причиной тяжелых генетических заболеваний (например, муковисцидоза). Но гораздо чаще точечные изменения безобидны, поэтому их и называют не мутациями, а вариантами.

Более 160 миллионов описанных в медицине и генетике вариантов хранятся в генетической энциклопедии полиморфизмов dbSNP, под уникальными номерами (RefSNP), которые начинаются с префикса rs.

Приведем пример очень распространенного SNP, который вы, возможно, найдете в своих результатах секвенирования:

Вариант под номером rs1801131 – это SNP в гене MTHFR. В нашем случае был вариант T>G (то есть, однонуклеотидная замена “T” на “G”) в хромосоме 1 в позиции 11,794,419 по референсоному геному GRCh38. Такая замена ДНК приведет к тому, что в белке вместо аминокислоты глутамин будет вставлена аминокислота аланин.

Белок МТНFR (метилентетрагидрофолатредуктаза) участвует в превращении гомоцистеина в метионин. При гетерозиготном варианте функция гена сохранена примерно на 65%, а при гомозиготном – примерно на 30%.

Согласно данным 1000 Genome, частота аллеля в мире составляет 24,94%. Это означает что вероятность быть носителем гомозиготного варианта составляет около 6%.

Под номером 3521 этот же вариант хранится в клинической базе данных Clinvar, где записаны те SNV, которые имеют медицинское значение. В разделе Conditions можно прочитать про ассоциированные заболевания.

Влияние варианта на функцию белка можно прогнозировать не только на основании клинических баз данных, но и на базе алгоритмов, которые учитывают, какой именно участок гена был изменен.

Но как так сразу можно узнать о серьезности мутации?

Участок ДНК гена состоит из нескольких фрагментов, которые неравнозначны по важности. Первый фрагмент указывает РНК-полимеразе на начало считывания, далее идет область экзонов вместе с интронами, завершающий фрагмент кода указывает на конец гена, то есть, служит командой для прекращения считывания. Повреждения в этих областях будут иметь совершенно различные последствия.

Схематическая структура гена

Как будет выглядеть такой анализ на практике?

Когда мы будем делать аннотирование VCF-файла, то инструмент snpEff добавит к каждому варианту множество подписей. Среди них будет столбец ANN[*].IMPACT (Impact prediction), в котором записано одно из четырех значений HIGH, MODERATE, LOW, MODIFIER. За редкими исключениями, с нарушением могут быть связаны варианты HIGH или MODERATE.

Чтобы оценить влияние конкретного варианта, программа ориентируется на таблицу соответствия. То есть, на записи соседнего столбца ANN[*].EFFECT. Сюда алгоритм записывает, какую именно часть или структуру гена затронул вариант.

Влияние ANN[*].IMPACT	Описание	ANN[*].EFFECT
HIGH	Предполагается, что вариант оказывает сильное (разрушительное) воздействие на белок, вероятно вызывая укорочение белка, потерю функции или запуска нонсенс-опосредованного распада.	chromosome_number_variation exon_loss_variant frameshift_variant rare_amino_acid_variant splice_acceptor_variant splice_donor_variant start_lost stop_gained stop_lost transcript_ablation
MODERATE	Неразрушающий вариант, который может изменить эффективность белка.	3_prime_UTR_truncation & exon_loss 5_prime_UTR_truncation & exon_loss_variant coding_sequence_variant conservative_inframe_deletion conservative_inframe_insertion disruptive_inframe_deletion disruptive_inframe_insertion missense_variant regulatory_region_ablation splice_region_variant TFBS_ablation
LOW	Предполагается, что вариант в основном безвреден или вряд ли изменит поведение белка.	5_prime_UTR_premature_start_codon_gain_variant initiator_codon_variant splice_region_variant start_retained stop_retained_variant synonymous_variant
MODIFIER	Обычно некодирующие варианты или варианты, влияющие на некодирующие гены, где предсказания затруднены или нет доказательств воздействия.	3_prime_UTR_variant 5_prime_UTR_variant coding_sequence_variant conserved_intergenic_variant conserved_intron_variant downstream_gene_variant exon_variant feature_elongation feature_truncation gene_variant intergenic_region intragenic_variant intron_variant mature_miRNA_variant miRNA NMD_transcript_variant non_coding_transcript_exon_variant non_coding_transcript_variant regulatory_region_amplification regulatory_region_variant TF_binding_site_variant TFBS_amplification transcript_amplification transcript_variant upstream_gene_variant

Повреждения очевидно будут сильными (HIGH), если они связаны с исчезновением целого экзона (exon_loss_variant), нарушению кратности считывания триплета ДНК (frameshift_variant), преждевременной остановке считывания (stop_gained) и прочими серьезными структурными проблемами.

Зато на этапе первичного анализа можно не обращать внимания на строки LOW и MODIFIER. В них, например, записаны SNP в некодирующей области (intron_variant), синонимичные варианты, которые несмотря на замену в ДНК приведут к кодированию одной и той же аминокислоты, а также другие малозначимые изменения.

Например, для описанного выше варианта rs1801131 может быть такая запись.

ANN[*].EFFECT	ANN[*].IMPACT	ANN[*].GENE
missense_variant, downstream_gene_variant	MODERATE, MODIFIER	MTHFR,C1orf167

Поскольку данный вариант затрагивает транскрипцию двух генов (MTHFR и C1orf167), то для них записаны два различных эффекта.

Для гена C1orf167 – это downstream, то есть вариант в некодирующей части ДНК, который не имеет значения (MODIFIER).

Для гена MTHFR – это missense, то есть вариант, который, хотя и не разрушает белок, но может привести к изменению его эффективности. Поэтому нужно выяснить его значимость (а пока считаем, что он умеренный – MODERATE).

Больше о патогенности варианта, мы узнаем из клинического опыта, то есть других баз данных (например, Clinvar, о которой речь пойдет ниже).

Содержание:

Часть 2. Немного теории: чтение ДНК, аллели, поломки генов
2.1. Что и как секвенируют?
2.2. Аллели и наследственные менделевские заболевания
2.3. Что может поломаться в гене?

Источник