October 17th, 2015

agsf

Чудеса в Пробирках

К предыдущему посту, вспомнил такую историю. Еще когда я сам этой фигней занимался, с генетическими маркерами, на меня вышел один израильтянин. Он хотел, чтобы я сделал ему кит на простой набор маркеров (SNPs) для анализа возможного отцовства-материнства. Тогда тесты подобного рода были достаточно дорогими, и у него была вполне разумная идея отфильтровывать процентов 90 случаев на основании дешевого "негативного предиктора" родительства. Напр, если есть две аллели, А и а, и у отца генотип АА, а у матери Аа, то дети с типами АА и Аа могут быть потомством этой пары, а с типом аа не могут, и т п. Если мы по этому маркеру имеем, напр, допустимый вариант АА + Аа = АА, то по другому маркеру можем получить недопустимые для родительства ВВ + ВВ = Вв или вв, и т п. В общем, свои расчеты я уже не помню, но где-то дюжина маркеров его требованиям должна была теоретически удовлетворять.

Есть такой Кориелловский институт, который продает образцы ДНК для научной работы. У них есть "маленькие панельки" этнических образцов, по 10 шт: чехи, итальянцы, "западноевропейцы", китайцы, японцы, афро-американцы и т п, примерно поровну М и Ж. Они гарантируют, что образцы не являются близкородственными. У меня уже была коллекция этих панелек, в том числе, ашкеназная, и я взялся за дело.

Я решал задачу в общем виде. Вот у меня есть панелька в 10 образцов. Когда я ничего о них не знаю (0 маркеров проверено) каждый из них может теоретически быть отпрыском любой комбинации М + Ж из остальных образцов панельки. Напр, если четные образцы, это М, а нечетные, это Ж, то детьми пары 1 + 2 могут быть все образцы 3-10, и т п. Один маркер мне уберет часть вариантов, оставив возможным потомством пары 1 + 2 только номера 3, 5, 6, 7, и 10, т к номера 4, 8 и 9 отсеялись. Второй маркер уберет номер 10, 3й и 4й никого не уберут, зато 5й уберет № 3, потом 6й уберет все остальные, и будет понятно, что ни один из образцов 3-10 не может быть от ребенка гипотетической пары 1 + 2. Итого, для этой пары и 8 кандидатов в ихние отпрыски мы уложились в 6 маркеров.

У меня уже была маленькая датабаза по тестированию ряда маркеров на кориеловских панельках, осталось только ее дополнить. Я довольно быстро получал желаемый результат на большинстве панелек с дюжиной достаточно произвольно взятых маркеров, включая даже относительно близкородственных исландцев. Но вот с ашкеназами у меня вышел прокол. Сколько маркеров я ни пробовал, исключения возможности родительства в этой панельке шли неожиданно медленно. Косяком шли бесконечные Аа + Аа = Аа, ВВ + вв = Вв, и т п. То ли большая семья ашкеназов надурила сотрудников Кориелла, притворившись неродней, то ли ашкеназы жестоко страдают от инбридинга, то ли мне просто не везло с маркерами и это какая-то флуктуация, но чтобы исключить 90% вариантов, меньше двух дюжин маркеров никак не получалось...