Главная » Хабрахабр » [Перевод] Близнецы получили «загадочные» результаты, проверив 5 сервисов поиска предков по ДНК

[Перевод] Близнецы получили «загадочные» результаты, проверив 5 сервисов поиска предков по ДНК

Главный генетик популярной компании по поиску предков признал, что это «частью наука, частью искусство»


Слева — Чарлзи Агро, справа — её однояйцевая сестра-близнец Карли; проверка некоторых из результатов ДНК-тестирования

По крайней мере, так следует из результатов работы одной из крупнейших компаний, разыскивающей предков через ДНК. Один набор однояйцевых близнецов, и два разных профиля для предков.

И, несмотря на то, что их ДНК практически одинаковы, они не получили сходных результатов ни от одной из них. Прошлой весной Чарлзи Агро и её сестра-близнец Карли купили себе наборы для проверки ДНК от AncestryDNA, MyHeritage, 23andMe, FamilyTreeDNA и Living DNA, и по отдельности отправили образцы своей ДНК в каждую из компаний на анализ.

Но результаты от 23andMe дают понять, что у каждой из близняшек в родословной был неожиданный поворот. В большинстве случаев одна и та же компания отслеживала предков близнецов до одинаковых частей света – с разной вероятностью. Также у неё есть предки из Франции и Германии (2,6%), которых нет у её сестры.
Если верить им, наследственность у Чарлзи на 10% менее «общеевропейская», чем у Карли.

И если у Карли эти предки связаны с Польшей, то у Чарлзи точное их происхождение было не указано. Также у близнецов оказались разные степени принадлежности к предкам из Восточной Европы – 28% у Чарлзи и 24,7% у Карли.

«То, что они выдали разные результаты для вас и для вашей сестры, я нахожу крайне загадочным», — сказал Марк Герштейн, вычислительный биолог из Йельского университета.

«Шокирующе похожие» ДНК близнецов

Близнецы отправили результаты, полученные из всех пяти компаний, на анализ команде Герштейна. Он говорит, что любые результаты, полученные от одной компании каждым близнецом должны быть идентичны. И тому есть простая причина: собранные данные по ДНК сестёр практически идентичны. «Они шокирующе похожи», — сказал он.

Полный образец ДНК состоит из трёх миллиардов частей, но компании, занимающиеся проверкой происхождения, используют порядка 700 000 из них, чтобы работать с генетическими различиями. Команда из Йельского университета смогла скачать и проанализировать исходные данные, использованные каждой из компаний для расчётов.

Они пришли к выводу, что исходные данные четырёх других компаний также были статистически идентичными. Согласно данным от 23andMe, 99,6% частей были одинаковыми, отчего Герштейн с командой и были так удивлены результатом. Но при этом, ни одна из пяти компаний не выдала идентичной истории происхождения близнецам.

И хотя он не может сказать точно, почему возникли эти различия, он подозревает, что всё дело в алгоритмах, используемых компаниями для обработки ДНК пользователей. «Мы думаем, что числа должны были точно совпадать», — сказал Герштейн. Эти подсчёты осуществляются разными методами». «Всё дело должно быть в подсчётах.

Хотя в компании и говорят, что они подходят к разработке своих инструментов и отчётов с научной строгостью, но признают, что результаты являются «статистическим приближением». В ответ на вопрос, почему близнецы не получили одинаковых результатов, несмотря на схожесть их ДНК, представитель сайта 23andMe сообщил, что даже такие небольшие различия могут привести к тому, что их алгоритм выдаст немного отличающиеся оценки вероятности происхождения.

Различия по пяти компаниям

В FamilyTreeDNA близнецам сообщили, что их предки жили на Сицилии, в Польше и на Украине. Однако результаты, полученные каждой из сестёр, содержат весьма удивительные – а в некоторых случаях и противоречивые – детали семейной истории.

До использования ДНК-тестов сёстры Агро считали, что большая часть их предков жила на Сицилии, Украине и в Польше
Чарлзи Агро со своей тётей в отпуске на Мальте прошлым летом.

Результаты тестов MyHeritage относят большую часть их предков к Балканскому региону (60,6% для Карли и 60,7% для Чарльзи). В AncestryDNA обнаружили, что большая часть предков близнецов происходит из Восточной Европы (38% для Карли и 39% для Чарльзи).

Более удивительные результаты представила компания Living DNA, согласно которым небольшая часть предков Карли жила в Англии, а предки Чарльзи жили в Шотландии и Ирландии.

Ещё один неожиданный поворот нашёлся в результатах от FamilyTreeDNA, отнёсшей 13-14% предков близнецов к Ближнему Востоку – гораздо больше, чем у других компаний, если учесть, что две из них вообще не нашли никаких ближневосточных корней.

«Сам по себе поиск границ – это передний край науки, поэтому эта задача стоит на стыке науки и искусства», — сказал Майер в интервью по телефону. Пол Майер, главный генетик из FamilyTreeDNA, признаёт, что определение генетических различий людей, происходящих из разных мест, является сложной задачей.

Как это работает

Чтобы узнать о предках человека, такие компании, как 23andMe, сравнивают образец ДНК с тем, что называется эталонной панелью. Она состоит из набора образцов ДНК пользователей, проходивших тест ранее, и из образцов, взятых из публично доступных баз данных.

Доктор Саймон Грэвел, специалист по популяционной генетике из Университета Макгилл, участвующий в проекте 1000 Genomes Project, говорит, что подобные компании берут порядка 700 000 сегментов ДНК и используют алгоритм, сравнивающий их с сегментами из эталонной панели.

– В итоге у них получается некоторая оценка вклада той части эталонной панели, которая сильнее совпадает с вашей ДНК, и из этого выводится оценка вашего происхождения». «Они ищут совпадения с различными регионами мира, — сказал он. Разные компании пользуются разными панелями, поэтому каждая из них, вероятно, выдаст одному человеку разные результаты.

Нам сообщили, что компания «постоянно работает над улучшением научного подхода», и что «новая, более крупная панель даст пользователям более точные результаты». В AncestryDNA признали, что размер эталонной панели – это основной фактор.

Откуда взялись отличия?

Как говорит Грэвел, множество факторов могут влиять на точность результатов, полученных от компании, занимающейся наследственностью, но размер и качество эталонной панели особенно важны. Чем она больше, тем точнее результаты, говорит он. «Если у вас есть меньше людей для сравнения, вам приходится срезать углы активнее, — сказал он. – Также вы рискуете потерять разнообразие, о существовании которого в определённом регионе вы не знали».

«Им приходится, грубо говоря, брать в руки карандаш и говорить: „Вот это будет регион“. Другая причина расхождений результатов разных компаний – произвольный подход к разделению мира на регионы, говорит Грэвел. И разные компании рисуют разные границы».

Он также говорит, что тесты оказываются более точными для людей европейского происхождения, поскольку их прошло большее количество людей с такой наследственностью.

Он говорит, что компания может отслеживать наследственность человека по образцу ДНК на определённом континенте со статистической погрешностью, но какие-то более конкретные сведения, вроде страны или города происхождения не будут надёжными. Он предупреждает, что не стоит считать полученные результаты определёнными.

Отсутствие надзора

Крупнейшие компании, занимающиеся изучением наследственности по ДНК, протестировали уже миллионы людей. MyHeritage, к примеру, говорит, что в этом году ожидает превысить планку в $100 млн по продажам услуг. Но, несмотря на популярность подобного тестирования, за этой индустрией не осуществляется никакого правительственного или профессионального надзора, который бы гарантировал подлинность результатов. У Грэвела такая ситуация вызывает беспокойство.

– А в данном случае к ним нет доступа, поскольку компании держат данные в секрете». «В науке обычно присутствует процесс проведения экспертных оценок и открывается доступ к данным и алгоритмам – так мы гарантируем высокое качество данных, — сказал он.

Людям нужно понять, что эти тесты не удовлетворяют таким стандартам, как, например, проведение медицинских анализов. Поэтому, говорит Грэвел, потребители должны относиться к результатам этих тестов скептически. Данные тесты больше похожи на «научное развлечение», — сказал он.

Когда Рафи Мендельсона, представителя MyHeritage, спросили, почему компания предлагает свои результаты с такой определённостью – в видеоролике с результатами тестирования, который получает пользователь, указано «вы принадлежите к» перед родословной пользователя – он сказал, что считает очевидным, что пользователи получают оценочные результаты, и что это особенно понятно пользователям из Северной Америки. Как и в компании 23andMe, в MyHeritage говорят, что их результаты являются «приблизительными этническими оценками».

Результаты могут меняться

Какие бы результаты вы не получили, не стоит к ним сильно привязываться. Они могут измениться. В сентябре AncestryDNA сообщила клиентам об обновлении оценок следующим сообщением:

В статье использованы результаты, полученные 6 ноября 2018 года, когда компания уже обновила свои данные. «Ваша ДНК не меняется, но у нас теперь есть 13 000 дополнительных эталонных образцов и новый мощный научный метод, что позволяет дать вам улучшенные результаты по этническому происхождению». В обновлённых результатах были обнаружены родственные связи с Россией, Грецией, Балканами и странами Балтии, которых не было указано раньше.


Оставить комментарий

Ваш email нигде не будет показан
Обязательные для заполнения поля помечены *

*

x

Ещё Hi-Tech Интересное!

[Перевод] Python Testing с pytest. Начало работы с pytest, Глава 1

Вернуться Дальше Это уже приносит мне дивиденды в моей компании.Chris ShaverVP of Product, Uprising Technology Я обнаружил, что Python Testing с pytest является чрезвычайно полезным вводным руководством к среде тестирования pytest. 6 и pytest 3. Примеры в этой книге написаны ...

[Перевод] Python Testing с pytest. ГЛАВА 3 pytest Fixtures

Вернуться Дальше Эта книга — недостающая глава, отсутствующая в каждой всеобъемлющей книге Python. Frank RuizPrincipal Site Reliability Engineer, Box, Inc. 6 и pytest 3. Примеры в этой книге написаны с использованием Python 3. pytest 3. 2. 6, 2. 2 поддерживает ...