Вэс недостатки и преимущества: Ветром надуло: какие преимущества и недостатки у энергии ветра

Содержание

Ветром надуло: какие преимущества и недостатки у энергии ветра

Ветром надуло: какие преимущества и недостатки у энергии ветра

Последние несколько лет популярность энергии ветра в мире бьет все рекорды.  К началу 2016 года общая мощность всех ветрогенераторов планеты уже превзошла суммарную мощность атомной энергетики. Но в Украине до сих пор очень мало людей позволяют себе добывать энергию таким способом.

Казалось бы, ветер — это абсолютная свобода от невозобновляемых и дорогих источников энергии типа нефти и газа. Это бесспорная  перспектива. Но, кроме ряда преимуществ, такая энергетика имеет и несколько минусов, которые затормаживают массовое распространение это вида альтернативной энергии.

Преимущества энергии ветра


Никакого загрязнения окружающей среды
Использование энергии ветра практически сводит к нулю выбросы в окружающею среду. Традиционные источники энергии таких возможностей не дают. Энергия ветра не имеет скрытых опасностей, как, например, у ядерного топлива, и не способствует глобальному потеплению.  Более того, если использовать энергию ветра вместо энергии, вырабатываемой тепловыми электростанциями, это уменьшит выбросы парниковых газов, что положительно скажется на озоновом слое Земли.   Это энергия, которая с нами навеки
Энергия ветра полностью возобновляемая. Нет никакой опасности, что когда-то ветер на планете исчезнет. Традиционные источники, напротив, ограничены, и в конечном счете закончатся. Поскольку с каждым годом в недрах Земли становится все меньше ископаемых для выработки энергии, мы вынуждены искать им альтернативы. Ветер доступен по всему миру
Нефть концентрируется в определенных районах, и это приводит к геополитическому напряжению. Всему миру сейчас важно контролировать и выгодно покупать нефть. Ветер же — источник, который есть в каждой стране мира. Где-то ветер слабее, где-то сильнее, но он есть практически везде. Так что почти любой человек может к нему “подключится”. 

Позволяет рационально использовать земельные ресурсы
Жители традиционно бедных каменистых и пустынных уголков нашей планеты благодаря ветру смогут стать богаче, продавая излишки энергии — там ветер сильнее.  

Еще один плюс — теперь земли, непригодные для сельского хозяйства и стройки жилья, можно будет использовать для размещения на них ветровых электростанций. Так мы рационально используем каждый кусочек планеты.

Энергия ветра стоит копейки и уменьшает зависимость от традиционных источников энергии

Как и другие альтернативные источники энергии, ветряные электростанции снижают зависимость компаний и частных лиц от монополии нефтегазовых кампаний, ведь создают конкуренцию, от которой выигрывают конечные потребители. 

Минусы энергии ветра


Высокая начальная стоимость останавливает многих потенциальных покупателей ветровых электростанций
Стоимость  ветрогенератора в Украине на сегодня составляет в среднем 100 тыс. грн. И это еще без обязательного специального оборудования типа аккумулятора, редуктора и самой электростанции. Это и есть главным препятствием всех желающих на пути к независимому от нефти и газа будущему.   Ветряные электростанции шумят
Ветряные турбины создают шум сравнимый с шумом автомобиля, движущегося со скоростью 70 км/ч, что создает дискомфорт для людей и отпугивает животных. Поэтому слишком близко к дому их не поставишь, а чтоб поставить подальше, нужны большие земельные участки.

Некоторые люди называют их “эстетическими монстрами”
Многие жалуются на то, что ветряные генераторы выглядят ужасно и портят абсолютно любой ландшафт. Ведь ставят их обычно где-то на открытых для ветра участках,  и вместо красот приходится разглядывать лопасти этих великанов. Но некоторым людям даже нравится их урбанистический вид.

А еще они несут угрозу для птиц
Вращающиеся лопасти ветрогенератора представляют потенциальную опасность для некоторых видов животных. По статистике, лопасти каждой установленной турбины являются причиной гибели не менее 4  птиц в год.

Хотя вероятность попадания птиц под лопасти не больше, чем удара током от высоковольтной линии. 

И дают слишком мало электроэнергии
Сейчас возобновляемая энергетика в общем энергобалансе нашей страны, включая большую гидроэнергетику, составляет порядка 7%.

Энергия ветра не является постоянной величиной. С помощью традиционной электростанции вы можете поддерживать постоянную выходную мощность, но количество энергии ветра зависит от погодных условий. Это означает, что полностью полагаться на ветер вы не сможете — нужно также иметь резервные источники энергии.

Несмотря на явные минусы, энергия ветра каждый год привлекает все больше стран. В прошлом году в Дании с помощью ветрогенераторов произвели 42 % всего электричества. Украина пока отстает, но это временно. К 2020 году с помощью ветра в нашей стране должно производиться от 11% электроэнергии — средний показатель по Европе сейчас. Предусмотрено даже дотации для новичков в виде “зеленого тарифа”.

По материалам Economics Help

преимущества и недостатки использования ВЭС. Часть 2

В первой части повествуется о том, как наши предки использовали силу ветра, как смогли при помощи него получать электроэнергию. В настоящее время ветряная энергетика успешно развивается во многих странах. Для успешного функционирования ВЭС важно правильно найти местность, которое характеризуется постоянными ветряными потоками, обладающими достаточной силой. Также в первой части были перечислены преимущества ветряной энергетики, среди которых выделяются возобновляемость, экологичность, безопасность и для природы и для здоровья человека, низкая стоимость.

Недостатки ВЭС

Однако наряду с преимуществами ветряная энергетика сопровождается и недостатками, которые очень важно учитывать, чтобы предпринять заранее ряд действий, минимизирующих возможные потери или риски.

Самым главным недостатком является огромная сумма, которую следует вложить на стартовом этапе. Эти финансы должны быть направлены на приобретение оборудования, строительство станций, привлечение специалистов, которые должны рассчитать оптимальное место для установки ветряных ферм.

Чтобы решить такую проблему, многие опытные специалисты рекомендуют привлекать инвесторов или же воспользоваться банковским кредитованием, тем более что впоследствии ветряные фермы смогут обеспечить постоянные доходы.

Вторым явным недостатком является невозможность ведения точного прогнозирования, поскольку руководство природными процессами полностью человеку все-таки не подвластно. Чтобы в этом направлении минимизировать риски, привлекают грамотных специалистов, осуществляющих мониторинговые исследования, на основе которых проводятся расчеты по определению лучшего места расположения.

Еще несколько лет назад многие зачисляли к недостаткам повышенный шум, который сопровождал работу станций. В настоящее время можно смело утверждать, что шум от работающих лопастей слышен уже только фоном даже на расстоянии 30 метров. К тому же такой показатель шума полностью идентичен природным естественным шумам.

В редких случаях, попадая под вращающиеся лопасти, могут погибать птицы, поэтому представители общества по защите животных первоначально предъявляли существенные претензии. Однако практика показала, что количество пернатых, пострадавших от ВЭС, ничем не отличается от количества тех птиц, которые погибли при контакте с высоковольтными линиями.

Работающие ВЭС могут немного искажать телевизионный сигнал, если он находится на небольшом удалении от ферм. Однако, учитывая, что в настоящее время чаще используется спутниковое телевидение или цифровое, то риск искажения также сводится практически на нет.

Существенные достижения ветряной энергетики

Интересен опыт внедрения ветроэнергетики в Шотландии. В настоящее время количество энергии, которое вырабатывается ветряными станциями, на четверть превышает объемы, которые необходимы для обеспечения всего жилого компонента страны. Однако на достигнутых результатах страна не останавливается, деятельность сориентирована на получение такого количества электроэнергии, которого будет хватать не только для жилого, но и для промышленного сектора. Невзирая на высокие показатели первоначальных капиталовложений, страна готова выделить около 46 миллиардов фунтов стерлингов, чтобы успешно развивать ветряную энергетику. А вот от атомных станций принято решение в Шотландии постепенно отказываться, освобождая место ветряной и солнечной возобновляемой энергии.

В Канаде также успешно развивается ветряная энергетика, где общее количество ветряных станций достигло полутысячи. Всего десять лет назад в стране была построена первая ветряная станция, а уже в настоящее время 3% приходится на ветроэнергетику, в перспективе через десять лет увеличение объемов до 20%.

На Ямайке успешно функционирует гибридная электростанция, основанная на успешном использовании одновременно энергии ветра и солнца. Владельцем гибридной станции является тот самый производитель, который выпускает оборудование для таких станций. Он заявляет о том, что полностью окупить средства, вложенные на строительство, удается за четыре года, после чего ВЭС будет приносить хорошую прибыль.

К сожалению, ветряная энергетика на российском пространстве развивается медленными темпами. Кроме этого стоимость ветряного электричества превышает в восемь раз традиционное электричество. Объяснить данный факт, по мнению большинства специалистов, можно только слабым вниманием к такому альтернативному энергетическому ресурсу. Вследствие этого за год в России вырабатывается столько ветряной энергии, сколько в Китае всего за два часа.

Преимущества и недостатки ветровой энергетики | Конструктив

Ветер — это мощный, экологически чистый и неисчерпаемый источник энергии. Люди с древних времен используют его, сначала это были мельницы, где перемалывали зерно в муку, а сейчас #ветряные электростанции (ВЭС). Возможно, некоторые уже сталкивались с ними и видели огромные башни с лопастями, которые обеспечивают электроэнергией близлежащие населенные пункты.

Преимущества и недостатки ветровой энергетики

Для получения энергии достаточно скорости ветра более три метра в секунду и мест с удовлетворяющих этому условию на нашей планете огромное количество. Конструктивно, ВЭС состоит из мачты, электрогенератора, лопастей и вспомогательного оборудования. Принцип её работы достаточно прост: воздушные потоки раскручивают лопасти, соединенными через редуктор с электрогенератором, который при вращении вырабатывает электроэнергию и заряжает аккумуляторные батареи, соединенные через инвертор с промышленной сетью.

Однажды правильно выбранное место для строительства ВЭС на десятилетия гарантирует получение должного объема #»зеленой» энергии при минимальных затратах на обслуживание оборудования и персонал.

Основными преимуществами ВЭС являются:

  • при их работе не загрязняется атмосфера
  • для работы не требуется какое-то топливо
  • #ветер #не иссекаемый источник энергии, хотя при изменении климата, возможны изменения его силы и направления
  • относительно небольшие издержки на эксплуатацию, хотя постройка всего комплекса достаточно затратна, но это зависит от многих факторов и есть инженерные решения существенно удешевляющие строительство
  • высокая автономность, что делает ВЭС идеальным источником энергии в большинстве труднодоступных мест на Земле
  • компактность, в сравнении с другими системами генерации (ТЭЦ, АЭС, ГЭС)

Среди недостатков можно отметить:

  • низкая плотность энергии, приходящейся на единицу площади винта
  • непредсказуемые изменения скорости и направления ветра, а как следствие неравномерность генерируемых мощностей
  • необходимость аккумулирования энергии в емкостях
  • создание помех радиотелевизионным системам и радиолокаторам
  • высокий уровень шума при работе
  • работа установки вызывает инфразвук, сопровождающийся низкочастотными колебаниями
  • негативное влияние на среду обитания животных
  • обледенение лопастей

Чаще всего для нивелирования недостатков ВЭС размещают в относительной удаленности от населенных пунктов. Территория вблизи их размещения нередко используется в сельскохозяйственных целях.

Преимущества и недостатки ветровой энергетики

Популярность ветроэнергетики в Мире

Ветроэнергетика используется на коммерческой основе во многих странах мира и число ВЭС ежегодно растет.

Значительное развитие она получила в Китае, где используя силу ветра вырабатывается более 70 ГВт. Более того, ВЭС устанавливают на огромное число объектов, таких как небоскребы, заводы. Быстрое развитие в регионе обусловлено развитием промышленности, потребляющей значительный объем энергии и большое число труднодоступных населенных пунктов.

В США #ветроэнергетика также достаточно быстро развивается, заменяя устаревшие #теплоэлектростанции. Популярность ВЭС наглядно показана в американских фильмах, где очень часто можно видеть в населенных пунктах их башни с лопастями.

Страны Европы давно уже взяли курс на «Зеленую» энергетику. Так например, в Германии ВЭС генерируют порядка 40% от общего объема, хотя есть определенные проблемы в увеличении этой цифры. В Великобритании выделяются значительные инвестиции для строительства объектов ветроэнергетики. Франция лидер по использованию энергии ветра и активно взаимодействует с компаниями Германии, что положительно сказывается на развитии французской ветроэнергетики. Италия отказалась от атомной энергии и сырья в 2011 году, перейдя на альтернативное ее получение.

#Россия, как и другие страны активно строит ВЭС по всей территории страны, ввиду их высокой автономности и невысоким эксплуатационным расходам. На конец 2019 года ветровая генерация преодолела порог в 600 ГВт.

Преимущества и недостатки ветровой энергетики

Ветровая энергетика имеет огромный потенциал, но и ряд существенных недостатков, таких как неравномерность выдаваемой мощности и высокий уровень шума. Для нивелирования недостатков ВЭС их обычно строят вместе с солнечными электростанциями, что позволяет существенно выровнять пульсации энергии в сети. Это конструктивный подход нашел широкое применение в промышленности

Инжиниринг ветряной электростанции в России и за рубежом

В последние годы крупнейшие страны мира столкнулись с энергетической дилеммой.

С одной стороны, спрос на электрическую энергию растет стремительными темпами, но с другой стороны, организации по защите окружающей среды требуют сокращения производства дешевой энергии ТЭС и АЭС.

Чтобы удовлетворить эти две потребности экономичным образом и оптимально использовать имеющиеся ресурсы, многие компании в России и за рубежом обратились к возобновляемым источникам энергии.

Услуги по инжинирингу ветряных электростанций сегодня способствуют снижения зависимости бизнеса от ископаемого топлива.

Ветроэнергетика становится полностью зрелой и великолепно отлаженной отраслью, привлекающей многомиллионные инвестиции в России, Европе, Северной Африке, Ближнем Востоке и других регионах мира.

Рынок профессиональных услуг по инжинирингу и строительству ветряных электростанций (ВЭС) растет со скоростью более 10% в год.

Мы предлагаем полный спектр инжиниринговых услуг в энергетике, включая прединвестиционные исследования, поиск источников финансирования, детальное проектирование, строительство, эксплуатацию, ремонт, оптимизацию технологических процессов и модернизацию ветряных электростанций в любой точке мира.

Нынешнее состояние и перспективы развития ветроэнергетики

С начала своего широкого развития в 1980-х годах мировой рынок ветроэнергетики расширялся в геометрической прогрессии.

За два десятилетия, между 1990 и 2010 годами, установленная мощность ветроэлектростанций в мире увеличилась в 50 раз.

Прогнозы показывают, что в 2030 году установленная мощность в мире будет в 10 раз больше в 2010 году, а в 2050 году в 20 раз.

Это сопровождается ежегодным снижением стоимости электрической энергии от альтернативных источников, как это происходит и с фотоэлектрической энергией.

На сегодняшний день ветровая энергия является наиболее распространенной современной возобновляемой технологией.

На конец 2017 года суммарная мощность ветроэлектростанций в мире достигла 540 ГВт. Она является вторым источником получения энергии из возобновляемых источников после гидроэнергетики.

В конце того же 2017 года энергия ветра обеспечивала около 5% мирового спроса на электроэнергию, тогда как в конце 2006 года на ее долю приходилось лишь менее 1%.

Этот рост был достигнут за счет суммирования двух факторов:

• Государственная политика, которая стимулирует использование ветроэнергетики в основных промышленно развитых странах.
• Существенный прогресс в технологии производства ветряных турбин, сопровождающееся удешевлением оборудования.

Как и в случае других возобновляемых источников, уменьшение цены на электроэнергию ветра напрямую связано с ростом установленной мощности.

С увеличением установленной мощности ВЭС возникает экономия: чем выше установленная мощность, тем ниже стоимость произведенной энергии.

Одним из факторов, который, среди прочего, помог снизить стоимость энергии ветра, является продолжающееся увеличение размера ветряных турбин. Укрупнение оборудования способствует дальнейшему повышению конкурентоспособности по сравнению с электроэнергией, получаемой из ископаемого топлива.

Почему увеличивается размер ветряных турбин?

Мощность ветрогенераторов пропорциональна площади, охватываемой лопастями, поэтому увеличение диаметра ротора подразумевает увеличение мощности ВЭС. Чем меньше ветровых турбин используется для производства определенной энергии, тем ниже затраты на их содержание.

С другой стороны увеличение размеров турбин уменьшает расходы на строительство ветроэлектростанций. Это приводит к уменьшению затрат на МВт, поэтому компаниям выгоднее увеличивать размеры ветрогенераторов, а не их число.

Очевидно, что увеличение диаметра роторов и, следовательно, длины лопастей, влечет за собой материально-технические проблемы при транспортировке и установке компонентов.

Поэтому сложно сказать, смогут ли размеры турбин продолжать расти или, наоборот, они достигают предела из-за законов физики и из-за логистических проблем транспортировки таких огромных ветрогенераторов к местам установки и эксплуатации.

При этом морские ветровые электростанции имеют наибольший потенциал роста.

Оффшорная ветроэнергетика и наземная ветроэнергетика идут разными технологическими путями. На суше генераторы растут не так быстро, а на побережьях эксперты отмечают все большие и большие мощности. Это связано с более упорядоченной логистикой транспортировки тяжелого оборудования в прибрежные районы.


Что ожидать инвесторам в ближайшем будущем?

Стремительное развитие технологий делает ВЭС важным источником возобновляемой энергии, наряду с фотоэлектрическими солнечными электростанциями.

Они становятся будущим мировой энергетики по мере истощения запасов ископаемого топлива.

Главные тенденции развития ветроэнергетики, которые должен учитывать бизнес, состоят в увеличении мощности ветрогенераторов и быстром расширении ветряных парков на морских побережьях, где ветры наиболее сильные и постоянные.

Основными факторами развития отрасли считаются:

• Сокращение запасов ископаемого топлива.
• Развитие и удешевление технологий производства энергии.
• Государственная поддержка возобновляемых технологий.
• Растущая социальная обеспокоенность по поводу выбросов парниковых газов.
• Необходимость отказа от ядерной энергии как потенциально опасной.
• Потребность в автономных источниках энергии для удаленных районов.

Ожидается, что в ближайшие годы возобновляемые технологии, особенно энергия ветра, станут более заметными на мировой арене производства электроэнергии.

Наша компания, предоставляющая услуги по инжинирингу ветряных электростанций в России и за рубежом, готова разработать надежный источник энергии для вашего бизнеса.

Развитие ветроэнергетики в Российской Федерации

Развитие ветроэнергетики в России имеет богатую историю.

Еще в 1930-х годах в стране был открыт первый в мире исследовательский центр ветроэнергетики.

Между 1914 и 1918 годами русский ученый Н.Е. Жуковский и другие разработали теорию ветряных мельниц и поведения лопастей в воздушном потоке.

Теория заложила основу для современной ветроэнергетики — предел Жуковского-Беца, определяющий максимальный коэффициент использования энергии ветра ветротурбиной.

В 1931 году около Балаклавы была построена пилотная ветровая турбина Д-30 с диаметром ротора 30 м и асинхронным генератором мощностью 400 кВт. В то время подобного проекта в мире не существовало. Не менее уникальным в мировом масштабе было создание более чем 40 тысяч ветрогенераторов мощностью 50-100 кВт в 1940-50-х годах, которые использовались в крупных сельских хозяйствах (колхозах и совхозах).

После энергетического кризиса 1973 года государственная программа развития ветроэнергетики привела к разработке новых мегаваттных ветрогенераторов и серийному производству ветрогенераторов мощностью 100-300 кВт.

В конце 1980-х годов была спроектирована и построена турбина «Радуга 1» мощностью 1000 кВт.

Из-за снижения цен на нефть и изменения социальной и политической ситуации 1990-х годов идея развития ветроэнергетики отошла на второй план, до настоящего времени тормозя целый сектор ветроэнергетической промышленности нашей страны.

В последнее время рынок ветроэнергетики в России получил импульс для динамичного роста.

Согласно постановлению правительства №449, власти создают реальный механизм стимулирования развития возобновляемых источников энергии. В планах создание дополнительных мощностей до 4,5 ГВт уже к 2030 году.

По оценкам экспертов, Россия располагает самыми большими в мире ветровыми ресурсами. Развитие отечественных технологий и активное сотрудничество с зарубежными партнерами позволяет надеяться на появление новых ветряных электростанций в Адыгее, Башкирии, Ростовской области, Краснодарском крае, Калининграде и других регионах.

Сегодня реализуются крупнейшие ветроэнергетические проекты во многих субъектах Российской Федерации, включая знаменитую Ейскую ВЭС и самую большую ветряную электростанцию за Полярным кругом — Кольскую ВЭС на 201 МВт.

С одной стороны, положительная динамика налицо. С другой стороны, это капля в море на фоне «традиционных» источников энергии, которые доминируют на российском рынке. К сожалению, развитие ветроэнергетики в нашей стране сталкивается с целым рядом препятствий, которые еще предстоит устранить.

Основными проблемами эксперты называют:

• Общая нехватка инвестиций и инвесторов, что в первую очередь связано с непрозрачной схемой вознаграждения и небольшим объемом рынка.
• Значительное количество недостатков в нормативно-правовой базе, включая проблемы землепользования, экологической безопасности и др.
• Нестабильная макроэкономическая ситуация в стране.
• Проблемы с подключением к сети.
• Плохая инфраструктура.

Все эти препятствия необходимо преодолеть, прежде чем Россия сможет приблизиться к ведущим мировым рынкам ветроэнергетики.

Такие страны, как Китай, Германия, Индия и США, ежегодно добавляют до 30000 МВт установленной мощности.

Развитие рынка включает в себя задачу обновления существующих стандартов, внедрения государственной программы планирования участков для проектов ветроэнергетики, начало массового участия государства в пилотных проектах в отдаленных регионах.

Существуют перспективные проекты по производству водорода на крупных ветряных электростанциях. По аналогии с нынешними газопроводами, Россия могла бы получать огромное количество водорода на своих удаленных территориях и поставлять его в Восточную Азию или страны Европейского Союза.

При таком подходе Россия могла бы закрепить свои позиции в качестве поставщика энергии и в долгосрочной перспективе — экспортируя «ветровой газ» вместо ископаемого газа.

Будь то автономные или же более крупные ветряные электростанции, если России удастся запустить ветроэнергетику в ближайшие несколько лет, оживив свой ветроэнергетический сектор на основе имеющихся технических и промышленных ресурсов, это будет способствовать благосостоянию и процветанию страны.

Ветряные электростанции: плюсы и минусы

Экономический кризис 1970-х годов, вызванный ростом цен на нефть, подтолкнул правительства и компании к развитию альтернативных источников энергии. Впоследствии возникли новые экологические требования, связанные с ухудшением состояния экологии.

Энергия ветра является одним из лучших решений не только для отдельного бизнеса, но и всего населения планеты. Ветряные электростанции не загрязняют окружающую среду, они дают неисчерпаемый источник энергии и замедляют климатические изменения.

Это один из самых дешевых источников энергии, который может конкурировать с другими традиционными источниками энергии, такими как угольные тепловые электростанции или даже с ядерной энергией, если учитывать потенциальные экологические последствия.

Выработка электрической энергии без термического превращения подразумевает отсутствие проблем загрязнения и является исключительно благоприятной с экологической точки зрения. Современные ВЭС полностью исключают негативные воздействия, связанные с добычей топлива, его преобразованием, транспортировкой и сжиганием.

Использование энергии ветра не влияет на физико-химические характеристики почвы и не вызывает ее эрозии, поскольку не образуются загрязняющие вещества, которые влияют на эту среду, а также не предполагает взрывов или крупных земляных работ.

В отличие от других энергетических объектов, ВЭС не вызывают никаких изменений в водоносных горизонтах ни в плане потребления, ни в плане загрязнения захороненными отходами. Выработка электричества от ветра не производит токсичных газов и не способствует парниковому эффекту или кислотным дождям.

Предлагаем подытожить преимущества и недостатки ветряных электростанций.

Плюсы

Из всех возобновляемых источников энергии энергия ветра имеет наибольшее количество ощутимых практических преимуществ, и вот лишь некоторые из них.
Неисчерпаемый источник энергии
Энергия ветра неисчерпаема, потому что это возобновляемая энергия. Данное направление энергетики развивается независимо от запасов угля, нефти и газа или цены на них. Бизнес может рассчитывать на этот источник в долгосрочной перспективе.
Безопасность для здоровья человека
Поскольку технологический процесс исключает использование ядерного топлива или токсичных химикатов, ветроэлектростанции считаются безопасными для людей.

Возможные последствия аварий на этих объектах несоизмеримы с авариями на ТЭС или тем более АЭС.

С другой стороны, шумовое загрязнение окружающей среды может представлять проблему для жителей близлежащих населенных пунктов. Чем больше ветряных турбин установлено на ограниченной территории, тем больше шума они будут вызывать.

Сокращение влияния на экологию
Ветроэлектростанции являются экологически чистыми объектами, поскольку не производят токсичных отходов, таких как шлам, отработанное ядерное топливо и химические реагенты. Ветроэнергетика сохраняет почву и водоносные горизонты.

Отсутствие выбросов углекислого газа является важным преимуществом в борьбе с глобальными климатическими изменениями.

Тем не менее ветровые электростанции оказывают определенное негативное воздействие на окружающую среду. Эти объекты обычно занимают большие пространства и располагаются в естественных зонах, таким образом изменяя природный ландшафт.

Следует понимать, что в процессе производства ветряных турбин образуются отходы и используются синтетические материалы, влияющие на окружающую среду.

Одним из последствий эксплуатации ВЭС является сокращение популяции местных и перелетных птиц. Ветровые турбины истребляют множество птиц, поэтому они должны располагаться вдали от путей их миграции.

Простота строительства ветропарков
Важным преимуществом для инвестора является простота монтажа и демонтажа оборудования.

Если строительство занимает много времени, это обычно связано с получением разрешений и другими бюрократическими проблемами.


Экономические преимущества
Высокоэффективные современные ветрогенераторы производят электрическую энергию, которая может конкурировать с другими источниками. Это также экономически выгодное решение для мелких хозяйств, расположенных у изолированных районах.

Строительство ветроэлектростанции создает дополнительные рабочие места для местных жителей, одновременно обеспечивая надежное энергоснабжение.

Установка на море
Возможность установки ветрогенераторов в море позволяет использовать более сильные потоки ветра, не занимая ценной земли и не оказывая визуального воздействия на пейзаж. Это является дальнейшим стимулом для развития ветроэнергетики.

В настоящее время значительные денежные ресурсы выделяются на исследования и повышение эффективности плавающих ветрогенераторов.

Минусы

Несмотря на то, что ветроэнергетика имеет много преимуществ и положительных аспектов для окружающей среды, эксперты подчеркивают некоторые недостатки.
Нестабильность ветра
Хотя ветер представляет собой неисчерпаемый ресурс, он также непредсказуем и его трудно контролировать. Будучи малопредсказуемой, ветровая энергия не может быть использована в качестве единственного источника производства электроэнергии.

Чтобы обеспечить потребителей электричеством в безветренную погоду, электростанции должны будут накапливать энергию, используя крайне дорогостоящие технологии.

Слишком сильный ветер может повредить лопасти ветрогенераторов, поэтому владельцы должны отключать оборудование в неблагоприятных погодных условиях. Все это ведет к падению производства электроэнергии и требует сложных решений.

Высокая стоимость установки и обслуживания
Основным фактором, который играет против энергии ветра, является высокая стоимость ветряных турбин. Это может ограничить возможности правительств инвестировать в эту технологию, несмотря на все ее преимущества.

Аналогичным образом, проведение профилактического и корректирующего обслуживания ветряных турбин также требует больших денег и квалифицированных специалистов.


Основные проблемы при проектировании ветропарков

Проектирование ветропарка — это задача с высокой степенью сложности.

Она включает такие разные области знаний, как инжиниринг, экономика, экология или юриспруденция.

В ходе инжиниринговых работ специалисты компании учитывают многочисленные факторы, влияющие на технико-экономическую целесообразность проекта:

Ветровые условия на площадке
Этот фактор оказывает наибольшее влияние на экономические показатели ветроэнергетического проекта.

Средние значения интенсивности ветра должны быть достаточно высокими, чтобы обеспечить экономическую жизнеспособность ветропарка. С другой стороны, орография местности и наличие препятствий оказывают большое влияние на уровень турбулентности, что напрямую влияет на надежность турбин.

Площадь и конфигурация земельного участка
На площадке для строительства ветряной электростанции должно быть достаточно места для обеспечения работы ветрогенераторов. При этом расстояние между ветряными турбинами не должно быть очень большим, поскольку это увеличивает затраты на электромонтаж, электрические потери в системе и расходы на эксплуатацию и обслуживание.
Факторы окружающей среды
Воздействие ветряной электростанции на окружающую среду должно быть минимальным. Поэтому инженерам необходимо учитывать разные факторы, такие как маршрут миграции перелетных птиц, наличие близлежащих населенных пунктов и др.

С другой стороны, при выборе участка для строительства необходимо учитывать климатические условия, состояние грунта и его несущую способность. Уделяется повышенное внимание оценке вероятности стихийных бедствий.

Доступ к сети передачи и распределения электроэнергии
Подключение ветряной электростанции к национальной электросети является ключевым фактором, от которого зависит успешная реализация проекта.

С одной стороны, расстояние до точки подключения будет сильно влиять на первоначальные инвестиции. С другой стороны, придется оценить техническую осуществимость указанного соединения с точки зрения предела мощности и стабильности системы.

Специалисты решают эти и другие проблемы, связанные с инжиниринговых ветряных электростанций. На протяжении десятилетий мы отвечаем за успешную и безопасную работу многомиллионого оборудования в самых труднодоступных уголках планеты.

Выбор места для строительства ветроэлектростанции

Первым шагом при строительстве ветропарка является определение места, где он будет располагаться.

Выбор участка для строительства ВЭС будет обусловлено техническими, экономическими и экологическими критериями.

Для этого анализа используются следующие критерии:

• Текущее и предлагаемое использование земли в выбранных областях.
• Топография местности, которая может рассматриваться как неблагоприятная.
• Близость к подъездным путям для подвоза оборудования и обслуживания.
• Расстояние до экологически чувствительных районов (флора, фауна).
• Близость к населенным пунктам, связанная с получением разрешений.

На этом этапе проекта наши специалисты, используя специальное программное обеспечение, собирают данные о ветре, которые позволяют оценить ветровой ресурс местности.

Как правило, эти данные содержат преобладающие направления ветра и значения скорости, частоты и мощности на определенной высоте для каждого из сезонов года. Дополнительные параметры включают распределение плотности воздуха, атмосферного давления, температуры, топографии или рельефа местности.

После изучения ветрового атласа выбирается оптимальный район, где будут установлены ветровые турбины. Чтобы оптимизировать конечную производительность ветропарка, мы должны выбирать районы с самым высоким значением скорости ветра.

Правильное расположение ветрогенераторов и вспомогательного оборудования является необходимым условием для достижения максимальной мощности, минимизации потерь и обеспечения безопасности ветропарка.

Поскольку параметры ветра в каждом участке уникальны, планировка ветропарка разрабатывается строго индивидуально. С этой целью используются специальные программы, которые учитывают рельеф местности и ветровые ресурсы.

Выбор ветрогенератора для электростанции

После выбора участка для строительства и оценки ветрового ресурса инженеры должны подобрать оптимальные ветрогенераторы и вспомогательное оборудование, максимально адаптированное к конкретным условиям и требованиям проекта.

Выбор ветрогенераторов считается одним из ключевых моментов, поскольку их стоимость может составлять от 60 до 80% от общего объема инвестиций. Вот почему предварительное изучение характеристик ветряных турбин является важным аспектом для успешной реализации ветроэнергетического проекта.

Все ветровые турбины классифицируются в соответствии с условиями их эксплуатации.

Соответственно, область может быть отнесена к тому или иному классу в зависимости от скорости ветра и допустимых значений турбулентности.

Инженеры компании имеют богатый опыт в проектировании и строительстве ветроэлектростанций, в том числе в сложных климатических условиях. Мы можем найти идеальный баланс между производительностью, надежностью и стоимостью установок.

Оценка инвестиционных затрат и финансирование проекта

Так называемые инвестиционные затраты фактически являются теми расходами, которые возникают при выполнении проекта строительства.

Они состоят из нескольких групп.


Стоимость ветровых турбин и электрооборудования
Эта статья расходов будет включать стоимость поставки ветровых турбин, а также работы по их установке, такие как транспортировка или сборка компонентов на площадке. Она может варьировать, поскольку сфера ответственности между поставщиком турбин и производителем будет определена ранее.

Таким образом, цена, указанная производителем, является субъективной, поскольку она может включать только поставку турбин или же учитывать полный объем работ, которые должны быть выполнены для установки под ключ.

Вспомогательное оборудование, такое как электрическая подстанция, трансформатор и компоненты для подключения, представляют собой важную часть инвестиционных затрат.

Стоимость строительных работ
Это все работы, которые необходимо выполнить для строительства ветропарка и адаптации земельного участка. Основные расходы определяются фундаментами, на которых опираются ветряные турбины, подъездными путями к парку и траншеями для прокладки кабелей.
Стоимость прокладки линий электропередач
Важной статьей расхода является прокладка линий среднего напряжения, которые соединяют ветрогенераторы с национальной электросетью, а также оптоволоконные кабели связи.
Прочие расходы
В этом разделе мы сгруппируем расходы, связанные с проектированием, исследованиями на местах, управлением проектом, контролем качества работ и их воздействием на экологию.

Благодаря системному подходу, а также использованию инновационных технологий и партнерству с ведущими производителями оборудования и спецтехники инжиниринговая компания гарантирует реализацию проекта при минимальных инвестиционных затратах и рисках.

Наша компания готова помочь заказчику в поиске источников финансирования проектов, в том числе путем получения кредитов на строительство в крупнейших банках Испании.

Ветряная электростанция: услуги инжиниринга

Проектирование ВЭС начинается с оценки ветрового потенциала исследуемой области (средние скорости ветра, распределения Вейбулла и многие другие показатели).

Оценка характеристик выбранного района определяет целесообразность строительства.

С учетом параметров доступных ветряных турбин и их расположения инженеры рассчитывают общее время работы и коэффициент нагрузки, количество вырабатываемой электроэнергии. Вся эта информация ложится в основу детального ТЭО (технико-экономического обоснования) для изучения рентабельности проекта.

Также целью этой работы является проведение исследования воздействия на окружающую среду, чтобы оценить последствия строительства для флоры, фауны и для здоровья человека.

Реализация проекта ветроэлектростанции включает три этапа:

Этап строительства:
• Земляные работы, выравнивание и подготовка строительной площадки.
• Строительство и расширение подъездных путей для доступа тяжелой техники.
• Строительство высоковольтных линий электропередач для экспорта энергии.
• Заливка фундаментов для строительства зданий и сооружений.
• Закупка, поставка и сборка ветрогенераторов и другого оборудования.
• Испытания оборудования и ввод в эксплуатацию.
Этап эксплуатации:
• Эксплуатация ветроэлектростанции в штатном режиме.
• Техническое обслуживание и мониторинг состояния оборудования.
• Оптимизация технологических процессов и модернизация объекта.
Этап закрытия проекта:
• Профессиональный демонтаж оборудования.
• Снос зданий и сооружений ветроэлектростанции.
• Восстановление территории.

Специалисты нашей инжиниринговой компании готовы оказать вам помощь на любом этапе жизни энергетического проекта.

Мы занимаемся международным инжинирингом ветряных электростанций по ЕРС-контрактам в разных странах мира.

Мы предоставляем следующие услуги:

• Изучение ветрового ресурса площадки.
• Поиск потенциально интересных мест для установки ветрогенераторов.
• Технико-экономическое обоснование и помощь с финансированием проекта.
• Получение всех необходимых разрешений на строительство и эксплуатацию.
• Выбор моделей ветряных турбин, подходящих под характеристики объекта.
• Оптимизация конструкции ветроэлектростанции с учетом различных критериев.
• Детальная оценка неопределенностей и рисков, связанной с проектом.

Чтобы узнать больше, свяжитесь с нами.

Мы проконсультируем вас по любым аспектам проекта.

Наши услуги:

• Подготовка ТЭО проекта.
• Создание и управление SPV.
• Финансирование проектов / инвестиционное кредитование.
• Финансовый консалтинг / моделирование.
• Кредитные гарантии.
• Привлечение финансирования.
• Инженерное проектирование.
• Промышленный инжиниринг.
• Энергетический инжиниринг.
• Cтроительство и модернизация.
• Эксплуатация и безопасность объектов.

Подводные камни ветряной энергетики: «лопасти-убийцы» и другое — Энергетика и промышленность России — № 03-04 (311-312) февраль 2017 года — WWW.EPRUSSIA.RU

Газета «Энергетика и промышленность России» | № 03-04 (311-312) февраль 2017 года

Однако наряду с неоспоримыми плюсами ветряная энергетика имеет и свои минусы.

Что такое ветряная энергетика? По сути, энергия ветра – это преобразованная в кинетическую энергию молекул воздуха энергия солнца. Проще говоря, энергия ветра, как и энергия волн, – это разновидность солнечной энергии, энергии, которая будет нам доступна столько времени, сколько будут существовать Солнце и наша планета.

Энергию ветра люди научились использовать еще в древности. Так, уже в Древнем Египте ветер использовали для помола зерна, а в Вавилоне и Китае – для осушения полей. Наконец, в XX веке ветер стали использовать непосредственно для получения электроэнергии. Сторонники ветро­энергетики заявляют о сплошных плюсах подобного подхода: отмечают ничтожную стоимость эксплуатации ветряной электростанции, то, что ветряная энергетика соответствует всем условиям, необходимым для причисления ее к экологически чистым методам производства.

Недовольные соседи

Однако противники ветряной энергетики находят в ней и недостатки. Причем если некоторые из них по сравнению с вредом, причиняемым традиционными источниками энергии, незначительны, то другие заставляют серьезно задуматься о дальнейших перспективах ветряной отрасли.

Начнем с простейших из них. Например, многие считают, что ветряки, торчащие здесь и там, портят вид местности. Поэтому соседи могут воспротивиться сооружению ветряной турбины (это называется «синдромом отчужденности»). Кроме того, лопасти винтов при работе издают шум, который раздражает живущих по соседству (при этом малые ветряные турбины, часто устанавливаемые в непосредственной близости от жилья, шумят сильнее – скорость их вращения выше, чем у крупных турбин, и они находятся ближе к земле). А отсутствие согласия соседей на установку турбины может поставить крест на ваших планах получать энергию от ветра.

Между прочим, у соседей могут быть и вполне рациональные причины невзлюбить ветряк. Так, есть мнение, что турбины создают помехи, ухудшающие прием радио- и телепередач. Кроме того, на многих негативно воздействует и постоянное мелькание солнечного света, прерываемого лопастями или отражающегося от них. При определенной частоте мельканий у некоторых людей даже возникают эпилептические припадки.

Финансовый аспект

Есть у ветряных электростанций минусы и посерьезнее. Не стоит забывать, что ветер – неустойчивый источник энергии. Сила ветра весьма переменчива и зачастую непредсказуема, что требует использования дополнительного буфера для накапливания избыточной электроэнергии или дублирования источника для подстраховки.

Если говорить о малой генерации, то даже лучшие образцы автономных ветроэлектростанций могут обеспечить регулярное производство только небольшого количества электроэнергии. К тому же малые ветряные турбины не работают при слишком сильном ветре, а гроза, ураган или снежный буран могут такую турбину повредить. Все это приводит к тому, что если малые ветроэлектростанции и окупаются, то очень долго.

Впрочем, и с «большой» ветряной энергетикой не все так просто. Несмотря на массовое производство, стоимость строительства современной ветряной электростанции велика. При этом ветряные электростанции, как правило, простираются на обширные территории и находятся в отдалении от потребителя, что создает дополнительные расходы на транспортировку энергии. Сохранение избыточной энергии, выработанной ветряными турбинами, также требует дополнительных решений: аккумуляторов или преобразователей в другие виды энергии. То есть для того, чтобы получать «бесплатную» энергию ветра, вначале придется хорошо заплатить, ведь ветряная электростанция отличается высокой начальной стоимостью.

Кроме того, в разных частях Земли в разное время ветер дует по‑разному. При строительстве ветряных электростанций необходимо предварительное исследование и разработка карты ветров, что увеличивает стоимость такой электростанции.

Экологический аспект

Сторонники ветроэлектроэнергии постоянно подчеркивают, что по сравнению с вредным воздействием традиционных энергоисточников воздействие ветроэнергетики на экологию планеты ничтожно. Но риски есть.

Прежде всего, ветряки несут угрозу крылатым существам – птицам и летучим мышам. Некоторые исследователи утверждают, что ветряки принуждают некоторые виды птиц менять пути миграции, а кто не меняет, рискуют погибнуть от лопастей турбин. Например, в США, согласно данным Национальной академии наук этой страны, от них погибает от 20 тыс. до 37 тыс. птиц ежегодно.

Причина гибели летучих мышей сложнее: способность к эхолокации, как правило, позволяет им не попадать на лопасти, но они залетают в область низкого давления, тянущуюся за вращающейся лопастью. От внезапного попадания в почти безвоздушное пространство лопаются капилляры в легких, и зверек гибнет.

Наконец, есть версия, что ветровые электростанции вредят и людям. Так, многие живущие поблизости от них жалуются на постоянный шум. Ветряные турбины действительно создают шум, сравнимый с шумом автомобиля, движущегося со скоростью 70 км / ч, что вызывает дискомфорт для людей и отпугивает животных.

Другая неожиданная особенность ветряных энергоустановок проявилась в том, что они оказались источником достаточно интенсивного инфразвукового шума, неблагоприятно воздействующего на человеческий организм, вызывающего постоянное угнетенное состояние, сильное беспричинное беспокойство и жизненный дискомфорт. Как показал опыт эксплуатации большого числа ветряных установок в США, этот шум не выдерживают ни животные, ни птицы, покидая район размещения станции, т. е. территории самой ветровой станции и примыкающие к ней становятся непригодными для жизни.

Американский педиатр Нина Пьерпонт утверждает: близость ветроустановок вызывает у некоторых людей мигрень, головокружение, беспокойство, тахикардию, давление в ушах и тошноту, а также ухудшает зрение и даже пищеварение. Она даже выявила так называемый «синдром ветрогенератора» – клиническое наименование ряда симптомов, которые наблюдаются у многих (но не у всех) людей, живущих вблизи промышленных ветровых турбин.

По мнению врача, к проблемам приводит нарушение вестибулярной системы внутреннего уха низкочастотным шумом от турбин ветрогенераторов. Проще говоря, инфразвуком. Низкочастотный шум от турбин стимулирует выработку ложных сигналов в системе внутреннего уха, которые и приводят к головокружению и тошноте, а также к проблемам с памятью, тревожности и панике. Инфра­звук, вследствие большой длины волны, свободно обходит препятствия и может распространяться на большие расстояния без значительных потерь энергии. Поэтому инфра­звук можно рассматривать как фактор, загрязняющий окружающую среду. Таким образом, если ветрогенераторы приводят к выработке инфразвука, то они все же не являются чистым источником энергии, поскольку загрязняют окружающую среду. А отфильтровать инфразвук намного сложнее, чем обычный звук. Устанавливаемые звуковые фильтры не позволяют экранировать его полностью.

Впрочем, «синдром ветрогенератора» не признается официально. Критики Пьерпонт говорят, что написанная ею книга не рецензировалась и была издана самостоятельно, а ее выборка субъектов для исследований слишком мала и не имеет контрольной группы для сравнения. Многие специалисты заявляют, что термин «синдром ветрогенератора» распространяется группами активистов, выступающими против ветропарков. А некоторые исследования объясняют синдром ветрогенератора силой внушения. (Справедливости ради надо заметить, что те же аргументы приводятся в ответ на критику более традиционных видов энергии, например атомной, которым противопоставляется энергия ветра.)

Однако, несмотря на критику синдрома, люди очень часто жалуются на головные боли, бессонницу, звон в ушах, которые связываются с ветрогенераторами. Не зря рядом с ветропарками исчезают животные. Чтобы выявить реальные угрозы, необходимы дополнительные исследования.

Ветрогенераторы ведут мир к апокалипсису?

Есть и еще более серьезные опасения. Согласно некоторым исследованиям, развертывание ветро­энергетики хотя бы до 33 процентов от уровня нынешней мировой электрогенерации приведет к худшим последствиям для климата, чем удвоение содержания углекислого газа в атмосфере. Между тем, по современным научным представлениям, удвоение содержания углекислого газа в атмосфере неизбежно вызовет поистине катастрофические изменения климата и массовое вымирание видов.

Как же ученые пришли к подобным выводам? Дело в том, что каждая ветряная турбина создает прямо за собой «ветряную тень» – область, в которой воздух замедлен в сравнении со своей естественной скоростью в этом районе. Вот отчего ветряки на ВЭС расставляют с существенными «зазорами»: в противном случае слишком близкие соседи снизят эффективность друг друга.

Если бы мы покрыли всю Землю ветряными турбинами, считают исследователи, такая энергосистема «могла бы генерировать огромные количества энергии, намного больше, чем 100 ТВт, но в этой точке, как подсказывает климатическое моделирование, ее влияние на глобальные ветра и, следовательно, климат стало бы очень суровым».

Напомним, что именно ветер «отвечает» в мировой атмосфере за перенос тепла из жарких, тропических частей земного шара в более холодные, высокие широты (и в Россию в том числе). Снижение их скорости, неизбежное при вращении ветряков, ведет к падению интенсивности такого теплопереноса. Словом, теоретически слишком бурное развитие ветроэнергетики может привести к росту средних температур летом и их падению зимой. А значит, к экологической катастрофе планетарных масштабов.

Сложно сказать, правда ли это, однако, на мой взгляд, даже малейшее подозрение в столь негативном воздействии на экологию Земли требует дополнительных исследований. Возможно, мы наблюдаем не рассвет ветряной энергетики, а ее апогей, за которым ветряную энергетику ждут увядание и забвение.

Япония построит первый в мире танкер для хранения и перевозки электроэнергии

Пока речь идет о транспортировке электроэнергии с морских ветропарков

Токио, 31 авг — ИА Neftegaz.RU. К 2025 г. власти Японии планируют построить первое в мире судно для хранения и транспортировки электроэнергии.
Об этом сообщили японские СМИ.

Проект будет реализовывать компания PowerX.

Почему Япония

Власти Японии планирует, что в 2030 г. на возобновляемые источники энергии (ВИЭ) будет приходиться 36-38% производства электроэнергии в стране.
Ранее прогноз составлял 22-24%.
Это означает, что генерация мощности морской ветровой энергии возрастет с нынешних 20 МВт до 10 ГВт к 2030 году и до 30-45 ГВт к 2040 г.

Япония — островная страна, окруженная глубокими прибрежными водами, которые ограничивают потенциальный диапазон для строительства ВЭС на шельфе.
Судно для перевозки электроэнергии позволит:

  • изменить способ хранения и передачи возобновляемой энергии во всем мире;
  • устранить ограничения на площадку для производства электроэнергии, что обеспечит гибкость при строительстве морских ВЭС, особенно для островной Японии,
  • в перспективе, возможна транспортировка э/энергии между портами.
PowerX спроектирует и построит автоматизированное судно для транспортировки энергии (Power Transfer Vessel) с ВЭС на берег.

Недостатки подводного кабеля:

  • дорогостоящее строительство;
  • негативное влияние на окружающую среду.
Преимущества судна для передачи электроэнергии:
  • устойчиво к бедствиям,
  • требует меньше времени и затрат на разработку,
  • оказывает минимальное воздействие на окружающую среду.


Источник: PowerX

Судно Power ARK 100, первая модель в серии Power ARK

Технические характеристики и главные размерения:
  • длина — 100 м, ширина -22 м;
  • дедвейт — 2200 т;
  • тримаран на 100 TEU,
  • назначение — транспортировка электроэнергии ВИЭ в прибрежных водах Японии,
  • ввод в эксплуатацию — 2025,
  • на судне будут контейнеры с аккумуляторными батареями:
    • емкость 1 батареи — до 2 МВт*ч энергии,
    • количество-100;
    • суммарная мощность -200 МВт*ч энергии (22 000 домохозяйств/сутки),
  • автономность хода — 300 км на электричестве.

Завод по производству аккумуляторных батарей

  • PowerX построит завод по сборке аккумуляторных батарей для судна;
  • производственная мощность:
    • 1 ГВт*ч — к 2024 г,
    • 5 ГВт*ч — к 2028 г.

Японская компания PowerX

Соучредители:
  • генеральный директор — Масахиро Ито;
  • председатель — Тадахиса Кагимото.

М. Ито известен по основанной в 2000 г. компании Yappa, компанию по разработке программного обеспечения, которая стала пионером в разработке технологий цифровой визуализации.
Т. Кагимото — основатель, председатель и генеральный директор Healios, биотехнологической компании, разрабатывающей регенеративную терапию на основе стволовых клеток.
Оба — удачливые стартаперы.

преимущества и недостатки использования ВЭС. Часть 1

Главная › Новости

Опубликовано: 08.12.2017

HyperNormalisation by Adam Curtis HD Full [2016] [Subs]

Объяснить значение слова «ветер» большинство современных людей смогут только на бытовом уровне, совершенно не углубляясь в его физические характеристики, поскольку это сложно для непосвященных в секреты сложнейшей отрасли «физика». Однако многие в последние годы уже заметили, что слово «ветер» сопровождается еще и экономическим толкованием, поскольку это природное явление позволяет получать возобновляемую энергию, которая к тому же имеет и невысокую стоимость. Ветроэнергетика способна успешно конкурировать и с другими разновидностями возобновляемой энергии, к которым относятся энергия солнца и воды.


История ветряной энергии

Не только современные люди обнаружили удивительные свойства ветра, направив их на получение электроэнергии и развитии прочих благ. В третьем тысячелетии до нашей эры люди уже научились успешно использовать силу ветра. Чуть позже человеку удалось создать устройство, при помощи которого удавалось приводить в порядок земли, осушать заболоченные местности.


TEDxFlanders — Kevin Verstrepen — 1/22/10

Немного позже появились первые ветряные мельницы на территории Египта, которые на протяжении многих лет позволяли человеку получать муку из зерновых культур.

Ветер позволял китайцам откачивать воду с рисовых полей. Для этого на полях были установлены специальные устройства с лопастями, которые приходили во вращательное движение благодаря потокам ветра.


Marco Annunziata: Welcome to the age of the industrial internet

Однако Европа продолжительное время не уделяла должного внимания ветряным технологиям, поэтому на европейском континенте они стали распространяться только спустя несколько веков.

Секвенирование всего генома (WGS) по сравнению с секвенированием всего экзома (WES)

«Что выбрать для моего проекта — секвенирование всего генома (WGS) или всего экзома (WES)?» это настолько часто задаваемый вопрос во время консультации по Genohub, мы подумали, что было бы полезно ответить на него здесь. Обладая неограниченными ресурсами и временем, WGS — явный победитель, поскольку он позволяет вам исследовать однонуклеотидные варианты (SNV), инделки, структурные варианты (SV) и варианты числа копий (CNV) как в ~ 1% части генома, которая кодирует белковые последовательности и ~ 99% остальных некодирующих последовательностей.WES по-прежнему стоит намного меньше, чем WGS, что позволяет исследователям увеличивать количество выборок, что является важным фактором для крупных популяционных исследований. Однако у WES есть свои ограничения. Ниже мы выделили преимущества WGS по сравнению с WES и описали реальный пример того, как кто-то заказывает эти услуги через Genohub.

Преимущества секвенирования всего генома

  1. Позволяет исследовать SNV, инделки, SV и CNV в кодирующих и некодирующих областях генома. WES не включает регуляторные области, такие как промоторы и энхансеры.
  2. WGS имеет более надежное покрытие последовательности. Различия в эффективности гибридизации зондов захвата WES могут привести к участкам генома с небольшим охватом или без него.
  3. Равномерность покрытия с WGS превосходит WES. Области генома с низкой сложностью последовательности ограничивают возможность разработки полезных приманок для захвата WES, что приводит к эффектам захвата вне цели.
  4. ПЦР-амплификация
  5. не требуется во время подготовки библиотеки, что снижает вероятность смещения GC.WES часто требует ПЦР-амплификации, так как объем вводимого количества, необходимого для захвата, обычно составляет ~ 1 мкг ДНК.
  6. Длина чтения секвенирования не является ограничением для WGS. Большинство зондов-мишеней для exome-seq имеют длину менее 120 нуклеотидов, что делает бессмысленным секвенирование с использованием большей длины чтения.
  7. Требуется более низкая средняя глубина считывания для достижения такого же уровня покрытия, как у WES.
  8. WGS не страдает систематической ошибкой ссылок. Зонды захвата WES имеют тенденцию преимущественно обогащать референсные аллели в гетерозиготных сайтах, вызывая ложноотрицательные вызовы SNV.
  9. WGS более универсален. Если вы секвенируете не человеческий вид, а другой вид, ваш выбор для секвенирования экзома довольно ограничен.

Преимущества секвенирования всего экзома

  1. WES нацелен на белковые кодирующие области, поэтому считывания составляют менее 2% генома. Это снижает стоимость секвенирования целевой области на большой глубине и снижает затраты на хранение и анализ.
  2. Снижение затрат делает возможным увеличение количества образцов для секвенирования, что позволяет проводить сравнения на основе больших популяций.

Большинство функционально связанных вариантов заболевания могут быть обнаружены на глубине между 100-120x (1), что определенно является оправданием затрат на секвенирование экзома. Сегодня на Genohub, если вы хотите выполнить секвенирование всего человеческого генома с глубиной ~ 35X, стоимость составит примерно 1700 долларов за образец. Если бы вы запросили услуги по секвенированию экзома человека со 100-кратным охватом, используя целевую область 62 Мб, ваши затраты составили бы 550 долларов за образец. Обе эти цены включают подготовку библиотеки. Таким образом, с точки зрения производства данных WES по-прежнему значительно дешевле WGS.Важно отметить, что сюда не входят расходы на хранение и анализ данных, которые также могут быть немного выше при секвенировании всего генома.

Также важно помнить, что глубина — это еще не все. Чем лучше у вас единообразие чтения и дыхание охвата, тем выше вероятность того, что вы действительно обнаружите мутации de novo и вызовете их. И это главная цель: если вы не можете вызвать SNP или INDEL с высокой чувствительностью и точностью, то запуски секвенирования на самой глубокой глубине бесполезны.

В заключение, полногеномное секвенирование обычно обеспечивает лучшую однородность и сбалансированное соотношение аллелей. В то время как большая глубина exome-seq может соответствовать этому, достаточная отображаемая глубина или обнаружение вариантов в определенных регионах может никогда не достичь качества WGS из-за ошибок конструкции зонда или недостатков протокола. Это важные соображения при исследовании тканей, таких как первичные опухоли, где изменение числа копий и гетерогенность являются смешивающими факторами.

Если вы готовы начать проект экзома, потратьте несколько минут на определение покрытия, которое вам понадобится для эксперимента.У нас есть руководство по exome-seq с примерами, которое поможет вам определить количество чтений секвенирования, необходимых для достижения определенного охвата экзома. Если вы планируете приступить к секвенированию всего генома, используйте нашу NGS Matching Engine, которая автоматически рассчитывает объем возможностей секвенирования на различных платформах в соответствии с требованиями к охвату вашего проекта.

Артикул:

1) Влияние глубины секвенирования экзома следующего поколения на открытие диагностических вариантов

Нравится:

Нравится Загрузка…

WGS лучше WES?

Abstract

Текущее клиническое секвенирование следующего поколения выполняется с использованием панелей генов и анализа экзома, оба из которых включают выборочный захват целевых областей. Однако у захвата есть ограничения в достаточном покрытии кодирующих экзонов, особенно богатых GC областей. Мы сравнили секвенирование всего экзома (WES) с самым последним секвенированием всего генома без ПЦР (WGS), показав, что только последнее способно обеспечить беспрецедентно полный охват кодирующей области генома.Таким образом, с клинической / технической точки зрения, WGS является лучшим WES, так что регистрация более не требуется для наиболее полного геномного тестирования менделевских расстройств.

Электронные дополнительные материалы

Онлайн-версия этой статьи (doi: 10.1007 / s00439-015-1631-9) содержит дополнительные материалы, которые доступны авторизованным пользователям.

Об оптимальном применении секвенирования следующего поколения (NGS) в диагностике менделевских расстройств ведутся активные дискуссии.Предпочтение отдается генным панелям из-за низких затрат на секвенирование, короткого времени обработки и низкой частоты неспецифических или случайных результатов, в то время как только около 10% мутаций, обнаруживаемых с помощью секвенирования всего экзома (WES), были пропущены (Saudi Mendeliome Group 2015). Фактически, генные панели, связанные с фенотипом пациентов, можно рассматривать как недорогой и быстрый тест первого уровня. Если этот тест отрицательный, WES или полногеномное секвенирование (WGS) можно рассматривать как наиболее полный тест второго уровня.

В WGS охват чтением всего генома может позволить надежное обнаружение вариаций числа копий (CNV), которые могут вносить существенный вклад в бремя болезни (Girirajan et al. 2011). Цены на WGS падают, время обработки, включая анализ данных (например, с использованием GENALICE MAP, www.genalice.com), может быть сокращено до нескольких дней, виртуальные панели генов могут быть выбраны in silico, чтобы избежать случайных выводов, а диагностический результат может быть уменьшен. достигает 73%, что на порядок выше, чем при обычном фенотип-ориентированном анализе отдельных генов (Soden et al.2014; Miller et al. 2015; Виллиг и др. 2015). Таким образом, WGS следует рассматривать как альтернативу WES.

Недавно мы показали, что даже современные платформы WES имеют проблемы с достаточным захватом всего экзома, и предположили, что WGS, который отказывается от захвата, менее чувствителен к содержимому GC и с большей вероятностью, чем WES, обеспечивает полное покрытие всей кодирующей области генома. (Мейенберг и др., 2015). Здесь мы даем новое понимание WGS, показывая, что недавно представленный WGS без ПЦР предлагает беспрецедентно полный охват кодирующей области генома, и, следовательно, WGS вместо WES следует рассматривать как наиболее полный тест второго уровня. .

Мы сравнили оптимальный WES (с использованием Agilent SureSelect v5 + захват UTR; Мейенберг и др., 2015) с WGS (с использованием подготовки библиотеки WGS TruSeq без ПЦР Illumina) в образцах ДНК пяти женщин каждый. Секвенирование было выполнено поставщиками V2 (WES) и V4 (WGS) на HiSeq 2000 при 100 × и системе HiSeq X Ten при 60 × соответственно. Чтобы в значительной степени уменьшить систематические ошибки и артефакты выравнивания, мы ограничили наше сравнение кодирующими последовательностями RefSeq, которые однозначно отображались на X-хромосомные или аутосомные области (Derrien et al.2012), идентичны в геномных сборках hg19 и hg38 и не перекрываются с обычными CNV, перечисленными в базе данных геномных вариантов (DGV, MacDonald et al. 2014). Дополнительные сведения см. В дополнительных электронных материалах.

Наши текущие данные показывают, что новый WGS без ПЦР намного менее чувствителен к содержанию GC и приводит к более равномерному охвату, чем WES и WGS без ПЦР (рис. A, дополнительные рисунки S1-S3). Хотя средняя глубина покрытия была меньше половины (65 × в WGS против 154 × в WES, дополнительная таблица S1), количество кодирующих экзонов RefSeq с полным (100%) покрытием при ≥13 × было значительно больше в без ПЦР. WGS, чем в WES (100.00 против 98,15%; Рис. Б). Разница была более выраженной, когда были исследованы первые экзоны, богатые GC (59 против 51% GC во всех экзонах) (100,00% в WGS без ПЦР против 93,60% в WES; рис. B). В случае генов, рекомендованных Американским колледжем медицинской генетики (ACMG) для регистрации в случае мутации (Green et al.2013), WGS без ПЦР полностью покрывает все уникально картируемые экзоны (100% при ≥13 ×) во всех пяти образцов нашего исследования, тогда как только 98,25% экзонов ACMG были полностью покрыты WES, что привело к полному охвату WES только 75.56% генов ACMG (рис. Б). Заметная и клинически значимая разница в характеристиках WES и WGS также наблюдалась в охвате экзонов, в которых вызывали болезненные мутации (DM, включая однонуклеотидные варианты, а также небольшие (≤20 п.н.) вставки, делеции и индели) были зарегистрированы в HGMD (98,22% в WES против 100,00% в WGS; рис. b). Соответственно, WES может не обнаружить 0,42% (401 / 95,118) известных в настоящее время экзонных DM, обнаруживаемых WGS. Учитывая также идентификацию некодирующих патогенных вариаций (Spielmann and Klopocki, 2013), WES может пропустить всего 0.81% (863/106 819) DM, которые в настоящее время перечислены в HGMD и потенциально могут быть обнаружены WGS (99,19% в WES по сравнению со всеми DM, кроме одного, в WGS; рис. B). Примечательно, что отсечение 13x, представленное здесь, показывает минимальное количество чтений, при котором WGS достигает 100,00% покрытия в наших выборках. Для той же производительности WGS при широко используемом 20-кратном отсечении требуется секвенирование при> 100 × (65 ∗ 20/13) (в то время как для WES большее количество считываний секвенирования может не привести к более полному охвату из-за ограничений захвата, особенно в GC- богатые регионы).

Сравнение производительности WES и WGS. a Средняя глубина считывания кодирующих экзонов RefSeq на содержание GC, показанное для WES, а также для WGS с (WGS_wPCR) и без (WGS) ПЦР как среднее значение пяти образцов для каждого. b Процент полностью покрытых (т. Е. ≥13 считываний в каждом положении нуклеотида) генов, экзонов и вариантов в WES и WGS без ПЦР в виде среднего значения пяти образцов для каждого (столбцы ошибок указывают доверительные интервалы 95%). В случае генов, рекомендованных для отчетности ACMG (гены ACMG, n = 54) и генов базы данных RefSeq (гены RefSeq, n = 16,896), набор всех кодирующих экзонов (все экзоны ACMG, n = 1152; RefSeq все экзоны, n = 177 084) и набор экзонов, содержащих старт-кодон (первые экзоны).Набор экзонов RefSeq, несущих по крайней мере одну вызывающую заболевание мутацию (DM), перечисленный в HGMD (HGMD все экзоны, n = 22 303), и набор всех кодирующих и некодирующих DM (HGMD все варианты, n = 106 819) также были проанализированы. Обратите внимание, что 100,00% подразумевает отклонение не более 0,005%: * два экзона были частично покрыты 12 чтениями; # одна интронная мутация была покрыта за 12 чтений; и 12 генов были частично покрыты 7–12 чтениями; три экзона были частично покрыты 10–12 чтениями; § 12 экзонов были частично покрыты 7–12 прочтениями

Кроме того, однородность покрытия во всем геноме делает WGS, а не WES, подходящим для обнаружения CNV (Gilissen et al.2014; Meienberg et al. 2015). В наших выборках коэффициент вариации (cv = SD / среднее) в охвате экзонами индивидуума в среднем примерно в 4 раза больше в WES, чем в WGS без ПЦР (0,59 против 0,14). По общему признанию, относительное отсутствие равномерного покрытия в WES, по-видимому, не является результатом повышенного уровня шума, поскольку межиндивидуальное cv на экзон сравнимо в WES и WGS (0,08 против 0,09). Другими словами, дополнительная изменчивость покрытия WES представляется воспроизводимой и, следовательно, в принципе может быть нормализована in silico.Однако такие алгоритмы нормализации относительно сложны, их необходимо калибровать для каждого протокола обогащения (Szatkiewicz et al. 2013), и они позволяют обнаруживать только CNV, влияющие на обогащенную область генома. Более того, WGS без пропусков также предлагает обнаружение структурных вариантов (SV) на основе парных и разделенных чтений, что позволяет обнаруживать (нейтральные к копии) SV при разрешении пар оснований (Escaramis et al. 2015). Таким образом, по нашему мнению, WGS, вероятно, заменит методы массивов в обнаружении CNV, тогда как WES может не заменить.

WGS доступен по всему миру в лабораториях, которые имеют возможности высокопроизводительного секвенирования не менее 60 × 3 ∗ 10 9 п.н., а также соответствующие аппаратные и программные ресурсы для обработки и интерпретации больших файлов WGS. Можно возразить, что WGS дороже NGS с выборочным захватом целей. Действительно, генетическая мозаика и панели генов соматического рака требуют нескольких 100-кратных глубин секвенирования для обнаружения низкочастотных нереференсных вариантов, так что WGS в настоящее время будет слишком дорогим для этих приложений.В противном случае, однако, затраты на секвенирование неуклонно снижаются, и усилия по интерпретации данных могут быть сокращены путем in silico выбора соответствующих частей WGS. Учитывая, что эти части могут быть изменены, выборочный захват потребует повторной последовательности нерешенных дел, в то время как с WGS потребуется только повторный анализ существующих данных. Кроме того, можно утверждать, что WGS подразумевает случайное обнаружение мутаций, не связанных с текущим заболеванием пациента, и обнаружение вариантов с неопределенным или неполным эффектом.Опять же, перегрузку такими результатами можно предотвратить, сократив данные WGS до представляющих интерес виртуальных панелей генов. Таким образом, мы и другие (Belkadi et al. 2015; Lelieveld et al. 2015) полагаем, что WGS более эффективен, чем WES в обнаружении вариантов экзома, так что будущая NGS-диагностика менделевских расстройств больше не будет включать методы захвата. В дополнение к предыдущим исследованиям, наши настоящие данные показывают, что WGS без ПЦР обеспечивает даже более равномерный и полный охват экзома, чем WGS с ПЦР во время подготовки библиотеки.

В заключение, производительность WES зависит от содержимого последовательности (GC), а также от дизайна и обогащения. Следовательно, WES не полностью выполняет свою задачу, тогда как новый WGS без ПЦР обеспечивает беспрецедентно полное покрытие экзома и других клинически значимых геномных последовательностей. Таким образом, преимущество WGS не только в выявлении некодирующих патогенных вариаций, но и, ввиду его более полного экзомного покрытия, представленного здесь, это просто лучший WES.Таким образом, WGS без ПЦР следует рассматривать как наиболее полный геномный тест второго уровня. При дальнейшем снижении затрат на секвенирование и использовании соответствующих виртуальных панелей WGS даже может полностью заменить WES и другие методы, предполагающие выборочный захват целевых последовательностей.

Секвенирование всего экзома — обзор

Секвенирование всего экзома и секвенирование всего генома

WES был описан в 2009 году [34] как метод, позволяющий секвенировать экзом, который является частью генома, включающей весь белок. кодирующие области (экзоны).Привлекательность WES заключается в том, что, хотя он охватывает только ~ 1,5% генома, он содержит большинство (~ 85%) вариантов, вызывающих одногенные расстройства. Действительно, в том же году обнаружение врожденной диареи с потерей хлоридов у пациента с ошибочным диагнозом синдрома Барттера было зарегистрировано как первое клиническое применение WES [35]. Отчет о впечатляющей диагностике и терапии тяжелого воспалительного заболевания кишечника с помощью WES продемонстрировал потенциал этой технологии не только для диагностики, но и для лечения [36].

В 2011 году Ambry Genetics, как первая лаборатория, сертифицированная CLIA, предложила WES вместе с медицинской интерпретацией для клинических целей. По состоянию на октябрь 2014 года на веб-сайте GeneTests (www.genetests.org) было перечислено 16 лабораторий, предлагающих клинические WES. Срок выполнения в большинстве случаев составляет 12–13 недель, самый короткий — 4–8 недель, а цена — 4000–5500 долларов США. Примечательно, что стоимость WES может быть всего в два-четыре раза выше, чем стоимость некоторых гораздо более избирательных панелей. Большинство лабораторий также предлагают интерпретацию данных, в том числе в некоторых случаях интерпретацию внешних данных.На веб-сайте GeneTests (www.genetests.org) указана одна лаборатория (Медицинский колледж Висконсина), предлагающая WGS, декларирующая минимальный охват 10 для более 90% генома с периодом обработки 12–13 недель. WGS также можно получить в компаниях Illumina и BGI (www.bgiamericas.com).

WES обычно выполняется с использованием обогащения на основе гибридизации с использованием наборов от Agilent Technologies, Roche NimbleGen, Illumina или других. Хотя все предлагаемые комплекты допускают WES, существуют различия в их конструкции и характеристиках [37].В некоторых случаях наборы охватывают только экзоны, кодирующие белок, тогда как другие наборы включают дополнительные локусы для некодирующих РНК (включая микро РНК) и 5 ​​’, а также 3′ нетранслируемые области. Полученные различия в размере цели (например, 37 МБ для Nextera Rapid Capture Exome от Illumina против 96 МБ для SeqCap EZ Exome + UTR от NimbleGen) подразумевают значительные, до трех раз, различия в стоимости секвенирования.

WES особенно привлекателен, когда есть подозрение, что болезнь вызвана неизвестным локусом — до сих пор WES позволил связать более 150 новых генов с менделевскими расстройствами человека [38].Однако в клинических условиях большая часть информации, предоставляемой WES, остается трудной для интерпретации, поскольку она относится к локусам, которые до сих пор не были связаны с какими-либо заболеваниями человека. Чтобы сосредоточиться на наиболее клинически значимых локусах, были разработаны так называемые панели «клинического экзома», такие как TruSight One от Illumina, который охватывает> 4800 генов и имеет совокупный целевой размер всего ∼12 Mb, или SureSelect Inherited Disease от Agilent (> 2700 генов, 10,5 МБ).

Использование WGS, которое теоретически должно предлагать гораздо более мощный диагностический инструмент, чем WES, в настоящее время ограничено плохим пониманием роли вариаций в некодирующей части генома.Интересно, что исследование 50 пациентов с тяжелой умственной отсталостью, у которых причинный молекулярный дефект не был обнаружен в обширных предыдущих исследованиях, включая WES и сравнительную геномную гибридизацию, пришло к выводу, что WGS имеет высокую диагностическую ценность 42%, но в основном благодаря находкам экзонные варианты, по-видимому, пропущены более ранними исследованиями [39].

Учебное пособие по анализу секвенирования всего экзома

Методы секвенирования следующего поколения (NGS) все больше делают возможным крупномасштабный анализ секвенирования ДНК с массовым параллелизмом.В рамках методов NGS секвенирование всего экзома (WES) направлено на секвенирование и обнаружение вариаций в экзонных областях генома.

Хотя методы полногеномного секвенирования (WGS) могут использоваться для выполнения генетической диагностики, в зависимости от типа и сложности заболевания, WES может быть лучшим методом. WES, во-первых, дешевле — у него более низкие затраты на хранение данных и менее трудоемкий последующий анализ данных, чем у WGS. Значительно сокращается объем хранилища данных: для типичного файла WGS требуется 90 ГБ или более по сравнению с 5–6 ГБ для файла WES.

Самым большим преимуществом WGS является то, что он имеет более широкий охват и позволяет обнаруживать больше типов вариантов. Но даже несмотря на то, что только 2% генома соответствует кодирующим областям, здесь картировано около 90% известных вариантов, вызывающих болезни. Таким образом, несмотря на различия в охвате, анализ секвенирования всего экзома сохраняет свой статус экономически эффективной альтернативы секвенированию всего генома.

Подход WES имеет различные применения от точечного варианта до идентификации структурного варианта.В классе точечных мутаций наиболее часто наблюдаются однонуклеотидные варианты (SNV). К распространенным типам изучаемых SNV относятся синонимичные, бессмысленные, бессмысленные, внутрикадровые мутации, мутации со сдвигом рамки и сайта сплайсинга. Вставки или делеции (инсерции) от 2 до 30 пар оснований — еще один распространенный тип мутации, обнаруживаемый WES. Хотя WGS обычно предпочтительнее для идентификации структурных вариантов, WES также позволяет обнаруживать варианты числа копий (CNV) и другие хромосомные делеции.

Во время последующего анализа идентификация класса мутации имеет сильное влияние на определение клинической значимости варианта. В общем, большинство вариантов, идентифицированных в анализе WES, являются синонимами и, следовательно, не влияют на кодируемый белок, за исключением некоторых конкретных случаев. Точно так же, в зависимости от конструкции набора зондов, WES может также обнаруживать несколько интронных мутаций, которые обычно имеют клиническое значение. Напротив, миссенс-варианты вызывают аминокислотные изменения в белке и могут быть очень информативными в зависимости от механизма заболевания.Нонсенс и мутации сдвига рамки считывания могут иметь резкое влияние на функцию белка, поскольку они вызывают преждевременный стоп-кодон и изменяют рамку считывания ДНК путем вставки или удаления пар оснований соответственно. Более того, внутрикадровые мутации приводят к вставке или удалению пары оснований и, в отличие от мутаций со сдвигом рамки считывания, всегда приводят к триплетным инделениям.

Важным этапом во время WES является обогащение экзонов, при котором кодирующие области захватываются посредством гибридизации ДНК-зондов. Как правило, эти зонды связываются с магнитными шариками, а затем осаждаются и амплифицируются с целевой последовательностью.Доступные коммерческие наборы могут различаться по типу зонда и методу захвата, поэтому важно учитывать используемый набор для захвата экзома — неправильный выбор может привести к неравномерному охвату некоторых регионов. Зонды также могут быть сконструированы по индивидуальному заказу в зависимости от целей расследования. С этой целью можно использовать общедоступные базы данных для выбора целевых регионов для усиления. Однако перед созданием зондов для нацеливания на экзоны необходимо учесть некоторые детали; на качество результатов WES могут влиять многие факторы, такие как области, богатые GC, качество фрагмента ДНК, размер вставки и наличие повторяющихся элементов в последовательности.

Высококачественные результаты анализа экзома во многом зависят от того, как обрабатывается набор данных. Таким образом, протоколы анализа данных секвенирования всего экзома включают в себя несколько этапов, таких как контроль качества (QC), предварительная обработка необработанных считываний, отображение коротких считываний, обработка после выравнивания, вызов и аннотация вариантов, а также приоритезация вариантов. Из-за возможного присутствия примесей и артефактов, таких как ошибки секвенирования, низкое качество чтения, адаптеры и дубликаты, появившиеся в процессе секвенирования, показатели контроля качества оценивают качество данных путем создания основных статистических показателей, касающихся глубины, охвата, идентификации адаптера последовательности. , Содержание GC и базовое распределение.Пайплайны Basepair осуществляют контроль качества с помощью инструмента fastp.

Поскольку в необработанных данных присутствуют артефакты, настоятельно рекомендуются этапы предварительной обработки чтения, такие как обрезка, фильтрация или отсечение адаптера, чтобы избежать смещений сопоставления на этапе выравнивания чтения. Для сопоставления считываний с эталонным геномом Basepair поддерживает два ведущих инструмента: Bowtie и BWA. Оба выполняют сопоставление на основе ссылок. Здесь оцениваются критические показатели контроля качества, такие как глубина и охват областей генома. После этого этапы обработки после выравнивания удаляют многократно отображенные и дублированные считывания, чтобы минимизировать аллельные смещения во время этапа вызова варианта.

На этапе вызова варианта вычисляется вероятность того, что генетический вариант действительно присутствует в анализируемой выборке. Один из самых популярных программных пакетов для вариантного обзвона — GATK. Чтобы избежать ложноположительных вызовов SNP, важно установить правильные параметры, такие как максимальная глубина чтения для каждой позиции, минимальное количество считываний с пропусками и пересчет базового качества выравнивания для улучшения вызываемого базового качества. Кроме того, аннотация вариантов направлена ​​на интеграцию соответствующей информации о каждом вызываемом варианте.Здесь такие программы, как SnpEff / SnpSift и VEP, помогают аннотировать типы вариантов, их влияние на гены (например, изменения в аминокислотах), влияние и частоту встречаемости в человеческих популяциях (например, с использованием базы данных DbSNP). Эта информация имеет решающее значение для выполнения последующей фильтрации и определения приоритетов в анализе секвенирования экзома.

Сотни и тысячи вариантов потенциально могут быть получены путем секвенирования экзома. Здесь очень сложно сократить пространство поиска причинных вариантов.В целом, пользователи могут сортировать найденные варианты по эффекту, влиянию мутаций и зиготности. Могут быть полезны более сложные статистические тесты, хотя они обычно требуют значительного размера выборки. В качестве альтернативы прямой фильтрации данных, используя данные WES, пользователи могут выполнять полногеномные ассоциативные исследования (GWAS), подходы на основе фенотипа или генотипа, ген-специфический анализ и семейные исследования в зависимости от дизайна экспериментального исследования.

Узнайте больше о конвейерах секвенирования всего экзома Basepair на нашей странице продукта.

Список литературы

1. Хинтше, Дженнифер Д., Уильям А. Робинсон и Айк Чун Тан. 2016. «Обзор вычислительных инструментов для анализа и интерпретации данных секвенирования всего экзома». Международный журнал геномики и протеомики, 2016 г. (декабрь): 7983236.

2. Пабинджер, Стефан, Андреас Дандер, Мария Фишер, Рене Снайдер, Майкл Сперк, Мирьяна Ефремова, Биргит Крабихлер, Майкл Р. Спайхер, Йоханнес Зшоке и Златко Траяноски. 2014. «Обзор инструментов для анализа вариантов данных секвенирования генома следующего поколения.Брифинги по биоинформатике 15 (2): 256–78.

3. Реттерер, Кайл, Джейн Юусола, Меган Т. Чо, Патрик Витазка, Франциска Миллан, Федерика Гибеллини, Аннет Вертино-Белл и другие. 2016. «Клиническое применение секвенирования всего экзома по клиническим показаниям». Генетика в медицине: Официальный журнал Американского колледжа медицинской генетики 18 (7): 696–704.

4. Сувински, Павел, Чуангки Онг, Морис Х. Т. Линг, Ян Мин По, Асиф М. Хан и Хуэй Сан Онг. 2019. «Продвижение персонализированной медицины с помощью секвенирования всего экзома и аналитики больших данных.”Frontiers in Genetics 10 (февраль): 49.

Секвенирование экзома: взгляд экспертов | Genome Biology

LGB, JCM

Это открытый вопрос. Вполне возможно, что секвенирование экзома с будущими уточнениями и индексацией образцов могло бы остаться достаточно дешевым, чем WGS, что было бы предпочтительнее WGS для определенных приложений. Для того чтобы экзомы оставались конкурентоспособными, необходимо значительно снизить стоимость комплектов для захвата экзомов, так как затраты на WGS упадут.

Даже если соотношение разницы затрат уменьшится, в настоящее время 6: 1, даже почти до паритета с точки зрения расходных материалов, может быть лучше продолжить использование WES из-за других затрат, которые часто игнорируются.К ним относятся время прибора для секвенирования и вычислительные ресурсы. Там соотношение останется примерно 15: 1 в зависимости от машинного времени и результирующего объема данных. Таким образом, если вы можете создать 1000 экзомов, такое же количество секвенирующих машин может произвести только 67 полных геномов. Если вы действительно хотите собрать 1000 образцов с использованием WGS за те же сроки, что и подход WES, вам потребуется в 15 раз больше машин для секвенирования. Это огромные затраты на капитальные затраты, лабораторные площади и так далее. После инструментов секвенирования объем данных, сгенерированных для WES, также составляет 1/15 объема по сравнению с WGS; таким образом, сетевая и вычислительная инфраструктура значительно упрощается.Уже по этой причине WES может быть привлекательной на долгие годы.

Возможно, срок годности наступит, когда любой, кто хочет или нуждается в секвенировании своего генома, сможет отправить буккальный мазок для WGS за 1000 долларов и получить учетную запись облачных вычислений со своей полной последовательностью. Но даже в этом сценарии ежемесячная стоимость учетной записи с WGS по сравнению с WES, если основываться на объеме данных, будет в 15 раз дороже для WGS, чем для набора данных WES.

KVS

Да, как только разница в стоимости между экзомом и целым геномом уменьшится (что будет в ближайшее время) и будут решены проблемы с управлением и хранением данных, методом выбора будет секвенирование всего генома.Кроме того, в ближайшие несколько лет будет происходить быстрое развитие технологии секвенирования, что приведет к способности секвенировать геном с высоким охватом за очень короткий период времени (несколько дней и, возможно, часы). Когда это станет реальностью, спрос на метод секвенирования экзома будет невелик.

Идентификация мутаций при дистрофиях сетчатки, вызывающих новые и рецидивирующие заболевания, с помощью секвенирования всего экзома (WES): преимущества и ограничения

Abstract

Унаследованные дистрофии сетчатки (IRD) — это менделевские заболевания с огромной генетической и фенотипической гетерогенностью.Поэтому идентификация генетической основы этих дистрофий является сложной задачей. В этом исследовании мы использовали полное секвенирование экзома (WES) в 11 семьях с IRD и идентифицировали варианты, вызывающие заболевание, в 8 из них. Анализ последовательности около 250 IRD-ассоциированных генов выявил 3 ранее описанных связанных с заболеванием варианта в RHO , BEST1 и RP1 . Далее мы идентифицировали 5 новых патогенных вариантов в RPGRIP1 (p.Ser964Profs * 37), PRPF8 (p.Tyr2334Leufs * 51), CDHR1 (p.Pro133Arg и c.439-17G> A) и PRPF31 (p.Glu183_Met193dup). Помимо подтверждения эффективности WES в генетической диагностике IRD, мы документируем проблемы анализа данных и показываем случаи, когда WES упускал из виду основные генетические причины IRD и требовал дополнительных методов. Например, мутация c.439-17G> A в CDHR1 будет оценена как маловероятная при использовании стандартного анализа WES. Только анализ транскриптов в фибробластах пациентов подтвердил патогенную природу этого варианта, который влияет на сплайсинг CDHR1 путем активации скрытого акцепторного сайта сплайсинга.В другом примере дупликация из 33 пар оснований в PRPF31 , пропущенная WES, может быть идентифицирована только с помощью целевого анализа с помощью секвенирования по Сэнгеру. Мы обсуждаем преимущества и проблемы использования WES для выявления мутаций при гетерогенных заболеваниях, таких как IRD.

Образец цитирования: Tiwari A, Lemke J, Altmueller J, Thiele H, Glaus E, Fleischhauer J, et al. (2016) Выявление новых и рецидивирующих мутаций, вызывающих заболевание, при дистрофиях сетчатки с использованием секвенирования всего экзома (WES): преимущества и ограничения.PLoS ONE 11 (7): e0158692. https://doi.org/10.1371/journal.pone.0158692

Редактор: Дрор Шарон, Медицинский центр Хадасса-Еврейского университета, ИЗРАИЛЬ

Поступила: 7 апреля 2016 г .; Одобрена: 20 июня 2016 г .; Опубликован: 8 июля 2016 г.

Авторские права: © 2016 Tiwari et al. Это статья в открытом доступе, распространяемая в соответствии с условиями лицензии Creative Commons Attribution License, которая разрешает неограниченное использование, распространение и воспроизведение на любом носителе при условии указания автора и источника.

Доступность данных: Все научные данные, которые помогают в понимании статьи, такие как секвенирование по Сэнгеру, родословная задействованного семейства, конвейеры секвенирования и вариантной фильтрации, представлены в документе и его вспомогательных информационных файлах. В соответствии с законами о конфиденциальности пациентов личная информация пациента и членов его семьи, такая как имя, адрес, дата рождения, идентификатор пациента и т. Д., Не будет разглашаться. Эта информация никоим образом не добавляет, не умаляет научного содержания статьи и не препятствует ее полному пониманию.

Финансирование: Это исследование финансировалось за счет гранта Швейцарского национального научного фонда (номер гранта: 320030_138507) для Всемирного банка и JN и от Velux Stiftung, Швейцария, для Всемирного банка. Финансирующие организации не играли никакой роли в дизайне исследования, сборе и анализе данных, принятии решения о публикации или подготовке рукописи.

Конкурирующие интересы: Авторы заявили об отсутствии конкурирующих интересов.

Введение

Унаследованные дистрофии сетчатки (IRD) представляют собой группу редких, но весьма гетерогенных генетических нарушений, характеризующихся аномальной функцией или дегенерацией определенных типов клеток сетчатки, например, фоторецепторов.Следовательно, пострадавшие люди испытывают частичную или полную потерю зрения. Эти заболевания неоднородны не только с точки зрения возраста начала, тяжести и прогрессирования заболевания, но и с точки зрения лежащей в их основе генетики [1]. В настоящее время существует около 250 генов, мутации в которых, как сообщается, вызывают различные формы дистрофий сетчатки. Эти мутации могут передаваться по аутосомно-рецессивному, доминантному или Х-сцепленному типу. Основываясь на клетках, которые поражаются первыми во время прогрессирования заболевания, эти заболевания также классифицируются как палочко-доминантные (например.грамм. пигментный ретинит, RP) или с доминированием конуса (например, дистрофия шишки-палочки, CORD). Более того, было показано, что мутации в одном и том же гене приводят к изменчивым фенотипам, что усложняет уже существующую ситуацию.

Секвенирование всего экзома (WES) — эффективный метод выявления мутаций, вызывающих заболевание, особенно для моногенных наследственных заболеваний, таких как IRD [2–4]. Несмотря на то, что WES является быстрым и точным, он не может идентифицировать мутации, вызывающие заболевание, почти в 35% случаев (Tiwari et al, неопубликованные данные).Возможные причины включают (i) варианты в генах, еще не связанных с заболеванием, (ii) варианты, которые лежат в глубоких интронных областях и, следовательно, не учитываются методами захвата экзома, или (iii) ограничения используемого метода, которые препятствуют эффективной идентификации последовательности. переделки. Дополнительные методы, например Картирование аутозиготности или секвенирование всего генома можно рассматривать для облегчения идентификации генетических изменений, связанных с заболеванием.

Общие диагностические подходы, применяемые в большинстве генетических лабораторий, включают секвенирование по Сэнгеру наиболее часто ассоциированных с заболеванием генов с последующим секвенированием панелей или всего экзома.В этом исследовании большинство случаев было сначала проверено секвенированием по Сэнгеру на предмет вариантов в наиболее вероятных генах-кандидатах. Затем они были подвергнуты секвенированию всего экзома. Первоначальный анализ был направлен на выявление вариантов в пределах 250 генов, связанных с различными формами дистрофий сетчатки. Также были привлечены дополнительные члены семьи для выполнения анализа сегрегации мутации с фенотипом заболевания. Мы представляем примеры случаев, которые подчеркивают проблемы и ограничения анализа данных WES, которые могут иметь значение для процедур, используемых для выявления мутаций в генной диагностике и исследовательских проектах.

Материалы и методы

Заявление об этике

Исследование было проведено в соответствии с Хельсинкской декларацией и согласно утвержденным протоколам в Цюрихском университете в соответствии с рекомендациями Swissmedic. Разрешение на генетическое тестирование в рамках этого исследования было предоставлено Институту медицинской молекулярной генетики Федеральным управлением общественного здравоохранения (FOPH) в Швейцарии.

Пациенты и семьи

Пациенты и члены их семей были направлены к нам для генетического тестирования из разных офтальмологических клиник.Все пациенты или члены их семей, а также родители пострадавших детей дали письменное информированное согласие на генетическое тестирование. Родословные были составлены с использованием программного обеспечения PED6 (http://www.medgen.de/ped/index.html). Информация о семейном анамнезе, жалобах на зрение и наследовании заболеваний была собрана с помощью стандартного офтальмологического обследования. В это исследование были включены все члены семьи с 5-значным идентификатором пациента, представленные в родословных. Члены семьи, не отмеченные 5-значным идентификатором, не участвовали в этом исследовании, и образцы не анализировались.

Извлечение ДНК

Венозную кровь, взятую у пациентов, использовали для выделения геномной ДНК в двух экземплярах с использованием технологии магнитных шариков с покрытием в соответствии с рекомендациями производителя (PerkinElmer Chemagen Technologie GmbH, Baesweiler, Германия). Целостность ДНК проверяли с помощью Nanodrop (Life technologies, Дармштадт, Германия).

Анализ секвенирования всего экзома (WES)

WES было выполнено в Кельнском центре геномики Кельнского университета с использованием библиотеки экзома человека NimbleGen SeqCap EZ (Roche NimbleGen Inc., Мэдисон, Висконсин) для подготовки библиотеки. Секвенирование 100nt парных концов выполняли на Illumina HiSeq2000. Выравнивание считываний последовательностей, индексация эталонного генома, вызов вариантов и аннотация были достигнуты с использованием конвейера, основанного на BWA [5], Samtools [6], Picard (http://broadinstitute.github.io/picard/) и Annovar [ 7] соответственно. Варианты аннотировали с помощью Alamut-HT (Interactive Biosoftware, Руан, Франция) и визуализировали в Alamut Viewer 2.2 (Interactive Biosoftware, Руан, Франция). Был создан конвейер фильтрации для удаления известных и часто встречающихся SNP или доброкачественных полиморфизмов.Были отобраны варианты с частотой менее 1% в популяции. Варианты, которые были описаны в литературе и базе данных мутаций генов человека (HGMD) как связанные с заболеванием, получили более высокий приоритет. Среди вариантов типов мутации с укорочением белка, ведущие к потере функции, такие как бессмысленные мутации или мутации сдвига рамки считывания, получили более высокий приоритет. Патогенность миссенс-вариантов проверялась пятью алгоритмами предсказания белков SIFT [8], PolyPhen2 [9], MutationTaster2 [10], MAPP [11] и Align GVGD [12, 13].

Дизайн праймера, ПЦР-амплификация и секвенирование по Сэнгеру

Наиболее вероятные варианты, вызывающие заболевание, были подтверждены секвенированием по Сэнгеру у пациента и доступных членов семьи. Праймеры были сконструированы с использованием алгоритма Primer3 [14] и приобретены в Microsynth AG (Балгач, Швейцария). Все целевые области были амплифицированы в двух экземплярах из геномной ДНК пациентов и доступных членов семьи с использованием ДНК-полимеразы Hot FirePol ® (Solis BioDyne, Тарту, Эстония).Продукты ПЦР очищали путем обработки их реагентом ExoSAP (Affymetrix, Санта-Клара, Калифорния) и секвенировали с помощью набора для секвенирования Big Dye Terminator Cycle v1.1 (Applied Biosystems, Карлсбад, Калифорния, США) и генетического анализатора ABI Prism 3730 (Applied Biosystems). , Карлсбад, Калифорния, США). Анализ данных секвенирования по Сэнгеру выполняли с использованием программного обеспечения Sequencing Analysis Software v5.4, SeqScape v2.6 (Applied Biosystems, Карлсбад, Калифорния, США), MutationSurveyorV5.0.0 (Soft Genetics, Пенсильвания, США) и Chromas (Technelysium, Южный Брисбен, Австралия). ) для определения вероятных мутаций, вызывающих заболевание.Мутация определяется, как описано ранее [15].

Клеточные культуры и анализ сплайсинга

Полученные пациентом фибробласты были созданы, как описано ранее [16, 17]. Клетки культивировали в среде MEM, замещенной 10% фетальной телячьей сывороткой, 1,3% L-глутамином, 0,8% раствором антибиотика и антимикотика, и инкубировали при 37 ° C и 5% CO 2 . 80% конфлюэнтных клеток обрабатывали 100 мкг / мл циклогексимида и инкубировали в течение 4 часов, после чего клетки собирали и общую РНК экстрагировали с использованием мини-набора Qiagen RNeasy (Hombrechtikon, Швейцария).кДНК получали из общей РНК путем обратной транскрипции со случайными праймерами в соответствии с инструкциями производителя (Supercript III, Invitrogen, Базель, Швейцария). Праймеры, перекрывающие интронную область (интрон 5 гена CDHR1 ), были сконструированы для амплификации конкретного продукта в случае активации скрытого сайта сплайсинга в клеточной линии пациента. Была проведена реакция RT-PCR, и продукты PCR были проанализированы на агарозном геле. Продукты ОТ-ПЦР проверяли секвенированием.

Расчет конструкций

Структурное моделирование CDHR1 (эталонная последовательность NP_149091.1), PRPF31 (эталонная последовательность NP_056444.3) и соответствующие последовательности мутантного белка были выполнены на сервере iTasser [18]. Визуализацию сгенерированных структур и их выравнивание выполняли с помощью PyMol (The PyMOL Molecular Graphics System, Version 1.8 Schrödinger, LLC).

Результаты

Из 11 случаев с диагнозом RP или CORD мы выявили предполагаемые варианты, связанные с заболеванием, в 8 случаях. Клинические фенотипы пациентов, описания вариантов и прогнозы патогенности этих вариаций последовательности показаны в таблице 1.

Все идентифицированные варианты, описанные в этом исследовании (кроме вариантов RP1 и BEST1 ), отсутствовали в собственной базе данных из 130 экзомов (260 аллелей). RP1 Вариант (NM_006269.1: c.2613dup) был идентифицирован в четырех дополнительных семьях с диагнозом пигментный ретинит. BEST1 вариант (NM_001139443.1: c.242G> A) был гетерозиготным у человека, о котором не известно, что он страдает заболеванием сетчатки (частота аллелей = 0,38% в нашей внутренней базе данных).

WES анализирует

ID случая 27485 (RP, аутосомно-доминантный): индексный пациент — 63-летний пациент мужского пола с диагнозом RP. В семье был аутосомно-доминантный тип наследования, и сын основного пациента также пострадал. Мы идентифицировали гетерозиготную миссенс-мутацию в RHO : NM_000539.3: c.170T> G: p.Leu57Arg (рис. 1a и 1b). Эта мутация была ранее описана [19] (HGMD_PRO = CM063096) и совпадает с заболеванием в семье.Четыре алгоритма предсказания белка предсказывают, что мутация повреждает (таблица 1) и находится в трансмембранном домене.

Рис. 1. Родословные пациентов и последовательная хроматография идентифицированных вариантов, связанных с заболеванием.

Затронутые лица обозначены закрашенными символами, а незатронутые люди обозначены открытыми символами. Индексные пациенты указаны стрелкой и были подвергнуты WES. Варианты обозначены как M1, M2, M3 и M4, а зиготность вариантов указывается в третьих скобках под каждым анализируемым членом семейства.Последовательные хроматографические изображения пациентов и репрезентативных членов семей показаны под эталонной последовательностью. Положение мутации на хроматографе обозначено звездочкой. (a) Семейная родословная пациента 27485. (b) Последовательная хроматография идентифицированного гетерозиготного варианта RHO у пациента (внизу) и здоровой дочери (вверху). (c) Семейная родословная пациента 23880. (d) Последовательная хроматография идентифицированного гетерозиготного варианта PRPF8 у пациента (внизу) и здорового отца (вверху). (e) Семейная родословная пациента 27536. (f) Последовательная хроматография идентифицированного гомозиготного варианта RPGRIP1 у пациента (внизу), гетерозиготной здоровой матери (в центре) и незатронутой сестры (вверху). (g) Семейная родословная пациента 24718. (h) Последовательная хроматография идентифицированного гомозиготного варианта BEST1 у пациента (внизу), незатронутого гетерозиготного отца (в центре) и незатронутой сестры (вверху).

https: // doi.org / 10.1371 / journal.pone.0158692.g001

Идентификационный номер случая 23880 (RP, аутосомно-доминантный): индексный пациент — 35-летний мужчина с больным братом или сестрой. Его мать также пострадала от RP, но не его отец. Были и другие затронутые члены в материнской ветви семьи, что явно указывает на аутосомно-доминантный тип наследования. Новая гетерозиготная дупликация со сдвигом рамки считывания была идентифицирована в PRPF8 в предпоследнем кодоне: NM_006445.3: c.7000dupA: p.Tyr2334 * (рис. 1c и 1d).Этот вариант был выявлен у всех пораженных членов семьи (пациента, его сестры и отца). Незараженные члены семьи не переносили этот вариант.

Идентификационный номер случая 27536 (RP, аутосомно-рецессивный; дифференциальный диагноз: врожденный амавроз Лебера, LCA). Пациентка — 32-летняя женщина от единокровных родителей, не страдающих заболеванием. У нее одна больная и одна здоровая сестра. Новая гомозиготная делеция сдвига рамки считывания была идентифицирована в экзоне 17 (из 24 экзонов) RPGRIP1 у пациента и пораженной сестры: NM_020366.3: c.2890delT: p.Ser964Profs * 37 (рис. 1e и 1f). Эта мутация приводит к сдвигу рамки считывания и преждевременным триплетам стоп-кодона 37 после мутации. Вызов варианта NGS первоначально предполагал гетерозиготную мутацию в RPGRIP1 . Мутация была исключена у здоровой сестры и матери. Образцы от отца пациента не были доступны, но можно предположить, что он, как и мать, также является носителем этой мутации.

Идентификационный номер случая 24718 (конусно-стержневая дистрофия, аутосомно-рецессивный): Гомозиготная миссенс-мутация в BEST1 была идентифицирована у пораженного индексного пациента (24718) и его пораженного брата (24719): NM_001139443.1: c.242G> A: p.Arg81His. Они унаследовали по одному мутантному аллелю от каждого родителя; оба гетерозиготных носителя мутации (рис. 1g и 1h). Все остальные члены семьи не подвержены влиянию и не проявляют никаких проявлений, связанных с бестрофином. Они являются либо гетерозиготными носителями (28218, 28549, 24990 и 24989), либо не носителями (28197 и 28177) мутации. Ранее сообщалось, что эта мутация вызывает заболевание [20–22] (HGMD_PRO = CM001382). Предполагается, что он будет вредным (SIFT), вероятно, повреждающим (оценка Polyphen2 = 1.0) и вызывающие болезни (MutationTaster2).

Идентификационный номер случая 26165 (RP, аутосомно-доминантный): индексный пациент — женщина 54 лет с двумя больными братьями, 3 здоровыми братьями и сестрами, больным отцом и здоровой матерью. Родословная указывает на аутосомно-доминантный тип наследования (рис. 2а). Гетерозиготная вставка со сдвигом рамки считывания была обнаружена в экзоне 4 в RP1 (последний экзон): NM_006269.1: c.2613dup: p.Arg872Thrfs * 2 (рис. 2b). Этот сдвиг рамки считывания приводит к преждевременному стоп-кодону, на 2 триплета ниже мутации.Мутация совмещена с заболеванием внутри семьи (рис. 2а). Ранее он был описан как связанный с заболеванием [23] (HGMD_PRO = CI004598). Мутация отсутствовала в этнически подобранной контрольной когорте, представляющей 576 аутосомных аллелей.

Рис. 2. Родословные пациентов и последовательная хроматография идентифицированных вариантов, связанных с заболеванием.

Варианты обозначены как M5. (a) Семейная родословная пациента 26165. (b) Последовательная хроматография идентифицированного гетерозиготного варианта RP1 у пациента (внизу) и здоровой сестры (вверху). (c) Семейная родословная пациента 25900. (d) Последовательная хроматография идентифицированного гетерозиготного варианта RP1 у пациента (внизу), у здоровой сестры, несущей этот вариант (в центре), и у здоровой матери (вверху). β: Известный полиморфизм в положении c.2618 в гене RP1 с частотой 26,98% у европейцев (Источник: Exome Aggregation Consortium).

https://doi.org/10.1371/journal.pone.0158692.g002

Идентификатор случая 25900 (RP, аутосомно-доминантный): индексный пациент — 47-летняя женщина с больным отцом.Ее мать и двое братьев и сестер не пострадали (рис. 2c). Такая же вставка со сдвигом рамки кадра в RP1 , как описано выше, была обнаружена у пациента и пострадавшего отца: NM_006269.1: c.2613dup: p.Arg872Thrfs * 2. Мутация также была идентифицирована у двух дополнительных членов этого семейства (28223 и 28109), у которых не было никаких симптомов заболевания при первом клиническом обследовании в возрасте 37 и 40 лет соответственно (рис. 2c и 2d).

ID случая 26007 (RP, аутосомно-рецессивный): Пациент — 59-летняя женщина, с клиническим диагнозом RP.Ее родители не пострадали (рис. 3а). Мы обнаружили новые сложные гетерозиготные мутации в CDHR1 , кодирующем родственного кадгерину члена семейства 1, в ДНК пациента. Она унаследовала по одному мутантному аллелю от каждого родителя (рис. 3b и 3c). (i) NM_033100.2: c.398C> G: p.Pro133Arg (Missense) был передан по материнской линии. Это приводит к замене высококонсервативного пролина на аргинин (S1 фиг., красный прямоугольник ). Предполагается, что это опасно (SIFT) и вызывает болезни (MutationTaster2).Структурное предсказание с использованием iTasser показало, что этот миссенс-вариант приводит к созданию короткого бета-листа в мутантном белке, который лежит в первом кадгериновом домене CDHR1 (рис. 3d и 3e). (ii) NM_033100.2: c.439-17G> A была унаследована от ее отца. Этот вариант расположен на 17 оснований выше экзона 6 и, по прогнозам, генерирует криптический акцепторный сайт сплайсинга в интроне 5 (фиг. 4, , зеленый прямоугольник ). Значения предсказания нового акцептора сплайсинга с использованием пяти различных алгоритмов предсказания сплайсинга (подобные SpliceSite Finder, MaxEntScan, NNSPLICE, GeneSplicer и Human Splicing Finder) сопоставимы с таковыми для канонического акцепторного сайта сплайсинга, начиная с консервативного акцептора сплайсинга экзона 6 ( Рис 4 вставка: синий прямоугольник , таблица 2).Кажется вероятным, что этот новый акцепторный сайт сплайсинга используется аппаратом сплайсинга в дополнение к каноническому сайту. Это приводит к удлинению экзона на 15 п.н. и генерированию стоп-кодона из 3 пар оснований ниже криптического акцепторного сайта сплайсинга (рис. 4, красный прямоугольник ). Оба варианта отсутствовали в этнически подобранной контрольной когорте из 576 аллелей.

Рис. 3. Родословные пациентов и последовательная хроматография идентифицированных вариантов, связанных с заболеванием.

Варианты обозначены как M6, M7 и M8. (a) Семейная родословная пациента 26007. (b) Последовательная хроматография гетерозиготного CDHR1 варианта c.398C> G у пациента (внизу), матери-носителя (в центре) и отца (вверху). (c) Последовательная хроматография гетерозиготного CDHR1 варианта c.439-17G> A у пациента (внизу), матери (в центре) и отца-носителя (вверху). (d) Предсказанная структура эталонного белка CDHR1 (синим цветом), выровненная с мутантным CDHR1 (p.Pro133Arg) (оранжевым цветом).Мутация показана пурпурными сферами и локализована в первом кадгериновом домене (белый прямоугольник). (e) Увеличенное изображение первого домена кадгерина CDHR1 показывает дополнительный бета-лист (белая стрелка), близкий к мутации (f) Родословная семьи пациента 23530. (g) Изображение геля агарозы PRPF31 ПЦР экзона 7 показывает большую полосу только у пораженных членов, что указывает на дупликацию. C = Контроль воды в ПЦР. (h) Сравнение предсказанных моделей последовательности эталонного белка PRPF31 (i и v, зеленые), мутантного PRPF31 (ii и vi, пурпурный), выравнивание эталонного и мутантного PRPF31 (iii и viii) и увеличенное изображение выравнивание по сайту мутации (iv и viii).Дополнительный виток мутанта в домене coiled-coil показан белым цветом. Первая аминокислота дупликации 11 п.н. показана белой стрелкой. «N» обозначает N-конец белка.

https://doi.org/10.1371/journal.pone.0158692.g003

Рис. 4. CDHR1 интронный вариант.

Снимок визуального изображения Аламута, показывающий интронный вариант (c.439-17G> A) у пациента 26007 (зеленый прямоугольник). Файл выравнивания bam ясно показывает гетерозиготный вариант 17bp выше экзона 6.Врезка: снимок алгоритмов прогнозирования сращивания ( in silico ) показывает сильное загадочное усиление акцептора сращивания в месте варианта (синий прямоугольник). Значения сопоставимы со значением канонического акцепторного сайта сплайсинга. Красный прямоугольник показывает стоп-кодон в рамке для скрытого сайта активатора сплайсинга.

https://doi.org/10.1371/journal.pone.0158692.g004

Поскольку за сайтом сплайсинга следует стоп-кодон, мы предположили, что на мутантный транскрипт может влиять нонсенс-опосредованный распад мРНК.Чтобы проверить эту гипотезу, мы обработали фибробласты, полученные из биопсии кожи пациента, по сравнению с контрольными фибробластами (не несущими эти мутации в CDHR1 ) циклогексимидом и ДМСО в качестве контроля. Впоследствии мы выделили общую РНК из этих клеточных линий и выполнили ОТ-ПЦР. После гель-электрофореза мы идентифицировали аберрантный продукт ОТ-ПЦР (рис. 5b, белая звездочка) в клеточной линии пациента, обработанной циклогексимидом. Ожидаемый размер этого продукта был 140 п.п. Продукт не амплифицировался в контрольной клеточной линии после обработки ДМСО или циклогексимидом, а также в клеточной линии пациента, обработанной ДМСО (фиг. 5b).После секвенирования этого продукта ПЦР мы подтвердили, что у этого пациента произошла предполагаемая активация сайта сплайсинга. Он включал вставку 15 п.н. из интрона 5 CDHR1 , что соответствует предсказанной криптической активации сплайсинга, происходящей из-за мутации c.439-17G> A (фиг. 5c и вставка 4 ).

Рис. 5. Анализ альтернативного сплайсинга in vitro .

(a) Дизайн праймера для фиксации предполагаемого удерживания интрона из-за варианта c.439-17G> A в CDHR1 . (b) Электрофорез в агарозном геле для ОТ-ПЦР, показывающий продукт ПЦР размером 140 пар оснований только в клеточной линии пациента (белая звездочка). Никаких продуктов не было обнаружено ни в контрольной клеточной линии, ни в контроле воды. (c) Внизу: хроматографическая последовательность показывает четкое удерживание 15 п.н. от интрона 5 в продукте ОТ-ПЦР, образованное из-за активации скрытого сайта сплайсинга. Вверху: Схема, представляющая границы экзон-интрон, наблюдаемые в продукте ОТ-ПЦР.

https://doi.org/10.1371 / journal.pone.0158692.g005

ID случая 23530 (RP, аутосомно-доминантный): индексный пациент — 43-летний мужчина с больным братом-близнецом, вторым больным братом, здоровой сестрой и здоровой матерью (рис. 3е). Сообщается, что отец пострадал. Среди известных генов RP не было выявлено мутации, объясняющей заболевание, с использованием WES у этого пациента. Однако при скрининге генов-кандидатов с помощью секвенирования по Сэнгеру была обнаружена новая дупликация из 33 пар оснований в гене PRPF31 (NM_015629.3: c.548_580dup: p.Glu183_Met193dup), который совпадает с заболеванием в семье. Дупликация наблюдалась только у пораженных членов семьи, что видно по более крупному продукту ПЦР на агарозном геле (рис. 3g). Структурный анализ мутантного белка PRPF31, согласованного со структурой эталонного белка, предсказывает генерацию дополнительного витка из-за этой дупликации из 11 аминокислот во втором спиральном домене альфа-спирали белка PRPF31 (рис. 3h). Модель с наивысшей степенью достоверности (c-score) предсказала, что дополнительный поворот был продолжением существующей альфа-спирали (рис. 3hi – 3hiv).Вторая модель предполагает, что этот дополнительный виток спирали выходит из домена спиральной катушки (Рис. 3hv – 3hviii). В обеих моделях предполагается, что мутация приведет к потере N-концевой альфа-спирали (рис. 3h, обозначенный буквой N зеленого цвета для эталонного PRPF31 и пурпурного цвета для мутантного PRPF31).

В трех семьях (одна с предполагаемым доминантным типом наследования и два потенциально рецессивных случая) мы не смогли обнаружить мутации в генах, в настоящее время связанных с IRD, которые могли бы объяснить фенотип заболевания на основе предполагаемого способа наследования (рис. ).Эти случаи в настоящее время исследуются для выявления новых мутаций генов, связанных с заболеванием.

Рис. 6. Родословные семей, в которых основные генетические мутации не были идентифицированы.

(a) Семейная родословная пациента 22538 с диагнозом CORD. (б) Семейная родословная пациента 26309 с диагнозом РПЖ. (c) Семейная родословная пациента 23609 с диагнозом CORD.

https://doi.org/10.1371/journal.pone.0158692.g006

Обсуждение

IRD демонстрируют необычайную генетическую и фенотипическую гетерогенность.Эти заболевания сетчатки в настоящее время связаны с мутациями более чем 250 генов. С появлением секвенирования следующего поколения (NGS) идентификация генетической основы IRD произвела революцию. Генетическая диагностика с помощью секвенирования панелей или всего экзома оказалась надежным и быстрым методом с зарегистрированной диагностической эффективностью между 50–65% [15, 24–27] (Tiwari et al, неопубликованные данные). Хотя это число выше по сравнению с обычным секвенированием по Сэнгеру и подходами к генам-кандидатам, значительный процент случаев все еще остается невыявленным.Эти недиагностированные пациенты реже встречаются для синдромных случаев [15] и в случаях в кровнородственных популяциях, где анализ мутаций на основе аутозиготности в сочетании с WES / NGS показал более высокую диагностическую эффективность [28, 29]. Мы использовали хорошо зарекомендовавший себя метод скрининга образцов пациентов на наличие мутаций в наиболее вероятных генах-кандидатах и ​​подтвердили идентифицированные варианты у дополнительных членов семьи с помощью анализа сегрегации. Некоторых пациентов предварительно обследовали на наличие мутаций в вероятных генах-кандидатах ( RHO , PRPh3 , RP2 , RPGR , CRX , NRL) с использованием секвенирования по Сэнгеру.В этом исследовании, в котором участвовала одна кровно-кровная семья, мы смогли выявить варианты, вызывающие болезнь, в 7 из 11 случаев с помощью WES. Связанный с заболеванием вариант в дополнительном случае был идентифицирован только секвенированием по Сэнгеру. Наша когорта состояла из 8 случаев RP и 3 случаев CORD, семь и один из которых показали положительные результаты в этом исследовании, соответственно. Мы идентифицировали 3 ранее описанные мутации в 4 семьях и 5 новых вариантов в 4 семьях. Типы вариантов включали 3 сдвига рамки считывания, 3 миссенс-мутации и 1 сплайс-мутацию, а также 1 дупликацию 33 п.н.

Несмотря на то, что это привело к более высокому уровню успешности диагностики, при анализе данных NGS требуется осторожность, особенно при заболеваниях с значительной генетической гетерогенностью, таких как IRD. Идентификация вариантов, связанных с заболеванием, иногда очень проста, как в случае 27485 (рис. 1a), где известная миссенс-мутация в RHO была идентифицирована у пораженных членов семьи. Мутации в RHO составляют большинство случаев аутосомно-доминантного RP. Это может быть немного сложнее, если в гене выявлено очень мало мутаций.Например, в случае 23880 (рис. 1c), в котором была идентифицирована новая дупликация одного нуклеотида в предпоследнем кодоне PRPF8 . Мутации в PRPF8 являются одной из наименее частых причин доминантного RP, и, следовательно, этот ген с меньшей вероятностью будет подвергаться скринингу с помощью секвенирования по Сэнгеру в рамках традиционного диагностического лабораторного скрининга. Аминокислоты 2301–2335 на C-конце PRPF8, как известно, взаимодействуют с EFTUD2 и SNRNP200 [30–32], и было показано, что многие мутации, приводящие к RP, группируются в C-концевом домене PRPF8 [30, 33].Предполагается, что неэффективная репрессия SNRNP200 из-за мутаций на C-конце PRPF8 связана с PRPF8-связанным RP [34]. Нонсенс-мутация p.Tyr2334 * в PRPF8 у пациента 23880 генерирует кодон преждевременной терминации в белке. Однако, поскольку она находится в составе предпоследней аминокислоты, потерю функции нельзя объяснить бессмысленным распадом. Скорее всего, это приводит к неэффективному подавлению функции SNRNP200 или потере взаимодействия с EFTUD2 или SNRNP200.

Если используется панельный подход, анализ ограничивается генами, связанными с конкретным заболеванием.Например, в случае 27536 (рис. 1e) первичным клиническим диагнозом была RP с дифференциальным клиническим диагнозом врожденный амавроз Лебера (LCA). Панель RP обычно исключает RPGRIP1 , потому что большинство мутаций, описанных в RPGRIP1 , были связаны с LCA (n = 77, источник: HGMD), а очень немногие — с RP (n = 4, источник: HGMD), что привело к неудачной генетической диагностике. В этом случае мы идентифицировали новую делецию со сдвигом рамки считывания у всех затронутых членов семьи в экзоне 17 (из 24) RPGRIP1 (стр.Ser964Profs * 37), что приводит к триплетам преждевременного терминирующего кодона 37 ниже мутации и, скорее всего, приводит к несмысловому распаду транскрипта. Ретроспективно дифференциальный диагноз LCA может более точно описать клинический фенотип у этого пациента. Точно так же в случае 24718 CORD возникает из-за ранее описанной гомозиготной миссенс-мутации в BEST1 (p.Arg81His) [20]. Хотя большинство мутаций BEST1 наследуются доминантно, мутации BEST1 связаны как с рецессивными, так и с доминантными формами макулярной дистрофии Беста [35]. BEST1 не является наиболее вероятным кандидатом для CORD, и поэтому BEST1 будет исключен из типичной панели диагностических генов CORD. Функциональные исследования показали, что эта мутация приводит к снижению хлоридной проводимости и усилению протеасомной деградации белка BEST1 [21, 22, 36].

Конвейеры анализа и алгоритмы вызова вариантов постоянно улучшаются, поэтому вероятность неправильного вызова может создать проблемы при анализе. Например, в случае 27536 зиготность мутации RPGRIP1 c.2890delT был аннотирован как гетерозиготный, а не гомозиготный. Поскольку родители были кровнородственными и незатронутыми, мы ожидали, что в этом случае гомозиготный или составной гетерозиготный вариант (ы) будет причиной заболевания. Только после подробного повторного анализа этой специфической мутации мы определили, что последовательность включала 6 прочтений Т-аллеля и 49 делеций Т-аллеля, что свидетельствует об атипичном балансе аллелей (<20% референсного аллеля) в сочетании со смещением цепи Т -аллеле (S2 фиг.). После проверки Сэнгером мы могли подтвердить гомозиготность этой делеции.

Мутации гена

, которые могут быть либо рецессивно, либо доминантно унаследованы, либо проявлять неполную пенетрантность, особенно затрудняют точную интерпретацию генетических данных и результатов, например, RP1 . В семьях пациентов 26165 и 25900 была идентифицирована ранее описанная доминантно наследуемая дупликация сдвига рамки считывания в RP1 [23] (Fig 2a-2d). В семье пациента 26165 все пораженные члены были гетерозиготными по мутации, а незатронутые члены семьи не несли мутацию.Однако в семье пациента 25900 двое здоровых братьев и сестер (один брат и одна сестра) также были гетерозиготными по мутации (рис. 2c и 2d). Это может быть связано с неполной пенетрантностью, поскольку было показано, что доминантные мутации в RP1 обладают переменной экспрессией [37, 38]. Более поздний возраст начала заболевания у этих членов семьи также может объяснить это несоответствие. Следовательно, в этих случаях потребуется повторное клиническое обследование. Мы также идентифицировали эту мутацию в четырех дополнительных семьях с аутосомно-доминантным RP в нашей когорте (данные не показаны), что подтверждает патогенность варианта последовательности.

CDHR1 принадлежит к суперсемейству кадгеринов кальций-зависимых молекул клеточной адгезии. Он кодирует специфичный для фоторецепторов кадгерин, который играет роль в морфогенезе внешнего сегмента диска. Это может быть необходимо для структурной целостности внешнего сегмента фоторецепторных клеток и, как было показано, взаимодействует с PROM1 [39]. Мы идентифицировали сложные гетерозиготные мутации в трио, где индексный пациент был поражен RP (рис. 3a). Миссенс вариант в CDHR1 (Pro133Arg) влияет на высококонсервативную аминокислоту и локализуется в первом кадгериновом домене белка.Структурный анализ предсказал появление нового бета-листа в этом кадгериновом домене из-за миссенс-варианта. Кадгерины участвуют в кальций-зависимой межклеточной адгезии. Другая замена пролина была идентифицирована в конце пятого домена кадгерина у пациента с испанским RP [40]. Можно предположить, что мутация нарушает адгезионную роль кадгеринового домена в межклеточной адгезии. В качестве альтернативы он может опосредовать свою патогенность с помощью механизма, еще не описанного для CDHR1. Было предсказано, что вариант c.439-17G> A CDHR1 активирует криптический сайт активатора сплайсинга in silico .Эта активация была подтверждена с использованием фибробластов пациента в клеточной линии, полученной от пациента. Часто фокус идентификации мутации находится в кодирующих областях. Изменения сплайсинга, затрагивающие положения +/- 2 и +5 пар оснований вокруг экзонов, также имеют значение. Однако области заполнения также могут нести мутации, которые могут привести к альтернативному сплайсингу. Эти области сильно различаются между экзонами и зависят от используемого метода обогащения. Кроме того, варианты, расположенные на концах областей набивки, обычно демонстрируют смещение прядей и, таким образом, исключаются из многих конвейеров анализа.Следовательно, важно тщательно анализировать область «заполнения» захватывающих экзом последовательностей, чтобы не пропустить мутации, лежащие дальше от канонических акцепторных и донорных сайтов сплайсинга. Это также подчеркивает необходимость функциональных анализов для проверки прогнозируемых эффектов вариантов, например, миссенс-сайтов или изменений сайтов сплайсинга. В этом случае только анализ транскрипта клеточной линии, полученной от пациента, подтвердил дефект сплайсинга.

У пациента 23530 ни один из вариантов, идентифицированных при WES, не объясняет доминантный фенотип RP в семье.Мы включили ДНК пациентов в проект скрининга по Сэнгеру гена PRPF31 , мутации которого составляют второе по величине количество связанных с заболеванием мутаций в случаях аутосомно-доминантного RP. При секвенировании по Сэнгеру новая дупликация 33 п.н. была идентифицирована в PRPF31 у пациента и всех затронутых членов семьи. Этот случай иллюстрирует важное ограничение этого подхода NGS, при котором большая дупликация была упущена в данных WES, но могла быть идентифицирована только с помощью обычного секвенирования по Сэнгеру.Структурный анализ предсказывает генерацию дополнительного витка в альфа-спирали домена coiled-coil белка. Вероятно, мутация нарушает взаимодействие PRPF31 с PRPF6 [41]. Улучшенные алгоритмы биоинформатики для обнаружения дупликаций или делеций более 20 пар оснований могут помочь в идентификации таких мутаций. Однако такие специфические анализы обычно не используются, и поэтому важно рассмотреть возможность использования альтернативных методов анализа в случаях, когда генетический диагноз еще не установлен.

В заключение, наше исследование показывает силу WES в выявлении патогенных мутаций в IRD с вероятностью успеха 63%, но также и с его ограничениями. В каждом случае может быть несколько мутаций в разных генах, в дополнение к вариациям последовательности de-novo, которые могут не сочетаться с заболеванием [15]. Более того, мутации, расположенные внутри и за пределами захваченных экзонных областей, должны быть тщательно оценены на предмет влияния на сплайсинг или дополнительных регуляторных эффектов. Кроме того, дополнительный подход к WES может быть очень полезным для выявления мутаций, связанных с IRD, в случаях, когда генетический диагноз отсутствует.

Вспомогательная информация

S2 Рис. Скриншот Alamut для

RPGRIP1 вариант NM_020366.3: c.2890delT (p.Ser964Profs * 37).

Эта делеция 1bp, приводящая к сдвигу рамки считывания, была аннотирована как гетерозиготная. Значения прочтений на вставке показывают 49 делеций и 6 Т-аллелей (что показывает смещение цепи). Секвенирование по Сэнгеру подтвердило гомозиготность этой делеции.

https://doi.org/10.1371/journal.pone.0158692.s002

(TIF)

Благодарности

Авторы благодарят всех пациентов и членов их семей за участие.

Вклад авторов

Задумал и спроектировал эксперименты: AT JN WB. Проведены эксперименты: AT JA EG HT. Проанализированы данные: AT EG HT. Предоставленные реагенты / материалы / инструменты анализа: PN JN WB. Написал статью: AT JN WB. Собранные образцы от пациентов и членов их семей: JL JF JN WB. Выполнен клинический анализ пациентов: JF.

Ссылки

  1. 1. Berger W, Kloeckener-Gruissem B, Neidhardt J. Молекулярные основы заболеваний сетчатки и витреоретинала человека.Прогресс в исследованиях сетчатки и глаз. 2010. 29 (5): 335–75. pmid: 20362068.
  2. 2. Эллингфорд Дж. М., Бартон С., Бхаскар С., О’Салливан Дж., Уильямс С. Г., Лэмб Дж. А. и др. Молекулярные исследования 537 человек с наследственным заболеванием сетчатки. Журнал медицинской генетики. 2016. pmid: 27208204.
  3. 3. Кортон М., Нисигучи К.М., Авила-Фернандес А., Никопулос К., Ривейро-Альварес Р., Тату С.Д. и др. Секвенирование экзома индексных пациентов с дистрофиями сетчатки как инструмент молекулярной диагностики.ПлоС один. 2013; 8 (6): e65574. pmid: 23940504; PubMed Central PMCID: PMC3683009.
  4. 4. Хуан Л., Сяо Х, Ли С., Цзя Х, Ван П, Сунь В. и др. Молекулярная генетика дистрофии колбочек-стержней у китайских пациентов: новые данные от 61 пробанда и обзор мутаций 163 пробандов. Экспериментальное глазное исследование. 2016; 146: 252–8. pmid: 26992781.
  5. 5. Ли Х, Дурбин Р. Быстрое и точное согласование короткого чтения с преобразованием Барроуза-Уиллера. Биоинформатика. 2009. 25 (14): 1754–60. pmid: 19451168; PubMed Central PMCID: PMC2705234.
  6. 6. Ли Х, Хандакер Б., Вайсокер А., Феннелл Т., Руан Дж., Гомер Н. и др. Формат Sequence Alignment / Map и SAMtools. Биоинформатика. 2009. 25 (16): 2078–9. pmid: 19505943; PubMed Central PMCID: PMC2723002.
  7. 7. Ван К., Ли М., Хаконарсон Х. ANNOVAR: функциональная аннотация генетических вариантов на основе данных высокопроизводительного секвенирования. Исследование нуклеиновых кислот. 2010; 38 (16): e164. pmid: 20601685; PubMed Central PMCID: PMC2938201.
  8. 8. Кумар П., Хеникофф С., Нг ПК.Прогнозирование влияния кодирования несинонимичных вариантов на функцию белка с использованием алгоритма SIFT. Протоколы природы. 2009. 4 (7): 1073–81. pmid: 19561590.
  9. 9. Аджубей И.А., Шмидт С., Пешкин Л., Раменский В. Е., Герасимова А., Борк П. и др. Метод и сервер для предсказания повреждающих миссенс-мутаций. Природные методы. 2010. 7 (4): 248–9. pmid: 20354512; PubMed Central PMCID: PMC2855889.
  10. 10. Schwarz JM, Cooper DN, Schuelke M, Seelow D. MutationTaster2: предсказание мутации для возраста глубокого секвенирования.Природные методы. 2014; 11 (4): 361–2. pmid: 24681721.
  11. 11. Stone EA, Sidow A. Нарушение физико-химических ограничений миссенс-заменами опосредует нарушение функции белка и тяжесть заболевания. Геномные исследования. 2005. 15 (7): 978–86. pmid: 15965030; PubMed Central PMCID: PMC1172042.
  12. 12. Мате Э., Оливье М, Като С., Ишиока С., Эно П., Тавтиджан С.В. Вычислительные подходы к прогнозированию биологического эффекта миссенс-мутаций p53: сравнение трех методов, основанных на анализе последовательностей.Исследование нуклеиновых кислот. 2006. 34 (5): 1317–25. pmid: 16522644; PubMed Central PMCID: PMC13.
  13. 13. Тавтиджан С.В., Деффенбо А.М., Инь Л., Джудкинс Т., Шолл Т., Самоллоу П.Б. и др. Комплексное статистическое исследование 452 миссенс-замен BRCA1 с классификацией восьми повторяющихся замен как нейтральных. Журнал медицинской генетики. 2006. 43 (4): 295–305. pmid: 16014699; PubMed Central PMCID: PMC2563222.
  14. 14. Untergasser A, Cutcutache I, Koressaar T., Ye J, Faircloth BC, Remm M, et al.Primer3 — новые возможности и интерфейсы. Исследование нуклеиновых кислот. 2012; 40 (15): e115. pmid: 22730293; PubMed Central PMCID: PMC3424584.
  15. 15. Glockle N, Kohl S, Mohr J, Scheurenbrand T, Sprecher A, Weisschuh N и др. Секвенирование следующего поколения на основе панелей как надежный и эффективный метод обнаружения мутаций у невыбранных пациентов с дистрофиями сетчатки. Европейский журнал генетики человека: EJHG. 2014; 22 (1): 99–104. pmid: 235; PubMed Central PMCID: PMC3865404.
  16. 16.Глаус Э., Шмид Ф., Да Коста Р., Бергер В., Нейдхардт Дж. Генный терапевтический подход с использованием адаптированной к мутации U1 snRNA для исправления дефекта сплайсинга RPGR в клетках, полученных от пациента. Молекулярная терапия: журнал Американского общества генной терапии. 2011; 19 (5): 936–41. pmid: 21326217; PubMed Central PMCID: PMC3098652.
  17. 17. Виллегас Дж, Макфол М. Создание и культура фибробластов кожи человека. Современные протоколы в молекулярной биологии / под редакцией Фредерика М. Осубеля [и др.].2005; Глава 28: Блок 28 3. pmid: 18265368.
  18. 18. Рой А., Кучукурал А., Чжан Ю. I-TASSER: унифицированная платформа для автоматизированного прогнозирования структуры и функции белков. Протоколы природы. 2010. 5 (4): 725–38. pmid: 20360767; Идентификатор PubMed Central PMCID: PMCPMC2849174.
  19. 19. Салливан Л.С., Боун С.Дж., Берч Д.Г., Хьюбэнкс-Уитон Д., Хекенливли Дж. Р., Льюис Р.А. и др. Распространенность болезнетворных мутаций в семьях с аутосомно-доминантным пигментным ретинитом: скрининг известных генов в 200 семьях.Исследовательская офтальмология и визуализация. 2006. 47 (7): 3052–64. pmid: 16799052; PubMed Central PMCID: PMC2585061.
  20. 20. Крамер Ф., Уайт К., Паулейхофф Д., Гериг А., Пассмор Л., Ривера А. и др. Мутации в гене VMD2 связаны с ювенильным началом желточно-желточной дистрофии (болезнь Беста) и желточно-желточной дистрофией желтого пятна у взрослых, но не с возрастной дегенерацией желтого пятна. Европейский журнал генетики человека: EJHG. 2000. 8 (4): 286–92. pmid: 10854112.
  21. 21.Дэвидсон А.Е., Миллар И.Д., Берджесс-Муллан Р., Махер Дж. Дж., Уркхарт Дж. Э., Браун П.Д. и др. Функциональная характеристика миссенс-мутаций бестрофина-1, связанных с аутосомно-рецессивной бестрофинопатией. Исследовательская офтальмология и визуализация. 2011. 52 (6): 3730–6. pmid: 21330666.
  22. 22. Джонсон А.А., Бахман Л.А., Жиль Б.Дж., Кросс С.Д., Стелциг К.Э., Реш З.Т. и др. Аутосомно-рецессивная бестрофинопатия не связана с потерей функции анионного канала бестрофина-1 у пациента с новой мутацией BEST1.Исследовательская офтальмология и визуализация. 2015; 56 (8): 4619–30. pmid: 26200502; Идентификатор PubMed Central PMCID: PMCPMC4515977.
  23. 23. Пейн А., Витана Е., Халик С., Хамид А., Деллер Дж., Абу-Сафие Л. и др. Мутации, усекающие белок RP1, преобладают в локусе adRP RP1. Исследовательская офтальмология и визуализация. 2000. 41 (13): 4069–73. pmid: 11095597.
  24. 24. Consugar MB, Navarro-Gomez D, Place EM, Bujakowska KM, Sousa ME, Fonseca-Kelly ZD, et al. Панельное генетическое диагностическое тестирование наследственных заболеваний глаз является очень точным и воспроизводимым, а также более чувствительным для выявления вариантов, чем секвенирование экзома.Генетика в медицине: официальный журнал Американского колледжа медицинской генетики. 2015. 17 (4): 253–61. pmid: 25412400.
  25. 25. Zhao L, Wang F, Wang H, Li Y, Alexander S, Wang K и др. Молекулярная диагностика 82 пробандов пигментного ретинита на основе секвенирования нового поколения из Северной Ирландии. Генетика человека. 2015; 134 (2): 217–30. pmid: 25472526; PubMed Central PMCID: PMC4347882.
  26. 26. Березкин А., Шевах Е., Кимчи А., Мизрахи-Мейссонье Л., Хатеб С., Ратнаприя Р. и др.Секвенирование всего экзома выявляет мутации в генах известных заболеваний сетчатки в 33 из 68 израильских семей с унаследованными ретинопатиями. Научные отчеты. 2015; 5: 13187. pmid: 26306921; PubMed Central PMCID: PMC4549705.
  27. 27. Сюй И, Гуань Л., Шен Т., Чжан Дж., Сяо Х, Цзян Х. и др. Мутации 60 известных причинных генов в 157 семьях с пигментным ретинитом на основе секвенирования экзома. Генетика человека. 2014; 133 (10): 1255–71. pmid: 24938718.
  28. 28. Абу-Сафие Л., Альрашед М., Анази С., Алькурая Х., Хан А.О., Аль-Оуайн М. и др.Аутозигомное секвенирование экзома у пациентов с дистрофией сетчатки выявляет патогенетические мутации и новые гены-кандидаты болезней. Геномные исследования. 2013. 23 (2): 236–47. pmid: 23105016; PubMed Central PMCID: PMC3561865.
  29. 29. Алдахмеш М.А., Сафие Л.А., Алкурая Х., Аль-Раджи А., Шамселдин Х., Хашем М. и др. Молекулярная характеристика пигментного ретинита в Саудовской Аравии. Молекулярное зрение. 2009; 15: 2464–9. pmid: 19956407; PubMed Central PMCID: PMC2786884.
  30. 30. Pena V, Liu S, Bujnicki JM, Luhrmann R, Wahl MC.Структура многочастичного домена белок-белкового взаимодействия в факторе сплайсинга prp8 и его связь с пигментным ретинитом. Молекулярная клетка. 2007. 25 (4): 615–24. pmid: 17317632.
  31. 31. Maeder C, Kutach AK, Guthrie C. АТФ-зависимое раскручивание мяРНК U4 / U6 с помощью геликазы Brr2 требует C-конца Prp8. Структурная и молекулярная биология природы. 2009. 16 (1): 42–8. pmid: 116; PubMed Central PMCID: PMC2707180.
  32. 32. Mozaffari-Jovin S, Santos KF, Hsiao HH, Will CL, Urlaub H, Wahl MC и др.Н-подобный домен РНКазы Prp8 ингибирует опосредованное Brr2 разворачивание мяРНК U4 / U6, блокируя загрузку Brr2 на мяРНК U4. Гены и развитие. 2012. 26 (21): 2422–34. pmid: 23124066; PubMed Central PMCID: PMC34

    .

  33. 33. Zhang L, Shen J, Guarnieri MT, Heroux A, Yang K, Zhao R. Кристаллическая структура C-концевого домена фактора сплайсинга Prp8, несущего мутанты пигментного ретинита. Наука о протеине: публикация Белкового общества. 2007. 16 (6): 1024–31. pmid: 17473007; PubMed Central PMCID: PMC2206663.
  34. 34. Mozaffari-Jovin S, Wandersleben T, Santos KF, Will CL, Luhrmann R, Wahl MC. Ингибирование РНК-геликазы Brr2 С-концевым хвостом сплайсосомного белка Prp8. Наука. 2013; 341 (6141): 80–4. pmid: 23704370.
  35. 35. Бун Си-Джей, Клеверинг Б.Дж., Лерой Б.П., Хойнг С.Б., Кеунен Дж.Э., ден Холландер А.И. Спектр глазных фенотипов, вызванных мутациями в гене BEST1. Прогресс в исследованиях сетчатки и глаз. 2009. 28 (3): 187–205. pmid: 19375515.
  36. 36.Макдональд И.М., Гудисева Х.В., Вильянуэва А., Греве М., Карузо Р., Айягари Р. Фенотип и генотип пациентов с аутосомно-рецессивной бестрофинопатией. Ophthalmic Genet. 2012; 33 (3): 123–9. pmid: 21809908.
  37. 37. Дитрих К., Якоби Ф.К., Типпманн С., Шмид Р., Зреннер Э., Виссинджер Б. и др. Новая мутация гена RP1 (Lys778ter), связанная с аутосомно-доминантным пигментным ретинитом. Британский офтальмологический журнал. 2002. 86 (3): 328–32. pmid: 11864893; PubMed Central PMCID: PMC1771063.
  38. 38. Audo I, Mohand-Said S, Dhaenens CM, Germain A, Orhan E, Antonio A и др. RP1 и аутосомно-доминантная палочко-конусная дистрофия: новые мутации, обзор опубликованных вариантов и корреляция генотип-фенотип. Человеческая мутация. 2012. 33 (1): 73–80. pmid: 22052604.
  39. 39. Ян З., Чен Й., Лилло С., Чиен Дж., Ю З., Михаэлидес М. и др. Мутантный проминин 1, обнаруженный у пациентов с дегенерацией желтого пятна, нарушает морфогенез фоторецепторного диска у мышей. Журнал клинических исследований.2008. 118 (8): 2908–16. pmid: 18654668; PubMed Central PMCID: PMC2483685.
  40. 40. Никопулос К., Авила-Фернандес А., Кортон М., Лопес-Молина М.И., Перес-Карро Р., Бонтаделли Л. и др. Идентификация двух новых мутаций в CDHR1 в родственных испанских семьях с аутосомно-рецессивной дистрофией сетчатки. Научные отчеты. 2015; 5: 13902. pmid: 26350383; Идентификатор PubMed Central PMCID: PMCPMC4642573.
  41. 41. Лю С., Ли П., Дыбков О., Нотротт С., Хартмут К., Лурманн Р. и др.Связывание Nop домена Prp31 человека с платформой композитной РНК-белка в snRNP U4. Наука. 2007. 316 (5821): 115–20. pmid: 17412961.

Обзор компьютерных инструментов для анализа и интерпретации данных секвенирования всего экзома

Секвенирование всего экзома (WES) — это применение технологии следующего поколения для определения вариаций экзома, которая становится стандартным подходом к изучению генетических вариантов при заболеваниях . Понимание экзомов людей при разрешении единого основания позволяет идентифицировать действенные мутации для лечения и ведения болезни.Технологии WES сместили узкое место в производстве экспериментальных данных в пользу ресурсоемкого анализа данных на основе информатики. Новые вычислительные инструменты и методы были разработаны для анализа и интерпретации данных WES. Здесь мы рассмотрим некоторые из текущих инструментов, которые используются для анализа данных WES. Эти инструменты варьируются от выравнивания исходных данных секвенирования до связывания вариантов с действенными терапевтическими средствами. Обсуждаются сильные и слабые стороны каждого инструмента, чтобы помочь исследователям принимать более информативные решения по выбору лучших инструментов для анализа своих данных WES.

1. Введение

Последние достижения в технологиях секвенирования следующего поколения предоставляют революционные возможности для характеристики геномных ландшафтов людей с разрешением единой базы для выявления действенных мутаций для лечения и ведения болезней [1, 2]. Секвенирование всего экзома (WES) — это применение технологии следующего поколения для определения вариаций экзома, то есть всех кодирующих областей известных генов в геноме. Например, более 85% болезнетворных мутаций при менделевских заболеваниях обнаруживаются в экзоме, и WES обеспечивает беспристрастный подход к обнаружению этих вариантов в эпоху персонализированной и точной медицины.Технологии секвенирования нового поколения сместили узкое место в производстве экспериментальных данных в пользу ресурсоемкого анализа данных на основе информатики. Например, Консорциум агрегации экзомов (ExAC) собрал и повторно проанализировал данные WES для 60 706 неродственных особей из различных генетических исследований конкретных заболеваний и популяций [3]. Чтобы получить представление о WES, новые вычислительные алгоритмы и методы биоинформатики представляют собой критически важный компонент в современных биомедицинских исследованиях для анализа и интерпретации этих массивных наборов данных.

Геномные исследования, в которых используется WES, с годами расширились, и были разработаны новые методы биоинформатики и вычислительные инструменты, помогающие анализировать и интерпретировать эти данные (рис. 1). Большинство вычислительных инструментов WES сосредоточено на создании файла Variant Calling Format (VCF) из необработанных данных секвенирования. После того, как файлы VCF были сгенерированы, дальнейшие последующие анализы могут быть выполнены другими вычислительными методами. Поэтому в этом обзоре мы классифицировали методы и вычислительные инструменты биоинформатики на категории Pre-VCF и Post-VCF.Рабочие процессы Pre-VCF включают инструменты для согласования необработанных считываний секвенирования с эталонным геномом, обнаружения вариантов и аннотации. Рабочие процессы после VCF включают методы обнаружения соматических мутаций, анализа путей, изменения числа копий, идентификации INDEL и прогнозирования драйверов. В зависимости от характера гипотезы, помимо VCF, анализ может также включать методы, которые связывают варианты с клиническими данными, а также с потенциальными терапевтическими средствами (рис. 2).



Вычислительные инструменты, разработанные для согласования необработанных данных секвенирования с аннотированным файлом VCF, хорошо зарекомендовали себя.Большинство исследований, как правило, следуют рабочим процессам, связанным с GATK [4–6], SAMtools [7] или их комбинацией. В общем, рабочие процессы начинаются с согласования считываний WES с эталонным геномом и отслеживания различающихся чтений. Наиболее распространенными из этих вариантов являются однонуклеотидные варианты (SNV), но они также включают вставки, делеции и перестройки. Расположение этих вариантов используется для примечания к конкретному гену. После аннотации найденные SNV можно сравнить с базами данных SNV, найденными в других исследованиях.Это позволяет определить частоту конкретного SNV в данной популяции. В некоторых исследованиях, например, связанных с раком, интерес представляют редкие соматические мутации. Однако в менделевских исследованиях картина мутаций зародышевой линии будет представлять больший интерес, чем соматические мутации. Перед созданием окончательного файла VCF для данного образца можно использовать программное обеспечение, чтобы предсказать, будет ли вариант функционально повреждающим белок, для определения приоритетности генов-кандидатов для дальнейшего изучения.

Методы биоинформатики, разработанные помимо создания аннотированных файлов VCF, гораздо менее распространены.В исследованиях рака наиболее распространенные типы дополнительных инструментов, помимо VCF, сосредоточены на обнаружении соматических мутаций. Однако предпринимаются шаги по разработке других вычислительных инструментов, включая анализ путей, изменение числа копий, идентификацию INDEL, предсказания мутаций драйверов и связывание генов-кандидатов с клиническими данными и действенными целями.

Здесь мы рассмотрим новейшие вычислительные инструменты для анализа и интерпретации данных WES, уделяя особое внимание применению этих методов в исследованиях рака.Мы изучили текущие тенденции в инструментах секвенирования следующего поколения и сравнили их методологию, чтобы исследователи могли лучше определить, какие инструменты являются лучшими для их исследования WES и продвижения точной медицины. Кроме того, мы включаем список общедоступных биоинформатических и вычислительных инструментов в качестве справочного материала для исследований WES (Таблица 1).

9065 гена до VCF-даты Обеспечивает обновление файлов аннотации VCF по дате , регион и фильтры из нескольких других баз данных. для оценки всех возможных алгоритмов машинного обучения

Вычислительные инструменты Описание Веб-сайт Ссылки


Инструмент для выравнивания 90WW 9065 выравнивание коротких чтений с использованием подхода BWT относительно эталонного генома с учетом пропусков / несоответствий. http://bio-bwa.sourceforge.net/ [8]
Bowtie (1 и 2) Выполняет выравнивание при коротком чтении с использованием индекса Барроуза-Уиллера для экономии памяти при сохранении поддержание скорости выравнивания более 25 миллионов 35 bp чтений в час. http://bowtie-bio.sourceforge.net/index.shtml [9, 10]
ELAND Устройство выравнивания коротких считываний, которое обеспечивает скорость за счет разделения считываний на равные отрезки и применения шаблонов семян для гарантии совпадений всего с 2 несовпадениями. http://www.illumina.com/ Illumina, Inc.
GEM Устройство выравнивания с коротким считыванием, использующее сопоставление строк вместо BWT для обеспечения точности и скорости. http://algorithms.cnag.cat/wiki/The_GEM_library [11]
GSNAP Выполняет выравнивание по короткому и длинному считыванию, обнаруживает сращивание на длинном и коротком расстоянии, SNP и способен обнаруживать бисульфитные обработанная ДНК для исследований метилирования. http: // research-pub.gene.com/gmap/ [12]
MAQ Выравниватель с коротким считыванием, совместимый с данными Illumina-Solexa и ABI SOLiD, выполняет выравнивание без пробелов, допускающее 2-3 несовпадения для односторонних считываний и одно несовпадение для парных считываний. конец читает. http://maq.sourceforge.net/ [13]
mrFAST Выполняет выравнивание по короткому чтению, позволяя использовать INDEL до 8 бит / с для данных, сгенерированных Illumina. Сопоставление парных концов с использованием алгоритма привязки на одном конце позволяет обнаруживать новые вставки. http://mrfast.sourceforge.net/ [14]
Novoalign Выравнивание выполняется на последовательностях с парным или одинарным концом, также можно проводить исследования метилирования. Допускает несоответствие до 50% длины считывания и имеет встроенный адаптер и обрезку базового качества. http://www.novocraft.com/products/novoalign/ http://www.novocraft.com/
SOAP (1 и 2) SOAP2 скорость улучшена на порядок по сравнению с SOAP1 и может выравнивать широкий диапазон длин чтения со скоростью 2 минуты для одного миллиона односторонних чтений с использованием двустороннего алгоритма BWT. http://soap.genomics.org.cn/ [15, 16]
SSAHA Использует алгоритм хеширования для поиска точного или близкого к точному совпадению в базах данных ДНК и белков, аналогично выполнению BLAST поиск для каждого чтения. https://www.vectorbase.org/glossary/ssaha-sequence-search-and-alignment-hashing-algorithm/ [17]
Stampy Выравнивание выполнено с использованием алгоритма хеширования и статистической модели, для выравнивания считываний Illumina для секвенирования генома, РНК и чипа с учетом большого количества или вариаций, включая вставки и делеции. http://www.well.ox.ac.uk/project-stampy [18]
YOABS Использует алгоритм 0 (), который использует как хеш-методы, так и три-методы, эффективные в выравнивание последовательностей размером более 200 п.н. с в 3 раза меньшим объемом памяти и в десять раз быстрее, чем SSAHA. Доступен по запросу для некоммерческого использования [19]
HTSeq Пакет на основе Python с множеством функций для облегчения некоторых аспектов исследований секвенирования. http://www-huber.embl.de/HTSeq/doc/overview.html

Вспомогательные инструменты
FastUniq , импорт, sorts дубликаты коротких последовательностей из данных секвенирования. https://sourceforge.net/projects/fastuniq/ [23]
Picard Picard — это набор инструментов командной строки для управления данными и форматами высокопроизводительного секвенирования (HTS), такими как SAM / BAM / CRAM и VCF. http://picard.sourceforge.net/
SAMtools Набор инструментов для просмотра, индексации, редактирования, записи и чтения файлов в формате SAM, BAM и CRAM. http://www.htslib.org/ [7]

Звонки SNV и SV
GATK Варианты звонков SNP и малых INDEL; может также использоваться на нечеловеческих и недиплоидных организмах. https://www.broadinstitute.org/gatk/ [4–6]
SAMtools Набор инструментов, способных просматривать, индексировать, редактировать, писать и читать в форматах SAM, BAM и CRAM файлы. http://www.htslib.org/ [7]
VCMM Обнаружение SNV и INDEL с использованием полиномиального вероятностного метода в данных WES и WGS. http://emu.src.riken.jp/VCMM/ [25]
FreeBayes Обнаружение SNP, MNP, INDEL и структурных вариантов (SV) из выравнивания секвенирования с использованием байесовских статистических методов. https://github.com/ekg/freebayes [27]
indelMINER Алгоритм разделения потока для определения точки останова в INDEL на основе данных секвенирования парных концов. https://github.com/aakrosh/indelMINER [32]
Pindel Обнаружение INDEL с использованием подхода роста паттерна с якорными точками для обеспечения разрешения на уровне нуклеотидов. http://gmt.genome.wustl.edu/packages/pindel/ [30]
Platypus Обнаружение SNP, MNP, INDELs, замен и структурных вариантов (SV) при секвенировании выравнивания с использованием локальная перестройка и локальная сборка для достижения высокой специфичности и чувствительности. http://www.well.ox.ac.uk/platypus [26]
Splitread Обнаружение INDEL длиной менее 50 бит на основе данных WES или WGS с использованием алгоритма раздельного чтения. http://splitread.sourceforge.net/ [31]
Спрайты Обнаружение INDEL выполняется с использованием подхода раздельного чтения и мягкого отсечения, который особенно чувствителен в наборах данных с низким охватом. https://github.com/zhangzhen/sprites [33]

VCF-аннотация
ANNOVAR- http://annovar.openbioinformatics.org/ [34]
MuTect Постпроцессирует варианты для устранения артефактов из гибридного захвата, выравнивания короткого чтения и секвенирования следующего поколения. http://www.broadinstitute.org/cancer/cga/mutect [35]
SnpEff Использует 38 000 геномов для прогнозирования и аннотирования эффектов вариантов на гены. http://snpeff.sourceforge.net/ [36]
SnpSift Инструменты для управления файлами VCF, включая фильтрацию, аннотации, регистр, скорость перехода и трансверсии и многое другое. http://snpeff.sourceforge.net/SnpSift.html [37]
VAT Аннотация вариантов по функциональности в среде облачных вычислений. http://vat.gersteinlab.org/ [38]

Фильтрация базы данных
1000 Genomes Project Информация о генотипах от 1000 здоровых людей. http: // www.1000genomes.org/ [41]
dbSNP База данных геномных вариантов 53 организмов. https://www.ncbi.nlm.nih.gov/projects/SNP/ [39]
LOVD База данных с открытым исходным кодом свободно доступной генно-ориентированной коллекции вариантов ДНК и хранения пациентов и Данные NGS. http://www.lovd.nl/3.0/home [40]
COSMIC База данных, содержащая соматические мутации от рака человека, разделенные на данные, тщательно отобранные экспертами, и результаты анализа всего генома, опубликованные в научной литературе. http://cancer.sanger.ac.uk/cosmic [42]
NHLBI GO Exome Sequencing Project (ESP) База данных генов и механизмов, которые способствуют развитию заболеваний крови, легких и сердца через Данные NGS в различных популяциях. http://evs.gs.washington.edu/EVS/
Консорциум агрегации экзомов (ExAC) База данных 60706 неродственных лиц по результатам исследований секвенирования экзомов болезней и популяций. http://exac.broadinstitute.org/ [3]
SeattleSeq Аннотация Часть проекта по секвенированию NHBLI; эта база данных содержит новые и известные SNV и INDEL, включая регистрационный номер, функцию варианта и частоты HapMap, клиническую ассоциацию и прогнозы PolyPhen. http://snp.gs.washington.edu/SeattleSeqAnnotation137/

Функциональные предикторы
CADD .6 миллионов замен в эталонном геноме человека от 1 до 99 на основе известных и смоделированных функциональных вариантов. http://cadd.gs.washington.edu/info [49]
FATHMM Использует скрытые модели Маркова для прогнозирования функциональных последствий SNV в вариантах кодирования и некодирования через веб-сервер. http://fathmm.biocompute.org.uk/ [46]
LRT Использует статистический тест отношения правдоподобия, чтобы сравнить вариант с известными вариантами и определить, считаются ли они доброкачественными или вредными. , или неизвестно. http://genome.cshlp.org/content/19/9/1553.long [45]
PolyPhen-2 Предсказывает потенциальное влияние несинонимичного варианта с использованием сравнительных и физических характеристик. http://genetics.bwh.harvard.edu/pph3/ [44]
SIFT Используя PSI-BLAST, можно прогнозировать влияние несинонимичной мутации в белке. http://sift.jcvi.org/ [43]
VEST Подход машинного обучения для определения вероятности того, что миссенс-мутация нарушит функциональность белка. http://karchinlab.org/apps/appVest.html [48]
MetaSVM и MetaLR Интеграция машины опорных векторов и логистической регрессии для интеграции девяти вредоносных оценок прогнозирования миссенс-мутаций. https://sites.google.com/site/jpopgen/dbNSFP [47]

Значимые соматические мутации
SomaticSniper 90, два входа Использование двух файлов bam646 SomaticSniper 90 этот инструмент использует модель вероятности генотипа MAZ для расчета вероятности того, что опухоль и нормальные образцы отличаются, тем самым идентифицируя соматические варианты. http://gmt.genome.wustl.edu/packages/somatic-sniper/ [50]
MuTect Использование статистического анализа для прогнозирования вероятности соматической мутации с использованием двух байесовских подходов. https://www.broadinstitute.org/cancer/cga/mutect [35]
VarSim Используя ранее описанные мутации, выполняется моделирование случайных мутаций для прогнозирования соматических мутаций. http: // bioinform.github.io/varsim/ [51]
SomVarIUS Идентификация соматических вариантов из непарных образцов ткани с глубиной секвенирования 150x и точностью 67%, реализованной в Python. https://github.com/kylessmith/SomVarIUS [52]

Изменение номера копии
Control-FREEC LOH) из парных файлов SAM / BAM путем вычисления и нормализации числа копий и частоты бета-аллелей. http://bioinfo-out.curie.fr/projects/freec/ [59]
CNV-seq Отображенный счетчик чтения вычисляется в скользящем окне в Perl и R для определения количества копий из HTS изучает. http://tiger.dbs.nus.edu.sg/cnv-seq/ [53]
SegSeq Используя 14 миллионов считываний выровненных последовательностей из линий раковых клеток, равные изменения числа копий рассчитываются из данные секвенирования. https: // www.broadinstitute.org/cancer/cga/segseq [54]
VarScan2 Определяет изменения количества копий в совпадающих или несогласованных выборках, используя коэффициенты чтения, а затем обрабатывает их с помощью алгоритма круговой двоичной сегментации. http://dkoboldt.github.io/varscan/using-varscan.html [61]
ExomeAI Обнаруживает аллельный дисбаланс, включая LOH, в несопоставленных образцах опухолей, используя статистический подход, который позволяет обрабатывать низкие наборы данных о качестве. http://gqinnovationcenter.com/index.aspx [64]
CNVseeqer Покрытие экзонов между согласованными последовательностями рассчитывалось с использованием соотношений с последующим алгоритмом круговой двоичной сегментации. http://icb.med.cornell.edu/wiki/index.php?title=Elementolab/CNVseeqer&redirect=no [60]
EXCAVATOR Обнаруживает варианты количества копий из данных WES в 3 этапа, используя алгоритм скрытой модели Маркова. https://sourceforge.net/projects/excavatortool/ [57]
ExomeCNV R пакет, используемый для обнаружения вариантов количества копий потери гетерозиготности из данных WES. https://secure.genome.ucla.edu/index.php/ExomeCNV_User_Guide [58]
ADTEx Обнаружение аберраций в экзомах опухоли путем определения частот B-аллелей и реализовано в R. http://adtex.sourceforge.net/ [55]
CONTRA Использует нормализованную глубину покрытия для обнаружения изменений количества копий из целевых данных повторного упорядочения, включая WES. https://sourceforge.net/projects/contra-cnv/ [56]

Инструменты прогнозирования драйверов
CHASM соматических мутаций. http://karchinlab.org/apps/appChasm.html [65]
Dendrix De novo Драйверы обнаружены только на основе данных о мутациях рака, включая гены, нуклеотиды или домены с высокой исключительностью и покрытие. http://compbio.cs.brown.edu/projects/dendrix/ [66]
MutSigCV Частоты мутаций, специфичных для генов и пациентов, включены для поиска мутаций в генах, которые мутировали больше часто, чем можно было бы ожидать случайно. http://www.broadinstitute.org/cancer/software/genepattern/modules/docs/MutSigCV [67]

Инструменты и ресурсы для анализа пути
База данных, использующая карты известных биологических процессов, что позволяет искать гены и цветовую кодировку результатов. http://www.genome.jp/kegg/ [68]
DAVID Позволяет пользователям вводить большой набор генов и обнаруживать функциональную аннотацию списка генов, включая пути, генную онтологию условия и многое другое. https://david.ncifcrf.gov/ [69]
STRING Сетевая визуализация белок-белковых взаимодействий более чем 2031 организма. http://string-db.org/ [70]
BEReX Использует биомедицинские знания, чтобы позволить пользователям искать взаимосвязи между биомедицинскими объектами. http://infos.korea.ac.kr/berex/ [71]
DAPPLE Использует список генов для определения физической связи между белками в соответствии с межбелковыми взаимодействиями. http://journals.plos.org/plosgenetics/article?id=10.1371/journal.pgen.1001273 [72]
SNPsea Использует неравновесие сцепления для определения возможных путей и типов клеток быть затронутым на основе данных SNP. http: // www.broadinstitute.org/mpg/snpsea/ [73]

Инструменты и ресурсы для связывания вариантов с терапевтическими препаратами
cBioPortal , визуализация и визуализация базы данных исследования по секвенированию рака, включая предоставление данных о пациентах и ​​клинических данных для образцов. http://www.cbioportal.org/ [78]
My Cancer Genome База данных для исследований рака, которая обеспечивает связь мутационного статуса с методами лечения и доступными клиническими испытаниями. https://www.mycancergenome.org/ http://www.mycancergenome.org/
ClinVar База данных взаимосвязей между фенотипами и человеческими вариациями, показывающая взаимосвязь между состоянием здоровья и человеческими вариациями и известные последствия. https://www.ncbi.nlm.nih.gov/clinvar/ [74]
DSigDB База данных сигнатур лекарств, которая включает 19 531 ген и 17 389 соединений, которые могут частично помочь в идентификации соединений для лекарств перепрофилирование исследований в трансляционных исследованиях. http://tanlab.ucdenver.edu/DSigDB [77]
PharmGKB База знаний, позволяющая визуализировать различные знания о генах лекарств. https://www.pharmgkb.org/ [75]
DrugBank Содержит подробную информацию о лекарствах с исчерпывающей информацией о целевых лекарствах для 8 206 лекарств. http://www.drugbank.ca/ [76]

Конвейеры анализа данных WES
fast2VCF Конвейер полного быстрого секвенирования ) и заканчивается файлом VCF, который подходит для новичков и опытных пользователей. http://fastq2vcf.sourceforge.net/ [80]
SeqMule Конвейер WES или WGS, который объединяет информацию из более чем десяти инструментов выравнивания и анализа для получения файла VCF, который можно использовать в как менделевские, так и раковые исследования. http://seqmule.openbioinformatics.org/en/latest/ [79]
IMPACT Конвейер анализа данных WES, который начинается с необработанного секвенирования, считывает и анализирует SNV и CNA и связывает эти данные со списком приоритетных препаратов из клинических испытаний и DSigDB. http://tanlab.ucdenver.edu/IMPACT/ [81]
Геномы в облаке (GotCloud) Автоматизированный конвейер секвенирования, который выполняет частичное выравнивание, вызов вариантов и контроль качества, который может быть работать на Amazon Web Services EC2, а также на локальных машинах и кластерах. http://genome.sph.umich.edu/wiki/GotCloud

2. Вычислительные инструменты в анализах Pre-VCF

Выравнивание, удаление дубликатов, вариант вызова , аннотации, фильтрация и прогнозирование — все это части шагов, ведущих к созданию отфильтрованного и аннотированного файла VCF.Здесь мы рассматриваем каждый из этих шагов, как показано на рисунке 2, и сравниваем и сравниваем некоторые инструменты, которые можно использовать для выполнения шагов анализа Pre-VCF.

2.1. Инструменты для выравнивания

Первым шагом в любом анализе секвенирования следующего поколения является выравнивание считывания секвенирования с эталонным геномом. Двумя наиболее распространенными эталонными геномами в настоящее время являются hg18 и hg19. Было разработано несколько алгоритмов выравнивания, включая, помимо прочего, BWA [8], Bowtie 1 [9] и 2 [10], GEM [11], ELAND (Illumina, Inc.), GSNAP [12], MAQ [13], mrFAST [14], Novoalign (http://www.novocraft.com/), SOAP 1 [15] и 2 [16], SSAHA [17], Stampy [18 ] и YOABS [19]. У каждого метода есть свои уникальные особенности, и во многих статьях рассматривались различия между ними [20–22], и мы не будем здесь подробно рассматривать эти инструменты. Три наиболее часто используемых из этих алгоритмов — это BWA, Bowtie (1 и 2) и SOAP (1 и 2).

2.2. Вспомогательные инструменты

Некоторые вспомогательные инструменты были разработаны для фильтрации выровненных считываний, чтобы обеспечить более высокое качество данных для последующего анализа.ПЦР-амплификация может привести к дублированию считываний парных считываний в данных секвенирования. Эти повторяющиеся считывания могут влиять на глубину сопоставленных считываний и последующий анализ. Например, если вариант обнаружен в повторяющихся чтениях, доля чтений, содержащих вариант, может превысить порог, необходимый для вызова варианта, вызывая, таким образом, ложноположительный вариант. Следовательно, удаление повторяющихся считываний является важным шагом для точного представления глубины секвенирования во время последующих анализов.Было разработано несколько инструментов для обнаружения дубликатов ПЦР, включая Picard (http://picard.sourceforge.net./), FastUniq [23] и SAMtools [7]. SAMtools rmdup находит чтения, которые начинаются и заканчиваются в одной и той же позиции, находит чтение с наивысшим показателем качества и помечает остальные дубликаты для удаления. Пикард находит одинаковые 5′-положения для обоих считываний в паре пар и отмечает их как дубликаты. Напротив, FastUniq использует подход de novo для быстрой идентификации дубликатов ПЦР. FastUniq импортирует все чтения, сортирует их по местоположению, а затем отмечает дубликаты.Это позволяет FastUniq не требовать полные последовательности генома в качестве предварительных условий. Из-за различных алгоритмов, используемых каждым из этих инструментов, эти инструменты могут удалять дубликаты ПЦР по отдельности или в комбинации.

2.3. Методы для однонуклеотидных вариантов (SNV), вызывающих

После того, как последовательности были выровнены с эталонным геномом, следующим шагом является определение вариантов в данных WES. Существует четыре основных категории стратегий вызова вариантов: варианты зародышевой линии, соматические варианты, вариации числа копий и структурные варианты.Несколько инструментов, которые выполняют один или несколько из этих методов вызова вариантов, недавно сравнивались друг с другом [24]. Некоторые общие программы вызова SNV — это GATK [4–6], SAMtools [7] и VCMM [25]. Фактические механизмы вызова SNV инструментов GATK и SAM очень похожи. Однако контекст до и после вызова SNV представляет различия между этими инструментами. GATK предполагает, что каждая ошибка последовательности является независимой, в то время как SAMtools считает, что вторичная ошибка имеет больший вес. После того, как SNV вызывает GATK, GATK учится на данных, в то время как SAMtools полагается на варианты пользователя, Variant Caller с полиномиальной вероятностной моделью (VCMM) — еще один инструмент, разработанный для обнаружения SNV и INDEL из исследований WES и Whole Genome Sequencing (WGS) с использованием полиномиальной вероятностной модели с показатель качества и фильтр смещения цепочки [25].VCMM подавлял ложноположительные и ложноотрицательные вызовы вариантов по сравнению с GATK и SAMtools. Однако количество вариантов вызова было таким же, как и в предыдущих исследованиях. Сравнение, проведенное авторами VCMM, показало, что хотя все три метода вызывают большое количество общих SNV, каждый инструмент также идентифицирует SNV, не обнаруженные другими методами [25]. Способность каждого метода вызывать SNV, не найденные другими, должна приниматься во внимание при выборе инструмента (ов) вызова вариантов SNV.

2.4. Методы идентификации структурных вариантов (SV)

Структурные варианты (SV), такие как инсерции и делеции (INDEL) в данных высокопроизводительного секвенирования, идентифицировать сложнее, чем однонуклеотидные варианты, поскольку они могут включать неопределенное количество нуклеотидов. В большинстве исследований WES используются рабочие процессы SAMtools [7] или GATK [4–6], которые определяют INDEL в данных. Однако было разработано другое программное обеспечение для повышения чувствительности обнаружения INDEL при одновременном снижении частоты ложных обнаружений.

Platypus [26] был разработан для поиска SNV, INDEL и сложных полиморфизмов с использованием локальной сборки de novo . По сравнению с SAMtools и GATK, Platypus имел самый низкий уровень ложных обнаружений Fosmid как для SNV, так и для INDEL при полногеномном секвенировании 15 образцов. Кроме того, у него было самое короткое время работы из этих инструментов. Однако у GATK и SAMtools были более низкие показатели ложного обнаружения Fosmid, чем у Platypus при обнаружении SNV и INDEL в данных WES [26]. Таким образом, Platypus кажется подходящим для секвенирования всего генома, но следует соблюдать осторожность при использовании этого инструмента с данными WES.

FreeBayes использует уникальный подход к обнаружению INDEL по сравнению с другими инструментами. В этом методе используется определение вариантов на основе гаплотипов в рамках байесовской статистики [27]. Этот метод использовался в нескольких исследованиях в сочетании с другими подходами для идентификации уникальных INDEL [28, 29].

Pindel была одной из первых программ, разработанных для решения проблемы неопознанных больших INDEL из-за малой длины чтения WGS [30]. Вкратце, после сопоставления считываний с эталонным геномом Пиндел определяет считывания, в которых один конец был картирован, а другой — нет [30].Затем Пиндел ищет в эталонном геноме неотмеченную часть этого считывания в определенной пользователем области генома [30]. Этот алгоритм раздельного чтения успешно идентифицировал большие INDEL. Другие вычислительные инструменты, разработанные после Пиндела, по-прежнему используют этот алгоритм в качестве основы в своих методах обнаружения INDEL.

Splitread [31] был разработан для специфической идентификации структурных вариантов и INDEL в данных WES от 1 до 1 Мбит / с, основываясь на подходе Пиндела [30] с разделенным чтением.Алгоритмы, используемые SAMtools и GATK, ограничивают размер структурных вариантов, при этом редко идентифицируются варианты более 15 п.н. [31]. Splitread закрепляет один конец чтения и группирует незакрепленные концы для определения размера, содержания и расположения структурных вариантов [31]. По сравнению с GATK, Splitread вызвал 70% тех же INDEL, но выявил еще 19 уникальных INDEL, 13 из которых были проверены секвенированием по Сэнгеру [31]. Уникальная способность Splitread выявлять большие структурные варианты и INDEL заслуживает того, чтобы он использовался вместе с другим программным обеспечением для обнаружения INDEL в анализе WES.

Недавно разработанный indelMINER — это набор инструментов, который использует сильные стороны разделения чтения и сборки de novo для определения INDEL из парных считываний данных WGS [32]. Сравнение производилось между SAMtools, Pindel и indelMINER на смоделированном наборе данных с 7500 INDEL [32]. SAMtools обнаружил наименьшее количество INDEL с 6491, за ним следует Pindel с 7 239 и indelMINER с 7 365 идентифицированными INDEL. Однако процент ложных срабатываний indelMINER (3,57%) был выше, чем у SAMtools (2.65%), но ниже, чем у Пиндела (4,53%). И наоборот, у indelMINER было наименьшее количество ложноотрицательных результатов — 398 по сравнению с 589 и 1181 для Pindel и SAMtools, соответственно. У каждого из этих инструментов есть свои сильные и слабые стороны, как показали авторы indelMINER [32]. Следовательно, можно предсказать, что будущие инструменты, разработанные для обнаружения SV, будут использовать подход, аналогичный indelMINER, в попытке включить лучшие методы, которые были разработаны на данный момент.

Большинство новейших средств обнаружения SV полагаются на перераспределение разделенных чтений для обнаружения удалений.Вместо более универсального подхода, такого как indelMINER, Sprites [33] стремится решить проблему удалений с помощью микрогомологий и удалений с помощью микровставок. Алгоритм спрайтов перестраивает чтения с мягким отсечением, чтобы найти самый длинный префикс или суффикс, который соответствует целевой последовательности. Что касается -счетов, Sprites работали лучше, чем Pindel, используя реальные и смоделированные данные [33].

Все эти инструменты используют разные алгоритмы для решения проблемы структурных вариантов, которые обычны в геномах человека.У каждого из этих инструментов есть свои сильные и слабые стороны при обнаружении SV. Поэтому предлагается использовать несколько из этих инструментов в комбинации для обнаружения SV в WES.

2,5. Методы аннотации VCF

После того, как варианты обнаружены и вызваны, следующим шагом является аннотирование этих вариантов. Двумя наиболее популярными инструментами аннотации VCF являются ANNOVAR [34] и MuTect [35], который является частью конвейера GATK. ANNOVAR был разработан в 2010 году с целью быстрого и удобного аннотирования миллионов вариантов и до сих пор остается одним из популярных методов аннотации вариантов [34].ANNOVAR может использовать аннотацию на основе генов, регионов или фильтров для доступа к более чем 20 общедоступным базам данных для аннотации вариантов. MuTect — еще один метод, использующий байесовские классификаторы для обнаружения и аннотирования вариантов [34, 35]. MuTect широко использовался в исследованиях геномики рака, особенно в проектах Атласа генома рака. Другими инструментами аннотации VCF являются SnpEff [36] и SnpSift [37]. SnpEff может выполнять аннотацию для нескольких вариантов, а SnpSift позволяет быстро обнаруживать значимые варианты из файлов VCF [37].Инструмент Variant Annotation Tool (VAT) отличается от других инструментов аннотации в одном аспекте, добавляя возможности облачных вычислений [38]. Аннотация НДС выполняется на уровне транскрипта, чтобы определить, затронуты ли все или только подмножество изоформ транскрипта гена. VAT является динамичным в том смысле, что он также аннотирует множественные нуклеотидные полиморфизмы (MNP) и может использоваться не только для человеческого вида.

2.6. База данных и ресурсы для фильтрации вариантов

В процессе аннотации многие ресурсы и базы данных могут использоваться в качестве критериев фильтрации для обнаружения новых вариантов из общих полиморфизмов.Эти базы данных оценивают вариант по его минорной аллельной частоте (MAF) в конкретной популяции или исследовании. Необходимость фильтрации вариантов на основе этого числа зависит от цели исследования. Например, менделевские исследования будут заинтересованы во включении общих SNV, в то время как исследования рака обычно сосредоточены на редких вариантах, обнаруживаемых менее чем у 1% населения. База данных NCBI dbSNP, созданная в 2001 году, представляет собой развивающуюся базу данных, содержащую как хорошо известные, так и редкие варианты многих организмов [39].dbSNP также содержит дополнительную информацию, включая ассоциацию болезни, происхождение генотипа, а также информацию о соматических вариантах и ​​вариантах зародышевой линии [39].

Лейденская открытая база данных вариаций (LOVD), разработанная в 2005 году, связывает свою базу данных с несколькими другими репозиториями, чтобы пользователь мог проводить сравнения и получать дополнительную информацию [40]. Одна из самых популярных баз данных SNV была разработана в 2010 году в рамках проекта «1000 геномов», который использует статистику секвенирования более 1000 «здоровых» людей всех национальностей [41].Это особенно полезно для исследований рака, поскольку повреждающие мутации, обнаруженные при раке, часто очень редки в здоровом населении. Другая база данных, необходимая для изучения рака, — это Каталог соматических мутаций при раке (COSMIC) [42]. Эта база данных соматических мутаций, обнаруженных в исследованиях рака из почти 20 000 публикаций, позволяет идентифицировать потенциально важные варианты, связанные с раком. Совсем недавно Консорциум агрегации экзома (ExAC) собрал и повторно проанализировал данные WES по 60 706 неродственным особям из различных генетических исследований, специфичных для болезней и популяций [3].Веб-портал и данные ExAC предоставляют ресурс для оценки значимости вариантов, обнаруженных в данных WES [3].

2.7. Функциональные предикторы мутации

Помимо знания того, был ли ранее идентифицирован конкретный вариант, исследователи могут также захотеть определить эффект варианта. Было разработано множество инструментов функционального прогнозирования, алгоритмы которых незначительно различаются. Хотя можно использовать индивидуальное программное обеспечение для прогнозирования, ANNOVAR предоставляет пользователям оценки от нескольких различных функциональных предикторов, включая SIFT, PolyPhen-2, LRT, FATHMM, MetaSVM, MetaLR, VEST и CADD [34].

SIFT определяет, является ли вариант вредоносным, используя PSI-BLAST для определения консервативности аминокислот на основе близкородственных выравниваний последовательностей [43]. PolyPhen-2 использует конвейер, включающий восемь методов на основе последовательностей и три метода на основе структуры, чтобы определить, является ли мутация доброкачественной, вероятно вредной или заведомо вредной [44]. Тест отношения правдоподобия (LRT) использует сохранение между близкородственными видами для определения функционального воздействия мутаций [45]. Когда три генома подверглись анализу с помощью SIFT, PolyPhen-2 и LRT, только 5% всех предсказанных вредных мутаций были признаны вредными всеми тремя методами [45].Таким образом, было показано, что использование нескольких предикторов мутаций необходимо для обнаружения широкого спектра вредоносных SNV. FATHMM использует сохранение последовательности в рамках скрытых марковских моделей для предсказания функциональных эффектов миссенс-мутации белка [46]. FATHMM оценивает мутации на основании их патогенности на основе предсказанного взаимодействия белкового домена [46].

MetaSVM и MetaLR представляют два метода ансамбля, которые объединяют 10 оценок предикторов (SIFT, PolyPhen-2 HDIV, PolyPhen-2 HVAR, GERP ++, MutationTaster, Mutation Assessor, FATHMM, LRT, SiPhy и PhyloP) и максимальную частоту, наблюдаемую в 1000 популяций геномов для прогнозирования вредоносных вариантов [47].MetaSVM и MetaLR основаны на машине опорных векторов ансамбля (SVM) и логистической регрессии (LR), соответственно, для прогнозирования окончательных оценок вариантов [47].

Инструмент оценки эффекта вариантов (VEST) похож на MetaSVM и MetaLR в том, что он использует обучающий набор и машинное обучение для прогнозирования функциональности мутаций [48]. Основное отличие подхода VEST состоит в том, что обучающая выборка и методология прогнозирования специально разработаны для менделевских исследований [48]. Метод Combined Annotation Dependent Depletion (CADD) дифференцируется путем интеграции нескольких вариантов с мутациями, пережившими естественный отбор, а также с имитируемыми мутациями [49].

Хотя все эти методы предсказывают функциональность мутации, все они немного различаются по своим методологическим и биологическим допущениям. Донг и др. недавно проверили производительность этих алгоритмов прогнозирования на известных наборах данных [47]. Они отметили, что эти методы редко единодушно соглашаются с тем, является ли мутация вредной. Поэтому важно учитывать методологию предсказателя, а также фокус исследования при интерпретации пагубных результатов предсказания.

3. Вычислительные методы для анализа помимо VCF

После того, как файл VCF был сгенерирован, аннотирован и отфильтрован, можно выполнить несколько типов анализа (рис. 2). Здесь мы выделяем шесть основных типов анализов, которые могут быть выполнены после создания файла VCF, с особым акцентом на WES в исследованиях рака: (i) значительные соматические мутации, (ii) анализ путей, (iii) оценка количества копий, ( iv) прогнозирование факторов, (v) привязка вариантов к клинической информации и действенным методам лечения, и (vi) новые применения WES в исследованиях рака.

3.1. Методы определения значимых соматических мутаций

После аннотации VCF в образце WES могут быть идентифицированы тысячи SNV; однако большинство из них будут молчащими (синонимичными) мутациями и не будут иметь смысла для последующего исследования. Следовательно, важно идентифицировать значимые соматические мутации этих вариантов. Для выполнения этой задачи было разработано несколько инструментов для анализа данных WES рака, включая SomaticSniper [50], MuTect [35], VarSim [51] и SomVarIUS [52].

SomaticSniper — это вычислительная программа, которая сравнивает нормальные образцы и образцы опухоли, чтобы определить, какие мутации уникальны для образца опухоли и, следовательно, предсказываются как соматические мутации [50]. SomaticSniper использует модель вероятности генотипа MAQ (реализованную в SAMtools), а затем вычисляет вероятность того, что опухолевый и нормальный генотипы различаются. Вероятность сообщается как соматическая оценка, которая представляет собой вероятность по шкале Phred. SomaticSniper применялся в различных исследованиях рака для выявления значимых соматических вариантов.

Другой популярный инструмент идентификации соматических мутаций — MuTect [35], разработанный Институтом Броуда. MuTect, как и SomaticSniper, использует парные нормальные образцы и образцы рака в качестве входных данных для обнаружения соматических мутаций. После удаления считываний низкого качества MuTect использует статистику обнаружения вариантов, чтобы определить, является ли вариант более вероятным, чем ошибка секвенирования. Затем MuTect ищет шесть типов известных артефактов секвенирования и удаляет их. Панель нормальных образцов, а также база данных dbSNP используются для сравнения, чтобы удалить общие полиморфизмы.Таким образом, количество соматических мутаций не только идентифицируется, но и сокращается до более вероятного набора генов-кандидатов. MuTect широко использовался в исследованиях геномики рака Института Броуда.

В то время как SomaticSniper и MuTect требуют данных как парных образцов рака, так и нормальных образцов, VarSim [51] и SomVarIUS [52] не требуют нормального образца для вызова соматических мутаций. В отличие от большинства программ такого рода, VarSim [51] использует двухэтапный процесс, использующий как данные моделирования, так и экспериментальные данные для оценки точности выравнивания и вызова вариантов.На первом этапе VarSim моделирует диплоидные геномы с зародышевыми и соматическими мутациями на основе реалистичной модели, которая включает SNV и SV. На втором этапе VarSim выполняет обнаружение соматических вариантов с использованием смоделированных данных и проверяет наличие раковых мутаций в VCF опухоли. SomVarIUS — еще один недавний вычислительный метод для обнаружения соматических вариантов в экзомах рака без нормального парного образца [52]. Вкратце, SomVarIUS состоит из 3 шагов для обнаружения соматических вариантов. SomVarIUS сначала определяет приоритетность потенциальных вариантов сайтов, оценивает вероятность ошибки секвенирования, а затем вероятность того, что наблюдаемый вариант является зародышевым или соматическим.В образцах с более чем 150-кратным охватом SomVarIUS идентифицирует соматические варианты с точностью не менее 67,7% и частотой отзыва 64,6% по сравнению с вызовами соматических вариантов парных тканей в реальных образцах опухоли [52]. И VarSim, и SomVarIUS будут полезны для образцов рака, в которых отсутствуют соответствующие нормальные образцы для обнаружения соматических вариантов.

3.2. Вычислительные инструменты для оценки изменения количества копий

Одной из активных областей исследований в области анализа данных WES является разработка вычислительных методов для оценки изменения количества копий (CNA).Было разработано множество инструментов для оценки CNA из данных WES, основанных на парных образцах нормальной опухоли, таких как CNV-seq [53], SegSeq [54], ADTEx [55], CONTRA [56], EXCAVATOR [57], ExomeCNV [58] ], Control-FREEC (вызывающий номер копирования без управления) [59] и CNVseeqer [60]. Например, VarScan2 [61] — это вычислительный инструмент, который может оценивать соматические мутации и CNA из парных образцов нормальной опухоли. VarScan2 использует нормальный образец для поиска соматических CNA (SCNA), сначала сравнивая глубину считывания Q20 между нормальным и опухолевым образцами и нормализуя их на основе количества входных данных для каждого образца [61].Изменение числа копий выводится из журнала 2 отношения глубины опухоли к нормальной глубине для каждой области [61]. Наконец, алгоритм круговой сегментации (CBS) [62] используется для объединения смежных сегментов для вызова набора SCNA. Эти SCNA могут быть далее классифицированы как крупномасштабные (> 25% хромосомного плеча) или фокальные (<25%) события в данных WES [63].

Недавно был разработан ExomeAI для обнаружения аллельного дисбаланса (AI) по данным WES [64]. Используя гетерозиготные сайты, ExomeAI находит отклонения от ожидаемого соотношения 1: 1 между A- и B-аллелями в нескольких образцах опухолей без нормального сравнения.Абсолютное отклонение частоты B-аллеля от 0,05 рассчитывается аналогично VarScan2; алгоритм CBS применяется к каждому хромосомному плечу [62]. Чтобы уменьшить количество ложных срабатываний, была создана база данных с 500 (и их количество) нормальными образцами для фильтрации известных ИИ. Это новый инструмент для анализа WES для обнаружения повторяющихся событий AI без сопоставленных нормальных выборок.

Систематическая оценка инструментов оценки числа соматических копий для данных WES была недавно опубликована [63].В этом исследовании шесть вычислительных инструментов для обнаружения CNA (ADTEx, CONTRA, Control-FREEC, EXCAVATOR, ExomeCNV и VarScan2) были оценены с использованием данных WES из трех наборов данных TCGA. Используя массив SNP в качестве эталона, это исследование показало, что эти алгоритмы дают очень разные результаты. Авторы обнаружили, что ADTEx и EXCAVATOR показали лучшую производительность при относительно высокой точности и чувствительности по сравнению с эталонным набором. Исследование показало, что современные средства обнаружения CNA для данных WES все еще имеют ограничения, и потребовали более надежных алгоритмов для решения этой сложной задачи.

3.3. Вычислительные инструменты для прогнозирования факторов в экзомах рака

Рак — это заболевание, вызванное генетическими вариациями и изменениями числа копий. Эти генетические события можно разделить на два класса: «водительские» и «пассажирские» мутации. Драйверные мутации — это ключевая мутация, которая стимулирует развитие рака и обеспечивает преимущество в выживании, тогда как мутации-пассажиры — это «случайные» изменения, которые происходят в первичных клетках, но не обеспечивают преимущества в выживании.Поскольку раковые экзомы, как правило, несут большую мутационную нагрузку, определение «движущих» мутаций от «пассажирских» мутаций является одним из ключевых анализов в исследованиях рака. Было разработано несколько инструментов для поиска мутаций драйверов, включая, помимо прочего, CHASM [65], Dendrix [66] и MutSigCV [67].

CHASM (высокопроизводительная аннотация соматических мутаций, специфичная для рака) использует случайный лес в качестве метода машинного обучения, чтобы различать мутации водителя и пассажира при раке [65].CHASM был обучен на курируемых мутациях драйверов, полученных из базы данных COSMIC («положительные примеры»), и синтетических мутациях-пассажирах, созданных в соответствии с фоном частот замен оснований, наблюдаемых в определенных типах опухолей («отрицательные примеры»). CHASM может достичь высокой чувствительности и специфичности при различении между известными драйверными миссенс-мутациями и случайно сгенерированными миссенс-мутациями при тестировании на реальных образцах опухоли. Этот метод был одним из популярных инструментов прогнозирования обнаружения драйверов для исследователей рака и применялся в различных геномных исследованиях рака.

Другой распространенный инструмент мутации драйвера — MutSigCV, разработанный для решения проблемы обширных ложноположительных результатов, которые затмевают истинные мутации драйвера [67]. Поскольку размер секвенированных раковых геномов увеличивался, о неправдоподобных генах (таких как TTN ) ложно сообщалось, что они связаны с раком, тогда как на самом деле их большой размер просто увеличивает вероятность их случайной мутации [67]. MutSigCV учитывает частоту и спектр мутаций, специфичных для конкретного пациента, а также частоту генных фоновых мутаций, уровень экспрессии и время репликации.Объединив все эти доступные данные в одном инструменте, MutSigCV стал стандартным инструментом, используемым для идентификации мутаций драйвера в исследованиях рака.

De novo Driver Exclusibility (Dendrix) — это новый вычислительный инструмент для определения de novo путей драйвера (наборов генов) на основе соматических мутаций в данных пациентов [66]. Основная цель алгоритма Dendrix — найти наборы генов с высоким охватом и высокими эксклюзивными свойствами на основе соматических данных. Свойство высокого охвата предполагает, что у большинства пациентов есть по крайней мере одна мутация драйвера в наборе генов, тогда как свойство высокой исключительности предполагает, что эти мутации драйвера редко мутируют вместе у одного и того же пациента.В Dendrix были разработаны два алгоритма, один на основе жадного алгоритма, а другой на основе алгоритма Монте-Карло цепи Маркова (MCMC) для измерения наборов генов, которые демонстрируют оба критерия. Когда Dendrix был применен к данным TCGA, алгоритмы идентифицировали группы генов, которые были мутированы у больших подгрупп пациентов, и эти мутации были взаимоисключающими. Этот инструмент дает возможность анализировать данные WES для определения движущих путей в геномных исследованиях рака.

3.4. Методы анализа пути

После того, как были определены кандидаты соматических мутаций; один из распространенных типов анализа — определить пути, на которые влияют эти мутации.Общие ресурсы и инструменты, используемые для этих типов анализа, включают KEGG [68], DAVID [69], STRING [70], BEReX [71], DAPPLE [72] и SNPsea [73].

KEGG представляет собой одну из самых популярных баз данных для анализа путей. DAVID — популярный онлайн-инструмент для выполнения функционального анализа обогащения на основе определенных пользователем списков генов. STRING — это крупнейшая база данных белок-белковых взаимодействий для запросов и поиска взаимодействий между пользовательскими списками генов. BEReX объединяет STRING, KEGG и другие источники данных для изучения биомедицинских взаимодействий между генами, лекарствами, путями и болезнями.И STRING, и BEReX позволяют пользователям выполнять функциональный анализ обогащения и гибкость для изучения взаимодействия между определяемыми пользователем списками генов путем расширения сетей.

DAPPLE (Disease Association Protein-Protein Link Evaluator) использует описанные в литературе белок-белковые взаимодействия для определения значительной физической связи между интересующими генами [72]. DAPPLE предполагает, что генетическая изменчивость влияет на основные механизмы, обнаруживаемые только с помощью белок-белковых взаимодействий [72].SNPsea — еще один инструмент анализа путей, для которого требуются конкретные данные SNP [73]. SNPsea вычисляет неравновесие сцепления между задействованными генами и использует метод выборки для определения условий, на которые влияют эти взаимодействия.

3.5. Вычислительные инструменты для привязки вариантов к лечению

Способность связывать варианты с действенными лекарственными мишенями является новой темой исследований в точной медицине. Базы данных, такие как My Cancer Genome, послужили основой для этих исследований (https: // www.mycancergenome.org/). My Cancer Genome обеспечивает мост между геномными данными и клиническими терапевтическими методами лечения. Аналогичным образом ClinVar предоставляет информацию о взаимосвязи между вариантами и клинической терапией [74]. Собирая варианты и клиническую значимость, относящуюся к этим вариантам, ClinVar предлагает исследователям базу данных для изучения значимости результатов секвенирования в клинических условиях [74]. Фармакологические базы данных, такие как PharmGKB [75], DrugBank [76] и DSigDB [77], обеспечивают связь между лекарством и мишенями (вариантами)).Например, запрашивая список вариантов в одной из этих баз данных, он позволяет пользователям идентифицировать действенные цели с помощью анализа обогащения для перепрофилирования лекарств.

Точно так же возможность использовать клинические данные в исследованиях секвенирования жизненно важна для развития персонализированной медицины. Однако из-за отсутствия интеграции между электронными медицинскими картами (EHR) и молекулярным анализом это остается одной из проблем при внедрении анализа данных WES в клиническую практику.Такие проекты, как cBioPortal, обеспечивают основу для объединения данных секвенирования с доступными клиническими данными [78]. Срочно необходимы новые методы для решения этой задачи, чтобы воспользоваться преимуществами важных приложений данных WES в клинике для развития точной медицины.

4. Конвейеры анализа WES

Конвейеры анализа данных WES объединяют вычислительные инструменты и методы, описанные в предыдущих разделах, в единый рабочий процесс анализа. Здесь мы рассматриваем три последних конвейера секвенирования: SeqMule [79], Fastq2vcf [80] и IMPACT [81], которые ассимилируют некоторые инструменты, описанные в предыдущих разделах.

SeqMule выделяется отчасти благодаря использованию пяти инструментов выравнивания (BWA, Bowtie 1 и 2, SOAP2 и SNAP) и пяти различных вариантов алгоритмов вызова (GATK, SAMtools, VarScan2, FreeBayes и SOAPsnp) [79]. SeqMule содержит по крайней мере одну функцию, которая выполняет анализ Pre-VCF для создания отфильтрованного файла VCF. SeqMule также генерирует сопроводительный отчет на основе HTML и изображения, чтобы показать обзор каждого шага в конвейере. Fastq2vcf также выполняет анализ Pre-VCF с использованием BWA в качестве инструмента выравнивания и вызова вариантов с помощью GATK, UnifiedGenotyper, HaplotypeCaller, SAMtools и SNVer, что приводит к отфильтрованному VCF после реализации ANNOVAR и VEP [80].Fastq2vcf можно использовать в одиночной или параллельной вычислительной среде для различных данных секвенирования.

Конвейеры SeqMule и Fastq2vcf сосредоточены на получении необработанных данных секвенирования и их преобразовании в отфильтрованный файл VCF. IMPACT (интеграция молекулярных профилей с действенными терапевтическими средствами) конвейер анализа данных WES был разработан, чтобы сделать еще один шаг в этом анализе, связав отфильтрованный VCF с действенными терапевтическими средствами [81]. Конвейер IMPACT содержит четыре аналитических модуля: обнаружение соматических вариантов; изменение номера телефонной копии; прогнозирование лекарств против вредных вариантов; и анализ неоднородности опухоли.IMPACT был применен к продольным образцам, полученным от пациента с меланомой, и выявил новые приобретенные мутации устойчивости к лечению. Анализ IMPACT выявил потерю CDKN2A как новый механизм устойчивости к комбинации лечения дабрафенибом и траметинибом и предсказал потенциальные лекарственные средства для дальнейших фармакологических и биологических исследований [81].

Чтобы сравнить сильные и слабые стороны этих трех конвейеров WES, SeqMule позволяет использовать различные алгоритмы выравнивания в своем конвейере, тогда как IMPACT и Fastq2vcf используют только BWA в качестве алгоритма выравнивания последовательности.SAMtools — это обычный инструмент, используемый IMPACT, Fastq2vcf и SeqMule для вызова вариантов. Кроме того, Fastq2vcf и SeqMule используют GATK и другие алгоритмы вызова вариантов для обнаружения вариантов. Fastq2vcf и IMPACT аннотируют варианты с помощью ANNOVAR. Fastq2vcf также использует VEP, а IMPACT использует SIFT и PolyPhen-2 в качестве основных методов прогнозирования. Для анализа Post-VCF конвейер IMPACT имеет больше возможностей по сравнению с SeqMule и Fastq2vcf. В частности, IMPACT выполняет анализ количества копий, неоднородности опухоли и привязку эффективных терапевтических средств к молекулярным профилям.Однако IMPACT предназначен только для выполнения на образцах опухолей, в то время как SeqMule и Fastq2vcf предназначены для любого набора данных WES. Поэтому пользователям рекомендуется учитывать аналитические потребности, чтобы выбрать подходящий конвейер анализа данных WES для своих исследований.

Как недавно обсуждалось Альтманом и др., Часть Инициативы точной медицины США (PMI) включает в себя возможность определить золотой стандарт конвейеров и инструментов для конкретных исследований секвенирования, чтобы открыть новую эру медицины [82].Автоматизированные конвейеры, подобные этим, ускорят анализ и интерпретацию данных WES. Потребуется дальнейшее развитие конвейера анализа данных, чтобы включить новые и более широкие инструменты, адаптированные для конкретных исследовательских вопросов.

5. Выводы

Таким образом, мы рассмотрели несколько вычислительных инструментов для анализа и интерпретации данных WES. Эти вычислительные методы были разработаны для создания файлов VCF из необработанных данных секвенирования, а также инструментов, которые выполняют последующий анализ в исследованиях WES.У каждого инструмента есть свои сильные и слабые стороны, и кажется, что использование нескольких из них в сочетании приведет к более точным результатам. В настоящее время биоинформатики по-прежнему сталкиваются с проблемами на каждом этапе анализа данных WES. Однако наибольшая потребность в разработке инструментов, которые могут связать информацию, содержащуюся в файле VCF, с клиническими базами данных и терапевтическими средствами. Исследования в этой области помогут продвинуть точную медицину, предоставив удобные и информативные знания, выходящие за рамки лабораторных.

Конкурирующие интересы

Авторы заявляют об отсутствии конкурирующих интересов относительно публикации данной статьи.

Благодарности

Авторы хотели бы поблагодарить членов Лаборатории трансляционной биоинформатики и системной биологии рака за их конструктивные комментарии к этой рукописи. Эта работа частично поддерживается Национальными институтами здравоохранения P50CA058187, Раковой лигой Колорадо, Фондом семьи Дэвида Ф.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *