SlideShare une entreprise Scribd logo
1  sur  1
Télécharger pour lire hors ligne
Разработка алгоритма сборки генома
для вычислительных систем
экзафлопсного уровня производительности
· Экзафлопсные суперкомпьютеры
будут существенно отличаться от
сегодняшних
· Вывод – необходимы новые
алгоритмы обработки геномных
данных
Разработанный алгоритм
· Геном – последовательность из
четырех типов нуклеотидов: A, G, C и T
· Геномы разных живых существ имеют
разный размер – от нескольких тысяч
нуклеотидов до сотен миллиардов
нуклеотидов
· Геном человека – 3 миллиарда
нуклеотидов
· Чтения генома имеют длину примерно
100 нуклеотидов
· Производительность устройств для
чтения генома увеличивается в 10 раз
каждые 18 месяцев
· Производительность компьютеров за
тот же срок увеличивается в 2 раза
· Компьютеры экзафлопсной
производительности (1018
операций в
секунду) планируется построить к 2018
году
Paris Japonica – геном
в 150 миллиардов
нуклеотидов
Все чтения генома
... ...
Вычислительный
узел
Вычислительный
узел
Вычислительный
узел
...
Кластеризация
чтений генома
Собранный
геном
Государственный контракт №07.514.11.4010
Лаборатория «Алгоритмы
сборки геномных
последовательностей»
НИУ ИТМО
http://genome.ifmo.ru
genome@mail.ifmo.ru
Результаты
· Разработан алгоритм сборки генома для вычислительной
системы экзафлопсного уровня производительности
· Теоретическая оценка ускорения показывает, что при
переходе от 30 вычислительных узлов к 1 млн. узлов
скорость обработки данных повышается в 1000 раз, а для
отдельных этапов алгоритма – в 16000 раз
Суперкомпьютер
сегодня
Суперкомпьютер
2018 года
Пиковая
производительность
2 петафлопса 1 экзафлопс
Объем памяти 0.3 петабайта 32-64 петабайта
Производительность
вычислительного узла
125 гигафлопс 1-10 терафлопс
Число ядер на одном
узле
12 1000 – 10000
Число вычислительных
узлов
18700 100000 – 1000000
Объем хранилища
данных
15 петабайт 500-1000 петабайт
Геном Чтение генома
Компьютерная
обработка данных
Чтения
Собранный геном
…GGCATGCGTCAGAAACTATCATAGCTAGATCGTACGTAGCC…
Чтение
Сборка
Чтение генома
Набор чтений генома
Сборка генома
Собранный геном

Contenu connexe

Similaire à Алгоритм сборки генома для экзафлопсных систем

Guests 2011-10-04-pevzner-assembly
Guests 2011-10-04-pevzner-assemblyGuests 2011-10-04-pevzner-assembly
Guests 2011-10-04-pevzner-assemblyNikolay Vyahhi
 
2015-12-06 Сергей Хрущев - Человеческим языком о суперкомпьютерах
2015-12-06 Сергей Хрущев - Человеческим языком о суперкомпьютерах2015-12-06 Сергей Хрущев - Человеческим языком о суперкомпьютерах
2015-12-06 Сергей Хрущев - Человеческим языком о суперкомпьютерахHappyDev
 
СУПЕРКОПЬЮТЕРНЫЕ ТЕХНОЛОГИИ
СУПЕРКОПЬЮТЕРНЫЕ ТЕХНОЛОГИИСУПЕРКОПЬЮТЕРНЫЕ ТЕХНОЛОГИИ
СУПЕРКОПЬЮТЕРНЫЕ ТЕХНОЛОГИИMKoryakina
 
СУПЕРКОМПЬЮТЕРНЫЕ ТЕХНОЛОГИИ
СУПЕРКОМПЬЮТЕРНЫЕ ТЕХНОЛОГИИСУПЕРКОМПЬЮТЕРНЫЕ ТЕХНОЛОГИИ
СУПЕРКОМПЬЮТЕРНЫЕ ТЕХНОЛОГИИMKoryakina
 
Automate trading via genetic programming
Automate trading via genetic programmingAutomate trading via genetic programming
Automate trading via genetic programmingJamon Portu
 
JetPoint meeting @JetBrains on bioinformatics
JetPoint meeting @JetBrains on bioinformaticsJetPoint meeting @JetBrains on bioinformatics
JetPoint meeting @JetBrains on bioinformaticsolegshpynov
 

Similaire à Алгоритм сборки генома для экзафлопсных систем (10)

Genome Assembly
Genome AssemblyGenome Assembly
Genome Assembly
 
Guests 2011-10-04-pevzner-assembly
Guests 2011-10-04-pevzner-assemblyGuests 2011-10-04-pevzner-assembly
Guests 2011-10-04-pevzner-assembly
 
2015-12-06 Сергей Хрущев - Человеческим языком о суперкомпьютерах
2015-12-06 Сергей Хрущев - Человеческим языком о суперкомпьютерах2015-12-06 Сергей Хрущев - Человеческим языком о суперкомпьютерах
2015-12-06 Сергей Хрущев - Человеческим языком о суперкомпьютерах
 
СУПЕРКОПЬЮТЕРНЫЕ ТЕХНОЛОГИИ
СУПЕРКОПЬЮТЕРНЫЕ ТЕХНОЛОГИИСУПЕРКОПЬЮТЕРНЫЕ ТЕХНОЛОГИИ
СУПЕРКОПЬЮТЕРНЫЕ ТЕХНОЛОГИИ
 
СУПЕРКОМПЬЮТЕРНЫЕ ТЕХНОЛОГИИ
СУПЕРКОМПЬЮТЕРНЫЕ ТЕХНОЛОГИИСУПЕРКОМПЬЮТЕРНЫЕ ТЕХНОЛОГИИ
СУПЕРКОМПЬЮТЕРНЫЕ ТЕХНОЛОГИИ
 
Automate trading via genetic programming
Automate trading via genetic programmingAutomate trading via genetic programming
Automate trading via genetic programming
 
JetPoint meeting @JetBrains on bioinformatics
JetPoint meeting @JetBrains on bioinformaticsJetPoint meeting @JetBrains on bioinformatics
JetPoint meeting @JetBrains on bioinformatics
 
новости 30
новости 30новости 30
новости 30
 
Процессор
ПроцессорПроцессор
Процессор
 
Evolu Lang
Evolu LangEvolu Lang
Evolu Lang
 

Алгоритм сборки генома для экзафлопсных систем

  • 1. Разработка алгоритма сборки генома для вычислительных систем экзафлопсного уровня производительности · Экзафлопсные суперкомпьютеры будут существенно отличаться от сегодняшних · Вывод – необходимы новые алгоритмы обработки геномных данных Разработанный алгоритм · Геном – последовательность из четырех типов нуклеотидов: A, G, C и T · Геномы разных живых существ имеют разный размер – от нескольких тысяч нуклеотидов до сотен миллиардов нуклеотидов · Геном человека – 3 миллиарда нуклеотидов · Чтения генома имеют длину примерно 100 нуклеотидов · Производительность устройств для чтения генома увеличивается в 10 раз каждые 18 месяцев · Производительность компьютеров за тот же срок увеличивается в 2 раза · Компьютеры экзафлопсной производительности (1018 операций в секунду) планируется построить к 2018 году Paris Japonica – геном в 150 миллиардов нуклеотидов Все чтения генома ... ... Вычислительный узел Вычислительный узел Вычислительный узел ... Кластеризация чтений генома Собранный геном Государственный контракт №07.514.11.4010 Лаборатория «Алгоритмы сборки геномных последовательностей» НИУ ИТМО http://genome.ifmo.ru genome@mail.ifmo.ru Результаты · Разработан алгоритм сборки генома для вычислительной системы экзафлопсного уровня производительности · Теоретическая оценка ускорения показывает, что при переходе от 30 вычислительных узлов к 1 млн. узлов скорость обработки данных повышается в 1000 раз, а для отдельных этапов алгоритма – в 16000 раз Суперкомпьютер сегодня Суперкомпьютер 2018 года Пиковая производительность 2 петафлопса 1 экзафлопс Объем памяти 0.3 петабайта 32-64 петабайта Производительность вычислительного узла 125 гигафлопс 1-10 терафлопс Число ядер на одном узле 12 1000 – 10000 Число вычислительных узлов 18700 100000 – 1000000 Объем хранилища данных 15 петабайт 500-1000 петабайт Геном Чтение генома Компьютерная обработка данных Чтения Собранный геном …GGCATGCGTCAGAAACTATCATAGCTAGATCGTACGTAGCC… Чтение Сборка Чтение генома Набор чтений генома Сборка генома Собранный геном