SlideShare a Scribd company logo
1 of 4
Download to read offline
Обмен файлами с сервером
Под линуксом удобно копировать файлы, например, используя scp:
scp [-r] [-P port] <source> <destination>
-r -- копировать директории рекурсивно;
-P -- номер порта;
<sorce>, <destination> -- что и куда буем копировать файлы. Можно копировать как
на сервер, так и с него. Путь на сервере указывается как
user@194.85.238.21:/acestorage2/students/.../
Например, залить локальную папку на сервер можно командой
scp -r -P 23 ~/mylocaldir/ user@194.85.238.21:/acestorage2/students/user/
Можно использовать, например, программу FileZilla (http://filezilla-project.org/).
Она есть и для линукса, и для Windows. Пользоваться ей достаточно просто. В
качестве хоста вводим
sftp://194.85.238.21
Далее вводим логин, пароль, порт (23) и подключаемся. Копировать файлы
можно просто перетаскивая их, или правой кнопкой по нужным файлам и Upload/
Download.
FileZilla далеко не единственный клиент. Например, в Windows можно
пользоваться привычным Total Commander.
Bowtie
Сайт: http://bowtie-bio.sourceforge.net/index.shtml
Статья: http://genomebiology.com/content/pdf/gb-2009-10-3-r25.pdf
На сервере программа находится в /storage/labnas/NGS/2/bowtie-0.12.7/
Для того, чтобы приложить риды необходимо сперва построить индекс генома
(или контигов), к которому будем прикладывать. Это делается командой:
bowtie-build <genome file> <index name>
Индекс строиться один раз для конкретного генома. Для больших геномов
(например человека) индекс можно скачать с сайта bowtie.
Риды можно прикладывать в непарном и парном режимах.
Общие опции:
-q/-f -- формат ридов (fastq/fasta)
-p <thread number> -- количество потоков (много не используйте)
--al <filename> -- вывести все приложившиеся риды в указанный файл
--un <filename> -- вывести все не приложившиеся риды в указанный файл
-m <int> -- игнорировать риды, приложившиеся больше, чем заданное число раз
-a -- выводить все приложения рида (по умолчанию выводится первое найденное)
--best -- выводить лучшее возможное приложение для рида
Последние три опции могут замедлить работу bowtie.
Запуск в одиночном режиме:
bowtie -q -p 4 --best <index name> <fastq file with reads> > 1.log 2> 1.err
В файле 1.log будет вся информация о приложившихся ридах -- стренд, позиция и
т.д. В файле 1.err будет краткая статистика.
Опции парного режима:
--minins <int> -- минимальное расстояние вставки (insert size)
--maxins <int> -- максимальное расстояние вставки
--fr/--rf/--ff -- ориентация ридов
Запуск в парном режиме:
bowtie -q -p 4 --fr --minins 0 --maxins 500 <index name> -1 <left fastq file> -2 <right
fastq file> > 1.log 2> 1.err
Полный список опций:
bowtie -h
Различные ориентации пар ридов:
FR (forward - reverse) —--> <-----
RF (reverse - forward) <----- —-->
FF (forward - forward) —--> —-->
Расстояние вставки во всех случаях определяется как расстояние между
дальними концами ридов.
Второе домашнее задание
0. Посмотреть статистику Bowtie
Определить процент приложившихся ридов.
1. Покрытие генома.
По выводу Bowtie или SAM файлу построить график покрытия генома, определить
среднее покрытие и долю покрытой области генома. Покрытие одного нуклеотида
есть количество ридов, приложившихся так, что их концы находятся по разные
стороны от нуклеотида. График можно строить усредняя, например, по 1000
нуклеотидов. Доля покрытой области генома определяется как процент
нуклеотидов с ненулевым покрытием по отношению ко всей длине генома.
2. Распределение расстояния вставки.
По выводу Bowtie построить график распределения расстояния вставки,
определить среднее расстояние вставки и его среднеквадратичное отклонение.
По оси Х -- расстояние вставки, по оси Y -- количество ридов в заданным
расстоянием вставки.
3*. Классификация парности ридов
Задание, которое можно сделать вместо 1 и 2.
Получить парную статистику по запускам Bowtie в одиночном режиме. У нас есть
данные о том как приложились левые и правые риды по одиночке. Хочется узнать
процент пар с каждой из ориентаций, процент пар с одним приложившимся ридом
и процент пар без приложений. Для приложившихся пар хочется узнать среднее
расстояние вставки и его СКО.
Данные:
Если ваша фамилия начинается на А-М:
Папка: /storage/labnas/NGS/2/E.coli/
Тестовый датасет: test_1.fastq, test_2.fastq
Тестовый геном: MG1655-K12.first10K.fasta
Датасет №1: ecoli_mda_lane1_left.fastq.00.cor.fastq,
ecoli_mda_lane1_right.fastq.00.cor.fastq
Датасет №2: s_6_1.fastq, s_6_2.fastq
Референсный геном: MG1655-K12.fasta
Если ваша фамилия начинается на Н-Я:
Папка: /storage/labnas/NGS/2/P.stipitis/
Тестовый датасет: test_1.fastq, test_2.fastq
Тестовый геном: P.stipitis.test.fasta
Датасет №1: HTC10499_s_8_1.fastq, HTC10499_s_8_2.fastq
Датасет №2: HTC10508_s_8_1.fastq, HTC10508_s_8_2.fastq
Референсный геном: P.stipitis.fasta

More Related Content

What's hot

12 вариантов использования Redis — в Tarantool (Александр Календарев, Констан...
12 вариантов использования Redis — в Tarantool (Александр Календарев, Констан...12 вариантов использования Redis — в Tarantool (Александр Календарев, Констан...
12 вариантов использования Redis — в Tarantool (Александр Календарев, Констан...Ontico
 
Владислав Животнев - Основы DNS
Владислав Животнев - Основы DNSВладислав Животнев - Основы DNS
Владислав Животнев - Основы DNSYandex
 
Tarantool: как обрабатывать 
1,5 млрд запросов в сутки?
Tarantool: как обрабатывать 
1,5 млрд запросов в сутки?Tarantool: как обрабатывать 
1,5 млрд запросов в сутки?
Tarantool: как обрабатывать 
1,5 млрд запросов в сутки?tfmailru
 
Web осень 2012 лекция 3
Web осень 2012 лекция 3Web осень 2012 лекция 3
Web осень 2012 лекция 3Technopark
 
Web осень 2012 лекция 2
Web осень 2012 лекция 2Web осень 2012 лекция 2
Web осень 2012 лекция 2Technopark
 
Web весна 2013 лекция 3
Web весна 2013 лекция 3Web весна 2013 лекция 3
Web весна 2013 лекция 3Technopark
 
Использование Tarantool для хранения чатов и лент друзей (Константин Осипов)
Использование Tarantool для хранения чатов и лент друзей (Константин Осипов)Использование Tarantool для хранения чатов и лент друзей (Константин Осипов)
Использование Tarantool для хранения чатов и лент друзей (Константин Осипов)Ontico
 
Принципы работы интернет.
Принципы работы интернет. Принципы работы интернет.
Принципы работы интернет. Dmitry Chabanenko
 
Доклад Антона Поварова на Tarantool Meetup. "Tarantool в Badoo: хранение исто...
Доклад Антона Поварова на Tarantool Meetup. "Tarantool в Badoo: хранение исто...Доклад Антона Поварова на Tarantool Meetup. "Tarantool в Badoo: хранение исто...
Доклад Антона Поварова на Tarantool Meetup. "Tarantool в Badoo: хранение исто...Badoo Development
 
Уязвимости сервисов
Уязвимости сервисовУязвимости сервисов
Уязвимости сервисовPositive Hack Days
 
тема
тематема
темаSabinaK
 
файловая система
файловая системафайловая система
файловая системаinfomoy49
 
где находится сайт в интернете
где находится сайт в интернетегде находится сайт в интернете
где находится сайт в интернетеСергей Савченко
 
Хочу знать, сколько уникальных посетителей было на моём сайте за произвольный...
Хочу знать, сколько уникальных посетителей было на моём сайте за произвольный...Хочу знать, сколько уникальных посетителей было на моём сайте за произвольный...
Хочу знать, сколько уникальных посетителей было на моём сайте за произвольный...Ontico
 
Отказоустойчивая обработка 10M OAuth токенов на Tarantool / Владимир Перепели...
Отказоустойчивая обработка 10M OAuth токенов на Tarantool / Владимир Перепели...Отказоустойчивая обработка 10M OAuth токенов на Tarantool / Владимир Перепели...
Отказоустойчивая обработка 10M OAuth токенов на Tarantool / Владимир Перепели...Ontico
 
Hacking PostgreSQL. Физическое представление данных
Hacking PostgreSQL. Физическое представление данныхHacking PostgreSQL. Физическое представление данных
Hacking PostgreSQL. Физическое представление данныхAnastasia Lubennikova
 
Hf labs education day. rocket science
Hf labs education day. rocket scienceHf labs education day. rocket science
Hf labs education day. rocket scienceOlga Kiseleva
 

What's hot (20)

12 вариантов использования Redis — в Tarantool (Александр Календарев, Констан...
12 вариантов использования Redis — в Tarantool (Александр Календарев, Констан...12 вариантов использования Redis — в Tarantool (Александр Календарев, Констан...
12 вариантов использования Redis — в Tarantool (Александр Календарев, Констан...
 
Владислав Животнев - Основы DNS
Владислав Животнев - Основы DNSВладислав Животнев - Основы DNS
Владислав Животнев - Основы DNS
 
Tarantool: как обрабатывать 
1,5 млрд запросов в сутки?
Tarantool: как обрабатывать 
1,5 млрд запросов в сутки?Tarantool: как обрабатывать 
1,5 млрд запросов в сутки?
Tarantool: как обрабатывать 
1,5 млрд запросов в сутки?
 
Web осень 2012 лекция 3
Web осень 2012 лекция 3Web осень 2012 лекция 3
Web осень 2012 лекция 3
 
Web осень 2012 лекция 2
Web осень 2012 лекция 2Web осень 2012 лекция 2
Web осень 2012 лекция 2
 
Web весна 2013 лекция 3
Web весна 2013 лекция 3Web весна 2013 лекция 3
Web весна 2013 лекция 3
 
Tarantool_qs
 Tarantool_qs Tarantool_qs
Tarantool_qs
 
Использование Tarantool для хранения чатов и лент друзей (Константин Осипов)
Использование Tarantool для хранения чатов и лент друзей (Константин Осипов)Использование Tarantool для хранения чатов и лент друзей (Константин Осипов)
Использование Tarantool для хранения чатов и лент друзей (Константин Осипов)
 
Принципы работы интернет.
Принципы работы интернет. Принципы работы интернет.
Принципы работы интернет.
 
file handling in c
file handling in cfile handling in c
file handling in c
 
Доклад Антона Поварова на Tarantool Meetup. "Tarantool в Badoo: хранение исто...
Доклад Антона Поварова на Tarantool Meetup. "Tarantool в Badoo: хранение исто...Доклад Антона Поварова на Tarantool Meetup. "Tarantool в Badoo: хранение исто...
Доклад Антона Поварова на Tarantool Meetup. "Tarantool в Badoo: хранение исто...
 
Уязвимости сервисов
Уязвимости сервисовУязвимости сервисов
Уязвимости сервисов
 
тема
тематема
тема
 
файловая система
файловая системафайловая система
файловая система
 
Ngs 1 2
Ngs 1 2Ngs 1 2
Ngs 1 2
 
где находится сайт в интернете
где находится сайт в интернетегде находится сайт в интернете
где находится сайт в интернете
 
Хочу знать, сколько уникальных посетителей было на моём сайте за произвольный...
Хочу знать, сколько уникальных посетителей было на моём сайте за произвольный...Хочу знать, сколько уникальных посетителей было на моём сайте за произвольный...
Хочу знать, сколько уникальных посетителей было на моём сайте за произвольный...
 
Отказоустойчивая обработка 10M OAuth токенов на Tarantool / Владимир Перепели...
Отказоустойчивая обработка 10M OAuth токенов на Tarantool / Владимир Перепели...Отказоустойчивая обработка 10M OAuth токенов на Tarantool / Владимир Перепели...
Отказоустойчивая обработка 10M OAuth токенов на Tarantool / Владимир Перепели...
 
Hacking PostgreSQL. Физическое представление данных
Hacking PostgreSQL. Физическое представление данныхHacking PostgreSQL. Физическое представление данных
Hacking PostgreSQL. Физическое представление данных
 
Hf labs education day. rocket science
Hf labs education day. rocket scienceHf labs education day. rocket science
Hf labs education day. rocket science
 

Similar to Ngs 2

Обратная разработка бинарных форматов с помощью Kaitai Struct
Обратная разработка бинарных форматов с помощью Kaitai StructОбратная разработка бинарных форматов с помощью Kaitai Struct
Обратная разработка бинарных форматов с помощью Kaitai StructPositive Hack Days
 
Про асинхронное сетевое программирование
Про асинхронное сетевое программированиеПро асинхронное сетевое программирование
Про асинхронное сетевое программированиеPython Meetup
 
Linux basics. Занятие 3.
Linux basics. Занятие 3. Linux basics. Занятие 3.
Linux basics. Занятие 3. Vikentsi Lapa
 
лекции спрг 6_семестр (1)
лекции спрг 6_семестр (1)лекции спрг 6_семестр (1)
лекции спрг 6_семестр (1)djbelyakk
 
Лекция 6. Стандарт OpenMP
Лекция 6. Стандарт OpenMPЛекция 6. Стандарт OpenMP
Лекция 6. Стандарт OpenMPMikhail Kurnosov
 
Проникновение в Docker с примерами
Проникновение в Docker с примерамиПроникновение в Docker с примерами
Проникновение в Docker с примерамиДмитрий Столяров
 
Устройство фреймворка symfony 2 (http://frontend-dev.ru)
Устройство фреймворка symfony 2 (http://frontend-dev.ru)Устройство фреймворка symfony 2 (http://frontend-dev.ru)
Устройство фреймворка symfony 2 (http://frontend-dev.ru)Александр Егурцов
 
О безопасном использовании PHP wrappers
О безопасном использовании PHP wrappersО безопасном использовании PHP wrappers
О безопасном использовании PHP wrappersPositive Hack Days
 
C++ Базовый. Занятие 13.
C++ Базовый. Занятие 13.C++ Базовый. Занятие 13.
C++ Базовый. Занятие 13.Igor Shkulipa
 
TMPA-2013 Sartakov: Genode
TMPA-2013 Sartakov: GenodeTMPA-2013 Sartakov: Genode
TMPA-2013 Sartakov: GenodeIosif Itkin
 
Bgp методякоби
Bgp методякобиBgp методякоби
Bgp методякобиMichael Karpov
 
Обработка голоса кодеком на Си под Андроид. Сделано / Константин Цховребов (M...
Обработка голоса кодеком на Си под Андроид. Сделано / Константин Цховребов (M...Обработка голоса кодеком на Си под Андроид. Сделано / Константин Цховребов (M...
Обработка голоса кодеком на Си под Андроид. Сделано / Константин Цховребов (M...Ontico
 
Обработка голоса кодеком Си под Андройд? Сделано!
Обработка голоса кодеком Си под Андройд? Сделано!Обработка голоса кодеком Си под Андройд? Сделано!
Обработка голоса кодеком Си под Андройд? Сделано!MobileUp
 
введение в интернет
введение в интернетвведение в интернет
введение в интернетUlyana1973
 
Артем Кувалдин: Основы HTML
Артем Кувалдин: Основы HTMLАртем Кувалдин: Основы HTML
Артем Кувалдин: Основы HTMLYandex
 
Anton Tsitou "Designing hybrid Go/PHP applications using RoadRunner"
Anton Tsitou "Designing hybrid Go/PHP applications using RoadRunner"Anton Tsitou "Designing hybrid Go/PHP applications using RoadRunner"
Anton Tsitou "Designing hybrid Go/PHP applications using RoadRunner"Fwdays
 

Similar to Ngs 2 (20)

Node.js (RichClient)
 Node.js (RichClient) Node.js (RichClient)
Node.js (RichClient)
 
Обратная разработка бинарных форматов с помощью Kaitai Struct
Обратная разработка бинарных форматов с помощью Kaitai StructОбратная разработка бинарных форматов с помощью Kaitai Struct
Обратная разработка бинарных форматов с помощью Kaitai Struct
 
Про асинхронное сетевое программирование
Про асинхронное сетевое программированиеПро асинхронное сетевое программирование
Про асинхронное сетевое программирование
 
Linux basics. Занятие 3.
Linux basics. Занятие 3. Linux basics. Занятие 3.
Linux basics. Занятие 3.
 
лекции спрг 6_семестр (1)
лекции спрг 6_семестр (1)лекции спрг 6_семестр (1)
лекции спрг 6_семестр (1)
 
Лекция 6. Стандарт OpenMP
Лекция 6. Стандарт OpenMPЛекция 6. Стандарт OpenMP
Лекция 6. Стандарт OpenMP
 
Сокеты
СокетыСокеты
Сокеты
 
Docker penetration
Docker penetrationDocker penetration
Docker penetration
 
Проникновение в Docker с примерами
Проникновение в Docker с примерамиПроникновение в Docker с примерами
Проникновение в Docker с примерами
 
Устройство фреймворка symfony 2 (http://frontend-dev.ru)
Устройство фреймворка symfony 2 (http://frontend-dev.ru)Устройство фреймворка symfony 2 (http://frontend-dev.ru)
Устройство фреймворка symfony 2 (http://frontend-dev.ru)
 
О безопасном использовании PHP wrappers
О безопасном использовании PHP wrappersО безопасном использовании PHP wrappers
О безопасном использовании PHP wrappers
 
C++ Базовый. Занятие 13.
C++ Базовый. Занятие 13.C++ Базовый. Занятие 13.
C++ Базовый. Занятие 13.
 
TMPA-2013 Sartakov: Genode
TMPA-2013 Sartakov: GenodeTMPA-2013 Sartakov: Genode
TMPA-2013 Sartakov: Genode
 
Bgp методякоби
Bgp методякобиBgp методякоби
Bgp методякоби
 
Обработка голоса кодеком на Си под Андроид. Сделано / Константин Цховребов (M...
Обработка голоса кодеком на Си под Андроид. Сделано / Константин Цховребов (M...Обработка голоса кодеком на Си под Андроид. Сделано / Константин Цховребов (M...
Обработка голоса кодеком на Си под Андроид. Сделано / Константин Цховребов (M...
 
Обработка голоса кодеком Си под Андройд? Сделано!
Обработка голоса кодеком Си под Андройд? Сделано!Обработка голоса кодеком Си под Андройд? Сделано!
Обработка голоса кодеком Си под Андройд? Сделано!
 
введение в интернет
введение в интернетвведение в интернет
введение в интернет
 
Кратко о Linux
Кратко о LinuxКратко о Linux
Кратко о Linux
 
Артем Кувалдин: Основы HTML
Артем Кувалдин: Основы HTMLАртем Кувалдин: Основы HTML
Артем Кувалдин: Основы HTML
 
Anton Tsitou "Designing hybrid Go/PHP applications using RoadRunner"
Anton Tsitou "Designing hybrid Go/PHP applications using RoadRunner"Anton Tsitou "Designing hybrid Go/PHP applications using RoadRunner"
Anton Tsitou "Designing hybrid Go/PHP applications using RoadRunner"
 

More from BioinformaticsInstitute

Comparative Genomics and de Bruijn graphs
Comparative Genomics and de Bruijn graphsComparative Genomics and de Bruijn graphs
Comparative Genomics and de Bruijn graphsBioinformaticsInstitute
 
Биоинформатический анализ данных полноэкзомного секвенирования: анализ качес...
 Биоинформатический анализ данных полноэкзомного секвенирования: анализ качес... Биоинформатический анализ данных полноэкзомного секвенирования: анализ качес...
Биоинформатический анализ данных полноэкзомного секвенирования: анализ качес...BioinformaticsInstitute
 
Вперед в прошлое. Методы генетической диагностики древней днк
Вперед в прошлое. Методы генетической диагностики древней днкВперед в прошлое. Методы генетической диагностики древней днк
Вперед в прошлое. Методы генетической диагностики древней днкBioinformaticsInstitute
 
"Зачем биологам суперкомпьютеры", Александр Предеус
"Зачем биологам суперкомпьютеры", Александр Предеус"Зачем биологам суперкомпьютеры", Александр Предеус
"Зачем биологам суперкомпьютеры", Александр ПредеусBioinformaticsInstitute
 
Иммунотерапия раковых опухолей: взгляд со стороны системной биологии. Максим ...
Иммунотерапия раковых опухолей: взгляд со стороны системной биологии. Максим ...Иммунотерапия раковых опухолей: взгляд со стороны системной биологии. Максим ...
Иммунотерапия раковых опухолей: взгляд со стороны системной биологии. Максим ...BioinformaticsInstitute
 
Рак 101 (Мария Шутова, ИоГЕН РАН)
Рак 101 (Мария Шутова, ИоГЕН РАН)Рак 101 (Мария Шутова, ИоГЕН РАН)
Рак 101 (Мария Шутова, ИоГЕН РАН)BioinformaticsInstitute
 
Секвенирование как инструмент исследования сложных фенотипов человека: от ген...
Секвенирование как инструмент исследования сложных фенотипов человека: от ген...Секвенирование как инструмент исследования сложных фенотипов человека: от ген...
Секвенирование как инструмент исследования сложных фенотипов человека: от ген...BioinformaticsInstitute
 
Инвестиции в биоинформатику и биотех (Андрей Афанасьев)
Инвестиции в биоинформатику и биотех (Андрей Афанасьев)Инвестиции в биоинформатику и биотех (Андрей Афанасьев)
Инвестиции в биоинформатику и биотех (Андрей Афанасьев)BioinformaticsInstitute
 

More from BioinformaticsInstitute (20)

Graph genome
Graph genome Graph genome
Graph genome
 
Nanopores sequencing
Nanopores sequencingNanopores sequencing
Nanopores sequencing
 
A superglue for string comparison
A superglue for string comparisonA superglue for string comparison
A superglue for string comparison
 
Comparative Genomics and de Bruijn graphs
Comparative Genomics and de Bruijn graphsComparative Genomics and de Bruijn graphs
Comparative Genomics and de Bruijn graphs
 
Биоинформатический анализ данных полноэкзомного секвенирования: анализ качес...
 Биоинформатический анализ данных полноэкзомного секвенирования: анализ качес... Биоинформатический анализ данных полноэкзомного секвенирования: анализ качес...
Биоинформатический анализ данных полноэкзомного секвенирования: анализ качес...
 
Вперед в прошлое. Методы генетической диагностики древней днк
Вперед в прошлое. Методы генетической диагностики древней днкВперед в прошлое. Методы генетической диагностики древней днк
Вперед в прошлое. Методы генетической диагностики древней днк
 
Knime &amp; bioinformatics
Knime &amp; bioinformaticsKnime &amp; bioinformatics
Knime &amp; bioinformatics
 
"Зачем биологам суперкомпьютеры", Александр Предеус
"Зачем биологам суперкомпьютеры", Александр Предеус"Зачем биологам суперкомпьютеры", Александр Предеус
"Зачем биологам суперкомпьютеры", Александр Предеус
 
Иммунотерапия раковых опухолей: взгляд со стороны системной биологии. Максим ...
Иммунотерапия раковых опухолей: взгляд со стороны системной биологии. Максим ...Иммунотерапия раковых опухолей: взгляд со стороны системной биологии. Максим ...
Иммунотерапия раковых опухолей: взгляд со стороны системной биологии. Максим ...
 
Рак 101 (Мария Шутова, ИоГЕН РАН)
Рак 101 (Мария Шутова, ИоГЕН РАН)Рак 101 (Мария Шутова, ИоГЕН РАН)
Рак 101 (Мария Шутова, ИоГЕН РАН)
 
Плюрипотентность 101
Плюрипотентность 101Плюрипотентность 101
Плюрипотентность 101
 
Секвенирование как инструмент исследования сложных фенотипов человека: от ген...
Секвенирование как инструмент исследования сложных фенотипов человека: от ген...Секвенирование как инструмент исследования сложных фенотипов человека: от ген...
Секвенирование как инструмент исследования сложных фенотипов человека: от ген...
 
Инвестиции в биоинформатику и биотех (Андрей Афанасьев)
Инвестиции в биоинформатику и биотех (Андрей Афанасьев)Инвестиции в биоинформатику и биотех (Андрей Афанасьев)
Инвестиции в биоинформатику и биотех (Андрей Афанасьев)
 
Biodb 2011-everything
Biodb 2011-everythingBiodb 2011-everything
Biodb 2011-everything
 
Biodb 2011-05
Biodb 2011-05Biodb 2011-05
Biodb 2011-05
 
Biodb 2011-04
Biodb 2011-04Biodb 2011-04
Biodb 2011-04
 
Biodb 2011-03
Biodb 2011-03Biodb 2011-03
Biodb 2011-03
 
Biodb 2011-01
Biodb 2011-01Biodb 2011-01
Biodb 2011-01
 
Biodb 2011-02
Biodb 2011-02Biodb 2011-02
Biodb 2011-02
 
Ngs 3 1
Ngs 3 1Ngs 3 1
Ngs 3 1
 

Ngs 2

  • 1. Обмен файлами с сервером Под линуксом удобно копировать файлы, например, используя scp: scp [-r] [-P port] <source> <destination> -r -- копировать директории рекурсивно; -P -- номер порта; <sorce>, <destination> -- что и куда буем копировать файлы. Можно копировать как на сервер, так и с него. Путь на сервере указывается как user@194.85.238.21:/acestorage2/students/.../ Например, залить локальную папку на сервер можно командой scp -r -P 23 ~/mylocaldir/ user@194.85.238.21:/acestorage2/students/user/ Можно использовать, например, программу FileZilla (http://filezilla-project.org/). Она есть и для линукса, и для Windows. Пользоваться ей достаточно просто. В качестве хоста вводим sftp://194.85.238.21 Далее вводим логин, пароль, порт (23) и подключаемся. Копировать файлы можно просто перетаскивая их, или правой кнопкой по нужным файлам и Upload/ Download. FileZilla далеко не единственный клиент. Например, в Windows можно пользоваться привычным Total Commander. Bowtie Сайт: http://bowtie-bio.sourceforge.net/index.shtml Статья: http://genomebiology.com/content/pdf/gb-2009-10-3-r25.pdf На сервере программа находится в /storage/labnas/NGS/2/bowtie-0.12.7/ Для того, чтобы приложить риды необходимо сперва построить индекс генома (или контигов), к которому будем прикладывать. Это делается командой: bowtie-build <genome file> <index name> Индекс строиться один раз для конкретного генома. Для больших геномов (например человека) индекс можно скачать с сайта bowtie. Риды можно прикладывать в непарном и парном режимах. Общие опции: -q/-f -- формат ридов (fastq/fasta)
  • 2. -p <thread number> -- количество потоков (много не используйте) --al <filename> -- вывести все приложившиеся риды в указанный файл --un <filename> -- вывести все не приложившиеся риды в указанный файл -m <int> -- игнорировать риды, приложившиеся больше, чем заданное число раз -a -- выводить все приложения рида (по умолчанию выводится первое найденное) --best -- выводить лучшее возможное приложение для рида Последние три опции могут замедлить работу bowtie. Запуск в одиночном режиме: bowtie -q -p 4 --best <index name> <fastq file with reads> > 1.log 2> 1.err В файле 1.log будет вся информация о приложившихся ридах -- стренд, позиция и т.д. В файле 1.err будет краткая статистика. Опции парного режима: --minins <int> -- минимальное расстояние вставки (insert size) --maxins <int> -- максимальное расстояние вставки --fr/--rf/--ff -- ориентация ридов Запуск в парном режиме: bowtie -q -p 4 --fr --minins 0 --maxins 500 <index name> -1 <left fastq file> -2 <right fastq file> > 1.log 2> 1.err Полный список опций: bowtie -h Различные ориентации пар ридов: FR (forward - reverse) —--> <----- RF (reverse - forward) <----- —--> FF (forward - forward) —--> —--> Расстояние вставки во всех случаях определяется как расстояние между дальними концами ридов. Второе домашнее задание 0. Посмотреть статистику Bowtie
  • 3. Определить процент приложившихся ридов. 1. Покрытие генома. По выводу Bowtie или SAM файлу построить график покрытия генома, определить среднее покрытие и долю покрытой области генома. Покрытие одного нуклеотида есть количество ридов, приложившихся так, что их концы находятся по разные стороны от нуклеотида. График можно строить усредняя, например, по 1000 нуклеотидов. Доля покрытой области генома определяется как процент нуклеотидов с ненулевым покрытием по отношению ко всей длине генома. 2. Распределение расстояния вставки. По выводу Bowtie построить график распределения расстояния вставки, определить среднее расстояние вставки и его среднеквадратичное отклонение. По оси Х -- расстояние вставки, по оси Y -- количество ридов в заданным расстоянием вставки. 3*. Классификация парности ридов Задание, которое можно сделать вместо 1 и 2. Получить парную статистику по запускам Bowtie в одиночном режиме. У нас есть данные о том как приложились левые и правые риды по одиночке. Хочется узнать процент пар с каждой из ориентаций, процент пар с одним приложившимся ридом и процент пар без приложений. Для приложившихся пар хочется узнать среднее расстояние вставки и его СКО. Данные: Если ваша фамилия начинается на А-М: Папка: /storage/labnas/NGS/2/E.coli/ Тестовый датасет: test_1.fastq, test_2.fastq Тестовый геном: MG1655-K12.first10K.fasta Датасет №1: ecoli_mda_lane1_left.fastq.00.cor.fastq, ecoli_mda_lane1_right.fastq.00.cor.fastq Датасет №2: s_6_1.fastq, s_6_2.fastq Референсный геном: MG1655-K12.fasta Если ваша фамилия начинается на Н-Я: Папка: /storage/labnas/NGS/2/P.stipitis/ Тестовый датасет: test_1.fastq, test_2.fastq Тестовый геном: P.stipitis.test.fasta Датасет №1: HTC10499_s_8_1.fastq, HTC10499_s_8_2.fastq
  • 4. Датасет №2: HTC10508_s_8_1.fastq, HTC10508_s_8_2.fastq Референсный геном: P.stipitis.fasta