SlideShare une entreprise Scribd logo
1  sur  136
Télécharger pour lire hors ligne
Синдром статистической
снисходительности
или
значение и назначение P-значения
Никита Николаевич Хромов-БорисовНикита Николаевич Хромов-Борисов
Кафедра медицинской информатики
СПбГМУ им. акад. И.П. Павлова
Nikita.KhromovBorisov@gmail.com
(812) 234-18-40
8-952-204-89-49
1
9th International Congress of Human Genetics
18-23 August 1996. Rio de Janeiro, Brazil
2
Статистика
• 80% ёжиков колются,
а 20% - нюхают грибы
• При упоминании• При упоминании
слова «статистика»
многие врачи
раздражаются и
приходят в
замешательство или в
уныние.
3
Единые требования
• Редакции многих отечественных и зарубежных биомедицинских
журналов при подготовке к публикации научных статей
рекомендуют авторам руководствоваться «Едиными требованиями
к рукописям, представляемым в биомедицинские журналы».
• Требования разрабатывает Международный комитет редакторов
медицинских журналов (International Committee of Medical Journalмедицинских журналов (International Committee of Medical Journal
Editors – ICMJE).
• Эти требования регулярно пересматриваются, и последняя их
редакция датирована октябрем 2008 г.:
• http://www.icmje.org/index.html
• На русский наиболее удачно переведена редакция 2005 г.:
• http://www.mediasphera.ru/mjmp/2005/5/10.pdf
4
Единые требования, раздел «Статистика»
• В этих требованиях в разделе «Статистика» сказано:
• «Описывайте статистические методы настолько детально,
чтобы осведомленный читатель, имеющий доступ к
исходным данным, мог проверить сообщаемые Вами
результаты.
• По возможности, подвергайте полученные данные
количественной оценке и представляйте их сколичественной оценке и представляйте их с
соответствующими показателями ошибок измерения и
неопределенности или варьирования измерений (такими как
доверительные интервалы).
• Не следует полагаться исключительно на проверку
статистических гипотез, например, на использование Р-
значений, которые не содержат важную информацию о
размере эффекта».
5
Открой личико
• Katrina Kelner, Deputy Editor for Life Sciences,
Science
• Журнал “Science” принял такую политику в
отношении открытости данных:
• «После публикации, все данные, необходимые
для понимания, оценки и проверки выводов
статьи, должны быть доступны всем читателям
журнала».
6
Журнал «Экология человека»
7
Экология человека, 2008. - № 7. - С. 57-64.
• Обновленные требования появились недавно в журнале
«Экология человека», в которых в частности содержится
чрезвычайно важное предостережение:
• «Всегда следует помнить, что выявление
статистически значимых различий еще не означает
наличия достоверных или клинически важныхналичия достоверных или клинически важных
различий, а также причинно-следственных связей».
• Несмотря на рекомендацию «не полагаться
исключительно на использование P-значения», до сих
пор во многих научных публикациях оно фигурирует как
решающий показатель значимости наблюдаемых
авторами эффектов, различий, корреляций и т.п.
8
Р-значение
• Напомним, как определяется и вычисляется Р-значение.
• P-значение есть условная вероятность, а именно:
• Вероятность получить наблюдаемое значение tнабл. статистики
некоего критерия T и все остальные еще менее вероятные
значения этой статистики (или значения, еще более
отклоняющиеся от ожидаемых) ПРИ УСЛОВИИ, что вернаотклоняющиеся от ожидаемых) ПРИ УСЛОВИИ, что верна
нулевая гипотеза H0:
• Pval = Pr[|T| ≥ |tнабл.| | H0].
• Тут следует обратить внимание на то, что «еще менее
вероятные данные» не являются «данными», мы их не
наблюдаем.
• Мы их додумываем из всех возможных значений в рамках
выбранной нами (нулевой) модели.
9
P-значение есть вероятность наблюдать исход (x), плюс все «еще более
экстремальные исходы». Они представлены затушеванной областью
хвоста распределения, соответствующего нулевой модели
Goodman S. A Dirty Dozen: Twelve P-Value Misconceptions.
Semin. Hematol. 45:135-140 © 2008
10
Интерпретация P-значения
• Распространенной является интерпретация P-
значения как меры (силы) доказательства,
предоставляемого имеющимися данными,
против нулевой гипотезы.
• Однако, строго говоря, оно не является мерой в
математическом смысле (не обладает свойством
аддитивности) и не удовлетворяет, как
минимум, двум важнейшим принципам теории
статистики – Принципу правдоподобия и
Р-постулату.
11
Принцип правдоподобия
• В словесной формулировке Принцип
правдоподобия есть положение о том, что
статистический анализ данных должен
оперировать теми и только теми данными,
которые реально получены в эксперименте.которые реально получены в эксперименте.
• В математических терминах Принцип
правдоподобия утверждает, что вся информация
о неизвестном параметре µ содержится в
функции правдоподобия для µ, вычисляемой из
полученных данных.
12
• Однако, для вычисления Р-значения, как это
следует из его определения, используются не
только наблюдаемые в эксперименте данные,
но и все другие, еще менее вероятные, которые
в реальности не были наблюдены.в реальности не были наблюдены.
• Другими словами, вычисление Р-значения не
основано на функции правдоподобия и,
соответственно, не удовлетворяет Принципу
правдоподобия.
13
Р-постулат
• Чтобы Р-значение служило реальной и адекватной
мерой статистического доказательства, оно должно
удовлетворять простому правилу (постулату) согласно
которому одинаковые P-значения должны
предоставлять одинаковые доказательства противпредоставлять одинаковые доказательства против
нулевой гипотезы.
• Это правило называют «Р-постулатом»
• Wagenmakers E.-J. A practical solution to the pervasive
problems of p values // Psychonomic Bulletin & Review,
2007. - Vol. 14.- № 5. - P. 779-804.
• Однако, это минимальное требование не выполняется.
14
Р-постулат
• Интуитивно можно понять, что Р = 0,01 для эксперимента с 10
наблюдениями явно не будет иметь той же доказательной
силы, что и Р = 0,01 для эксперимента с 300 наблюдениями.
• Равным образом, Р = 0,001, полученное в одном опыте, и
Р = 0,01 – в другом, не означает, что эффект, наблюдаемый в
первом опыте, в 10 раз более убедителен, чем эффект вопервом опыте, в 10 раз более убедителен, чем эффект во
втором опыте.
• Это прекрасно понимал Р.А. Фишер:
• «Критерий значимости [P-значение] не позволяет нам
делать какие-либо выводы о проверяемой гипотезе в
терминах математической вероятности»
• Fisher R.A. The design of experiments. Edinburgh: Oliver & Boyd,
1935.
15
«Парадокс» правила остановки
• Вероятность обманчивого доказательства,
основанного на малом Р-значении,
достигает 100% при увеличении числа
наблюдений до бесконечного ∞→nнаблюдений до бесконечного
НО!!
•
∞→n
( ) 10 →< HP critvalPr α
( ) γγ ≤< 0HLRPr
А – одинаковые эффекты могут иметь разные P-значения.
B – разные эффекты могут иметь одинаковые P-значения.
Goodman S. A Dirty Dozen: Twelve P-Value Misconceptions.
Semin. Hematol. 45:135-140 © 2008
17
Распространенное заблуждение, или чем не
является P-значение
• Квинтэссенцию традиционных (частотнических)
заключений при проверке статистических гипотез
принято интерпретировать так:
• чем меньше P-значение, тем сильнее (весомее) доводы
(свидетельства, доказательства) против нулевой(свидетельства, доказательства) против нулевой
гипотезы H0, которые предоставляют нам
имеющиеся (наблюдаемые) данные; тем больше у нас
оснований сомневаться в H0.
• Отсюда невольно (и вроде бы естественно) возникает
соблазн интерпретировать P-значение как вероятность
нулевой гипотезы.
18
P-значение не есть вероятность нулевой
гипотезы!
• Например, в известной книге С.Гланца можно встретить
утверждение:
• «Упрощая, можно сказать, что Р — это вероятность
справедливости нулевой гипотезы»
• Гланц С. Медико-биологическая статистика. — М.:• Гланц С. Медико-биологическая статистика. — М.:
Практика, 1998. — с. 119.
• Это мнение глубоко ошибочно и чревато пагубными
последствиями.
• К чести автора, в последующих (у нас не переведенных)
изданиях этой его книги оно отсутствует.
19
+ CD ! Программа
«БИОСТАТИСТИКА»
• Автор: Гланц С.
• Издательство: Практика
• c. 460, 1998 г.
• ISBN: 5-89816-009-4, 0-07-024268-2
• Принципиальная ошибка:
• P-значение можно• P-значение можно
интерпретировать как
вероятность нулевой гипотезы
• В последующих английских изданиях
этой книги эта фраза отсутствует.
• Но их перевод на русский язык не
предвидится.
20
P-значение не есть вероятность нулевой
гипотезы!
• Поскольку Р-значение вычисляется в предположении, что верна
нулевая гипотеза, то оно никак не может быть одновременно
вероятностью того, что нулевая гипотеза неверна:
• P[D|H0] ≠ P[H0|D].
• Здесь D = |T| ≥ |tнабл.| суть все значения статистики критерия T,
которые равны наблюдаемому значению |t | и превышают его.которые равны наблюдаемому значению |tнабл.| и превышают его.
• Подробнее о том, чем не является Р-значение, см.
энциклопедическую статью:
• http://en.wikipedia.org/wiki/P-value
• и недавнюю работу С. Гудмана, в которой перечислена «грязная
дюжина» ошибочных интерпертаций Р-значения:
• Goodman S. A dirty dozen: Twelve P-value misconceptions // Semin.
Hematol., 2008. - Vol. 45. – P. 135-140.
21
P-значение есть реализация вероятностной
переменной P*
• Кроме того, чрезвычайно важно осознавать, что P-значение
есть наблюдаемое значение соответствующей вероятностной
переменной (случайной величины) P*.
• Это означает, что всякий раз мы будем наблюдать одно из ее
возможных значений и в разных опытах оно будет
варьировать.варьировать.
• Когда нулевая гипотеза H0 верна, то Pval имеет непрерывное
равномерное распределение на отрезке [0; 1].
• Это означает, что в любом одиночном эксперименте при
справедливости гипотезы H0 мы можем получить любое P-
значение, как очень малое, близкое к нулю, так и очень
большое, близкое к единице.
22
Незначимое Р-значение не означает, что верна Н0
• Это и есть теоретическое обоснование известных
утверждений, присутствующих во многих
руководствах, о том, что
• на основании наблюдаемого P-значения нельзя
принять нулевую гипотезу, когда Pval > α, т.е.
когда P-значение не преодолевает уровень
значимости α, который выбирается заранее в
качестве порогового (критического).
23
Выбор порога для P-значения, и возможен ли он?
• Когда наблюдаемое P-значение мало, то у
исследователя зарождается сомнение:
действительно ли верна гипотеза H0, и он считает
себя в праве пойти на риск и принять решение
отклонить эту гипотезу.отклонить эту гипотезу.
• Однако важно понимать, что такое решение
является внестатистическим, ибо нет никаких
вероятностно-статистических или иных
теоретических соображений, какое значение Pval
следует считать настолько малым, чтобы смело
отвергнуть H0.
24
Акт интеллектуальной смелости
• Всякий раз, принимая то или иное решение, мы
осуществляем акт интеллектуальной
смелости.
• На практике решение отклонить или принять
H0 непременно зависит от обстоятельств.
• Исследователь в каждой конкретной ситуации
обязан сам делать этот выбор и осознавать
возможные последствия и не забывать об
ответственности за принимаемые решения.
25
Гипноз цифр 0,05 и 95%
• Наиболее часто в качестве критического порога
используется уровень значимости α = 0,05, и
статистический анализ в конечном итоге сводится к
сравнению наблюдаемого значения Pval с этим α, и
конечные результаты обычно представляются в виде
неравенств:неравенств:
• Pval > 0,05 или Pval < 0,05.
• К сожалениею, такое представление результатов анализа
до сих пор нередко встречается в публикациях, несмотря
на то, что в учебных руководствах и инструкциях для
авторов давно рекомендуется представлять конкретно
наблюдаемые значения Pval.
26
Гипноз цифр 0,05 и 95% и статистическая
снисходительность
• Преодоление этого порогового уровня (Pval < 0,05) всего лишь
в одной выборке часто считается достаточным для вывода о
статистической значимости наблюдаемого эффекта.
• В последнем случае часто употребляется даже более сильное
утверждение: «эффект достоверен».
• Наряду с пороговым значением 0,05 для уровня значимости,
повсеместно (за редчайшими исключениями) используется
уровень (вероятность) доверия 0,95 и строятся 95%-е
интервалы доверия (доверительные интервалы).
• Более строго их следует называть «интервалами накрытия»
оцениваемого (неизвестного) параметра.
27
Глотов Н.В., Животовский Л.А., Хованов Н.В., Хромов-Борисов Н.Н.
Биометрия, Л.: Изд-во ЛГУ, 1982. – 264 с.
• Выбор уровня значимости
определяется важностью
биологических выводов, которые
должен сделать экспериментатор.
• В настоящее время многие
биометрики склоняются кбиометрики склоняются к
следующему правилу:
• а) если P > 0,05, то принимается
нулевая гипотеза;
• б) если P < 0,01, то нулевая гипотеза
отклоняется и принимается
конкурирующая;
• в) если 0,01 < P < 0,05, то результат
считается неопределенным.
28
Курьез
• На выбор Фишером порогов для уровня значимости повлияли и
психологические причины.
• М. Кендалл вспоминал, что Фишер составил таблицы критических
значений (для уровней значимости 0,05; 0,02 и 0,01) из соображений
компактности и удобства пользования, а также с целью избежать
проблемы авторства с Карлом Пирсоном, с которым у него были
принципиальные разногласия.принципиальные разногласия.
• Цит. по: Dallal G.E. The Little Handbook of Statistical Practice. Why
P=0.05? http://www.jerrydallal.com/LHSP/p05.htm
• Кроме того, Фишер ориентировался на свой личный ограниченный
опыт статистического анализа результатов опытов, проводившихся с
сельскохозяйственными растениями на Ротамстедской
сельскохозяйственной станции.
• Фактически у него почти не было опыта анализа данных из других
областей экспериментальной науки, например, в медицине.
29
Sir Ronald Aylmer Fisher
17 Feb 1890 - 29 July 1962
30
Karl Pearson
27 March 1857 – 27 April 1936
31
Андрей Николаевич Колмогоров
12 (25) апреля 1903 -20 октября 1987
• Пророк в
своемсвоем
отечестве
32
912 стр.
33
Вероятность и математическая
статистика. Энциклопедия
• Издательство Большая Российская энциклопедия. 2003г. 912 стр.
ISBN 5-7107-7433-2. Тираж 10000 экз.
• Большинство статей сопровождается библиографией наиболее
важных работ по данной проблеме.
• Названия статей даны также в переводе на английский язык.
• Вторая часть - "Хрестоматия по теории вероятностей и• Вторая часть - "Хрестоматия по теории вероятностей и
математической статистике" содержит статьи, написанные для
отечественных энциклопедий прошлого, а также материалы
энциклопедического характера, опубликованные ранее в других
сочинениях.
• Особого внимания заслуживают не потерявшие своей актуальности
работы А.Н.Колмогорова.
34
Колмогоров, 1951
• Более полувека тому назад (в 1951г.) А.Н. Колмогоров
отмечал:
• «При практическом употреблении вычисленных
значений вероятности мы неизбежно приходим к
вопросу о том, какими (сколь малыми) значениямивопросу о том, какими (сколь малыми) значениями
вероятностей мы можем пренебречь.
• На практике этот вопрос решается каждый раз по-
разному, в зависимости от того, насколько велика
необходимость быстрого перехода от накопления
надежных данных к их действительному
употреблению».
35
Колмогоров, 1951
• «В спокойной обстановке научных исследований
принято пренебрегать лишь вероятностью в
0,003 (эта норма связана с так называемым
правилом трех сигма), а иногда требовать и еще
большего приближения вероятности отсутствиябольшего приближения вероятности отсутствия
ошибки к единице.
• В математической статистике вероятность,
которой решено пренебрегать в данном
исследовании, называют уровнем значимости».
36
Колмогоров, 1951
• «Хотя в статистике обычно рекомендуют
пользоваться уровнями значимости от 0,05 при
предварительных ориентировочных исследованиях и
до 0,001 при окончательных серьезных выводах, часто
достижима значительно большая достоверность
[статистическая значимость – НХ] вероятностных
выводов.выводов.
• Например, основные выводы статистической физики
основаны на пренебрежении лишь вероятности
порядка меньшего 0, 000 000 000 1 (<10-10)».
• Воспроизведено в: Колмогоров А. Н. Вероятность / Вероятность и
математическая статистика. Энциклопедия / Гл. ред.
Ю. В. Прохоров. — М.: Изд-во «Большая Российская Энциклопедия»,
1999. – c. 97.
37
Колмогоров, 1956
• Несколько позднее (в 1956 г.) Колмогоров повторил:
• «Вероятности, которыми принято пренебрегать в
различных практических приложениях, различны.
• Иногда в научных исследованиях ограничиваются
статистическими приемами, рассчитанными исходястатистическими приемами, рассчитанными исходя
из пренебрежения вероятностями в 0,05.
• Но это следует делать лишь в случаях, когда
собирание более обширного материала очень
затруднительно».
38
Колмогоров, 1956
• «Если норма в 0,05 для серьезных научных исследований явно
недостаточна, то вероятностью ошибки в 0,001 или 0,003
по большей части принято пренебрегать даже в столь
академических и обстоятельных исследованиях, как
обработка астрономических наблюдений.
• Впрочем, иногда научные выводы, основанные на
применении вероятностных закономерностей, обладают иприменении вероятностных закономерностей, обладают и
значительно большей достоверностью [статистической
значимостью – НХ] (то есть построены на пренебрежении
значительно меньшими вероятностями)».
• Воспроизведено в: Колмогоров А.Н. Теория вероятностей /
Вероятность и математическая статистика. Энциклопедия / Гл.
ред. Ю. В. Прохоров. — М.: Изд-во «Большая Российская
Энциклопедия», 1999. – c. 874.
39
• В наши дни Колмогорову вторят зарубежные авторы:
• «P-значение близкое к 0,05 не является сильным
свидетельством (доказательством) против нулевой
гипотезы.
• Сильными свидетельствами против Н0 следует• Сильными свидетельствами против Н0 следует
признавать значения P < 0,001».
• Sterne J.A.C., Davey Smith G. Sifting the evidence – what’s
wrong with significance tests? // BMJ, 2001. - Vol. 322. - P.
227-231.
40
• При бурлящей в наше время «золотой лихорадке» вокруг изучения
генетических предрасположенностей к общим болезням, т.е. поиска
связей («ассоциаций») между генетическим полиморфизмом и
заболеваниями рекомендуется ориентироваться на еще более
низкие пороговые значения уровня значимости:
• «Вместо повсеместно используемого порогового (критического)• «Вместо повсеместно используемого порогового (критического)
уровня значимости 0,05 в качестве такового мы должны
использовать значение порядка 5××××10-5.
• При таком уровне значимости потребуется обследовать две
группы здоровых и больных по 5000 человек в каждой».
• Colhoun H. M., McKeigue P. M. , Davey Smith G. Problems of reporting
genetic associations with complex outcomes. Lancet, 2003. - Vol. 361. -
№ 9360. – P. 865-872.
41
• Таким образом, явно не следует слепо применять
инструментарий процедур проверки значимости
нулевой гипотезы и основывать свои выводы
исключительно на получаемых Р-значениях.
• Осмысленные выводы должны основываться на• Осмысленные выводы должны основываться на
разумном взвешивании Р-значений и на использовании
дополнительной информации о других не менее важных
показателях, таких как мощность, размер эффекта,
количество наблюдений, о результатах прешествующих
работ, предсказаниях действующей теории и т.п.
42
Гибкие Р-значения
• Сам Фишер подчеркивал, что:
• «В действительности ни один исследователь не пользуется
фиксированным уровнем значимости с которым из года в
год и при любых обстоятельствах он отвергает нулевые
гипотезы.
• Он больше доверяет своему уму и каждый конкретный
случай рассматривает в свете совокупности имеющихся
доказательств и своих идей и представлений».
• Fisher R. A. Statistical Methods and Scientific Inference.
Edinburgh: Oliver & Boyd. 1956.
• Такой подход иногда интепретируют как призыв использовать
«гибкие» Р-значения.
43
Не «достоверный», но всего лишь
«статистически значимый»
• Надо стараться избегать слова «достоверность», ибо в русском
языке оно означает подлинный, несомненно верный, не
вызывающий сомнения.
• В теории вероятностей достоверное событие – событие с
вероятностью, равной 1.
• Если вдуматься, нередко встречающееся в биомедицинской• Если вдуматься, нередко встречающееся в биомедицинской
литературе словосочетание «статистическая достоверность» есть
оксюморон – сочетание несочетаемого.
• Всестороннее обсуждение этого вопроса см. в:
• Зорин Н.А. О неправильном употреблении термина
«достоверность» в российских научных психиатрических
и общемедицинских статьях. 2000.
http://www.biometrica.tomsk.ru/let1.htm
44
Ритуал проверки нулевых гипотез
• 1. Формулируется нулевая гипотеза о «равенстве нулю
разности между средними значениями» или о
«равенстве нулю коэффициента корреляции».
• 2. Альтернативная гипотеза не конкретизируется.
• 3. Для отклонения нулевой гипотезы по умолчанию
используется уровень значимости 5%.используется уровень значимости 5%.
• 4. Если эффект (отклонение от нулевого значения)
статистически значим, то принимается альтернативная
гипотеза.
• 5. Результат сообщается в виде неравенства p < 0,05, p <
0,01 или p < 0,001 (как ближайшее к полученному p-
значению).
Доверяя, повторяй
• Повторение исследования является решающим
(ключевым) аспектом научного метода.
• Один эксперимент, как бы хорошо он ни был
спланирован, не может обеспечить
неопровержимое доказательство правильности
теории или эффективности вмешательства
(воздействия).
• Ein Versuch kein Versuch.
46
Культ изолированного исследования
• Руководства по статистическим методам
сосредоточиваются зачастую на том, как анализировать
одиночный набор данных, пытаясь во что бы то ни стало
ответить на сакраментальный вопрос:
• «Является ли результат значимым?»,• «Является ли результат значимым?»,
• а не на том, как интерпретировать много наборов
данных, как их обобщить и ответить на вопрос:
• «Является ли результат фактом?».
• В статистических руководствах и статьях преобладает
«культ изолированного исследования».
47
Доверяя, повторяй
• Часто считается, что если получен «статистически
значимый» результат, то это исключает
необходимость повторить исследование.
• Повторность часто рассматривается как нечто
суетное и бесполезное.
• На самом же деле,
• «Проверка нулевой гипотезы есть метод
обнаружения маловероятных событий,
которые заслуживают дальнейшего изучения»
(Fisher).
48
Джон Уайлдер Тьюки (John Wilder Tukey, 16.04.1915 — 26.07.2000)
• Исследования должны
быть как минимум
двухэтапными.
• Первый этап – разведочное
исследование.исследование.
• Второй этап – проверочное
(порождающее гипотезы)
исследование.
• Оно планируется на основе
результатов разведочного
иследования.
49
Воспроизводимость и предсказательная способность
P-значений и доверительных интервалов (n = 32)
Использована программа “ESCI PPS p intervals”
http://www.latrobe.edu.au/psy/esci/. Cumming G. Replication and p intervals:
p values predict the future only vaguely, but confidence intervals do much
better // Persp. Psychol. Sci., 2008. - Vol. 3. – P. 286-300.
50
Воспроизводимость и предсказательная способность
P-значений и доверительных интервалов (n = 32)
Использована программа “ESCI PPS p intervals”
http://www.latrobe.edu.au/psy/esci/. Cumming G. Replication and p intervals:
p values predict the future only vaguely, but confidence intervals do much
better // Persp. Psychol. Sci., 2008. - Vol. 3. – P. 286-300.
51
Стандартизированный размер эффекта
MM
d 21 −
=
pooleds
MM
d 21 −
=
Интерпретация размера эффекта по Хопкинсу (Hopkins)
http://www.sportsci.org/resource/stats/
Размер эффекта, ES Градация эффекта
0 – 0,2 Ничтожный
0,2 – 0,6 Малый (слабый)
0,6 – 1,2 Умеренный0,6 – 1,2 Умеренный
1,2 – 2,0 Большой (сильный)
2,0 – 4,0 Очень большой
4,0 - ∞∞∞∞ Абсолютный
• Относительные меры эффекта OR, RR, RRR
часто приводят к впечатляющим цифрам,
даже когда абсолютные эффекты
воздействия оказываются малымивоздействия оказываются малыми
• Примеры:
• 1. р1=0,6; р2=0,1; RRR=83%; ARR=0,5; NNT=2
• 2. p1=0,06; p2=0,01; RRR=83%; но ARR=0,05
и NNT=20
54
Словесная шкала для размеров эффекта
Мера эффекта Градация
эффекта
r d ES RR OR LR NNT
0 0 0 1 1 1 ∞ ничтожный
0,1 0,1 0,2 1,2 1,5 2-5 5 слабый
0,5 0,5 1,2 3,0 9,0 5-10 2 сильный
0,9 0,9 4,0 19 360 >10 очень
сильный
1,0 1,0 ∞ ∞ ∞ ∞ 1 абсолютный
Программа LePrep
http://www.univ-rouen.fr/LMRS/Persopage/Lecoutre/PAC.htm
56
Воспроизводимость и предсказание, LePrep
http://www.univ-rouen.fr/LMRS/Persopage/Lecoutre/ErisA.html
57
LePrep, предсказание результата
последующего повторного эксперимента
58
10-кратное увеличение объема выборки
59
Jeffery S., Saggar Malik A.K., CrosbY A., BlanD M., Eastwood J.B., Amoah-Danquah J., Acheampong J.W., Plange-Rhule J.
A dominant relationship between the ACE D allele and serum ACE levels in a Ghanaian population
J. Med. Genet. 1999;36:869-870
Table 1 Serum ACE in U/l for each ACE genotype
ACE genotype
II ID DD
24 26 48 82 60 50 21 23
27 48 62 42 56 20 43 35
42 31 47 74 57 37 33 8
42 15 35 45 57 24 46 60
19 31 25 25 24 53 89 31
36 43 55 98 62 83 70
60
36 43 55 98 62 83 70
25 44 28 62 27 50 125
26 61 52 82 21 20 69
33 52 56 71 21 65
74 62 68 33 35 77
32 38 97 34 90 65
44 37 32 37 117 82
30 39 36 35 100 38
29 132 103 77 41 38
Mean
(SD)
34.5 (13.6) 51.3 (23.8) 53.3 (29.5)
Median
(range)
31 (19-74) 47.5 (15-132) 46 (8-125)
Программа Instat+
http://www.rdg.ac.uk/ssc/software/instat/instat.html
61
Инсерционно-делеционный диморфизм в гене ACE
и активность АПФ, программа Instat+
http://www.rdg.ac.uk/ssc/software/instat/instat.html
63
95%-е ПИ и ДИ для активности АПФ
http://smed.ru/guides/363/?q=%E0%ED%E3%E8%EE&search_type=tree#article
Эталонные (референсные) значения
Возраст Активность, Ед/л
< 12 9,4 – 37
13 – 16 9 – 33,4
Взрослые 6,1 – 26,6Взрослые 6,1 – 26,6
64
У здоровых индивидуумов в норме уровень
концентрации ACE между индивидуумами может
колебаться в 5 раз, а внутрииндивидуальная
вариабельность намного ниже.
http://medbiol.ru/medbiol/ace/00008b43.htm
Калибровка P-значений
• Как уже было сказано, Р-значение не может быть
вероятностью нулевой гипотезы P(H0).
• Но именно вероятность нулевой гипотезы, очевидно, должна
интересовать исследователя более всего.
• К сожалению традиционная частотническая статистика не• К сожалению традиционная частотническая статистика не
способно вычислять эту веротяность.
• Это может делать бейзовская статистика.
• Уже относительно давно статистики-бейзовцы предложили
калибровать Р-значения относительно вероятности P(H0).
• В простейшем варианте удается оценить не P(H0), а лишь ее
нижнюю границу (минимально достижимое значение) P(H0).
65
Калибровка p-значения
• Vovk V. G.
• A logic of probability, with application to the foundations of statistics
• Journal of the Royal Statistical Society. Series B (Methodological),
• Vol. 55, No. 2 (1993), pp. 317-351.
( ) ( )
• - нижняя граница для вероятности нулевой гипотезы H0
( ) ( )ppDHP p
lnln
−≥ +11
0
66
Калибровка p-значения
• Sellke T., Bayarri M.J., Berger J.O.
• Calibration of p Values for Testing Precise Null Hypotheses
• The American Statistician, Vol. 55, No. 1. (2001), pp. 62-71.
• При
ep 1<
( )
1
0
1
1
−






−
+≥
ppe
DHP
ln
ep 1<
67
«Цена» Р-значения
P-значение
Нижняя граница
для вероятности
нулевой гипотезы
P(H0)
Верхняя граница
для вероятности
воспроизведения
Рrepr
0,05 > 30% < 50%0,05 > 30% < 50%
0,01 > 10% < 75%
0,001 > 2% < 90%
Для наглядности значения в таблице округлены до первой значащей
цифры. Более точно значения для P(H0) (сверху вниз) равны 29%, 11%
и 1,8%.
68
Значение и назначение
P-значения
69
Заключение
• Надо перестать судорожно цепляться за уровень
значимости α = 0,05 (а, скоре всего, и за α = 0,01)
и некритично объявлять случаи его преодоления
(Pval < 0,05) статистически значимыми (или даже
«достоверными») событиями.«достоверными») событиями.
• Если мы сконцентрируемся на преодолении
уровня α = 0,001, т.е. будем считать
статистически значимыми Pval < 0,001, то в итоге
сможем съэкономить массу времени и средств.
70
Статистическая значимость и
размер эффекта
• Эффект (различие, связь, риск, польза,
ассоциация и т. п.) может быть статистически
значимым, но его практическая (например,
клиническая) ценность может оказаться
ничтожной.ничтожной.
• «Статистически значимый» не означает
«значительный», «практически важный»,
«ценный».
71
Излечися сам
• Единственный способ излечиться от
синдрома статистической
снисходительности
• – это многократно повторять• – это многократно повторять
эксперименты и изучать
воспроизводимость наблюдаемых
эффектов, которые при Pval < 0,05 слишком
часто могут оказаться ложными.
72
Повторение – мать познания
• Повторение составляет суть науки:
• «ученый должен всегда задумываться о том,
что произойдет, если он или другой ученый
повторят его эксперимент» (Guttman, 1977).
• «Ученые разработали метод определения
надежности (валидности) своих результатов.
• Они научились задавать вопрос:
воспроизводимы ли они?» (Scherr, 1983).
73
Михаил Ефимович Лобашев (11.11.1907 – 04.01.1971)
• Можете заниматься в
науке чем угодно,
только не забывайте о
последствиях и об
ответственности.ответственности.
74
Предсказательная способность и
экономическая эффективность
клинико-генетической
паспортизации
75
• Решающими показателями качества
любого метода диагностики являются не
отношения шансов (OR) или отношения
рисков (RR),рисков (RR),
• но предсказательные вероятности
(прогностические ценности)
положительного и отрицательного
результатов диагноза: PPV и NPV.
76
Рекомендации
• Khoury M.J., McBride C.M., Schully S.D., Ioannidis J.P.A., Feero W.G.,
Janssens A.C.J.W., Gwinn M., Simons-Morton D.G., Bernhardt J.M., Cargill
M., Chanock S.J., Church G.M., Coates R.J., Collins F.S., Croyle R.T., Davis
B.R., Downing G.J., DuRoss A., Friedman S., Gail M.H., Ginsburg G.S., Green
R.C., Greene M.H., Greenland P., Gulcher J.R., Hsu A., Hudson K.L., Kardia
S.L.R., Kimmel P.L., Lauer M.S., Miller A.M., Offit K., Ransohoff D.F., Roberts
J.S., Rasooly R.S., Stefansson K., Terry S.F., Teutsch S.M., Trepanier A.,J.S., Rasooly R.S., Stefansson K., Terry S.F., Teutsch S.M., Trepanier A.,
Wanke K.L., Witte J.S., Xu J.
• The Scientific Foundation for Personal Genomics: Recommendations
from a National Institutes of Health–Centers for Disease Control and
Prevention Multidisciplinary Workshop
• Genet. Med. 2009:11(8):559 –567
77
Использование генетических ассоциаций для
оценки риска и предсказания болезни
• Даже если генетическая ассоциация оказывается
статистически высоко значимой, то непременно
встает вопрос, насколько полезной будет эта
информация для оценки риска и предсказания
болезни?болезни?
• Необходимо измерять чувствительность,
специфичность, ценность положительного
предсказания (PPV) и ценность отрицательного
предсказания (NPV).
78
Теорема Бейза в действии
79
БОГО
• Мможно предложить называть
многофакторные болезни
• болезнями с ограниченной генетической
обусловленностью –обусловленностью –
• БОГО
80
• Пусть распространенность болезни с ограниченной генетической
обусловленностью (БОГО) в некоторой популяции равна
• P(D+) = 1%.
• Допустим, что у больных доля носителей генотипа (аллели,
гаплотипа) g1, предрасполагающего к данной БОГО, равна
• P(g1|D+) = 20%
• и она в 2 раза выше, чем у индивидуумов без этой БОГО:• и она в 2 раза выше, чем у индивидуумов без этой БОГО:
• P(g1|D-) = 10%.
• Этому соответствуют значения
• RR = 2,
• OR = 4,4
• и разности рисков
• RD = 10%.
81
• По формуле Бейза вероятность БОГО у носителя генотипа g1
примерно в 2 раза превышает ее распространенность:
• PPV1 = P(D+|g1) = 1,98%.
• Вряд ли на основе столь малого значения можно делать выводы о
наличии или развитии данной БОГО у конкретного индивидуума.
• Допустим теперь, что есть еще другой предрасполагающий к данной
БОГО генотип g с такими же характеристиками.БОГО генотип g2 с такими же характеристиками.
• Вероятность БОГО у носителей обоих генотипов совместно (g1 и g2)
возрастает по сравнению с носителями каждого из них по
отдельности (g1 или g2):
• PPV1,2 = P(D+|g1,g2) = 3,9%.
• Очевидно, что чем больше в генотипе предрасполагающих аллелей,
тем выше вероятность возникновения или развития данной БОГО у
его носителей.
82
• Однако доля носителей таких генотипов в популяции снижается
экспоненциально, и уже для 6-и маркеров составляет 1 на миллион
при PPV1,…,6 = P(D+|g1,…, g6) = 39%, которая всего в 10 раз выше, чем
для пары генотипов.
• Для носителей одновременно 9-и маркеров вероятность БЭНП
достигает 91%, а у носителей 10-и таких маркеров – 95%.достигает 91%, а у носителей 10-и таких маркеров – 95%.
• Но обнаружить таких индивидуумов практически невозможно: их
доли в популяции составляют 10-9 и 10-10.
• Фактически это будет один человек на Земле.
83
Предсказательная ценность нескольких независимых
предрасполагающих генетических маркеров
Число
предрасполагающих
локусов в генотипе
PPV
Доля носителей
предрасполагающего
генотипа G+ в популяции
1 0,020 0,1
2 0,039 0,01
3 0,075 0,001
4 0,14 0,0001
5 0,24 10-5
6 0,39 10-6
7 0,71 10-7
8 0,84 10-8
9 0,91 10-9
10 0,95 10-10
84
Экономическая
эффективность клинико-
генетической паспортизации
85
Rembold C.M. Number needed to screen: development of a statistic for
disease screening. BMJ – 1998. – Vol. 317. – P. 307–312.
• Полезным и наглядным показателем
эффективности и продуктивности
генотипирования является NNG (Number Needed
to be Genotyped) – количество подлежащих
генотипировнию:генотипировнию:
86
Экономическая эффективность генотипирования
БОГО
• Пусть распространенность болезни с ограниченной генетической
обусловленнностью (БОГО) в некоторой популяции равна
• P(D+) = 1%.
• Допустим, что разность рисков RD = 0,1.
• Тогда
• NNG = 1/(0,1 ×××× 0,01) = 1000.• NNG = 1/(0,1 ×××× 0,01) = 1000.
• Это означает, что надо генотипировать примерно 1000 человек,
чтобы этим методом выявить на одного больного человека больше,
чем эталонным (стандартным) методом.
• Пусть цена одного анализа составляет 100 у.е.
• Тогда для выявления одного больного надо затратить примерно 100
тыс. у.е.
• При генотипировании по k маркерам затраты возрастут в k раз.
87
Массовый маммографический
скрининг
• Emily Banks, Gillian Reeves, Valerie Beral, Diana Bull, Barbara Crossley,
Moya Simmonds, Elizabeth Hilton, Stephen Bailey, Nigel Barrett, Peter
Briers, Ruth English, Alan Jackson, Elizabeth Kutt, Janet Lavelle, Linda
Rockall, Matthew G Wallis, Mary Wilson and Julietta Patnick
• Influence of personal characteristics of individual women on sensitivity
and specificity of mammography in the Million Women Study: cohort
study
• BMJ 2004;329;477
Маммографическая процедура
Так выглядит рак молочной железы на рентгеновском
снимке (белое, яркое пятно с нечеткими краями)
http://www.breast-cancer.ru/diagnosis/mammogram.html
AtteStat
http://attestatsoft.com/download.htm
Маммо-
графия
Рак молочной
железы
Всего
есть нет
• Критерий хи-квадрат:
• χχχχ2 = 14119,4; P = 10-300
• Распространенность
(вычисленная):
• Prev = 0,0059 ≈ 0,6%
+ 629 3 885 4 514
− 97 117 744 117 841
Всего 726 121 629 122 355
• Prev = 0,0059 ≈ 0,6%
• Чувствительность:
• Sen = 0,820,870,91
• Специфичность:
• Spe = 0,9660,9680,970
Проверьте свою интуицию
• Допустим, что у женщины (не дай бог)
маммография дала положительный
результат.
• Как Вы думаете, какова вероятность того,
что этой женщины действительно рак
молочной железы?
PPV и NPV - предсказательные способности
положительного и отрицательного результатов
• Прогностичность
положительного
результата:
• PPV = a/(a + b) =
• Прогностичность
отрицательного
результата:
• NPV = d/(c + d) =
• = 629 : 4514 =
• = 0,14
• PPV = 0,120,140,16 ≈ 14%
• = 117744 : 117841 =
• = 0,9992
• NPV = 0,99890,99920,9994
PPVNPV.xls
www.cardiff.ac.uk/medic/aboutus/departments/
primarycareandpublichealth/resources/PPVNPV.xls
Utility of the apolipoprotein E genotype in the
diagnosis of Alzheimer’s disease
• Mayeux R., Saunders A.M., Shea S., Mirra S., Evans D., Roses A.D.,
Hyman B.T., Crain B., Tang M., Phelps C.H.
N. Engl. J. Med. 1998; 338:506-511.• N. Engl. J. Med. 1998; 338:506-511.
APPENDIX
• В исследовании принимали участие также следующие исследователи и Центры по болезни
Альцгеймера:
• Baylor College of Medicine: S. Appel, R. Doody, J. Kirkpatrick, J. Li; Case Western Reserve University: P.
Whitehouse, D. Geldmacher, J. Stuckey; Columbia University: M. Shelanski, J. Goldman, B. Tycko; Duke
University Medical Center: M. Pericak-Vance, C. Hulette; Emory University: M. Gearing, H. Kim; Harvard
Medical School: J. Growdon, D. Reardon, T. Hedley-Whyte; Indiana University: B. Ghetti, M. Farlow, H.
Hendrie, F. Unverzagt; Johns Hopkins University: D. Price, C. Kawas; Mayo Clinic: R. Petersen, S. Waring,
J. Parisi, S. Thibodeau; Mount Sinai School of Medicine: K. Davis, D. Marin, H. Haroutunian, D.
Greenberg; New York University: S. Ferris, B. Quinn, B. Reisberg, M. de Leon; Oregon Health SciencesGreenberg; New York University: S. Ferris, B. Quinn, B. Reisberg, M. de Leon; Oregon Health Sciences
University: J. Kaye, G. Murdoch, M. Ball; Rush–Presbyterian–St. Luke’s: D. Bennett, E. Cochran; University
of California–Davis: W. Jagust, B. Reed, W. Ellis; University of California–Los Angeles: H. Vinters, J.
Cummings; University of California–San Diego: L. Thal, R. Katzman, D. Galasko, M. Sundsmo; University
of Kansas: W. Koller, K. Lyons; University of Kentucky: W. Markesbery, D. Wekstein, M. Kindy; University
of Michigan: S. Gilman, N. Foster, R. Albin, A. Sima, J. Fink; University of Pennsylvania: J. Trojanowski, C.
Clark; University of Pittsburgh: S. DeKosky, M. Kamboh, R. Ferrell; University of Rochester: P. Coleman,
D. Ryan; University of California–Irvine: C. Finch, J. Buckwalter, C. Miller; University of Texas
Southwestern Medical Center: R. Rosenberg, C. White III, M. Weiner; University of Washington–Seattle:
M. Raskind, E. Peskind, J. Leverenz, D. Nochlin; Washington University Medical Center: J. Morris, E.
Grant, A. Goate.
Соответствие между наличием аллели APOE*ε4 и
патологическим диагнозом болезни Альцгеймера у 2188
пациентов с деменцией (приобретенным слабоумием)
Генотип по гену APOE
Патологический диагноз
Болезнь Альцгеймера Другие причины
слабоумия
Количество больных
Наличие одной или обеих
аллелей ε4
1142 133
аллелей ε4
Отсутствие аллеи ε4 628 285
Всего 1770 418
Чувствительность
диагностики БА по
наличию аллели APOE*ε4
1142:1770≈65%
0,620,650,67
Специфичность
диагностики БА по
наличию аллели APOE*ε4
285:418≈68%
0,620,680,74
PPVNPV.xls
www.cardiff.ac.uk/medic/aboutus/departments/
primarycareandpublichealth/resources/PPVNPV.xls
Ощутите разницу
Маммография APOE
Von Stein P., Lofberg R., Kuznetsov N.V., Gielen A.W., Persson J.-O.,
Sundberg R., Hellstrom K., Eriksson A., Befrits R., Ost A., Von Stein O.D.
Multigene analysis can discriminate between ulcerative colitis, Crohn’s
disease, and irritable bowel syndrome. Gastroenterol. 2008; 134:1869–1881
100
Анализ дифференциальной экспрессии генов, специфичных для
болезни Крона, может оказаться быстрым и надежным методом
диагностики.
ПСА
Уровень
ПСА, нг/мл
Случай Контроль
≤ 4,0 221 1439
4,1 – 9,9 926 233
10,0 – 19,9 654 3810,0 – 19,9 654 38
20,0 – 49,9 457 14
50,0 – 99,9 229 2
≥ 100 317 1
AUC = 0,900,920,93
Prev = 8% = 0,08
101
Kraft P., Wacholder S., Cornelis M.C., Hu F.B., Hayes R.B., Thomas G., Hoover R.,
David J. Hunter D.J., Chanock S. Beyond odds ratios — communicating disease risk
based on genetic profiles. Nature Rev. Genetics Vol. 10, 2009, 264-269.
Сильная
статистич-
еская связь
между
генотипом и
болезнью не
можетможет
служить
показателем
предсказа-
тельной
ценности.
AUC = 0,60 и
AUC = 0,57
102
Huett A., Xavier R.J. Neither hide nor hair: the difficulty of identifying useful
disease biomarkers. Gastroenterology Vol. 134, No. 7, p. 2164-2168.
Идеализиро-
ванная схема
диагностики в
постгеномную
103
постгеномную
эру
Фармакогенетика
• Lenzini P., Wadelius M., Kimmel S., Anderson J.L., Jorgensen
A.L., Pirmohamed M., Caldwell M.D., Limdi N., Burmester
J.K., Dowd M.B., Angchaisuksiri P., Bass A.R., Chen J.,
Eriksson N., Rane A., Lindh J.D., Carlquist J.F., Horne B.D.,
Grice G., Milligan P.E., Eby C., Shin J., Kim H., Kurnik D., SteinGrice G., Milligan P.E., Eby C., Shin J., Kim H., Kurnik D., Stein
C.M., McMillin G., Pendleton R.C., Berg R.L., Deloukas P.,
Gage B.F.
• Integration of genetic, clinical, and INR data to refine
warfarin dosing.
• Clin. Pharmacol. Ther. Volume 87, No 5, 2010, 572-578.
104
Индивидуальный подбор доз фарфарина
• Фармакогенетическая поддерживающая доза (mg/week) =
• EXP [3,10894 − 0,00767 ×××× age − 0,51611 ×××× ln(INR) − 0,23032 ×××× VKORC1-
1639 G>A − 0,14745 ×××× CYP2C9*2 − 0,3077 ×××× CYP2C9*3 + 0,24597 ×××× BSA +
0,26729 ×××× Target INR − 0,09644 ×××× African origin − 0,2059 ×××× stroke −
0,11216 ×××× diabetes − 0,1035 ×××× amiodarone use − 0,19275 ×××× fluvastatin
use + 0,0169 ×××× dose−2 + 0,02018 ×××× dose−3 + 0,01065 ×××× dose−4].use + 0,0169 ×××× dose−2 + 0,02018 ×××× dose−3 + 0,01065 ×××× dose−4].
• Клиническая поддерживающая доза (mg/week) =
• EXP [2,81602 − 0,76679 ×××× ln(INR) − 0,0059 ×××× age + 0,27815 ×××× target INR −
0,16759 ×××× diabetes + 0,17675 ×××× BSA − 0,22844 ×××× stroke − 0,25487 ××××
fluvastatin use + 0,07123 ×××× African origin − 0,11137 ×××× amiodarone use +
0,03471 ×××× dose−2 + 0,03047 ×××× dose−3 + 0,01929 ×××× dose−4].
105
106
Фармакогенетически
предсказанные дозы варфарина
Клинически предсказанные
дозы фарфарина
Репрезентативность выборки
• Один из важнейших вопросов, решаемых
аналитической статистикой:
• Достаточно ли имеющихся статистических
данных для того, чтобы выводы,
сделанные на их основе, были точными исделанные на их основе, были точными и
надежными?
• Другими словами, представительна ли
(репрезентативна ли) имеющаяся
выборка?
107
Босс В. Лекции по математике. Т. 4: Вероятность,
информация, статистика. М.: КомКнига, 2005. – 216 с.
• Сколько лягушек
придется
перецеловать, пока неперецеловать, пока не
найдешь свою
принцессу ?
108
Статистика с доверием
• Дает ли статистика нам право
доверять ей?
• Как проверить, является ли
игральная кость правильной?
109
Имитация ЗБЧ, программа SUStats.jar
http://www.jsc.nildram.co.uk/examples/sustats/SUStats.html
110
Имитация ЗБЧ, программа SUStats
http://www.jsc.nildram.co.uk/examples/sustats/SUStats.html
111
Donahue M.P., Allen A.S., Genetic association studies in cardiology
Am. Heart J. 2005; 149:964- 70.
112
Объемы выборок у Менделя и у его
последователей и опровергателей
Автор Желтые Зеленые Всего Согласие с 3 : 1
Pval BF01
Mendel 6022 2001 8003 1,0 82,4
Correns 1394 453 1847 0,66 35,7
Tschermak 3580 1190 4770 0,95 63,5
Bateson 11903 3903 15806 0,38 78,1Bateson 11903 3903 15806 0,38 78,1
Hurst 1310 445 1755 0,75 36,2
Lock 1438 514 1952 0,18 16,1
Darbishire 108866 36123 144989 0,45 264,3
Ермолаева 6206 2225 8431 0,0035 1,1
Всего 140699 46854 187553 0,86 392,5
Однород-
ность
Pval = 0,096;
BF01 = 2,7·109
113
Статистика – способ мышления
• Две основные идеологии статистических рассуждений:
• Бейзовская (Бейзианская) и
• Частотническая (частотная)
• В частотнической идеологии выделяются два основных
течения:
• Фишера и• Фишера и
• Неймана-Пирсона
• Пользователи их не всегда различают, и отсюда
возникают серьезные недоразумения.
114
Reverend Thomas Bayes [bɛi:z]) – Преподобный Томас Бейз
(Байес, Бейес) c. 1702 – 17.04.1761
115
Проверьте свою интуицию
• Допустим, я уговорил Вас сыграть со мной в орлянку.
• Я подбрасываю монету, и каждый раз она выпадает
одной стороной – орлом.
• Вопрос 1:
• начиная с какого раза Вы заподозрите неладное? И• начиная с какого раза Вы заподозрите неладное? И
решите, что я везучий, или ловкач?
• Вопрос 2:
• начиная с какого раза Вы обвините меня в
жульничестве? И определенно решите, что моя монета
фальшивая – с обеих сторон у нее орел?
Задача
• Я подбросил монету 10 раз, и все 10 раз монета выпала
вверх одной стороной (например, орлом).
• Вопрос:
• Что можно сказать обо мне или о монете:
• Можно ли признать монету правильной (идеальной)?• Можно ли признать монету правильной (идеальной)?
• Или монета фальшивая?
• Честный ли я, везучий ли я, или ловкач, или жулик?
• Если монета недоступна для непосредственного осмотра,
то задача неизбежно становится вероятностно-
статистической.
117
Бейзовская логика - I
• Две модели:
• M1 – монета идеальная (правильная), т.е.
параметр Модели 1:
• ϕϕϕϕ = Pr(орел) = 1/2.
• M – монета фальшивая – с обеих сторон• M2 – монета фальшивая – с обеих сторон
орел, т.е. параметр Модели 2:
• ϕϕϕϕ = Pr(орел) = 1.
• Вопрос: какая из двух моделей более
правдоподобна, если ϕϕϕϕнабл.= 10/10 = 1 ?
118
Бейзовская логика – I (продолжение)
000980
1024
1
2
1
10
10
10
11 ,~Pr ≈=





=






== MP ϕϕϕϕ
1
10
10
22 =






== MP ϕϕϕϕ~Pr
• Отношение правдоподобий (Бейзов множитель, Бейзов фактор)
• В 1024 раза более правдоподобно (вероятно, реально) получить
наблюдаемый результат (10 орлов подряд), если верна Модель 2
• (ϕϕϕϕ = 1), нежели если верна Модель 1 (ϕϕϕϕ = 1/2).
10 
1024
10241
1
1
2
21 ===
P
P
LR
119
Бейзовская логика - II
• Модель 3: неопределенная:
• Принцип недостаточного основания (Лаплас): вероятностная
переменная (доля орлов в выборке) распределена равномерно
на отрезке от 0 до 1:
2
1
≠ϕ
1110~ 
ϕ~
[ ]( )10;~~ ∈ϕϕϕϕϕϕϕϕ Uni
• В 93 раза более правдоподобно получить наблюдаемый результат
• при условии, что (Модель 3) нежели при (Модель 1).
0910
11
1
1
1
10
10
33 ,~Pr ≈=
+
=






==
n
MP ϕϕϕϕ
93
11
1024
10241
111
1
3
31 ≈===
P
P
LR
2
1
≠ϕ
2
1
=ϕ
120
Бейзовская логика - III
• Сравнение Модели 2 и Модели 3:
11
111
1
3
2
23 ===
P
P
LR
• В 11 раз более правдоподобно получить
наблюдаемый результат (n =10, y = 10) при
условии, что ϕϕϕϕ = 1 (Модель 2) нежели при
(Модель 3).
121
[ ]( )10,~~ ∈ϕϕ Uni
1113P
Интерпретация убедительности Бейзова фактора по Джеффризу
http://en.wikipedia.org/wiki/Bayes_factor
BF01 Свидетельство в пользу модели
M1 против модели M0
< 1:100 Убедительное
1:100 – 1:30 Очень сильное
1:30 – 1:10 Сильное
1:10 – 1:3 Существенное
1:3 – 1:1 Не заслуживает внимания1:3 – 1:1 Не заслуживает внимания
BF01 Свидетельство в пользу модели
M0 против модели M1
1:1 – 3:1 Не заслуживает внимания
3:1 – 10:1 Существенное
10:1 – 30:1 Сильное
30:1 – 100:1 Очень сильное
>100:1 Убедительное
Интерпретация убедительности Бейзова фактора
по Элстону и Джонсону (Elston, Johnson, 2008)
BF01
Свидетельство
в пользу модели M1
против модели M0
< 1 Отрицательное (в пользу M0)
2 Вряд ли заслуживает внимания2 Вряд ли заслуживает внимания
6 Существенное
20 Довольно сильное
60 Очень сильное
100 Убедительное
Интерпретация убедительности Бейзова
фактора по Ройаллу (Royall)
BF01 как свидетельство
Уровень
свидетельстваВ пользу M0
против M1
В пользу M1
против M0
1 ≤ BF < 8 1/8 < BF ≤ 1 Слабое
8 ≤ BF < 32 1/32 < BF ≤ 1/8 Умеренное
≥ 32 < 1/32 Сильное
Интерпретация убедительности Бейзова
фактора по Кассу-Рафтери (Kass, Raftery)
BF01
Свидетельство
в пользу модели M1
против модели M0
> 1:1 Отрицательное (в пользу M0)> 1:1 Отрицательное (в пользу M0)
От 1:1 до 1:3 Не заслуживает внимания
От 1:3 до 1:20 Умеренное
От 1:20 до 1:150 Значительное
< 1:150 Очень убедительное
Интерпретация убедительности Бейзова
фактора по Джекману (Simon Jackman)
BF01
Свидетельство
в пользу модели M0
против модели M1
< 1 Отрицательное (в пользу M1)< 1 Отрицательное (в пользу M1)
1 - 3 Не заслуживает внимания
3 -12 Положительное
12 – 150 Сильное
> 150 Очень сильное
Ng P.C., Murray S.S., Levy S., Venter J.C. An agenda for personalized
medicine. Nature Vol. 461, 2009, p. 724-726.
• Всего лишь 2/3
показателей
(предикторов)
относительного риска
качественнокачественно
согласуются между
23andMe и Navigenics
• для 5-и
индивидуумов.
127
Подготовиться к Олимпиаде в Сочи российским
спортсменам могут помочь генетические паспорта.
http://www.gzt.ru/print/298187.html
• Очевидно, что если повсеместно начать
тестировать российских школьников,
выбирающих тот или иной вид спорта, и
изначально иметь представление об ихизначально иметь представление об их
потенциале, то число будущих
олимпийских чемпионов увеличится на
порядок.
128
«Они знают, что могут умереть...»
http://www.sovsekretno.ru/magazines/article/2347
• – У человека могут быть отличные «гены спорта», но если он
психологически неустойчив, стабильных результатов не добьется, –
замечает сотрудник лаборатории Сергей Хальчицкий.
• – Недавно, к примеру, обследовали талантливого лыжника-
двоеборца (гонки и трамплин).
• Генетический набор – ну просто олимпийского чемпиона.• Генетический набор – ну просто олимпийского чемпиона.
• Проанализировали характер выступлений: нестабильные.
• Занялись семейной родословной: родители злоупотребляют
алкоголем.
• Это отразилось на его генах: человек психологически неустойчив.
• К сожалению, многие родители, настроенные сделать из ребенка
чемпиона, свято верят: в спорте главное – воля, а не генетика (Ирина
Астратенкова).
129
Евгений Константинович Гинтер,
академик РАМН, ГУ МГНЦ РАМН
130
Евгений Гинтер: «Генетический паспорт – это профанация»
«АиФ Здоровье», № 3 от 15 января 2009
http://www.aif.ru/health/article/23908
• Генетические паспорта в таком виде, в каком они
существуют сегодня, не нужны абсолютно.
• И в нашем центре мы этим не занимаемся.
• Сейчас во всем мире занимаются этим только частные
коммерческие структуры.коммерческие структуры.
• И если уж совсем откровенно, думаю, ни в одной такой
структуре ни одного грамотного,
• квалифицированного
• врача-генетика нет, а если и есть,
• то он занимается профанацией.
131
• Скажу больше, генетический паспорт в том виде, в котором
его сейчас выдают коммерческие структуры, может принести
существенный вред.
• Человеку говорят, что у него есть предрасположенность к сахарному
диабету или к ишемической болезни сердца.
• И что дальше?• И что дальше?
• Ничего, кроме банальных советов вести здоровый образ жизни, не
курить, делать физкультуру, не есть слишком жирную пищу, дать
ему не смогут.
• Но эти рекомендации, известные с доисторических времен, хороши
для любого, даже на сто процентов здорового человека.
• Зачем же запугивать людей, вгонять их в депрессию?
132
Николай Казимирович Янковский,
член-корр. РАН, директор Института общей генетики
133
Николай Казимирович Янковский
Итоги, № 14 (721) 5 апреля 2010 года. С. 50-51.
• Вред, нанесенный проверкой на всякий
случай, скорее навредит здоровью
общества, чем поможет.
• Даже зная всю структуру генома• Даже зная всю структуру генома
конкретного организма, мы не сможем
сказать, заболеет человек
[например, гипертонией или
диабетом] наверняка или нет.
134
Соблазны
• Ламаркизм
• Генетицизм – генетический детерминизм
• Евгенизм
• Лысенкоизм• Лысенкоизм
• Коммерциализм –
• «генетизация» медицины по сути
становится синонимом
коммерциализации
Спасибо за внимание!
Слайды доступны для всех
Никита Николаевич Хромов-Борисов
Кафедра медицинской информатикиКафедра медицинской информатики
СПбГМУ им. акад. И.П. Павлова
Nikita.KhromovBorisov@gmail.com
(812) 234-18-40
8-952-204-89-49
136

Contenu connexe

En vedette

Reproducibility and predictivity in the genetics of predispositions ppt 2013
Reproducibility and predictivity in the genetics of predispositions ppt 2013Reproducibility and predictivity in the genetics of predispositions ppt 2013
Reproducibility and predictivity in the genetics of predispositions ppt 2013
Nikita Khromov-Borisov
 
What is your teams digital strategy
What is your teams digital strategyWhat is your teams digital strategy
What is your teams digital strategy
Rich Street
 
Evolutionary medical genomics ppt 2013
Evolutionary medical genomics ppt 2013Evolutionary medical genomics ppt 2013
Evolutionary medical genomics ppt 2013
Nikita Khromov-Borisov
 
химия днк для генетиков 2015
химия днк для генетиков 2015химия днк для генетиков 2015
химия днк для генетиков 2015
Nikita Khromov-Borisov
 

En vedette (13)

Reproducibility and predictivity in the genetics of predispositions ppt 2013
Reproducibility and predictivity in the genetics of predispositions ppt 2013Reproducibility and predictivity in the genetics of predispositions ppt 2013
Reproducibility and predictivity in the genetics of predispositions ppt 2013
 
NARESH KUMAR..
NARESH KUMAR..NARESH KUMAR..
NARESH KUMAR..
 
聯誼規則簡易版簡介
聯誼規則簡易版簡介聯誼規則簡易版簡介
聯誼規則簡易版簡介
 
Harmonizing statistical evidences and predictions
Harmonizing statistical evidences and predictionsHarmonizing statistical evidences and predictions
Harmonizing statistical evidences and predictions
 
What is your teams digital strategy
What is your teams digital strategyWhat is your teams digital strategy
What is your teams digital strategy
 
Evolutionary medical genomics ppt 2013
Evolutionary medical genomics ppt 2013Evolutionary medical genomics ppt 2013
Evolutionary medical genomics ppt 2013
 
химия днк для генетиков 2015
химия днк для генетиков 2015химия днк для генетиков 2015
химия днк для генетиков 2015
 
кольцов и матричный принцип 2015
кольцов и матричный принцип 2015кольцов и матричный принцип 2015
кольцов и матричный принцип 2015
 
Half a century with the central dogma of molecular biology ppt
Half a century with the central dogma of molecular biology pptHalf a century with the central dogma of molecular biology ppt
Half a century with the central dogma of molecular biology ppt
 
Catalog of formulae for forensic genetics ppt
Catalog of formulae for forensic genetics pptCatalog of formulae for forensic genetics ppt
Catalog of formulae for forensic genetics ppt
 
Genetics of predispositions ppt
Genetics of predispositions pptGenetics of predispositions ppt
Genetics of predispositions ppt
 
Solar water pump (swp) in india "Research thesis presentation"
Solar water pump (swp) in india "Research thesis presentation"Solar water pump (swp) in india "Research thesis presentation"
Solar water pump (swp) in india "Research thesis presentation"
 
The Outcome Economy
The Outcome EconomyThe Outcome Economy
The Outcome Economy
 

Plus de Nikita Khromov-Borisov

Reproducibility of results in the genetics of predisposition eng 2014
Reproducibility of results in the genetics of predisposition eng 2014Reproducibility of results in the genetics of predisposition eng 2014
Reproducibility of results in the genetics of predisposition eng 2014
Nikita Khromov-Borisov
 

Plus de Nikita Khromov-Borisov (6)

парадоксы геномной медицины 2015
парадоксы геномной медицины 2015парадоксы геномной медицины 2015
парадоксы геномной медицины 2015
 
Evolutionary arguments in medical genomics
Evolutionary arguments in medical genomicsEvolutionary arguments in medical genomics
Evolutionary arguments in medical genomics
 
кризис воспроизводимости в биомедицине Rus 2014
кризис воспроизводимости в биомедицине Rus 2014кризис воспроизводимости в биомедицине Rus 2014
кризис воспроизводимости в биомедицине Rus 2014
 
Prematurity of genetic testing of predispositions rus 2014
Prematurity of genetic testing of predispositions rus 2014Prematurity of genetic testing of predispositions rus 2014
Prematurity of genetic testing of predispositions rus 2014
 
Format for the population data in forensic genetics ppt
Format for the population data in forensic genetics pptFormat for the population data in forensic genetics ppt
Format for the population data in forensic genetics ppt
 
Reproducibility of results in the genetics of predisposition eng 2014
Reproducibility of results in the genetics of predisposition eng 2014Reproducibility of results in the genetics of predisposition eng 2014
Reproducibility of results in the genetics of predisposition eng 2014
 

Syndrome of statistical leniency ppt

  • 1. Синдром статистической снисходительности или значение и назначение P-значения Никита Николаевич Хромов-БорисовНикита Николаевич Хромов-Борисов Кафедра медицинской информатики СПбГМУ им. акад. И.П. Павлова Nikita.KhromovBorisov@gmail.com (812) 234-18-40 8-952-204-89-49 1
  • 2. 9th International Congress of Human Genetics 18-23 August 1996. Rio de Janeiro, Brazil 2
  • 3. Статистика • 80% ёжиков колются, а 20% - нюхают грибы • При упоминании• При упоминании слова «статистика» многие врачи раздражаются и приходят в замешательство или в уныние. 3
  • 4. Единые требования • Редакции многих отечественных и зарубежных биомедицинских журналов при подготовке к публикации научных статей рекомендуют авторам руководствоваться «Едиными требованиями к рукописям, представляемым в биомедицинские журналы». • Требования разрабатывает Международный комитет редакторов медицинских журналов (International Committee of Medical Journalмедицинских журналов (International Committee of Medical Journal Editors – ICMJE). • Эти требования регулярно пересматриваются, и последняя их редакция датирована октябрем 2008 г.: • http://www.icmje.org/index.html • На русский наиболее удачно переведена редакция 2005 г.: • http://www.mediasphera.ru/mjmp/2005/5/10.pdf 4
  • 5. Единые требования, раздел «Статистика» • В этих требованиях в разделе «Статистика» сказано: • «Описывайте статистические методы настолько детально, чтобы осведомленный читатель, имеющий доступ к исходным данным, мог проверить сообщаемые Вами результаты. • По возможности, подвергайте полученные данные количественной оценке и представляйте их сколичественной оценке и представляйте их с соответствующими показателями ошибок измерения и неопределенности или варьирования измерений (такими как доверительные интервалы). • Не следует полагаться исключительно на проверку статистических гипотез, например, на использование Р- значений, которые не содержат важную информацию о размере эффекта». 5
  • 6. Открой личико • Katrina Kelner, Deputy Editor for Life Sciences, Science • Журнал “Science” принял такую политику в отношении открытости данных: • «После публикации, все данные, необходимые для понимания, оценки и проверки выводов статьи, должны быть доступны всем читателям журнала». 6
  • 8. Экология человека, 2008. - № 7. - С. 57-64. • Обновленные требования появились недавно в журнале «Экология человека», в которых в частности содержится чрезвычайно важное предостережение: • «Всегда следует помнить, что выявление статистически значимых различий еще не означает наличия достоверных или клинически важныхналичия достоверных или клинически важных различий, а также причинно-следственных связей». • Несмотря на рекомендацию «не полагаться исключительно на использование P-значения», до сих пор во многих научных публикациях оно фигурирует как решающий показатель значимости наблюдаемых авторами эффектов, различий, корреляций и т.п. 8
  • 9. Р-значение • Напомним, как определяется и вычисляется Р-значение. • P-значение есть условная вероятность, а именно: • Вероятность получить наблюдаемое значение tнабл. статистики некоего критерия T и все остальные еще менее вероятные значения этой статистики (или значения, еще более отклоняющиеся от ожидаемых) ПРИ УСЛОВИИ, что вернаотклоняющиеся от ожидаемых) ПРИ УСЛОВИИ, что верна нулевая гипотеза H0: • Pval = Pr[|T| ≥ |tнабл.| | H0]. • Тут следует обратить внимание на то, что «еще менее вероятные данные» не являются «данными», мы их не наблюдаем. • Мы их додумываем из всех возможных значений в рамках выбранной нами (нулевой) модели. 9
  • 10. P-значение есть вероятность наблюдать исход (x), плюс все «еще более экстремальные исходы». Они представлены затушеванной областью хвоста распределения, соответствующего нулевой модели Goodman S. A Dirty Dozen: Twelve P-Value Misconceptions. Semin. Hematol. 45:135-140 © 2008 10
  • 11. Интерпретация P-значения • Распространенной является интерпретация P- значения как меры (силы) доказательства, предоставляемого имеющимися данными, против нулевой гипотезы. • Однако, строго говоря, оно не является мерой в математическом смысле (не обладает свойством аддитивности) и не удовлетворяет, как минимум, двум важнейшим принципам теории статистики – Принципу правдоподобия и Р-постулату. 11
  • 12. Принцип правдоподобия • В словесной формулировке Принцип правдоподобия есть положение о том, что статистический анализ данных должен оперировать теми и только теми данными, которые реально получены в эксперименте.которые реально получены в эксперименте. • В математических терминах Принцип правдоподобия утверждает, что вся информация о неизвестном параметре µ содержится в функции правдоподобия для µ, вычисляемой из полученных данных. 12
  • 13. • Однако, для вычисления Р-значения, как это следует из его определения, используются не только наблюдаемые в эксперименте данные, но и все другие, еще менее вероятные, которые в реальности не были наблюдены.в реальности не были наблюдены. • Другими словами, вычисление Р-значения не основано на функции правдоподобия и, соответственно, не удовлетворяет Принципу правдоподобия. 13
  • 14. Р-постулат • Чтобы Р-значение служило реальной и адекватной мерой статистического доказательства, оно должно удовлетворять простому правилу (постулату) согласно которому одинаковые P-значения должны предоставлять одинаковые доказательства противпредоставлять одинаковые доказательства против нулевой гипотезы. • Это правило называют «Р-постулатом» • Wagenmakers E.-J. A practical solution to the pervasive problems of p values // Psychonomic Bulletin & Review, 2007. - Vol. 14.- № 5. - P. 779-804. • Однако, это минимальное требование не выполняется. 14
  • 15. Р-постулат • Интуитивно можно понять, что Р = 0,01 для эксперимента с 10 наблюдениями явно не будет иметь той же доказательной силы, что и Р = 0,01 для эксперимента с 300 наблюдениями. • Равным образом, Р = 0,001, полученное в одном опыте, и Р = 0,01 – в другом, не означает, что эффект, наблюдаемый в первом опыте, в 10 раз более убедителен, чем эффект вопервом опыте, в 10 раз более убедителен, чем эффект во втором опыте. • Это прекрасно понимал Р.А. Фишер: • «Критерий значимости [P-значение] не позволяет нам делать какие-либо выводы о проверяемой гипотезе в терминах математической вероятности» • Fisher R.A. The design of experiments. Edinburgh: Oliver & Boyd, 1935. 15
  • 16. «Парадокс» правила остановки • Вероятность обманчивого доказательства, основанного на малом Р-значении, достигает 100% при увеличении числа наблюдений до бесконечного ∞→nнаблюдений до бесконечного НО!! • ∞→n ( ) 10 →< HP critvalPr α ( ) γγ ≤< 0HLRPr
  • 17. А – одинаковые эффекты могут иметь разные P-значения. B – разные эффекты могут иметь одинаковые P-значения. Goodman S. A Dirty Dozen: Twelve P-Value Misconceptions. Semin. Hematol. 45:135-140 © 2008 17
  • 18. Распространенное заблуждение, или чем не является P-значение • Квинтэссенцию традиционных (частотнических) заключений при проверке статистических гипотез принято интерпретировать так: • чем меньше P-значение, тем сильнее (весомее) доводы (свидетельства, доказательства) против нулевой(свидетельства, доказательства) против нулевой гипотезы H0, которые предоставляют нам имеющиеся (наблюдаемые) данные; тем больше у нас оснований сомневаться в H0. • Отсюда невольно (и вроде бы естественно) возникает соблазн интерпретировать P-значение как вероятность нулевой гипотезы. 18
  • 19. P-значение не есть вероятность нулевой гипотезы! • Например, в известной книге С.Гланца можно встретить утверждение: • «Упрощая, можно сказать, что Р — это вероятность справедливости нулевой гипотезы» • Гланц С. Медико-биологическая статистика. — М.:• Гланц С. Медико-биологическая статистика. — М.: Практика, 1998. — с. 119. • Это мнение глубоко ошибочно и чревато пагубными последствиями. • К чести автора, в последующих (у нас не переведенных) изданиях этой его книги оно отсутствует. 19
  • 20. + CD ! Программа «БИОСТАТИСТИКА» • Автор: Гланц С. • Издательство: Практика • c. 460, 1998 г. • ISBN: 5-89816-009-4, 0-07-024268-2 • Принципиальная ошибка: • P-значение можно• P-значение можно интерпретировать как вероятность нулевой гипотезы • В последующих английских изданиях этой книги эта фраза отсутствует. • Но их перевод на русский язык не предвидится. 20
  • 21. P-значение не есть вероятность нулевой гипотезы! • Поскольку Р-значение вычисляется в предположении, что верна нулевая гипотеза, то оно никак не может быть одновременно вероятностью того, что нулевая гипотеза неверна: • P[D|H0] ≠ P[H0|D]. • Здесь D = |T| ≥ |tнабл.| суть все значения статистики критерия T, которые равны наблюдаемому значению |t | и превышают его.которые равны наблюдаемому значению |tнабл.| и превышают его. • Подробнее о том, чем не является Р-значение, см. энциклопедическую статью: • http://en.wikipedia.org/wiki/P-value • и недавнюю работу С. Гудмана, в которой перечислена «грязная дюжина» ошибочных интерпертаций Р-значения: • Goodman S. A dirty dozen: Twelve P-value misconceptions // Semin. Hematol., 2008. - Vol. 45. – P. 135-140. 21
  • 22. P-значение есть реализация вероятностной переменной P* • Кроме того, чрезвычайно важно осознавать, что P-значение есть наблюдаемое значение соответствующей вероятностной переменной (случайной величины) P*. • Это означает, что всякий раз мы будем наблюдать одно из ее возможных значений и в разных опытах оно будет варьировать.варьировать. • Когда нулевая гипотеза H0 верна, то Pval имеет непрерывное равномерное распределение на отрезке [0; 1]. • Это означает, что в любом одиночном эксперименте при справедливости гипотезы H0 мы можем получить любое P- значение, как очень малое, близкое к нулю, так и очень большое, близкое к единице. 22
  • 23. Незначимое Р-значение не означает, что верна Н0 • Это и есть теоретическое обоснование известных утверждений, присутствующих во многих руководствах, о том, что • на основании наблюдаемого P-значения нельзя принять нулевую гипотезу, когда Pval > α, т.е. когда P-значение не преодолевает уровень значимости α, который выбирается заранее в качестве порогового (критического). 23
  • 24. Выбор порога для P-значения, и возможен ли он? • Когда наблюдаемое P-значение мало, то у исследователя зарождается сомнение: действительно ли верна гипотеза H0, и он считает себя в праве пойти на риск и принять решение отклонить эту гипотезу.отклонить эту гипотезу. • Однако важно понимать, что такое решение является внестатистическим, ибо нет никаких вероятностно-статистических или иных теоретических соображений, какое значение Pval следует считать настолько малым, чтобы смело отвергнуть H0. 24
  • 25. Акт интеллектуальной смелости • Всякий раз, принимая то или иное решение, мы осуществляем акт интеллектуальной смелости. • На практике решение отклонить или принять H0 непременно зависит от обстоятельств. • Исследователь в каждой конкретной ситуации обязан сам делать этот выбор и осознавать возможные последствия и не забывать об ответственности за принимаемые решения. 25
  • 26. Гипноз цифр 0,05 и 95% • Наиболее часто в качестве критического порога используется уровень значимости α = 0,05, и статистический анализ в конечном итоге сводится к сравнению наблюдаемого значения Pval с этим α, и конечные результаты обычно представляются в виде неравенств:неравенств: • Pval > 0,05 или Pval < 0,05. • К сожалениею, такое представление результатов анализа до сих пор нередко встречается в публикациях, несмотря на то, что в учебных руководствах и инструкциях для авторов давно рекомендуется представлять конкретно наблюдаемые значения Pval. 26
  • 27. Гипноз цифр 0,05 и 95% и статистическая снисходительность • Преодоление этого порогового уровня (Pval < 0,05) всего лишь в одной выборке часто считается достаточным для вывода о статистической значимости наблюдаемого эффекта. • В последнем случае часто употребляется даже более сильное утверждение: «эффект достоверен». • Наряду с пороговым значением 0,05 для уровня значимости, повсеместно (за редчайшими исключениями) используется уровень (вероятность) доверия 0,95 и строятся 95%-е интервалы доверия (доверительные интервалы). • Более строго их следует называть «интервалами накрытия» оцениваемого (неизвестного) параметра. 27
  • 28. Глотов Н.В., Животовский Л.А., Хованов Н.В., Хромов-Борисов Н.Н. Биометрия, Л.: Изд-во ЛГУ, 1982. – 264 с. • Выбор уровня значимости определяется важностью биологических выводов, которые должен сделать экспериментатор. • В настоящее время многие биометрики склоняются кбиометрики склоняются к следующему правилу: • а) если P > 0,05, то принимается нулевая гипотеза; • б) если P < 0,01, то нулевая гипотеза отклоняется и принимается конкурирующая; • в) если 0,01 < P < 0,05, то результат считается неопределенным. 28
  • 29. Курьез • На выбор Фишером порогов для уровня значимости повлияли и психологические причины. • М. Кендалл вспоминал, что Фишер составил таблицы критических значений (для уровней значимости 0,05; 0,02 и 0,01) из соображений компактности и удобства пользования, а также с целью избежать проблемы авторства с Карлом Пирсоном, с которым у него были принципиальные разногласия.принципиальные разногласия. • Цит. по: Dallal G.E. The Little Handbook of Statistical Practice. Why P=0.05? http://www.jerrydallal.com/LHSP/p05.htm • Кроме того, Фишер ориентировался на свой личный ограниченный опыт статистического анализа результатов опытов, проводившихся с сельскохозяйственными растениями на Ротамстедской сельскохозяйственной станции. • Фактически у него почти не было опыта анализа данных из других областей экспериментальной науки, например, в медицине. 29
  • 30. Sir Ronald Aylmer Fisher 17 Feb 1890 - 29 July 1962 30
  • 31. Karl Pearson 27 March 1857 – 27 April 1936 31
  • 32. Андрей Николаевич Колмогоров 12 (25) апреля 1903 -20 октября 1987 • Пророк в своемсвоем отечестве 32
  • 34. Вероятность и математическая статистика. Энциклопедия • Издательство Большая Российская энциклопедия. 2003г. 912 стр. ISBN 5-7107-7433-2. Тираж 10000 экз. • Большинство статей сопровождается библиографией наиболее важных работ по данной проблеме. • Названия статей даны также в переводе на английский язык. • Вторая часть - "Хрестоматия по теории вероятностей и• Вторая часть - "Хрестоматия по теории вероятностей и математической статистике" содержит статьи, написанные для отечественных энциклопедий прошлого, а также материалы энциклопедического характера, опубликованные ранее в других сочинениях. • Особого внимания заслуживают не потерявшие своей актуальности работы А.Н.Колмогорова. 34
  • 35. Колмогоров, 1951 • Более полувека тому назад (в 1951г.) А.Н. Колмогоров отмечал: • «При практическом употреблении вычисленных значений вероятности мы неизбежно приходим к вопросу о том, какими (сколь малыми) значениямивопросу о том, какими (сколь малыми) значениями вероятностей мы можем пренебречь. • На практике этот вопрос решается каждый раз по- разному, в зависимости от того, насколько велика необходимость быстрого перехода от накопления надежных данных к их действительному употреблению». 35
  • 36. Колмогоров, 1951 • «В спокойной обстановке научных исследований принято пренебрегать лишь вероятностью в 0,003 (эта норма связана с так называемым правилом трех сигма), а иногда требовать и еще большего приближения вероятности отсутствиябольшего приближения вероятности отсутствия ошибки к единице. • В математической статистике вероятность, которой решено пренебрегать в данном исследовании, называют уровнем значимости». 36
  • 37. Колмогоров, 1951 • «Хотя в статистике обычно рекомендуют пользоваться уровнями значимости от 0,05 при предварительных ориентировочных исследованиях и до 0,001 при окончательных серьезных выводах, часто достижима значительно большая достоверность [статистическая значимость – НХ] вероятностных выводов.выводов. • Например, основные выводы статистической физики основаны на пренебрежении лишь вероятности порядка меньшего 0, 000 000 000 1 (<10-10)». • Воспроизведено в: Колмогоров А. Н. Вероятность / Вероятность и математическая статистика. Энциклопедия / Гл. ред. Ю. В. Прохоров. — М.: Изд-во «Большая Российская Энциклопедия», 1999. – c. 97. 37
  • 38. Колмогоров, 1956 • Несколько позднее (в 1956 г.) Колмогоров повторил: • «Вероятности, которыми принято пренебрегать в различных практических приложениях, различны. • Иногда в научных исследованиях ограничиваются статистическими приемами, рассчитанными исходястатистическими приемами, рассчитанными исходя из пренебрежения вероятностями в 0,05. • Но это следует делать лишь в случаях, когда собирание более обширного материала очень затруднительно». 38
  • 39. Колмогоров, 1956 • «Если норма в 0,05 для серьезных научных исследований явно недостаточна, то вероятностью ошибки в 0,001 или 0,003 по большей части принято пренебрегать даже в столь академических и обстоятельных исследованиях, как обработка астрономических наблюдений. • Впрочем, иногда научные выводы, основанные на применении вероятностных закономерностей, обладают иприменении вероятностных закономерностей, обладают и значительно большей достоверностью [статистической значимостью – НХ] (то есть построены на пренебрежении значительно меньшими вероятностями)». • Воспроизведено в: Колмогоров А.Н. Теория вероятностей / Вероятность и математическая статистика. Энциклопедия / Гл. ред. Ю. В. Прохоров. — М.: Изд-во «Большая Российская Энциклопедия», 1999. – c. 874. 39
  • 40. • В наши дни Колмогорову вторят зарубежные авторы: • «P-значение близкое к 0,05 не является сильным свидетельством (доказательством) против нулевой гипотезы. • Сильными свидетельствами против Н0 следует• Сильными свидетельствами против Н0 следует признавать значения P < 0,001». • Sterne J.A.C., Davey Smith G. Sifting the evidence – what’s wrong with significance tests? // BMJ, 2001. - Vol. 322. - P. 227-231. 40
  • 41. • При бурлящей в наше время «золотой лихорадке» вокруг изучения генетических предрасположенностей к общим болезням, т.е. поиска связей («ассоциаций») между генетическим полиморфизмом и заболеваниями рекомендуется ориентироваться на еще более низкие пороговые значения уровня значимости: • «Вместо повсеместно используемого порогового (критического)• «Вместо повсеместно используемого порогового (критического) уровня значимости 0,05 в качестве такового мы должны использовать значение порядка 5××××10-5. • При таком уровне значимости потребуется обследовать две группы здоровых и больных по 5000 человек в каждой». • Colhoun H. M., McKeigue P. M. , Davey Smith G. Problems of reporting genetic associations with complex outcomes. Lancet, 2003. - Vol. 361. - № 9360. – P. 865-872. 41
  • 42. • Таким образом, явно не следует слепо применять инструментарий процедур проверки значимости нулевой гипотезы и основывать свои выводы исключительно на получаемых Р-значениях. • Осмысленные выводы должны основываться на• Осмысленные выводы должны основываться на разумном взвешивании Р-значений и на использовании дополнительной информации о других не менее важных показателях, таких как мощность, размер эффекта, количество наблюдений, о результатах прешествующих работ, предсказаниях действующей теории и т.п. 42
  • 43. Гибкие Р-значения • Сам Фишер подчеркивал, что: • «В действительности ни один исследователь не пользуется фиксированным уровнем значимости с которым из года в год и при любых обстоятельствах он отвергает нулевые гипотезы. • Он больше доверяет своему уму и каждый конкретный случай рассматривает в свете совокупности имеющихся доказательств и своих идей и представлений». • Fisher R. A. Statistical Methods and Scientific Inference. Edinburgh: Oliver & Boyd. 1956. • Такой подход иногда интепретируют как призыв использовать «гибкие» Р-значения. 43
  • 44. Не «достоверный», но всего лишь «статистически значимый» • Надо стараться избегать слова «достоверность», ибо в русском языке оно означает подлинный, несомненно верный, не вызывающий сомнения. • В теории вероятностей достоверное событие – событие с вероятностью, равной 1. • Если вдуматься, нередко встречающееся в биомедицинской• Если вдуматься, нередко встречающееся в биомедицинской литературе словосочетание «статистическая достоверность» есть оксюморон – сочетание несочетаемого. • Всестороннее обсуждение этого вопроса см. в: • Зорин Н.А. О неправильном употреблении термина «достоверность» в российских научных психиатрических и общемедицинских статьях. 2000. http://www.biometrica.tomsk.ru/let1.htm 44
  • 45. Ритуал проверки нулевых гипотез • 1. Формулируется нулевая гипотеза о «равенстве нулю разности между средними значениями» или о «равенстве нулю коэффициента корреляции». • 2. Альтернативная гипотеза не конкретизируется. • 3. Для отклонения нулевой гипотезы по умолчанию используется уровень значимости 5%.используется уровень значимости 5%. • 4. Если эффект (отклонение от нулевого значения) статистически значим, то принимается альтернативная гипотеза. • 5. Результат сообщается в виде неравенства p < 0,05, p < 0,01 или p < 0,001 (как ближайшее к полученному p- значению).
  • 46. Доверяя, повторяй • Повторение исследования является решающим (ключевым) аспектом научного метода. • Один эксперимент, как бы хорошо он ни был спланирован, не может обеспечить неопровержимое доказательство правильности теории или эффективности вмешательства (воздействия). • Ein Versuch kein Versuch. 46
  • 47. Культ изолированного исследования • Руководства по статистическим методам сосредоточиваются зачастую на том, как анализировать одиночный набор данных, пытаясь во что бы то ни стало ответить на сакраментальный вопрос: • «Является ли результат значимым?»,• «Является ли результат значимым?», • а не на том, как интерпретировать много наборов данных, как их обобщить и ответить на вопрос: • «Является ли результат фактом?». • В статистических руководствах и статьях преобладает «культ изолированного исследования». 47
  • 48. Доверяя, повторяй • Часто считается, что если получен «статистически значимый» результат, то это исключает необходимость повторить исследование. • Повторность часто рассматривается как нечто суетное и бесполезное. • На самом же деле, • «Проверка нулевой гипотезы есть метод обнаружения маловероятных событий, которые заслуживают дальнейшего изучения» (Fisher). 48
  • 49. Джон Уайлдер Тьюки (John Wilder Tukey, 16.04.1915 — 26.07.2000) • Исследования должны быть как минимум двухэтапными. • Первый этап – разведочное исследование.исследование. • Второй этап – проверочное (порождающее гипотезы) исследование. • Оно планируется на основе результатов разведочного иследования. 49
  • 50. Воспроизводимость и предсказательная способность P-значений и доверительных интервалов (n = 32) Использована программа “ESCI PPS p intervals” http://www.latrobe.edu.au/psy/esci/. Cumming G. Replication and p intervals: p values predict the future only vaguely, but confidence intervals do much better // Persp. Psychol. Sci., 2008. - Vol. 3. – P. 286-300. 50
  • 51. Воспроизводимость и предсказательная способность P-значений и доверительных интервалов (n = 32) Использована программа “ESCI PPS p intervals” http://www.latrobe.edu.au/psy/esci/. Cumming G. Replication and p intervals: p values predict the future only vaguely, but confidence intervals do much better // Persp. Psychol. Sci., 2008. - Vol. 3. – P. 286-300. 51
  • 53. Интерпретация размера эффекта по Хопкинсу (Hopkins) http://www.sportsci.org/resource/stats/ Размер эффекта, ES Градация эффекта 0 – 0,2 Ничтожный 0,2 – 0,6 Малый (слабый) 0,6 – 1,2 Умеренный0,6 – 1,2 Умеренный 1,2 – 2,0 Большой (сильный) 2,0 – 4,0 Очень большой 4,0 - ∞∞∞∞ Абсолютный
  • 54. • Относительные меры эффекта OR, RR, RRR часто приводят к впечатляющим цифрам, даже когда абсолютные эффекты воздействия оказываются малымивоздействия оказываются малыми • Примеры: • 1. р1=0,6; р2=0,1; RRR=83%; ARR=0,5; NNT=2 • 2. p1=0,06; p2=0,01; RRR=83%; но ARR=0,05 и NNT=20 54
  • 55. Словесная шкала для размеров эффекта Мера эффекта Градация эффекта r d ES RR OR LR NNT 0 0 0 1 1 1 ∞ ничтожный 0,1 0,1 0,2 1,2 1,5 2-5 5 слабый 0,5 0,5 1,2 3,0 9,0 5-10 2 сильный 0,9 0,9 4,0 19 360 >10 очень сильный 1,0 1,0 ∞ ∞ ∞ ∞ 1 абсолютный
  • 57. Воспроизводимость и предсказание, LePrep http://www.univ-rouen.fr/LMRS/Persopage/Lecoutre/ErisA.html 57
  • 58. LePrep, предсказание результата последующего повторного эксперимента 58
  • 60. Jeffery S., Saggar Malik A.K., CrosbY A., BlanD M., Eastwood J.B., Amoah-Danquah J., Acheampong J.W., Plange-Rhule J. A dominant relationship between the ACE D allele and serum ACE levels in a Ghanaian population J. Med. Genet. 1999;36:869-870 Table 1 Serum ACE in U/l for each ACE genotype ACE genotype II ID DD 24 26 48 82 60 50 21 23 27 48 62 42 56 20 43 35 42 31 47 74 57 37 33 8 42 15 35 45 57 24 46 60 19 31 25 25 24 53 89 31 36 43 55 98 62 83 70 60 36 43 55 98 62 83 70 25 44 28 62 27 50 125 26 61 52 82 21 20 69 33 52 56 71 21 65 74 62 68 33 35 77 32 38 97 34 90 65 44 37 32 37 117 82 30 39 36 35 100 38 29 132 103 77 41 38 Mean (SD) 34.5 (13.6) 51.3 (23.8) 53.3 (29.5) Median (range) 31 (19-74) 47.5 (15-132) 46 (8-125)
  • 62. Инсерционно-делеционный диморфизм в гене ACE и активность АПФ, программа Instat+ http://www.rdg.ac.uk/ssc/software/instat/instat.html
  • 63. 63 95%-е ПИ и ДИ для активности АПФ
  • 64. http://smed.ru/guides/363/?q=%E0%ED%E3%E8%EE&search_type=tree#article Эталонные (референсные) значения Возраст Активность, Ед/л < 12 9,4 – 37 13 – 16 9 – 33,4 Взрослые 6,1 – 26,6Взрослые 6,1 – 26,6 64 У здоровых индивидуумов в норме уровень концентрации ACE между индивидуумами может колебаться в 5 раз, а внутрииндивидуальная вариабельность намного ниже. http://medbiol.ru/medbiol/ace/00008b43.htm
  • 65. Калибровка P-значений • Как уже было сказано, Р-значение не может быть вероятностью нулевой гипотезы P(H0). • Но именно вероятность нулевой гипотезы, очевидно, должна интересовать исследователя более всего. • К сожалению традиционная частотническая статистика не• К сожалению традиционная частотническая статистика не способно вычислять эту веротяность. • Это может делать бейзовская статистика. • Уже относительно давно статистики-бейзовцы предложили калибровать Р-значения относительно вероятности P(H0). • В простейшем варианте удается оценить не P(H0), а лишь ее нижнюю границу (минимально достижимое значение) P(H0). 65
  • 66. Калибровка p-значения • Vovk V. G. • A logic of probability, with application to the foundations of statistics • Journal of the Royal Statistical Society. Series B (Methodological), • Vol. 55, No. 2 (1993), pp. 317-351. ( ) ( ) • - нижняя граница для вероятности нулевой гипотезы H0 ( ) ( )ppDHP p lnln −≥ +11 0 66
  • 67. Калибровка p-значения • Sellke T., Bayarri M.J., Berger J.O. • Calibration of p Values for Testing Precise Null Hypotheses • The American Statistician, Vol. 55, No. 1. (2001), pp. 62-71. • При ep 1< ( ) 1 0 1 1 −       − +≥ ppe DHP ln ep 1< 67
  • 68. «Цена» Р-значения P-значение Нижняя граница для вероятности нулевой гипотезы P(H0) Верхняя граница для вероятности воспроизведения Рrepr 0,05 > 30% < 50%0,05 > 30% < 50% 0,01 > 10% < 75% 0,001 > 2% < 90% Для наглядности значения в таблице округлены до первой значащей цифры. Более точно значения для P(H0) (сверху вниз) равны 29%, 11% и 1,8%. 68
  • 70. Заключение • Надо перестать судорожно цепляться за уровень значимости α = 0,05 (а, скоре всего, и за α = 0,01) и некритично объявлять случаи его преодоления (Pval < 0,05) статистически значимыми (или даже «достоверными») событиями.«достоверными») событиями. • Если мы сконцентрируемся на преодолении уровня α = 0,001, т.е. будем считать статистически значимыми Pval < 0,001, то в итоге сможем съэкономить массу времени и средств. 70
  • 71. Статистическая значимость и размер эффекта • Эффект (различие, связь, риск, польза, ассоциация и т. п.) может быть статистически значимым, но его практическая (например, клиническая) ценность может оказаться ничтожной.ничтожной. • «Статистически значимый» не означает «значительный», «практически важный», «ценный». 71
  • 72. Излечися сам • Единственный способ излечиться от синдрома статистической снисходительности • – это многократно повторять• – это многократно повторять эксперименты и изучать воспроизводимость наблюдаемых эффектов, которые при Pval < 0,05 слишком часто могут оказаться ложными. 72
  • 73. Повторение – мать познания • Повторение составляет суть науки: • «ученый должен всегда задумываться о том, что произойдет, если он или другой ученый повторят его эксперимент» (Guttman, 1977). • «Ученые разработали метод определения надежности (валидности) своих результатов. • Они научились задавать вопрос: воспроизводимы ли они?» (Scherr, 1983). 73
  • 74. Михаил Ефимович Лобашев (11.11.1907 – 04.01.1971) • Можете заниматься в науке чем угодно, только не забывайте о последствиях и об ответственности.ответственности. 74
  • 75. Предсказательная способность и экономическая эффективность клинико-генетической паспортизации 75
  • 76. • Решающими показателями качества любого метода диагностики являются не отношения шансов (OR) или отношения рисков (RR),рисков (RR), • но предсказательные вероятности (прогностические ценности) положительного и отрицательного результатов диагноза: PPV и NPV. 76
  • 77. Рекомендации • Khoury M.J., McBride C.M., Schully S.D., Ioannidis J.P.A., Feero W.G., Janssens A.C.J.W., Gwinn M., Simons-Morton D.G., Bernhardt J.M., Cargill M., Chanock S.J., Church G.M., Coates R.J., Collins F.S., Croyle R.T., Davis B.R., Downing G.J., DuRoss A., Friedman S., Gail M.H., Ginsburg G.S., Green R.C., Greene M.H., Greenland P., Gulcher J.R., Hsu A., Hudson K.L., Kardia S.L.R., Kimmel P.L., Lauer M.S., Miller A.M., Offit K., Ransohoff D.F., Roberts J.S., Rasooly R.S., Stefansson K., Terry S.F., Teutsch S.M., Trepanier A.,J.S., Rasooly R.S., Stefansson K., Terry S.F., Teutsch S.M., Trepanier A., Wanke K.L., Witte J.S., Xu J. • The Scientific Foundation for Personal Genomics: Recommendations from a National Institutes of Health–Centers for Disease Control and Prevention Multidisciplinary Workshop • Genet. Med. 2009:11(8):559 –567 77
  • 78. Использование генетических ассоциаций для оценки риска и предсказания болезни • Даже если генетическая ассоциация оказывается статистически высоко значимой, то непременно встает вопрос, насколько полезной будет эта информация для оценки риска и предсказания болезни?болезни? • Необходимо измерять чувствительность, специфичность, ценность положительного предсказания (PPV) и ценность отрицательного предсказания (NPV). 78
  • 79. Теорема Бейза в действии 79
  • 80. БОГО • Мможно предложить называть многофакторные болезни • болезнями с ограниченной генетической обусловленностью –обусловленностью – • БОГО 80
  • 81. • Пусть распространенность болезни с ограниченной генетической обусловленностью (БОГО) в некоторой популяции равна • P(D+) = 1%. • Допустим, что у больных доля носителей генотипа (аллели, гаплотипа) g1, предрасполагающего к данной БОГО, равна • P(g1|D+) = 20% • и она в 2 раза выше, чем у индивидуумов без этой БОГО:• и она в 2 раза выше, чем у индивидуумов без этой БОГО: • P(g1|D-) = 10%. • Этому соответствуют значения • RR = 2, • OR = 4,4 • и разности рисков • RD = 10%. 81
  • 82. • По формуле Бейза вероятность БОГО у носителя генотипа g1 примерно в 2 раза превышает ее распространенность: • PPV1 = P(D+|g1) = 1,98%. • Вряд ли на основе столь малого значения можно делать выводы о наличии или развитии данной БОГО у конкретного индивидуума. • Допустим теперь, что есть еще другой предрасполагающий к данной БОГО генотип g с такими же характеристиками.БОГО генотип g2 с такими же характеристиками. • Вероятность БОГО у носителей обоих генотипов совместно (g1 и g2) возрастает по сравнению с носителями каждого из них по отдельности (g1 или g2): • PPV1,2 = P(D+|g1,g2) = 3,9%. • Очевидно, что чем больше в генотипе предрасполагающих аллелей, тем выше вероятность возникновения или развития данной БОГО у его носителей. 82
  • 83. • Однако доля носителей таких генотипов в популяции снижается экспоненциально, и уже для 6-и маркеров составляет 1 на миллион при PPV1,…,6 = P(D+|g1,…, g6) = 39%, которая всего в 10 раз выше, чем для пары генотипов. • Для носителей одновременно 9-и маркеров вероятность БЭНП достигает 91%, а у носителей 10-и таких маркеров – 95%.достигает 91%, а у носителей 10-и таких маркеров – 95%. • Но обнаружить таких индивидуумов практически невозможно: их доли в популяции составляют 10-9 и 10-10. • Фактически это будет один человек на Земле. 83
  • 84. Предсказательная ценность нескольких независимых предрасполагающих генетических маркеров Число предрасполагающих локусов в генотипе PPV Доля носителей предрасполагающего генотипа G+ в популяции 1 0,020 0,1 2 0,039 0,01 3 0,075 0,001 4 0,14 0,0001 5 0,24 10-5 6 0,39 10-6 7 0,71 10-7 8 0,84 10-8 9 0,91 10-9 10 0,95 10-10 84
  • 86. Rembold C.M. Number needed to screen: development of a statistic for disease screening. BMJ – 1998. – Vol. 317. – P. 307–312. • Полезным и наглядным показателем эффективности и продуктивности генотипирования является NNG (Number Needed to be Genotyped) – количество подлежащих генотипировнию:генотипировнию: 86
  • 87. Экономическая эффективность генотипирования БОГО • Пусть распространенность болезни с ограниченной генетической обусловленнностью (БОГО) в некоторой популяции равна • P(D+) = 1%. • Допустим, что разность рисков RD = 0,1. • Тогда • NNG = 1/(0,1 ×××× 0,01) = 1000.• NNG = 1/(0,1 ×××× 0,01) = 1000. • Это означает, что надо генотипировать примерно 1000 человек, чтобы этим методом выявить на одного больного человека больше, чем эталонным (стандартным) методом. • Пусть цена одного анализа составляет 100 у.е. • Тогда для выявления одного больного надо затратить примерно 100 тыс. у.е. • При генотипировании по k маркерам затраты возрастут в k раз. 87
  • 88. Массовый маммографический скрининг • Emily Banks, Gillian Reeves, Valerie Beral, Diana Bull, Barbara Crossley, Moya Simmonds, Elizabeth Hilton, Stephen Bailey, Nigel Barrett, Peter Briers, Ruth English, Alan Jackson, Elizabeth Kutt, Janet Lavelle, Linda Rockall, Matthew G Wallis, Mary Wilson and Julietta Patnick • Influence of personal characteristics of individual women on sensitivity and specificity of mammography in the Million Women Study: cohort study • BMJ 2004;329;477
  • 90. Так выглядит рак молочной железы на рентгеновском снимке (белое, яркое пятно с нечеткими краями) http://www.breast-cancer.ru/diagnosis/mammogram.html
  • 91. AtteStat http://attestatsoft.com/download.htm Маммо- графия Рак молочной железы Всего есть нет • Критерий хи-квадрат: • χχχχ2 = 14119,4; P = 10-300 • Распространенность (вычисленная): • Prev = 0,0059 ≈ 0,6% + 629 3 885 4 514 − 97 117 744 117 841 Всего 726 121 629 122 355 • Prev = 0,0059 ≈ 0,6% • Чувствительность: • Sen = 0,820,870,91 • Специфичность: • Spe = 0,9660,9680,970
  • 92. Проверьте свою интуицию • Допустим, что у женщины (не дай бог) маммография дала положительный результат. • Как Вы думаете, какова вероятность того, что этой женщины действительно рак молочной железы?
  • 93. PPV и NPV - предсказательные способности положительного и отрицательного результатов • Прогностичность положительного результата: • PPV = a/(a + b) = • Прогностичность отрицательного результата: • NPV = d/(c + d) = • = 629 : 4514 = • = 0,14 • PPV = 0,120,140,16 ≈ 14% • = 117744 : 117841 = • = 0,9992 • NPV = 0,99890,99920,9994
  • 95. Utility of the apolipoprotein E genotype in the diagnosis of Alzheimer’s disease • Mayeux R., Saunders A.M., Shea S., Mirra S., Evans D., Roses A.D., Hyman B.T., Crain B., Tang M., Phelps C.H. N. Engl. J. Med. 1998; 338:506-511.• N. Engl. J. Med. 1998; 338:506-511.
  • 96. APPENDIX • В исследовании принимали участие также следующие исследователи и Центры по болезни Альцгеймера: • Baylor College of Medicine: S. Appel, R. Doody, J. Kirkpatrick, J. Li; Case Western Reserve University: P. Whitehouse, D. Geldmacher, J. Stuckey; Columbia University: M. Shelanski, J. Goldman, B. Tycko; Duke University Medical Center: M. Pericak-Vance, C. Hulette; Emory University: M. Gearing, H. Kim; Harvard Medical School: J. Growdon, D. Reardon, T. Hedley-Whyte; Indiana University: B. Ghetti, M. Farlow, H. Hendrie, F. Unverzagt; Johns Hopkins University: D. Price, C. Kawas; Mayo Clinic: R. Petersen, S. Waring, J. Parisi, S. Thibodeau; Mount Sinai School of Medicine: K. Davis, D. Marin, H. Haroutunian, D. Greenberg; New York University: S. Ferris, B. Quinn, B. Reisberg, M. de Leon; Oregon Health SciencesGreenberg; New York University: S. Ferris, B. Quinn, B. Reisberg, M. de Leon; Oregon Health Sciences University: J. Kaye, G. Murdoch, M. Ball; Rush–Presbyterian–St. Luke’s: D. Bennett, E. Cochran; University of California–Davis: W. Jagust, B. Reed, W. Ellis; University of California–Los Angeles: H. Vinters, J. Cummings; University of California–San Diego: L. Thal, R. Katzman, D. Galasko, M. Sundsmo; University of Kansas: W. Koller, K. Lyons; University of Kentucky: W. Markesbery, D. Wekstein, M. Kindy; University of Michigan: S. Gilman, N. Foster, R. Albin, A. Sima, J. Fink; University of Pennsylvania: J. Trojanowski, C. Clark; University of Pittsburgh: S. DeKosky, M. Kamboh, R. Ferrell; University of Rochester: P. Coleman, D. Ryan; University of California–Irvine: C. Finch, J. Buckwalter, C. Miller; University of Texas Southwestern Medical Center: R. Rosenberg, C. White III, M. Weiner; University of Washington–Seattle: M. Raskind, E. Peskind, J. Leverenz, D. Nochlin; Washington University Medical Center: J. Morris, E. Grant, A. Goate.
  • 97. Соответствие между наличием аллели APOE*ε4 и патологическим диагнозом болезни Альцгеймера у 2188 пациентов с деменцией (приобретенным слабоумием) Генотип по гену APOE Патологический диагноз Болезнь Альцгеймера Другие причины слабоумия Количество больных Наличие одной или обеих аллелей ε4 1142 133 аллелей ε4 Отсутствие аллеи ε4 628 285 Всего 1770 418 Чувствительность диагностики БА по наличию аллели APOE*ε4 1142:1770≈65% 0,620,650,67 Специфичность диагностики БА по наличию аллели APOE*ε4 285:418≈68% 0,620,680,74
  • 100. Von Stein P., Lofberg R., Kuznetsov N.V., Gielen A.W., Persson J.-O., Sundberg R., Hellstrom K., Eriksson A., Befrits R., Ost A., Von Stein O.D. Multigene analysis can discriminate between ulcerative colitis, Crohn’s disease, and irritable bowel syndrome. Gastroenterol. 2008; 134:1869–1881 100 Анализ дифференциальной экспрессии генов, специфичных для болезни Крона, может оказаться быстрым и надежным методом диагностики.
  • 101. ПСА Уровень ПСА, нг/мл Случай Контроль ≤ 4,0 221 1439 4,1 – 9,9 926 233 10,0 – 19,9 654 3810,0 – 19,9 654 38 20,0 – 49,9 457 14 50,0 – 99,9 229 2 ≥ 100 317 1 AUC = 0,900,920,93 Prev = 8% = 0,08 101
  • 102. Kraft P., Wacholder S., Cornelis M.C., Hu F.B., Hayes R.B., Thomas G., Hoover R., David J. Hunter D.J., Chanock S. Beyond odds ratios — communicating disease risk based on genetic profiles. Nature Rev. Genetics Vol. 10, 2009, 264-269. Сильная статистич- еская связь между генотипом и болезнью не можетможет служить показателем предсказа- тельной ценности. AUC = 0,60 и AUC = 0,57 102
  • 103. Huett A., Xavier R.J. Neither hide nor hair: the difficulty of identifying useful disease biomarkers. Gastroenterology Vol. 134, No. 7, p. 2164-2168. Идеализиро- ванная схема диагностики в постгеномную 103 постгеномную эру
  • 104. Фармакогенетика • Lenzini P., Wadelius M., Kimmel S., Anderson J.L., Jorgensen A.L., Pirmohamed M., Caldwell M.D., Limdi N., Burmester J.K., Dowd M.B., Angchaisuksiri P., Bass A.R., Chen J., Eriksson N., Rane A., Lindh J.D., Carlquist J.F., Horne B.D., Grice G., Milligan P.E., Eby C., Shin J., Kim H., Kurnik D., SteinGrice G., Milligan P.E., Eby C., Shin J., Kim H., Kurnik D., Stein C.M., McMillin G., Pendleton R.C., Berg R.L., Deloukas P., Gage B.F. • Integration of genetic, clinical, and INR data to refine warfarin dosing. • Clin. Pharmacol. Ther. Volume 87, No 5, 2010, 572-578. 104
  • 105. Индивидуальный подбор доз фарфарина • Фармакогенетическая поддерживающая доза (mg/week) = • EXP [3,10894 − 0,00767 ×××× age − 0,51611 ×××× ln(INR) − 0,23032 ×××× VKORC1- 1639 G>A − 0,14745 ×××× CYP2C9*2 − 0,3077 ×××× CYP2C9*3 + 0,24597 ×××× BSA + 0,26729 ×××× Target INR − 0,09644 ×××× African origin − 0,2059 ×××× stroke − 0,11216 ×××× diabetes − 0,1035 ×××× amiodarone use − 0,19275 ×××× fluvastatin use + 0,0169 ×××× dose−2 + 0,02018 ×××× dose−3 + 0,01065 ×××× dose−4].use + 0,0169 ×××× dose−2 + 0,02018 ×××× dose−3 + 0,01065 ×××× dose−4]. • Клиническая поддерживающая доза (mg/week) = • EXP [2,81602 − 0,76679 ×××× ln(INR) − 0,0059 ×××× age + 0,27815 ×××× target INR − 0,16759 ×××× diabetes + 0,17675 ×××× BSA − 0,22844 ×××× stroke − 0,25487 ×××× fluvastatin use + 0,07123 ×××× African origin − 0,11137 ×××× amiodarone use + 0,03471 ×××× dose−2 + 0,03047 ×××× dose−3 + 0,01929 ×××× dose−4]. 105
  • 107. Репрезентативность выборки • Один из важнейших вопросов, решаемых аналитической статистикой: • Достаточно ли имеющихся статистических данных для того, чтобы выводы, сделанные на их основе, были точными исделанные на их основе, были точными и надежными? • Другими словами, представительна ли (репрезентативна ли) имеющаяся выборка? 107
  • 108. Босс В. Лекции по математике. Т. 4: Вероятность, информация, статистика. М.: КомКнига, 2005. – 216 с. • Сколько лягушек придется перецеловать, пока неперецеловать, пока не найдешь свою принцессу ? 108
  • 109. Статистика с доверием • Дает ли статистика нам право доверять ей? • Как проверить, является ли игральная кость правильной? 109
  • 110. Имитация ЗБЧ, программа SUStats.jar http://www.jsc.nildram.co.uk/examples/sustats/SUStats.html 110
  • 111. Имитация ЗБЧ, программа SUStats http://www.jsc.nildram.co.uk/examples/sustats/SUStats.html 111
  • 112. Donahue M.P., Allen A.S., Genetic association studies in cardiology Am. Heart J. 2005; 149:964- 70. 112
  • 113. Объемы выборок у Менделя и у его последователей и опровергателей Автор Желтые Зеленые Всего Согласие с 3 : 1 Pval BF01 Mendel 6022 2001 8003 1,0 82,4 Correns 1394 453 1847 0,66 35,7 Tschermak 3580 1190 4770 0,95 63,5 Bateson 11903 3903 15806 0,38 78,1Bateson 11903 3903 15806 0,38 78,1 Hurst 1310 445 1755 0,75 36,2 Lock 1438 514 1952 0,18 16,1 Darbishire 108866 36123 144989 0,45 264,3 Ермолаева 6206 2225 8431 0,0035 1,1 Всего 140699 46854 187553 0,86 392,5 Однород- ность Pval = 0,096; BF01 = 2,7·109 113
  • 114. Статистика – способ мышления • Две основные идеологии статистических рассуждений: • Бейзовская (Бейзианская) и • Частотническая (частотная) • В частотнической идеологии выделяются два основных течения: • Фишера и• Фишера и • Неймана-Пирсона • Пользователи их не всегда различают, и отсюда возникают серьезные недоразумения. 114
  • 115. Reverend Thomas Bayes [bɛi:z]) – Преподобный Томас Бейз (Байес, Бейес) c. 1702 – 17.04.1761 115
  • 116. Проверьте свою интуицию • Допустим, я уговорил Вас сыграть со мной в орлянку. • Я подбрасываю монету, и каждый раз она выпадает одной стороной – орлом. • Вопрос 1: • начиная с какого раза Вы заподозрите неладное? И• начиная с какого раза Вы заподозрите неладное? И решите, что я везучий, или ловкач? • Вопрос 2: • начиная с какого раза Вы обвините меня в жульничестве? И определенно решите, что моя монета фальшивая – с обеих сторон у нее орел?
  • 117. Задача • Я подбросил монету 10 раз, и все 10 раз монета выпала вверх одной стороной (например, орлом). • Вопрос: • Что можно сказать обо мне или о монете: • Можно ли признать монету правильной (идеальной)?• Можно ли признать монету правильной (идеальной)? • Или монета фальшивая? • Честный ли я, везучий ли я, или ловкач, или жулик? • Если монета недоступна для непосредственного осмотра, то задача неизбежно становится вероятностно- статистической. 117
  • 118. Бейзовская логика - I • Две модели: • M1 – монета идеальная (правильная), т.е. параметр Модели 1: • ϕϕϕϕ = Pr(орел) = 1/2. • M – монета фальшивая – с обеих сторон• M2 – монета фальшивая – с обеих сторон орел, т.е. параметр Модели 2: • ϕϕϕϕ = Pr(орел) = 1. • Вопрос: какая из двух моделей более правдоподобна, если ϕϕϕϕнабл.= 10/10 = 1 ? 118
  • 119. Бейзовская логика – I (продолжение) 000980 1024 1 2 1 10 10 10 11 ,~Pr ≈=      =       == MP ϕϕϕϕ 1 10 10 22 =       == MP ϕϕϕϕ~Pr • Отношение правдоподобий (Бейзов множитель, Бейзов фактор) • В 1024 раза более правдоподобно (вероятно, реально) получить наблюдаемый результат (10 орлов подряд), если верна Модель 2 • (ϕϕϕϕ = 1), нежели если верна Модель 1 (ϕϕϕϕ = 1/2). 10  1024 10241 1 1 2 21 === P P LR 119
  • 120. Бейзовская логика - II • Модель 3: неопределенная: • Принцип недостаточного основания (Лаплас): вероятностная переменная (доля орлов в выборке) распределена равномерно на отрезке от 0 до 1: 2 1 ≠ϕ 1110~  ϕ~ [ ]( )10;~~ ∈ϕϕϕϕϕϕϕϕ Uni • В 93 раза более правдоподобно получить наблюдаемый результат • при условии, что (Модель 3) нежели при (Модель 1). 0910 11 1 1 1 10 10 33 ,~Pr ≈= + =       == n MP ϕϕϕϕ 93 11 1024 10241 111 1 3 31 ≈=== P P LR 2 1 ≠ϕ 2 1 =ϕ 120
  • 121. Бейзовская логика - III • Сравнение Модели 2 и Модели 3: 11 111 1 3 2 23 === P P LR • В 11 раз более правдоподобно получить наблюдаемый результат (n =10, y = 10) при условии, что ϕϕϕϕ = 1 (Модель 2) нежели при (Модель 3). 121 [ ]( )10,~~ ∈ϕϕ Uni 1113P
  • 122. Интерпретация убедительности Бейзова фактора по Джеффризу http://en.wikipedia.org/wiki/Bayes_factor BF01 Свидетельство в пользу модели M1 против модели M0 < 1:100 Убедительное 1:100 – 1:30 Очень сильное 1:30 – 1:10 Сильное 1:10 – 1:3 Существенное 1:3 – 1:1 Не заслуживает внимания1:3 – 1:1 Не заслуживает внимания BF01 Свидетельство в пользу модели M0 против модели M1 1:1 – 3:1 Не заслуживает внимания 3:1 – 10:1 Существенное 10:1 – 30:1 Сильное 30:1 – 100:1 Очень сильное >100:1 Убедительное
  • 123. Интерпретация убедительности Бейзова фактора по Элстону и Джонсону (Elston, Johnson, 2008) BF01 Свидетельство в пользу модели M1 против модели M0 < 1 Отрицательное (в пользу M0) 2 Вряд ли заслуживает внимания2 Вряд ли заслуживает внимания 6 Существенное 20 Довольно сильное 60 Очень сильное 100 Убедительное
  • 124. Интерпретация убедительности Бейзова фактора по Ройаллу (Royall) BF01 как свидетельство Уровень свидетельстваВ пользу M0 против M1 В пользу M1 против M0 1 ≤ BF < 8 1/8 < BF ≤ 1 Слабое 8 ≤ BF < 32 1/32 < BF ≤ 1/8 Умеренное ≥ 32 < 1/32 Сильное
  • 125. Интерпретация убедительности Бейзова фактора по Кассу-Рафтери (Kass, Raftery) BF01 Свидетельство в пользу модели M1 против модели M0 > 1:1 Отрицательное (в пользу M0)> 1:1 Отрицательное (в пользу M0) От 1:1 до 1:3 Не заслуживает внимания От 1:3 до 1:20 Умеренное От 1:20 до 1:150 Значительное < 1:150 Очень убедительное
  • 126. Интерпретация убедительности Бейзова фактора по Джекману (Simon Jackman) BF01 Свидетельство в пользу модели M0 против модели M1 < 1 Отрицательное (в пользу M1)< 1 Отрицательное (в пользу M1) 1 - 3 Не заслуживает внимания 3 -12 Положительное 12 – 150 Сильное > 150 Очень сильное
  • 127. Ng P.C., Murray S.S., Levy S., Venter J.C. An agenda for personalized medicine. Nature Vol. 461, 2009, p. 724-726. • Всего лишь 2/3 показателей (предикторов) относительного риска качественнокачественно согласуются между 23andMe и Navigenics • для 5-и индивидуумов. 127
  • 128. Подготовиться к Олимпиаде в Сочи российским спортсменам могут помочь генетические паспорта. http://www.gzt.ru/print/298187.html • Очевидно, что если повсеместно начать тестировать российских школьников, выбирающих тот или иной вид спорта, и изначально иметь представление об ихизначально иметь представление об их потенциале, то число будущих олимпийских чемпионов увеличится на порядок. 128
  • 129. «Они знают, что могут умереть...» http://www.sovsekretno.ru/magazines/article/2347 • – У человека могут быть отличные «гены спорта», но если он психологически неустойчив, стабильных результатов не добьется, – замечает сотрудник лаборатории Сергей Хальчицкий. • – Недавно, к примеру, обследовали талантливого лыжника- двоеборца (гонки и трамплин). • Генетический набор – ну просто олимпийского чемпиона.• Генетический набор – ну просто олимпийского чемпиона. • Проанализировали характер выступлений: нестабильные. • Занялись семейной родословной: родители злоупотребляют алкоголем. • Это отразилось на его генах: человек психологически неустойчив. • К сожалению, многие родители, настроенные сделать из ребенка чемпиона, свято верят: в спорте главное – воля, а не генетика (Ирина Астратенкова). 129
  • 131. Евгений Гинтер: «Генетический паспорт – это профанация» «АиФ Здоровье», № 3 от 15 января 2009 http://www.aif.ru/health/article/23908 • Генетические паспорта в таком виде, в каком они существуют сегодня, не нужны абсолютно. • И в нашем центре мы этим не занимаемся. • Сейчас во всем мире занимаются этим только частные коммерческие структуры.коммерческие структуры. • И если уж совсем откровенно, думаю, ни в одной такой структуре ни одного грамотного, • квалифицированного • врача-генетика нет, а если и есть, • то он занимается профанацией. 131
  • 132. • Скажу больше, генетический паспорт в том виде, в котором его сейчас выдают коммерческие структуры, может принести существенный вред. • Человеку говорят, что у него есть предрасположенность к сахарному диабету или к ишемической болезни сердца. • И что дальше?• И что дальше? • Ничего, кроме банальных советов вести здоровый образ жизни, не курить, делать физкультуру, не есть слишком жирную пищу, дать ему не смогут. • Но эти рекомендации, известные с доисторических времен, хороши для любого, даже на сто процентов здорового человека. • Зачем же запугивать людей, вгонять их в депрессию? 132
  • 133. Николай Казимирович Янковский, член-корр. РАН, директор Института общей генетики 133
  • 134. Николай Казимирович Янковский Итоги, № 14 (721) 5 апреля 2010 года. С. 50-51. • Вред, нанесенный проверкой на всякий случай, скорее навредит здоровью общества, чем поможет. • Даже зная всю структуру генома• Даже зная всю структуру генома конкретного организма, мы не сможем сказать, заболеет человек [например, гипертонией или диабетом] наверняка или нет. 134
  • 135. Соблазны • Ламаркизм • Генетицизм – генетический детерминизм • Евгенизм • Лысенкоизм• Лысенкоизм • Коммерциализм – • «генетизация» медицины по сути становится синонимом коммерциализации
  • 136. Спасибо за внимание! Слайды доступны для всех Никита Николаевич Хромов-Борисов Кафедра медицинской информатикиКафедра медицинской информатики СПбГМУ им. акад. И.П. Павлова Nikita.KhromovBorisov@gmail.com (812) 234-18-40 8-952-204-89-49 136