Wyklad habilitacyjny biologia systemowa

BIOLOGIA SYSTEMOWA
I SYNTETYCZNA
OD WIEDZY SZCZEGÓŁOWEJ DO MODELU
WIELO-SKALOWEGO

DARIUSZ PLEWCZYŃSKI
D.PLEWCZYNSKI@ICM.EDU.PL

CENTRUM MODELOWANIA MATEMATYCZNEGO I
KOMPUTEROWEGO

UNIWERSYTET WARSZAWSKI

Celem jest zrozumienie biologii

Jak? Przez analizę komponentów,
modułów, elementów z których
zbudowany jest żywy organizm
Biologia

Organizm

Genom

Geny

Białka

Informacja rośnie bardzo szybko!

Jest to interdyscyplinarne podejście, które traktuje system jako zestaw
oddziałujących elementów, stosowany często do biologi, cybernetyki i
innych dziedzin wiedzy.
Głównym celem jest badanie ogólnych zasad rządzących
ALLGEMEINE SYSTEMTHEORIE
funkcjonowaniem dowolnego systemu, tak żeby móc zastosować je w
przypadku różnych typów układów złożonych.
Początki: General Systems Theory (GST) zaproponowana w książce
"General System theory: Foundations, Development, Applications" by
Bertalanffy, 1968

“...there exist models, principles,
and laws that apply to generalized
systems or their subclasses,
irrespective of their particular kind,
the nature of their component
elements, and the relationships or
"forces" between them. It seems
legitimate to ask for a theory, not of
systems of a more or less special
kind, but of universal principles
applying to systems in general”.
Bertalanﬀy, 1968

CO ZNAJDZIEMY W KOMÓRCE?

Neidhardt and Umbarger chapter 3 in Neidhardt F.C. Escherichia coli and
Salmonella: Cellular and Molecular Biology. Vol 1. ASM Press 1996. table 1

TROCHĘ STATYSTYKI: E. COLI
Number of cell walls/cell 1
Number of membranes/cell 2
Number of chromosomes/cell 2.3 (at mid log phase) Number of genes 4606
Number of mRNA/cell 4000
Number of rRNA/cell 18,000 RNA polymerase molecules per cell
Number of tRNA/cell 200,000 1500-11400
Number of all RNA/cell 222,000
Number of polysaccharides/cell 39,000
Number of proteins/mRNA ~540 proteins/
Number of murein molecules/cell 240,000-700,000 mRNA
Number of lipopolysaccharide/cell 600,000
Number of lipids/cell 25,000,000 Number of all proteins in average cell of
Number of all lipids/cell 25,000,000 E. coli B/r at 37° celsius in aerobic glucose
Number of phosphatidylethanolamine 18,500,000
Number of phosphatidylglycerol 5,000,000 with a 40 minute mass doubling time 2.35e
Number of cardiolipin 1,200,000
Number of phosphatidylserine 500,000 +6
Number of LPS (MW = 10kD) 600,000 Number of metabolites per cell ~3e+8
Average SA of lipid molecule 25 Ang2
Fraction of lipid bilayer=lipid 40% Copies/cell
Fraction of lipid bilayer=protein 60%
Number of outer membrane proteins 300,000
Number of water molecules per cell 2e+10
Number of porins (subset of OM) 60,000 Number of cells in human body (Human
Number of lipoproteins (OM) 240,000
Number of inner membrane proteins 200,000 Homo sapiens) ~1e+13
Number of nuclear proteins 100,000
Number of cytoplasmic proteins 1,000,000 (excluding ribo proteins)
Number of ribosomal proteins 900,000
Number of periplasmic proteins 80,000
Number of all proteins in cell 2,600,000
Number of external proteins (flag/pili) 1,000,000
Number of all proteins 3,600,000 http://redpoll.pharmacy.ualberta.ca/CCDB

CZYM JEST BIOLOGIA SYSTEMÓW?

Dziedzina interdyscyplinarna która bada złożone
oddziaływania w systemach żywych.

Nowa perspektywa:
holizm zamiast redukcjonizmu

Celem: studiowanie oddziaływań między
biomolekułami, oraz tego jak oddziaływania te
prowadzą do zjawisk emergentnych, takich jak
funkcja i zachowanie systemu biologicznego.

DENIS NOBLE

Oxford Press

DENIS NOBLE

“Systems Biology is an idea in search of a deﬁnition.

(...) It is an approach rather than a subject. Denis
Noble's work is one of the clearest examples of the
systems approach in practice since it reveals the
nature of some of the forms of downward
causation in multilevel analysis. The story will
delight readers who like to see how scientific
controversy is resolved, since many of the
developments described in each chapter were highly
controversial when they occurred.”

Oxford Press

CZYM JEST BIOLOGIA SYSTEMÓW?

“Integrate data from multiple levels of the
biological information hierarchy in an
environmental and evolutionary context
and pay particular attention to dynamic
processes that vary in time and space”

NIGMS, 2007

INTEGRACJA DANYCH

Biologia systemowa jest związana z możliwością zebrania i
analizy złożonych danych masowych z wielu źródeł danych
jednocześnie, przy użyciu narzędzi interdyscyplinarnych.
Dodatkowo związana jest z identyﬁkacją i oceną każdego z
typu biomolekuł, ich dynamiką i oddziaływaniami w
komórce żywej.
Genomics Transcriptomics
Interactomics
Epigenetics
Interferomics Translatomics
Metabolomics
Glycomics Proteomics
perturbation methods
Biomics Lipidomics Phenomics Fluxomics
high-throughput techniques wikipedia

ZBLIŻAJĄC SIĘ DO PEŁNEGO OBRAZU

“A quantitative data set of RNA, proteins,
and metabolites provides an unprecedented
starting point to understand, at a systems
level, the eﬀects of perturbations on a cell.”

Sauer U. et al., Science, 2007

AGENCI (AKTORZY)

Metabolities Proteins

Genes


ORAZ ICH ODDZIAŁYWANIA

Do niektórych oddziaływań molekularnych
istotnych dla funkcjonowania komórki: białko-
DNA, białko-białko, białko-kompleksy,
metaboliczne i funkcjonalne interakcje między
genami. Wszystkie razem, oddziaływania te
tworzą Interaktom, analogicznie do genomu,
transktyptomu, proteomu oraz metabolomu. BioZoom nr. 2, 2007

ZATEM: OD SUMY PUNKTÓW DO SIECI

Reprezentacja sieciowa jednej z części ludzkiego
systemu metabolicznego. Metabolity są
pokazane jako żółte węzły, enzymy oznaczone są
na czerwono/zielono w zależności od tego czy
wzmacniają czy wyciszają odpowiednie geny.
BioZoom nr. 2, 2007

Zaburzenia genetyczne skutkują małymi zmianami koncentracji mRNA oraz
białek.
Poziom metabolitów jest stabilny, co pokazuje możliwość przekierowywania
procesów w sieci metabolicznej.
ANALIZA WIELSKO-SKALOWA
E. coli aktywnie reguluje poziomy enzymów w celu podtrzymania stabilności stanu
metabolicznego w odpowiedzi na zmiany szybkości wzrostu.

Pałeczka okrężnicy wykorzystuje komplementarne strategie regulacyjne, dzięki
którym jej sieć metaboliczna jest odporna na dowolny typ zaburzeń.
Pomiar części składowych
komórki jednocześnie w
wielu skalach przetwarzania
umożliwia wyciaganie
ciekawych wniosków
biologicznych.

Wi e l o k r o t n e m a s o w e
pomiar y reakcji komórek
Escherichia coli na
zaburzenia genetyczne i
środowiskowe.
Ishii et al., Science, 2007

Piramida złożoności życia jest zbudowana z wielu komponentów molekularnych, takich jak geny, RNA, białka i
metabolity.
Te podstawowe elementy budujące organizują się w małe, powtarzalne połączenia, nazywane ścieżkami w
metaboliźmie, czy też motywami w sieciach regulacji genetycznej.
Następnie, ścieżki i motywy są łączone w funkcjonalne moduły, tj. grupy węzłów (np. białka i metabolity),
PIRAMIDA ZŁOŻONOŚCI ŻYCIA
które są odpowiedzialne za dyskretne funkcje biologiczne. Moduły te są połączone hierarchicznie i definiują
wielko-skalową funkcjonalną organizację komórki żywej.

W POSZUKIWANIU METAFORY DLA BIOLOGI SYSTEMÓW
Oltvai and Barabási, 2002

SYSTEMOWA ANALIZA UKŁADÓW ŻYWYCH

Struktura systemu: obejmuje sieci oddziaływań między genami,
ścieżki biochemiczne, oraz mechanizmy które wykorzystują takie
sieci do zmiany ﬁzycznych własności wewnątrz- i zewnątrz-
komórkowych struktur.
Dynamika systemu: opisuje jak system zachowuje się w czasie ,
może być zrozumiana przez analizę metabolizmu, wrażliwości na
zaburzenia, analizy dynamiczne, przez wykorzystanie metod ﬁzyki
(przestrzeń stanów, bifurkacje), oraz przez identyfikację
mechanizmów odpowiedziałnych za zaobserwowane zachowanie.
Metody kontroli: systematycznie kontrolują stan komórki, tak
żeby zminimalizować nieprawidłowości, typowo wykorzystywane
w projektowaniu leków jako cele terapeutyczne.
Metody projektowania: sposoby modyfikacji i budowy
systemów biologicznych o zadanych cechach, w celu opracowania
metodologii i zasad tworzenia syntetycznych procesów zamiast
metody prób i błędów.
Kitano, 2002

JĘZYK JAKO METAFORA BIOLOGII SYSTEMOWEJ

POZDRÓŻ OD POJEDYNCZYCH LITER DO CAŁYCH ZDAŃ

A WIĘC OD SZCZEGÓŁU DO WIEDZY OGÓLNEJ!

LITERY: AMINOKWASY

C e c h y f i z y ko - c h e m i c z n e p o j e d y n c z y c h
aminokwasów wpływają na własności całego białka.

STRUKTURA DRUGORZĘDOWA
Conf:
>1A02_PANTR, Eukaryota, signal Pred:
peptides: 1-24 Pred: CCCCCHHHHHHHHHHHHHCCCCCCCEEEEEEEEEEECCCC
AA: MQVTAPRTVLLLLSAALALTETWAGSHSMKYFYTAVSRPG
MQVTAPRTVLLLLSAALALTETWAGSHSMKYFYTA 10 20 30 40
VSRPGRGEPRFISVGYVDDTQFVWFDSDAASPREE
Conf:
PRAPWIEQEGPEYWDRETQISKTNAQTYRESLRNL
Pred:
RGYYNQSEAGSHIIQRMYGCDMGPDGRLLRGYEQY Pred: CCCCEEEEEEEECCEEEEEECCCCCCCCCCCCCCCCCCCC
AYDGKDYIALNQDLSSWTAADTAAQITQRKWEA AA: RGEPRFISVGYVDDTQFVWFDSDAASPREEPRAPWIEQEG
50 60 70 80
ARWAEQLRAYLEGTCVEWLRRYLENGKETLQRADP
PKTHVTHHPISDHEATLRCWALGFYPAEITLTWQR Conf:
DGEDQTQDTELVETRPAGDRTFQKWAAVVVPSGEE Pred:
Pred: CCHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCEEEE
QRYTCHVQHEGLPKPLTLRWEPSSQSTIPIVGIVA AA: PEYWDRETQISKTNAQTYRESLRNLRGYYNQSEAGSHIIQ
GLAVLAVVVIGAVVAAVMCRRKSSGGKGGSYSQ 90 100 110 120
AASSDSAQGSDVSLTA
Conf:
Pred:
Pred: EEECEEECCCCCEEEEEEEEEECCCCCEECCCCCCCCCCC
AA: RMYGCDMGPDGRLLRGYEQYAYDGKDYIALNQDLSSWTAA
130 140 150 160

Conf:
Pred:
Pred: HHHHHHHHHHHHHHHHHHHHHCCCCCHHHHHHHHHHHCCC

Przewidywanie struktury drugorzędowej jest kluczowe w
AA: DTAAQITQRKWEAARWAEQLRAYLEGTCVEWLRRYLENGK
170 180 190 200

zrozumieniu repertuaru struktur białek, oraz pełnionych przez
Conf:
Pred:

nich funkcji biologicznych. Pred: CCCCCCCCCCCEEECCCCCCCCEEEEEEECCCCCCCCEEE
AA: ETLQRADPPKTHVTHHPISDHEATLRCWALGFYPAEITLT
210 220 230 240
Przewidywanie struktury drugorzędowej dla nowych białek przy
Conf:
użyciu ich sekwencji aminokwasowej ma fundamentalne
Pred:
Pred: EEECCCCCCCCCCCCCCCCCCCCCCEEEEEEEECCCCCCC

znaczenie w bioinformatyce. AA: WQRDGEDQTQDTELVETRPAGDRTFQKWAAVVVPSGEEQR
250 260 270 280

Lokalna regularność strukturalna okazała się być bardzo
owocnym paradygmatem opisu całego białka.
wikipedia

KRÓTKIE CIĄGI LITER: LINIOWE MOTYWY
FUNKCJONALNE

Białka nabywają pewnych cech
molekularnych aby wykonywać procesy
biologiczne w komórce:

nieodwracalne modyfikacje
(eg. proteolityczne rozdzielanie)

odwracalne modyfikacje
(eg. fosforylacja, metylacja, acetylacja,...)
Fosforylacja: kluczowa dla regulacji
procesów biologicznych, takich jak
metabolizm, apoptoza, różnicowanie,
podział

Typowo modyfikowane są 3 aminokwasy w
kinazach białkowych: seryna, treonina,
tyrozyna

Mechanizm rozpoznania substratu dla
różnych kinaz może być podobny:
podobne domeny katalityczne,
7-12 fragmenty białek w miejscu
aktywnym kinazy stressgen.com, 2005

#PP: posterior probability. The degree of confidence in each individual aligned res
HMM. Columns are coloured according to the posterior probability
0% 100%

means 0-5%, 1 means 5-15% and so on; 9 means 85-95% and a '*' mean
You can bookmark this page and return to it later, but please use the URL that you can find in the
"Search options" section below. Please note that old results may be removed after one week.

posterior probability
We found 4 Pfam-A matches to your search sequence (3 significant and 1 insignificant) but we did
not find any Pfam-B matches.

#SEQ: query sequence. A '-' indicate deletions in the query sequence with respect
Show the search options and sequence that you submitted.

BIAŁKA WIELODOMENOWE:according to the posterior probability
HMM. Columns are coloured SŁOWA SĄ ZŁOŻONE
Return to the search form to look for Pfam domains on a new sequence.

Significant Pfam-A Matches
0% 100%
Show or hide all alignments.
Envelope Alignment HMM Predicted
Entry Bit E- Show/hide
Family Description Clan active
You can bookmark this page and return to it later, but please use the URL that you can
type Start End Start End From To score value alignment
sites
Class I
>1A02_PANTR, Eukaryota, signal
peptides: 1-24"Search options" section below. Please1 and 2 note that old203 25 203 1 may be removed after one w
results 179 322.9 97 n/a
Histocompatibility 2.9e-
MHC_I Domain CL0343 25
antigen, domains
alpha
MQVTAPRTVLLLLSAALALTETWAGSHSMKYFYTA Immunoglobulin 2.3e-
We found 4 Pfam-A matches to C1-set C1-set domain Domain CL0011 210 295 219 294 significant and 1 insignificant)
VSRPGRGEPRFISVGYVDDTQFVWFDSDAASPREE your search sequence (3 7 82 72.0 3.6e- n/a
MHC_I C-
20

PRAPWIEQEGPEYWDRETQISKTNAQTYRESLRNL MHC_I_C Family n/a 336 362 337 362 2 27 45.2 n/a
not find any Pfam-B matches. Insignificant Pfam-A Matches
RGYYNQSEAGSHIIQRMYGCDMGPDGRLLRGYEQY
terminus 12

AYDGKDYIALNQDLSSWTAADTAAQITQRKWEA
Envelope Alignment HMM Predicted
ARWAEQLRAYLEGTCVEWLRRYLENGKETLQRADP Entry Bit E- Show/hide
Family Description Clan active
type Start End Start End From To score value alignment
sites
PKTHVTHHPISDHEATLRCWALGFYPAEITLTWQR
Neogenin C-
Neogenin_C Family n/a 286 359 300 356 19 70 11.9 0.066 n/a
DGEDQTQDTELVETRPAGDRTFQKWAAVVVPSGEE
QRYTCHVQHEGLPKPLTLRWEPSSQSTIPIVGIVA options and sequenceComments or questions on the site? Send a mail to pfam-help@sanger.ac.uk
Show the search that you submitted.
terminus

The Wellcome Trust
GLAVLAVVVIGAVVAAVMCRRKSSGGKGGSYSQ
Return to the search form to look for Pfam domains on a new sequence.
AASSDSAQGSDVSLTA

Anotacja biologiczna foldów białkowych dla sekwencjonowanych genomów
http://pfam.sanger.ac.uk/search/sequence Page 1 of 1

Significant Pfam-A Matches
jest celem quasi-automatycznych wielko-skalowych metod in silico
przewidywania struktury.
Envelope Alignment
Jednak metody te w większości wypadków umożliwiają przewidywanie HMM
Entry Bit
Family struktury trójwymiarowej dla białek jednodomenowych.
Description Clan
type Start End Start End From To score
Metody te nie potraﬁą analizować bardziej złożonych struktur białkowych,
Class I
dlatego białka (np. ludzkie) powinny być najpierw podzielone na pojedyczne
Histocompatibility
domeny. Każda z tych domen jest następnie poddawana analizie
MHC_I Domain CL0343 25 203 25 203 1 179 322.9
antigen, domains
podobieństwa sekwencyjnego, jak również przewidywaniu struktury
trójwymiarowej. 2
alpha 1 and
Immunoglobulin
C1-set Dopiero później możliwa jest analiza strukturalna całości biomolekuły i 82
Domain CL0011 210 295 219 294 7 72.0
C1-set domain
przyporządkowanie jej funkcji biologicznej.
MHC_I C-
MHC_I_C Family n/a 336 362 337 362 2 27 45.2
terminus

A ZATEM PROBLEM Z KONTEKSTEM SŁÓW: STRUKTURA
TRÓJWYMIAROWA

Struktura trójwymiarowa białek jest bardzo
konserwowana w trakcie ewolucji.

Analiza podobieństwa struktur pozwala na znalezienie
około dwa razy więcej odległych podobieństw niż w
przy padku wykorzystania wyłącznie informacji
sekwencyjnej.

Dalekie podobieństwo pozwala łączyć białka bardzo
zróżnicowane sekwencyjnie.

Dlatego też uliniowienie strukturalne pozwoliło na
lepsze zrozumienie relacji ewolucyjnych między
białkami. Dzięki wykorzystaniu str ukturalnej
klasyﬁkacji białek, pojęciu rodzin białkowych, możemy
lepiej zrozumieć funkcję biologiczną foldów, całych
białek.

ZNACZENIE SŁÓW: OD SEKWENCJI/STRUKTURY
DO FUNKCJI BIOLOGICZNEJ

Sequence Structure Function
>1PKN:A|PDBID|CHAIN|SEQUENCE
SKSHSEAGSAFIQTQQLHAAMADTFLE
HMCRLDIDSAPITARNTGIICTIGPASRS
VETLKEMIKSGMNVARMNFSHGTH
EYHAETIKNVRTATESFASDPILYRPVAV
ALDTKGPEIRTGLIKGSGTAEVELKKG
ATLKITLDNAYMAACDENILWLDY RABBIT MUSCLE
KNICKVVEVGSKVYVDDGLISLQVKQ
KGPDFLVTEVENGGFLGSKKGVNLPG PYRUVATE KINASE
AAVDLPAVSEKDIQDLKFGVDEDVDM
VFASFIRKAADVHEVRKILGEKGKNIKI
ISKIENHEGVRRFDEILEASDGIMVARG
DLGIEIPAEKVFLAQKMIIGRCNRAG
KPVICATQMLESMIKKPRPTRAEGSDV
ANAVLDGADCIMLSGETAKGDYPLEA
VRMQHLIAREAEAAMFHRKLFEELAR
SSSHSTDLMEAMAMGSVEASYKCLAA
ALIVLTESGRSAHQVARYRPRAPIIAVT
RNHQTARQAHLYRGIFPVVCKDPVQE
AWAEDVDLRVNLAMNVGKAAGFFKK
GDVVIVLTGWRPGSGFTNTMRVVPVP

CAŁE ZDANIA? KOMPLEKSY

Rozwój technik przewidywania struktury trójwymiarowej z sekwencji
aminokwasowej białek.
Użycie informacji strukturalnej do przewidywania:
Funkcji biochemicznej
Partnerów oddziaływania
Ścieżek

OD POJEDYNCZYCH ZDAŃ DO CAŁEGO TEKSTU:

BIOLOGIA SYSTEMOWA I SYNTETYCZNA

CENTRALNY DOGMAT BIOLOGII MOLEKULARNEJ

EGF pathway, 2008

ZDANIA BUDUJĄ CAŁY INTERAKTOM

Ścieżki Ścieżki
Sygnałowe Metaboliczne

Oddziaływania molekularne między białkami i
małymi cząsteczkami chemicznymi pełnią
kluczową rolę w wielu procesach biologicznych.

INTERAKTOM STATYCZNY

Wyzwanie zbudowania kompletnego zestawu oddziaływań
obecnych w żywej komórce

Interakcje między białkami t worzą tylko jedną część interaktomu,
druga związana jest z oddziaływaniami z innymi biopolimerami
(DNA/RNA), dużymi cząsteczkami tłuszczów, oraz małymi
metabolitami - dopiero razem t worzą pełny, funkcjonalny model.

INTERAKTOM DYNAMICZNY
Drugim wyzwaniem jest charakteryzacja efektów dynamicznych
dla interaktomu

Interaktom jest statyczną, dwu-wymiarową reprezentacją
ponieważ oddziaływania nigdy nie dzieją się równocześnie w tym
samym miejscu i w tym samym momencie.

Przestrzenne i czasowe dane doświadczalne są więc niezbędne to
zrozumienia GDZIE i KIEDY oddziaływania się realizują w żywej
komórce. Lars Jensen and Peer Bork; Science 322, 56-57 (2008)

BIOLOGIA SYSTEMOWA W PRAKTYCE

1. Zdeﬁniuj wszystkie elementy budujące
system.
2 . S y s te m a t y c z n i e z a b u r z a j k a ż d y z
elementów i obserwuj reakcję systemu.
3 . S t a r a j s i ę p o g o d z i ć o b s e r wo w a n e
doświadczalnie zjawiska z tymi
przewidywanymi przez Twój model.
4. Zaprojektuj i przeprowadź nowe typy
doświadczeń analizy zaburzeń w celu
odróżnienia wielu wykluczających się
modeli i hipotez.
Ideker et al., 2001

WERYFIKACJA DOŚWIADCZALNA

Kitano, 2002

CENTRALNOŚĆ STEROWANIA?

“Systems biology is about putting together
rather than taking apart, integration rather
than reduction. It starts witch what we have
learned from the reductionist approach; and
then it goes further”

Wymagana jest inna droga myślenia o
integracji, podobnie rygorystyczna jak
podejście redukcjonistyczne, ale inna.
Oznacza to zmianę podejścia, ﬁlozoﬁ opisu
systemu biologicznego.
Noble D., 2006

WSZYSTKO TO JEST O NASZYCH BIO-AGENTACH
KTÓRE NIE SĄ STEROWANE CENTRALNIE

“There are no privileged components telling
the rest what to do”

Ni e i s t n i e j e p r o g r a m , k t ó r y k i e r u j e
systemem biologicznym, zarówno jego
rozwojem jak i funkcjonowaniem.

Genom, nie jest programem, ale raczej
pasywną bazą danych, jednym z wielu
czynników określających rozwój i dynamikę
żywego organizmu. Dopiero oddziaływania
wielu czynników opisują zachowanie całości.
Noble D., 2006

STRATEGIE ROZWOJU

Genomy funkcjonują raczej jak strategie,
które ukierunkowują działanie agentów
biologicznych (biomolekuł) w miarę jak
system się rozwija.
Takie strategie, lub programy mogą również
wchodzić w interakcje z otoczeniem,
środowiskiem zewnętrznym (np. z agentami
innych komórek) na każdym etapie rozwoju.

Werner, E., 2007

ROZPROSZONE PRZETWARZANIE DANYCH

Ko n c e p c j a v o n Ne u m a n n a s a m o -
reprodukujących się automatów, które
posiadają możliwość samo-konstrukcji
własnej kopii, przy użyciu zestawu instrukcji
(które także są kopiowane do potomka).

Inaczej jest w komórkach żywych, gdzie
genomy zachowują się raczej jak
rozproszeni agenci przetwarzający impulsy
informacyjne, nie zaś samo-reprodukujące
się automaty implementujące architekturę
von Neumanna.
Werner, E., 2007

BIOLOGIA JAKO NAUKA O PRZETWARZANIU
INFORMACJI W UKŁADACH ŻYWYCH

Systemy biologiczne są zbudowane z dwóch
ty pów informacji: genów kodujących
biomolekuły, które wykonują procesy
biologiczne, oraz sieci regulacyjne, które
określają jak i które geny są aktywne.

Ideker at al., 2001

Informacja biologiczna jest hierarchiczna:

DNA → mRNA → protein → protein
interactions → informational pathways →
informational networks → cells → tissues or
networks of cel ls → an organism →
populations → ecologies

Informacja biologiczna jest hierarchiczna:


... i zmienia się w czasie.


INFORMACJA BIOLOGICZNA

Informacja w biologii ma kilka ważnych
cech:
■ Oper uje na wielu hierarchicznych
poziomach organizacji.
■ Jest przetwarzana w złożonych sieciach.
■ Sieci informacyjne są stabilne, odporne na
zaburzenia, wiele pojedynczych zaburzeń
nie wpływa na nie znacząco.
■ W tych sieciach są wyróżnione węzły,
których zaburzenie ma duży wpływ na
całość organizmu, właśnie te węzły stanowią
najciekawsze cele do zrozumienia i kontroli
całego systemu. Ideker at al., 2001

INFORMACJA ANALOGOWA

Komórka zawiera informację analogową,
podczas gdy genom zawiera informację
dyskretną.

Ponieważ analogowa informacja jest ciągła,
ż y w a ko m ó r k a z a w i e r a p o te n c j a l n i e
nieskończenie wiele informacji, znacznie
więcej niż skończona ilość informacji
dyskretnej zapisane w genomie.

Jednak należy rozważyć ważność, istotność
takiej informacji!
Noble D., 2006

BIOLOGIA SYSTEMOWA BIOLOGIA SYNTETYCZNA

BIOLOGIA SYNTETYCZNA

Nowa dziedzina łącząca badania
biologiczne oraz nauki inżynieryjne.

Łączy ona wiele różnych podejść,
metodologii oraz dyscy plin
naukowych.

C e l e m j e s t p r o j e k to w a n i e i
tworzenie nowych biologicznych
funkcji i systemów nie istniejących w
naturze.

ZASADA: SZYBKO, TANIO I MNIEJ-WIĘCEJ
KONTROLOWALNIE

Arkin & Fletcher, 2006

ZASADA: SZYBKO, TANIO I MNIEJ-WIĘCEJ
KONTROLOWALNIE

Zasady inżynieri:
hierarchia
abstrakcja
projekt

Cel:
kontrola organizmu żywego
Potrzebne:
modularność
standarty
skalowanie Arkin & Fletcher, 2006

REDUKCJONIZM

System może być zrozumiany tylko przez jego
redukcję do najmniejszych elementów.

Najmniejsze elementy zachowują się indywidualnie
w sposób zgodny z przewidywaniami.

OSTRZEŻENIE

ale - samo wyliczenie tych elementów i ich
własności nie wystarcza do opisania procesu ich
współpracy i komunikacji niezbędnych do budowy
oraz funkcjonowania całej komórki.

WŁASNOŚCI EMERGENTNE

Podejście redukcjonistyczne z sukcesem pozwoliło
na identyﬁkację większości elementów składowych
i ich oddziaływań, jednak nie ofer uje ono
przekonującej koncepcji metodologicznej lub
metody umożliwiającej pokazanie w jaki sposób
pojawiają się własności emergentne całego systemu.


INTEGRACJA

Aby zrozumieć jak i dlaczego komórki funkcjonują
w ten a nie inny sposób, potrzebujemy dokładnych
danych o koncentracjach biomolekuł, tak żeby
można było odpisać ich wzajemne oddziaływania.

Pluralizm przyczyny i skutku w sieciach
biologicznych jest lepiej opisywany przez
obser wacje ilościowe i równoczesne, wielu
czynników odpowiadających za funkcjonowanie
komórki, jak również ich rygorystyczna integracja
z modelami matematycznymi.

MODELOWANIE/SYMULACJE

Niezbędne jest ponowne połączenie części w
całość, oraz budowa poszczególnych modułów
oprogramowania symulacyjnego, które same będą
się zachowywały jak dynamiczne częsci organizmu
żywego.

10 ZASAD BIOLOGII SYSTEMOWEJ

Noble D., 2006

10 ZASAD BIOLOGII SYSTEMOWEJ
Funkcja biologiczna jest wielo-skalowa;
Przekazywanie informacji nie zachodzi tylko
w jednym kierunku;
DNA nie jest wyłącznym przekaźnikiem
dziedziczenia;
Teoria biologicznej względności: nie ma
wyróżnionego poziomu kauzalnego;
Ontologia genów nie powiedzie się bez opisu
wysoko-poziomowego (integrującego);
Nie ma programu genetycznego;
Nie ma programów na innych poziomach;
Nie ma programów w mózgu;
Istota nie jest obiektem;
Jest wiele innych zasad, które zostaną
odkryte. Nie istnieje ostateczna “teoria biologii”Noble D., 2006

CZY ZOSTAŁO JESZCZE TROCHE CZASU?

JEŚLI TAK: CZY BIOLOG MOŻE NAPRAWIĆ RADIO?

Testowanie podejścia biologii systemowej w
przypadku kiedy znamy rozwiązanie
Lazebnik, Cancer Cell, 2002

ŚCIEŻKA SYGNAŁOWA

Oba przekształcają sygnał z jednej formy do drugiej,
Oba mają porównywalną ilość elementów/węzłów.
Molecular ce! biology Lodish H. et al.

CO ODRÓŻNIA TE DWA SWIATY?

formalny język ilościowy jest niezbędny

analiza perturbacji i stanów stacjonarnych

Lazebnik, Cancer Cell, 2002

Niels Bohr

Predicting is very
difﬁcult especially about
the future…

Przykład pierwszy: T. MARITIMA
• Analiza strukturalna pełnej
sieci metabolicznej

• 478 białek (358 modeli 3D)

• 503 metabolitów

• 182 foldów

• 562 wewnatrz-komórkowych
& 83 zewnątrz-komórkowych
reakcji

• lepsze zrozumienie ewolucji i
mechanizmów działania
ścieżek metabolicznych

• zastosowania w biotech

LBiBS

Godzik, Ginalski et al. Science 325, 1544-1549 (2009)

Przykład drugi: M.GENITALIUMA
External
environment RNA
modification
Figure 1. M. genitalium Whole-Cell Model
Integrates 28 Submodels of Diverse Cellular
Processes
RNA Ribosome Terminal organelle
decay assembly (A) Diagram schematically depicts the 28 sub-
Metabolism assembly
A Figure 1. M. genitalium Whole-Cell Model as colored words—grouped by category
tRNA Protein models

• Modeł pełnej komórki z
aminoacylation translocation
External RNA processing Integrates 28 Protein
Submodels of Diverse Host Cellularmetabolic (orange), RNA (green), protein
as
environment RNA processing interaction (blue), and DNA (red)—in the context of a single
modification Processes
(A) Diagram schematically depicts uwzględnieniem jej
Host epithelium
M. genitalium cell with its characteristic flask-
RNA Ribosome Terminal organelle
Transcription
decay assembly the 28 sub- shape. Submodels are connected through
like
Metabolism assembly Translation
tRNA
aminoacylation
Protein
DNA
translocation
supercoiling
Transcriptional Macromolecular
regulation complexation
Host
Protein
modification
charakterystycznego as and the
chromosome, which are depicted kształtu
common metabolites, RNA, protein,
models as colored words—grouped by category
as metabolic (orange), RNA (green), protein orange,
RNA processing Protein Protein Protein green, blue, and red arrows, respectively.
processing interaction
activation folding
(blue), and DNA (red)—in the context of a single
(B) The model integrates cellular function sub-
DNA
DNA Host epithelium
• Zróżnicowane procesy
repair M. genitalium cell with its characteristic flask- through 16 cell variables. First, simulations
models
damage
Transcription
like shape. Submodels areMetabolites
Protein
decay
are randomly initialized to the beginning of the cell
connected through

DNA
Transcriptional Macromolecular
regulation complexation
Protein
Translation RNA
Protein komórkowe: metaboliczne
common metabolites, RNA, protein, and cycle (left gray arrow). Next, for each 1 s time step
the
(dark black arrows), the submodels retrieve the
supercoiling modification chromosome, which are depicted as orange, values of the cellular variables, calculate
Protein
activation
Protein
folding
Chromosome
condensation DNA
green, blue, and red arrows, respectively.
Replication
(pomarańczowy), RNA
current
their contributions to the temporal evolution of the

DNA
repair DNA
DNA
replication
initiation model integrates cellular function sub-
(B) The
FtsZ
models through 16 cell variables. First, simulations
(zielony), białkowe (niebieski),
cell variables, and update the values of the cellular
variables. This is repeated thousands of times
damage polymerization
Protein
decay
Metabolites
Chromosome
segregation
Cytokinesis cell oraz DNA (czerwony)
during the course of each simulation. For clarity,
are randomly initialized to the beginning of the cell functions and variables are grouped into five
RNA cycle (left gray arrow). Next, for each 1 s time stepphysiologic categories: DNA (red), RNA (green),
Protein (dark black arrows), the submodels retrieve protein (blue), metabolite (orange), and other
the
Chromosome
condensation DNA • Integracja 28 podmodeli
current values of the cellular variables, calculate Colored lines between the variables and
(black).
submodels indicate the cell variables predicted by
B Update time & contributions to the temporal evolution of each submodel. The number of genes associated
their the
Replication cell variables
DNA initiation cell variables, and update the values of the cellular each submodel is indicated in parentheses.
with
replication Chromosome
variables. This(3) repeated thousands of times simulations are terminated upon cell divi-
Condensation
RNA DNA

FtsZ
polymerization
Transcript
Segregation (7)
during the (0)
is
Damage course of each simulation. For clarity,
• Podmodele są połączone
Finally,
sion when the septum diameter equals zero (right
The model integrates cellular function
Chromosome
Cytokinesis submodels through 16 cell
cellRepair (18) and variables are grouped into five
functions przez wspólne metabolity,
gray arrow).

DNA
segregation RNA
variables. First, simulations are randomly initialized to the beginning Supercoiling (5)
physiologic categories: DNA (red), RNA (green),
of the cell cycle (left gray arrow). Next, for each 1 s time Polypeptide step (dark
Replication (10)
protein (blue), metabolite (orange), and other
Replication initiation (1)
RNA, białka, oraz chromosom,
black arrows), the submodels retrieve the current values of the cellular Protein mon. Transcriptional reg. (5)
(black). Colored lines between the variables and
Transcription (8) co jest pokazane w
submodels indicate the cell variables predicted by and protein degradation were
variables, calculate their contributions to the temporal evolution of Complex Processing (6) RNA
odpowiadających im kolorach
Protein

B Update time &

RNA
each submodel. The number of genes associated
Modification (14)
the cell variables, and updatecell variables of the cellular variables. This is
the values RNA pol Aminoacylation (25)
modeled as Poisson processes.
with each submodel is indicated in parentheses. key challenge of the project was to
No: A
repeated Chromosome of times during the course of (3) simulation. ForSend cell Finally, simulations are terminated upon cell divi-
thousands Condensation each Decay (2)
RNA DNA

repeat
Ribosome integrate the 28 submodels into a unified
Initialize variables Translation (103)
clarity, cell Transcript and variables are grouped (7) five physiologic
functions Segregation into
FtsZ ring sion when the(2)
Cell Yes:
Processing I septum diameter equals zero (right
divided? terminate model. Although we and others had
Damage (0)
categories: DNA (red), RNA (green), protein (blue), metabolite (orange), gray arrow). (9)
Translocation previously developed methods to inte-
Metabolite

Repair (18) Metabolic rxn Processing II (2)
DNA

RNA grate ODEs with Boolean, probabilistic,
and other (black). Colored lines bet ween the variables andMetabolite
Supercoiling (5) submodels Folding (6)

Protein
Modification (3) and constraint-based submodels (Covert
indicate the cell variables predicted by each submodel. The number of
Polypeptide Replication (10) Complexation (0) et al., 2001, 2004, 2008; Chandrasekaran
Replication initiation (1) Geometry Ribosome assembly (6)
genes associated with each submodel isTranscriptionalin parentheses. Finally,
indicated reg. (5) Term. org. assembly (8)
and Price, 2010), the current effort
Protein mon. Host
simulations are terminated upon cell divi- sion when the septum
Transcription (8) Activation (0) involved so many different cellular func-
tions and mathematical representations
Decay (9)
Other

Complex Processing (6) Mass RNA polymerization (1)
FtsZ and protein degradation were a more general approach was
Protein

that
RNA

Modification (14) Stimulus Metabolism (140)
modeled as Poisson processes.
RNA pol needed. We began with the assumption
Other

Aminoacylation (25) Cytokinesis (1)
Decay (2)
No:
Time A key challenge of the project wasthat the submodels are approximately
Host interaction (16) to
Ribosome Send cell repeat Karr, Covertindependent 150, 389-401 (2012)
et al. Cell on short timescales (less
Cell variables Cell process submodels
integrate the 28 submodels into a unified
Initialize variables Translation (103) Yes:
Cell than 1 s). Simulations are then performed
FtsZ ring Processing I (2) divided? terminate model. Although we and others hadrunning through a loop in which the
by

Wyklad habilitacyjny biologia systemowa

Recommandé

Recommandé

Contenu connexe

Similaire à Wyklad habilitacyjny biologia systemowa

Similaire à Wyklad habilitacyjny biologia systemowa (18)

Wyklad habilitacyjny biologia systemowa

Notes de l'éditeur