2. Белки в организме
• Белки составляют ~15% массы тела среднего человека.
• Функции белков: структурные белки, каталитические белки,
транспорт и депо, регуляторные и рецепторные белки и белки
иммунной системы (защитные), моторная и сократительная
функции
• Большинство тканей тела состоит из белков.
• Многие болезни имеют причиной модификацию тех или иных
белков.
3. Какой процент человеческого
протеома имеет известную
структуру ?
• Крупные фармацевтические компании выявили множество структур, но
большинство из них не депонировано в Protein Data Bank.
• ~40,000 генов в человеческом геноме.
• ~25,000 записей в Protein Data Bank:
– a. ~5,600 точных записей хорошего качества.
– b. ~1,100 из них – человеческие белки
– c. И эти записи в основном – единичные домены или фрагменты белков.
• Ответ (эмпирический): ~1%
• Ответ (моделирование гомологов): ~20% доменов
5. Уровни структур белков
• Первичная структура – последовательность
аминокислот
• Вторичная структура – локальная организация
полипептидной цепи без учёта возможных конформаций
боковых цепей (R групп).
• Третичная структура – 3D структура всего протеина,
включая конформации боковых цепей.
• Четвертичная структура – 3D структура организации
субъединиц белка.
6. Аминокислоты
V
L I
M
Гидрофобные боковые цепи
F
Y
Гидрофильные
боковые цепи
N
Q
Aromatic side chains
Amide group
E D
Negatively charged
Positively charged
RH
K
G A S
T Y
PC
OH group (H-bonds(
-S- (SS-bonds in Cys(
W (Two rings(
9. Пептидные связи
Пептидная связь образуется в результате
взаимодействия α – углерода карбоксильной
группы одной аминокислоты и α –аминогруппы
другой аминокислоты.
10. Пептидные связи
Торзионный угол C,N,Cα,C называется φ.
Торзионный угол N,Cα,C,N называется ψ.
Торзионный угол Cα ,C,N,Cα ) называется ω.
HDF5 format
13. Основные белковые структуры
• Первичная структура – последовательность аминокислот
• Вторичная структура – это локальная организация главной
полипептидной цепи без учёта конформаций отдельных
боковых групп (R групп).
14. Вторичная структура. α спираль (α helix)
H связь: N-H i -> C=O i+4
Linus Pauling, Robert Corey, Max Perutz
15. Правозакрученная спираль.
Каждая аминокислота соответствует повороту на 100° - 3,6
аминокислоты на виток и трансляции на 1,5 Å вдоль оси.
Вторичная структура. α спираль (α helix)
Геометрия
310 спираль – H связь: N-H i -> C=O i+3
Концы стандартной спирали
π спираль – H связь: N-H i -> C=O i+5
23. Ramachandran Plot
• Sasisekaharn – Ramakrishnan -Ramachandran plot отображает “допустимые” области
для углов φ и ψ.
• Повторяющиеся величины φ и ψ вдоль пептидной цепи регулярные структуры.
24. Ramachandran Plot
αR - phi ~-57o
и psi ~-47o.
cytochrome C-256
β - phi ~-110->-140o
и psi ~110->135o
plastocyanin
25. Домены
Домен – элемент в протеине, свернутый независимо от белка, часто соединенный с
подвижной, гибкой, бесструктурной частью.
1) Домен – функциональный элемент белка.
2) Эволюционно сохранившиеся элементы.
26. Основные структуры белков
• Третичная структура – 3D структура всего белка с учётом
конформации боковых цепей.
• Четвертичная структура – 3D организация субъединиц (доменов)
и белков в надмолекулярные комплексы
Venn diagram of the physico-chemical properties of the 20 proteinogenic amino acids.
Display of a rotamer via library in WHAT IF. The backbone (only Ca) is drawn in blue and every corner point is one Ca.Two kinds of rotamers are seen very often in protein structures, two kinds of rotamers are only seen ones.
Domain - A region of a protein’s amino acid sequence that has evolutionary, structural, or functional significance. The amino acid sequence of a domain determines a protein’s 3D structure. ... The stated goal of structural genomics , as a field, involves generating a set of structures representative of most of the possible folds for specific protein domains and then solving the structures for new proteins based on known fold- structure relationships. Pharmaceutical researchers are most interested in domains because these determine the “active” or “binding” sites of molecules. Mosaic proteins: A number of eukaryotic proteins (often called "mosaic proteins") are formed by many modules. These modules are also functional units and can be identified from sequence patterns. Each module is a separate unit in the sequence and folds as a separate domain. An example is tissue plasminogen activator, which is composed of four modules, one fibronectin type III module, one epidermal growth factor module, one so-called kringle module and the main enzymatic portion, a serine protease module. Plasminogen is also a mosaic protein, with five kringle modules preceding a serine protease domain. In same proteins, the number of similar modules is very large. Some of these modules, like the fibronectin type III module, are found in a large number of proteins, and appear to fulfil a similar function in all of them. Most of these modules are not catalytic, but are able to bind other molecules. Mosaic proteins are formed by recombination events. Each domain corresponds to a single exon in the DNA. All the exons are in the same reading frame. Gene duplications and recombinations of the introns containing these exons will therefore lead to formation of protein molecules with new combinations of these modules.
=
TIM – Triose Phospahte somerase solved 1975 – first TIM barrel