SlideShare une entreprise Scribd logo
1  sur  24
Télécharger pour lire hors ligne
426
21.1. C¸c ph−¬ng ph¸p míi ® gióp gia t¨ng tèc ®é
gi¶i tr×nh tù c¸c hÖ gen
21.2. C¸c nhµ khoa häc øng dông tin sinh häc ®Ó
ph©n tÝch c¸c hÖ gen vµ chøc n¨ng cña chóng
21.3. C¸c hÖ gen kh¸c nhau vÒ kÝch cì, sè gen vµ
mËt ®é gen
21.4. Sinh vËt nh©n thËt ®a bµo cã nhiÒu ADN kh«ng
m hãa vµ nhiÒu hä ®a gen
21.5. LÆp ®o¹n, t¸i s¾p xÕp vµ ®ét biÕn trong tr×nh tù
ADN ®ãng gãp vµo qu¸ tr×nh tiÕn hãa
21.6. So s¸nh c¸c tr×nh tù hÖ gen cung cÊp b»ng
chøng vÒ c¸c qu¸ tr×nh tiÕn hãa vµ ph¸t triÓn
g−êi phô n÷ trªn Hinh 21.1 vµ con tinh tinh bªn c¹nh
c« ®ang c−êi ®ïa víi nhau – cã thËt vËy kh«ng? Hä cã
hiÓu nh÷ng “c©u ®ïa giìn” vµ ®¸p l¹i b»ng vÎ mÆt cïng
víi c¸c tiÕng ph¸t ©m cña nhau kh«ng? Nhê nh÷ng kü thuËt
®−îc ph¸t triÓn gÇn ®©y trong viÖc gi¶i tr×nh tù nhanh toµn bé
c¸c hÖ gen, giê ®©y chóng ta cã thÓ tuyªn bè vÒ c¬ së di truyÒn
liªn quan ®Õn c¸c c©u hái hÊp dÉn nh− võa ®−îc nªu.
Tinh tinh (Pan troglodytes) lµ loµi cã quan hÖ sèng gÇn
chóng ta nhÊt trªn c©y tiÕn hãa cña sù sèng. HÖ gen cña nã
®−îc gi¶i tr×nh tù hoµn toµn vµo n¨m 2005, nghÜa lµ kho¶ng 2
n¨m sau khi viÖc gi¶i tr×nh tù hÖ gen ng−êi hoµn thµnh phÇn
lín. Giê ®©y chóng ta ®· cã thÓ so s¸nh hÖ gen cña chóng ta víi
hÖ gen cña tinh tinh vµ ®èi chiÕu tõng baz¬ nit¬ nh»m lµm s¸ng
tá nh÷ng th«ng tin di truyÒn kh¸c nhau nµo ®· dÉn ®Õn c¸c ®Æc
®iÓm kh¸c biÖt gi÷a hai loµi linh tr−ëng nµy.
Ngoµi viÖc ®· x¸c ®Þnh ®−îc tr×nh tù hÖ gen ®Çy ®ñ cña
ng−êi vµ tinh tinh, c¸c nhµ nghiªn cøu còng ®· thu ®−îc tr×nh
tù hÖ gen ®Çy ®ñ cña vi khuÈn E. coli vµ nhiÒu loµi sinh vËt
nh©n s¬ kh¸c, còng nh− cña mét sè loµi sinh vËt nh©n thËt, bao
gåm Saccharomyces ceriviseae (nÊm men bia), Caenorhabitis
elegans (mét loµi giun trßn), Drosophila melanogaster (ruåi
giÊm), Mus musculus (chuét b¹ch) vµ Macaca mulatta (khØ
rhezut). ThËm chÝ c¸c ph©n ®o¹n ADN tõ c¸c loµi ®· bÞ tuyÖt
chñng, nh− gÊu hang (Ursus spelaneus) hay voi mamót l«ng
(Mammuthus primigenius) còng ®· ®−îc gi¶i tr×nh tù. C¸c tr×nh
tù hÖ gen ®Çy ®ñ hoÆc tõng phÇn b¶n th©n chóng lµ ®èi t−îng
®−îc quan t©m nghiªn cøu, ®ång thêi chóng cung cÊp nh÷ng
th«ng tin s©u h¬n vÒ tiÕn hãa vµ nhiÒu qu¸ tr×nh sinh häc kh¸c.
B»ng viÖc më réng so s¸nh hÖ gen ng−êi vµ tinh tinh víi c¸c
loµi linh tr−ëng kh¸c còng nh− víi c¸c loµi ®éng vËt cã quan hÖ
di truyÒn xa h¬n, chóng ta cã thÓ t×m thÊy tËp hîp c¸c gen quy
®Þnh sù kh¸c biÖt râ rÖt cña mçi nhãm sinh vËt. Xa h¬n mét
chót, sù so s¸nh víi c¸c hÖ gen vi khuÈn, vi khuÈn cæ (archaea),
nguyªn sinh ®éng vËt vµ c¸c loµi thùc vËt sÏ gióp chóng ta lµm
s¸ng tá lÞch sö tiÕn hãa l©u dµi liªn quan ®Õn c¸c gen ®−îc c¸c
loµi cïng nhau “chia sΔ cïng víi c¸c s¶n phÈm cña chóng.
Víi viÖc hÖ gen cña nhiÒu loµi ®· ®−îc gi¶i tr×nh tù ®Çy ®ñ,
c¸c nhµ khoa häc cã thÓ nghiªn cøu c¸c tËp hîp gen hoµn chØnh
vµ sù t−¬ng t¸c cña chóng theo mét h−íng nghiªn cøu ®−îc gäi
lµ hÖ gen häc (genomics). C¸c nç lùc gi¶i tr×nh tù theo h−íng
nghiªn cøu nµy ®· vµ ®ang tiÕp tôc t¹o ra nh÷ng khèi d÷ liÖu
khæng lå. Nhu cÇu cÇn xö lý mét l−îng th«ng tin trµn ngËp
®ang t¨ng lªn nhanh chãng ®· dÉn ®Õn sù h×nh thµnh cña lÜnh
vùc tin sinh häc (bioinformatics), lÜnh vùc øng dông c¸c
ph−¬ng ph¸p khoa häc m¸y tÝnh vµo viÖc l−u gi÷ vµ ph©n tÝch
c¸c sè liÖu sinh häc.
Chóng ta sÏ b¾t ®Çu ch−¬ng nµy b»ng viÖc th¶o luËn vÒ hai
h−íng nghiªn cøu, gåm c¸c kü thuËt gi¶i tr×nh tù hÖ gen vµ mét
sè tiÕn bé trong viÖc øng dông tin sinh häc. Sau ®ã chóng ta sÏ
s¬ l−îc vÒ nh÷ng hiÓu biÕt thu nhËn ®−îc tõ viÖc gi¶i tr×nh tù
c¸c hÖ gen ®· ®−îc tiÕn hµnh ®Õn nay. Sau ®ã chóng ta sÏ m« t¶
vÒ thµnh phÇn hÖ gen ng−êi nh− mét hÖ gen ®¹i diÖn cho c¸c
sinh vËt nh©n thËt ®a bµo. Cuèi cïng, chóng ta sÏ cïng t×m hiÓu
nh÷ng quan ®iÓm vÒ qu¸ tr×nh tiÕn hãa vµ c¸c c¬ chÕ ph¸t triÓn
vèn lµ c¬ së t¹o nªn sù ®a d¹ng vÜ ®¹i cña sù sèng hiÖn cã trªn
Tr¸i §Êt.
N
C¸c kh¸i niÖm chÝnh
Tæng quan
§äc c¸c l¸ trªn c©y sù sèng
 H×nh 21.1 Th«ng tin nµo trong hÖ gen ®· t¹o nªn
con ng−êi vµ tinh tinh ?
C¸c hÖ gen
vµ sù tiÕn hãa
cña chóng
Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 427
ViÖc gi¶i tr×nh tù hÖ gen ng−êi, mét dù ¸n tham väng víi tªn
gäi Dù ¸n HÖ gen Ng−êi (HGP) ®−îc b¾t ®Çu vµo n¨m 1990.
§−îc tæ chøc thµnh mét Tæ hîp (conxoocxi«m) gåm nhiÒu nhµ
khoa häc quèc tÕ ®−îc céng ®ång tµi trî, dù ¸n ®· ®−îc triÓn
khai ë 20 trung t©m gi¶i tr×nh tù lín thuéc 6 quèc gia bªn c¹nh
nhiÒu phßng thÝ nghiÖm nhá thùc hiÖn c¸c nh¸nh cña dù ¸n.
Sau khi viÖc gi¶i tr×nh tù hÖ gen ng−êi ®−îc hoµn thµnh
phÇn lín vµo n¨m 2003, tr×nh tù cña mçi nhiÔm s¾c thÓ ®· ®−îc
ph©n tÝch kü l−ìng vµ ®−îc m« t¶ trong hµng lo¹t c¸c bµi b¸o
khoa häc, trong ®ã bµi b¸o cuèi cïng liªn quan ®Õn tr×nh tù cña
nhiÔm s¾c thÓ sè 1 ®−îc c«ng bè vµo n¨m 2006. Víi kÕt qu¶
nµy, c¸c nhµ nghiªn cøu coi viÖc gi¶i tr×nh tù hÖ gen ng−êi ®·
“chÝnh thøc hoµn thµnh”. §Ó ®¹t ®−îc nh÷ng cét mèc ®ã, dù ¸n
®· ®−îc triÓn khai qua ba giai ®o¹n víi c¸c ph¸t hiÖn ngµy cµng
chi tiÕt h¬n vÒ hÖ gen ng−êi; ba giai ®o¹n ®ã gåm: lËp b¶n ®å
liªn kÕt, lËp b¶n ®å vËt lý vµ gi¶i tr×nh tù ADN.
Gi¶i tr×nh tù hÖ gen qua ba giai ®o¹n
Tr−íc khi Dù ¸n HÖ gen Ng−êi b¾t ®Çu, c¸c nghiªn cøu tr−íc
®ã ®· ph¸c th¶o ®−îc mét b−íc tranh s¬ bé vÒ tæ chøc hÖ gen
cña nhiÒu c¬ thÓ sinh vËt kh¸c nhau. VÝ dô nh−, viÖc ph©n tÝch
kiÓu h×nh nhiÔm s¾c thÓ cña nhiÒu loµi ®· cho biÕt sè l−îng
nhiÔm s¾c thÓ vµ kiÓu h×nh nhuém b¨ng cña chóng (xem H×nh
13.3). Vµ ®èi víi mét sè gen, vÞ trÝ cña chóng trªn nhiÔm s¾c
thÓ ®· ®−îc x¸c ®Þnh bëi ph−¬ng ph¸p lai huúnh quang t¹i chç
(FISH), ph−¬ng ph¸p mµ trong ®ã ng−êi ta ®em lai c¸c mÉu dß
ph¸t huúnh quang víi c¸c nhiÔm s¾c thÓ nguyªn vÑn ®−îc cè
®Þnh (xem H×nh 15.1). B¶n ®å di truyÒn tÕ bµo ®−îc x©y dùng
theo c¸ch nµy ®· cung cÊp nh÷ng th«ng tin khëi ®Çu cho viÖc
lËp b¶n ®å chi tiÕt h¬n sau nµy.
Khi ®· cã trong tay b¶n ®å di truyÒn tÕ bµo cña c¸c nhiÔm
s¾c thÓ, giai ®o¹n ®Çu tiªn cña tiÕn tr×nh gi¶i tr×nh tù hÖ gen
ng−êi lµ x©y dùng mét b¶n ®å liªn kÕt (mét lo¹i b¶n ®å di
truyÒn; xem Ch−¬ng 15) cña kho¶ng vµi ngh×n dÊu chuÈn di
truyÒn ®−îc ph©n bè kh¾p c¸c nhiÔm s¾c thÓ (Hinh 21.2 giai
®o¹n ). TrËt tù vÞ trÝ cña c¸c dÊu chuÈn vµ kho¶ng c¸ch gi÷a
chóng trªn b¶n ®å ®−îc x¸c ®Þnh trªn c¬ së tÇn sè t¸i tæ hîp
(xem H×nh 15.11). C¸c dÊu chuÈn di truyÒn cã thÓ lµ c¸c gen
hoÆc lµ c¸c ®o¹n tr×nh tù ADN kh¸c cã thÓ x¸c ®Þnh ®−îc,
ch¼ng h¹n nh− c¸c RFLP hay c¸c tr×nh tù lÆp l¹i kÕ tiÕp ng¾n
(STR) ®· ®−îc ®Ò cËp ë Ch−¬ng 20. TÝnh ®Õn n¨m 1992, c¸c
nhµ nghiªn cøu ®· tËp hîp ®−îc mét b¶n ®å liªn kÕt ë ng−êi
gåm kho¶ng 5000 dÊu chuÈn kh¸c nhau. Mét b¶n ®å nh− vËy
®· gióp hä x¸c ®Þnh ®−îc vÞ trÝ cña c¸c dÊu chuÈn kh¸c, bao
gåm c¶ c¸c gen, b»ng viÖc kiÓm tra tÝnh liªn kÕt di truyÒn cña
chóng víi c¸c dÊu chuÈn ®· biÕt tr−íc ®ã. Ngoµi ra, nã cßn cã
gi¸ trÞ lµ phÇn cèt lâi cña viÖc lËp b¶n ®å chi tiÕt h¬n t¹i nh÷ng
vïng nhÊt ®Þnh trong hÖ gen.
Giai ®o¹n tiÕp theo lµ viÖc lËp b¶n ®å vËt lý hÖ gen ng−êi.
Trong b¶n ®å vËt lý, kho¶ng c¸ch gi÷a c¸c dÊu chuÈn ®−îc
biÓu diÔn bëi ®¬n vÞ vËt lý, th−êng lµ sè cÆp baz¬ nit¬ (bp) däc
theo ph©n tö ADN. §Ó lËp mét b¶n ®å hÖ gen hoµn chØnh, mét
b¶n ®å vËt lý ®−îc thiÕt lËp b»ng c¸ch c¾t ph©n tö ADN t−¬ng
øng víi mét nhiÔm s¾c thÓ thµnh mét sè c¸c ph©n ®o¹n giíi h¹n
råi x¸c ®Þnh trËt tù cña c¸c ph©n ®o¹n trªn ph©n tö ADN nhiÔm
s¾c thÓ gèc. Ch×a khãa ®Ó thùc hiÖn ®iÒu nµy lµ cÇn t¹o ra c¸c
ph©n ®o¹n ADN gèi lªn nhau, råi sö dông c¸c mÉu dß hoÆc
ph−¬ng ph¸p gi¶i tr×nh tù tù ®éng c¸c tr×nh tù ®Çu cuèi cña
nh÷ng ph©n ®o¹n nµy ®Ó t×m ra c¸c tr×nh tù gèi lªn nhau ®ã
(H×nh 21.2, giai ®o¹n ). B»ng c¸ch ®ã, cã thÓ ®Æt c¸c ph©n
®o¹n vµo ®óng trËt tù t−¬ng øng cña chóng trªn nhiÔm s¾c thÓ.
Nguån cung cÊp c¸c ph©n ®o¹n ADN dïng cho viÖc lËp b¶n
®å vËt lý dùa trªn viÖc nh©n dßng ADN. §Ó gi¶i tr×nh tù c¸c hÖ
gen lín, c¸c nhµ khoa häc ph¶i thùc hiÖn lÆp l¹i nhiÒu lÇn c¸c
c«ng viÖc c¾t ADN, nh©n dßng vµ lËp b¶n ®å vËt lý. C¸c vect¬
nh©n dßng ®Çu tiªn th−êng ®−îc sö dông lµ nhiÔm s¾c thÓ nh©n
t¹o nÊm men (YAC) cho phÐp mang nh÷ng ®o¹n ADN cµi dµi
®Õn hµng triÖu bp, hoÆc nhiÔm s¾c thÓ nh©n t¹o vi khuÈn (BAC)
vèn ®iÓn h×nh cã thÓ mang c¸c ®o¹n cµi dµi tõ 100.000 ®Õn
300.000 bp. Sau khi nh÷ng ®o¹n ADN dµi nh− vËy ®· ®−îc x¸c
®Þnh trËt tù trªn nhiÔm s¾c thÓ chÝnh x¸c, chóng sÏ ®−îc c¾t
thµnh nh÷ng ph©n ®o¹n nhá h¬n, råi ®−îc nh©n dßng vµo c¸c
21.1
Kh¸i niÖm
C¸c ph−¬ng ph¸p míi ® gióp
gia t¨ng tèc ®é gi¶i tr×nh tù
c¸c hÖ gen
 H×nh 21.2 Ph−¬ng ph¸p gi¶i tr×nh tù toµn hÖ gen
qua ba giai ®o¹n. B¾t ®Çu tõ mét b¶n ®å di truyÒn tÕ bµo
cña mçi nhiÔm s¾c thÓ, c¸c nhµ nghiªn cøu liªn quan ®Õn Dù
¸n HÖ gen Ng−êi ®· tiÕn hµnh c¸c nghiªn cøu qua ba giai ®o¹n
®Ó ®¹t ®−îc môc tiªu cuèi cïng, ®ã lµ gi¶i tr×nh tù toµn bé tõng
nucleotide trªn mçi nhiÔm s¾c thÓ.
B¶n ®å di truyÒn tÕ bµo
KiÓu h×nh nhuém b¨ng cña
nhiÔm s¾c thÓ vµ vÞ trÝ c¸c gen
®Æc thï ®−îc x¸c ®Þnh b»ng
ph−¬ng ph¸p lai insitu (FISH) VÞ trÝ gen ®−îc x¸c
®Þnh b»ng FISH
C¸c b¨ng nhiÔm s¾c thÓ
sau khi ®−îc nhuém
B¶n ®å liªn kÕt
X¸c ®Þnh trËt tù cña c¸c
dÊu chuÈn di truyÒn
nh− RFLP, STR vµ c¸c
®a h×nh di truyÒn kh¸c
(kho¶ng 200 dÊu chuÈn
trªn mçi nhiÔm s¾c thÓ)
B¶n ®å vËt lý
X¸c ®Þnh trËt tù cña c¸c
ph©n ®o¹n lín gèi lªn
nhau ®−îc nh©n dßng
bëi c¸c vect¬ YAC vµ
BAC; sau ®ã lµ trËt tù
cña c¸c ®o¹n ng¾n h¬n
®−îc nh©n dßng bëi c¸c
vect¬ plasmid vµ phag¬
Gi¶i tr×nh tù ADN
X¸c ®Þnh tr×nh tù cña c¸c
nucleotide trªn mçi ®o¹n
ng¾n vµ ghÐp nèi c¸c tr×nh tù
thµnh phÇn víi nhau thµnh
tr×nh tù hÖ gen hoµn chØnh
C¸c dÊu chuÈn
di truyÒn
C¸c ®o¹n gèi
lªn nhau
428 khèi kiÕn thøc 3 Di truyÒn häc
vect¬ plasmid hoÆc phag¬, tr−íc khi nh÷ng ph©n ®o¹n nhá nµy
®−îc dïng ®Ó gi¶i tr×nh tù chi tiÕt.
Môc tiªu cuèi cïng cña viÖc lËp b¶n ®å mét hÖ gen lµ x¸c
®Þnh ®−îc tr×nh tù nucleotide hoµn chØnh cña mçi nhiÔm s¾c thÓ
(H×nh 21.2, giai ®o¹n ). §èi víi hÖ gen ng−êi, giai ®o¹n nµy
®−îc thùc hiÖn nhê c¸c m¸y gi¶i tr×nh tù sö dông ph−¬ng ph¸p
kÕt thóc chuçi dideoxy ®−îc m« t¶ trªn H×nh 20.12. Ngay c¶
khi ®· ®−îc tù ®éng hãa, viÖc gi¶i tr×nh tù cña toµn bé 3,2 tØ cÆp
baz¬ trong bé nhiÔm s¾c thÓ ®¬n béi cña ng−êi vÉn cßn lµ mét
th¸ch thøc khñng khiÕp. Trong thùc tÕ, mét ®ét ph¸ chÝnh cña
Dù ¸n HÖ gen Ng−êi lµ sù ph¸t triÓn cña c«ng nghÖ gi¶i tr×nh tù
nhanh. Nh÷ng c¶i tiÕn kü thuËt ®−îc tÝch lòy qua nhiÒu n¨m ®·
“mµi dòa” tõng b−íc cña qui tr×nh kü thuËt vèn tèn nhiÒu thêi
gian, vµ nhê vËy tèc ®é gi¶i tr×nh tù ®· ®−îc gia tèc mét c¸ch
Ên t−îng. NÕu nh− mét phßng thÝ nghiÖm hiÖu qu¶ cã thÓ gi¶i
tr×nh tù ®−îc 1000 bp mçi ngµy vµo nh÷ng n¨m 1980, th× ®Õn
n¨m 2000, mçi trung t©m nghiªn cøu thuéc Dù ¸n HÖ gen
Ng−êi cã thÓ gi¶i tr×nh tù 1000 bp mçi gi©y trong suèt 24 giê
mçi ngµy vµ 7 ngµy mçi tuÇn. C¸c ph−¬ng ph¸p nh− vËy cã thÓ
ph©n tÝch rÊt nhanh c¸c vËt liÖu sinh häc vµ t¹o ra c¸c khèi d÷
liÖu khæng lå trong thêi gian ng¾n vµ ®−îc gäi chung lµ c¸c
ph−¬ng ph¸p “hiÖu n¨ng cao”. C¸c m¸y gi¶i tr×nh tù tù ®éng lµ
mét vÝ dô vÒ c¸c thiÕt bÞ thÝ nghiÖm hiÖu n¨ng cao.
Trong thùc tiÔn, ba giai ®o¹n ®−îc m« t¶ trªn H×nh 21.2 gèi
lªn nhau theo mét c¸ch phøc t¹p h¬n m« h×nh gi¶n l−îc võa
®−îc chóng ta ®Ò cËp; tuy vËy, m« h×nh nµy ph¶n ¸nh ®óng
chiÕn l−îc nghiªn cøu tæng thÓ ®−îc dïng trong Dù ¸n HÖ gen
Ng−êi. Trong qu¸ tr×nh thùc hiÖn dù ¸n, mét chiÕn l−îc kh¸c
nh»m gi¶i tr×nh tù hÖ gen ®· xuÊt hiÖn vµ sau ®ã ®−îc ¸p dông
réng r·i nhê hiÖu qu¶ cùc kú cao cña nã. PhÇn tiÕp theo, chóng
ta ®Ò cËp ®Õn chiÕn l−îc gi¶i tr×nh tù nµy.
Gi¶i tr×nh tù ngÉu nhiªn toµn hÖ gen
N¨m 1992, m¹nh d¹n dùa trªn c¸c thµnh tùu míi cña kü thuËt
gi¶i tr×nh tù vµ c«ng nghÖ m¸y tÝnh, J. Craig Venter - mét nhµ
sinh häc ph©n tö - ®· ph¸t minh ra mét ph−¬ng ph¸p gi¶i tr×nh
tù toµn hÖ gen míi. §−îc ®Æt tªn lµ ph−¬ng ph¸p gi¶i tr×nh tù
ngÉu nhiªn toµn hÖ gen (hay ph−¬ng ph¸p shotgun), thùc chÊt
ph−¬ng ph¸p nµy ®· bá qua c¸c giai ®o¹n lËp b¶n ®å liªn kÕt vµ
b¶n ®å vËt lý; thay vµo ®ã, nã b¾t ®Çu ngay b»ng viÖc gi¶i tr×nh
tù c¸c ph©n ®o¹n ADN ngÉu nhiªn cña toµn hÖ gen. Sau ®ã, c¸c
ch−¬ng tr×nh m¸y tÝnh m¹nh sÏ tiÕn hµnh s¾p xÕp mét sè l−îng
lín c¸c ph©n ®o¹n ADN ®· ®−îc gi¶i tr×nh tù, dùa trªn c¸c ®o¹n
tr×nh tù ng¾n n»m gèi lªn nhau cña chóng, thµnh mét tr×nh tù
liªn tôc duy nhÊt (Hinh 21.3).
MÆc dï ban ®Çu bÞ hoµi nghi bëi nhiÒu nhµ khoa häc, gi¸ trÞ
cña ph−¬ng ph¸p Vender trë nªn râ rµng vµo n¨m 1995 khi «ng
vµ céng sù c«ng bè hÖ gen cña mét loµi sinh vËt ®−îc gi¶i tr×nh
tù hoµn chØnh ®Çu tiªn, ®ã lµ vi khuÈn g©y bÖnh tiªu ch¶y
Haemophilus influenza. N¨m 1998, Venter thµnh lËp mét c«ng
ty cã tªn lµ Celera Genomics vµ tuyªn bè dù ®Þnh gi¶i tr×nh tù
toµn bé hÖ gen ng−êi cña m×nh. N¨m n¨m sau, Cerela
Genomics vµ Tæ hîp HGP ®ång thêi th«ng b¸o viÖc gi¶i tr×nh
tù hÖ gen ng−êi ®· hoµn thµnh phÇn lín, nghÜa lµ sím h¬n hai
n¨m so víi tiÕn ®é dù kiÕn ban ®Çu cña Dù ¸n HÖ gen Ng−êi.
C¸c ®¹i diÖn cña Tæ hîp HGP chØ ra r»ng viÖc hoµn thµnh
gi¶i tr×nh tù hÖ gen ng−êi cña Celera ph¶i dùa nhiÒu vµo c¸c
b¶n ®å di truyÒn vµ sè liÖu tr×nh tù cña hä, còng nh− c¸c trang
thiÕt bÞ mµ hä thiÕt lËp cho dù ¸n ®· hç trî nhiÒu cho c¸c nç lùc
cña Celera. Ng−îc l¹i, Venter còng ®· dïng lý lÏ ®Ó biÖn hé
cho hiÖu qu¶ vµ gi¸ thµnh h¹ trong ph−¬ng ph¸p gi¶i tr×nh tù
cña Celera, ®ång thêi chØ ra r»ng Tæ hîp HGP còng ®· sö dông
c¸c sè liÖu cña hä. Râ rµng c¶ hai ph−¬ng ph¸p ®Òu cã gi¸ trÞ vµ
cïng ®ãng gãp vµo viÖc nhanh chãng hoµn thµnh viÖc gi¶i tr×nh
tù hÖ gen cña mét sè loµi.
HiÖn nay ph−¬ng ph¸p gi¶i tr×nh tù ngÉu nhiªn toµn hÖ gen
®ang ®−îc dïng réng r·i. Theo mét c¸ch ®iÓn h×nh, c¸c ph©n
®o¹n ADN ®−îc nh©n dßng b»ng ba lo¹i vect¬ kh¸c nhau, mçi
lo¹i ®−îc cµi mét ph©n ®o¹n x¸c ®Þnh. Kho¶ng c¸ch ®· biÕt
gi÷a c¸c ®Çu cña ph©n ®o¹n ADN cµi lµ mét th«ng tin bæ sung
gióp m¸y tÝnh cã thÓ s¾p xÕp ®óng c¸c tr×nh tù. Mét nghiªn cøu
gÇn ®©y so s¸nh hai chiÕn l−îc gi¶i tr×nh tù ®· chØ ra r»ng
ph−¬ng ph¸p shotgun cã thÓ m¾c lçi bá qua mét sè tr×nh tù lÆp
l¹i, v× vËy cã thÓ ph¶n ¸nh kh«ng chÝnh x¸c kÝnh th−íc thùc cña
hÖ gen vµ cã thÓ bá qua mét sè gen trong nh÷ng vïng nh− vËy
trªn nhiÔm s¾c thÓ. C¸c ph−¬ng ph¸p phèi hîp cuèi cïng ®·
®−îc ¸p dông cho hÖ gen ng−êi; trong ®ã ph−¬ng ph¸p shotgun
cã tèc ®é nhanh ®−îc hç trî bëi b¶n ®å di truyÒn cña c¸c dßng
gen cã lÏ lµ c¸ch h÷u hiÖu nhÊt cho nh÷ng øng dông l©u dµi.
§Õn n¨m 2007, vÉn cßn mét phÇn nhá cña hÖ gen ng−êi
ch−a ®−îc gi¶i tr×nh tù. Do sù cã mÆt cña tr×nh tù ADN lÆp l¹i
vµ bëi mét sè nguyªn nh©n ch−a biÕt kh¸c, mét sè phÇn nhÊt
C¾t ADN tõ nhiÒu
b¶n sao cña mét
nhiÔm s¾c thÓ thµnh
c¸c ph©n ®o¹n gèi
lªn nhau cã chiÒu
dµi ®ñ ng¾n ®Ó cã
thÓ gi¶i tr×nh tù.
Nh©n dßng mçi ph©n
®o¹n trong c¸c vect¬
plasmid hoÆc phag¬
(xem c¸c H×nh 20.4
vµ 20.5)
Gi¶i tr×nh tù tõng
ph©n ®o¹n (xem
H×nh 20.12)
Sö dông phÇn
mÒm m¸y tÝnh
s¾p xÕp c¸c
ph©n ®o¹n theo
®óng trËt tù vÞ trÝ
cña chóng
 H×nh 21.3 Gi¶i tr×nh tù ngÉu nhiªn toµn hÖ gen.
Theo ph−¬ng ph¸p nµy, ®−îc ph¸t triÓn bëi Craig Venter vµ c¸c ®ång nghiÖp
t¹i C«ng ty Celera Genomics do chÝnh «ng s¸ng lËp, c¸c ®o¹n ADN ®−îc gi¶i
tr×nh tù ngÉu nhiªn, råi sau ®ã chóng ®−îc s¾p xÕp theo ®óng trËt tù vÞ trÝ
t−¬ng ®èi víi nhau. H·y so s¸nh ph−¬ng ph¸p nµy víi ph−¬ng ph¸p gi¶i tr×nh
tù toµn hÖ gen qua ba giai ®o¹n ®−îc m« t¶ trªn H×nh 21.2.
C¸c ph©n ®o¹n ë giai ®o¹n 2 trªn h×nh nµy ®−îc vÏ n»m r¶i r¸c, trong
khi nh÷ng ph©n ®o¹n ë giai ®o¹n 2 trªn H×nh 21.2 ®−îc vÏ n»m theo
trËt tù vÞ trÝ. Sù kh¸c biÖt trong c¸ch vÏ nh− vËy ph¶n ¸nh sù kh¸c biÖt
gi÷a hai ph−¬ng ph¸p nh− thÕ nµo?.
Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 429
®Þnh trªn nhiÔm s¾c thÓ cña c¸c c¬ thÓ ®a bµo rÊt khã gi¶i tr×nh
tù chi tiÕt bëi c¸c ph−¬ng ph¸p th«ng th−êng.
Tho¹t nh×n th× d−êng nh− tr×nh tù hÖ gen cña ng−êi vµ c¸c
sinh vËt kh¸c ®¬n gi¶n chØ lµ nh÷ng tr×nh tù “kh« khèc” cña c¸c
nucleotide, nghÜa lµ hµng triÖu c¸c “ch÷ c¸i” A, T, G vµ C s¾p
xÕp kÕ tiÕp nhau mét c¸ch “buån ch¸n”. §iÒu cèt yÕu ®Ó l−îng
d÷ liÖu khæng lå nµy trë nªn cã nghÜa lµ c¸c ph−¬ng ph¸p ph©n
tÝch mµ chóng ta sÏ ®Ò cËp ®Õn ë tiÓu môc tiÕp theo.
Mçi mét trung t©m trong sè kho¶ng 20 trung t©m gi¶i tr×nh tù
tham gia dù ¸n HÖ gen Ng−êi ngµy nµy qua ngµy kh¸c ®· t¹o ra
mét l−îng khæng lå c¸c tr×nh tù ADN. Khi sè liÖu ngµy cµng
®−îc tÝch lòy, th× nhu cÇu n¶y sinh lµ ph¶i cã c¸ch qu¶n lý vµ
theo dâi tÊt c¶ c¸c tr×nh tù ®· ®−îc ph¸t hiÖn. Nhê ®· chuÈn bÞ
tõ tr−íc, c¸c nhµ khoa häc vµ c¸c c¬ quan qu¶n lý tham gia Dù
¸n HÖ gen Ng−êi ®· ®Æt ra mét môc tiªu ngay tõ ®Çu lµ thiÕt lËp
c¸c ng©n hµng d÷ liÖu, hay cßn gäi lµ c¬ së d÷ liÖu, vµ ngµy
cµng hoµn thiÖn c¸c phÇn mÒm ph©n tÝch d÷ liÖu. Nh÷ng c¬ së
d÷ liÖu vµ nh÷ng phÇn mÒm nµy sau ®ã ®−îc tËp hîp l¹i vµ cã
thÓ dÔ dµng truy cËp vµ sö dông trªn m«i tr−êng Internet. ViÖc
hoµn thµnh môc tiªu nµy cña dù ¸n ®· gãp phÇn thóc ®Èy viÖc
ph©n tÝch c¸c tr×nh tù ADN nhê t¹o ®iÒu kiÖn cho c¸c céng
®ång khoa häc toµn thÕ giíi cã thÓ tiÕp cËn c¸c tµi nguyªn tin
sinh häc, còng nh− thóc ®Èy viÖc truyÒn b¸ vµ trao ®æi c¸c
th«ng tin cã liªn quan.
TËp hîp d÷ liÖu ®Ó ph©n tÝch c¸c hÖ gen
C¸c c¬ quan ®−îc chÝnh phñ tµi trî thùc hiÖn vai trß thiÕt lËp
c¸c c¬ së d÷ liÖu vµ cung cÊp c¸c ph©n mÒm nhê ®ã c¸c nhµ
khoa häc cã thÓ ph©n tÝch c¸c d÷ liÖu tr×nh tù hÖ gen. Ch¼ng
h¹n, ë Mü, mét ch−¬ng tr×nh hîp t¸c gi÷a Th− viÖn Y häc Quèc
gia vµ ViÖn Y häc Quèc gia (NIH) ®· thiÕt lËp nªn Trung t©m
Quèc gia vÒ Th«ng tin C«ng nghÖ Sinh häc (NCBI) ®ång thêi
duy tr× mét trang Web (www.ncbi.nlm.nih.gov) l−u gi÷ c¸c tµi
nguyªn tin sinh häc hÕt søc phong phó. T¹i trang Web nµy, c¸c
®−êng “link” dÉn ®Õn c¸c c¬ së d÷ liÖu, c¸c phÇn mÒm vµ c¸c
kho chøa c¸c th«ng tin vÒ c¸c hÖ gen vµ c¸c chñ ®Ò cã liªn quan
kh¸c. C¸c trang Web t−¬ng tù còng ®· ®−îc thiÕt lËp bëi Phßng
thÝ nghiÖm Sinh häc ph©n tö Ch©u ¢u vµ Ng©n hµng D÷ liÖu
ADN NhËt B¶n; ®©y còng chÝnh lµ hai trung t©m nghiªn cøu hÖ
gen cïng hîp t¸c víi NCBI. Nh÷ng trang Web lín vµ toµn diÖn
nµy cßn ®−îc bæ sung thªm bëi nh÷ng trang Web kh¸c ®−îc
duy tr× bëi c¸c phßng thÝ nghiÖm nhá h¬n hoÆc bëi c¸c c¸ nh©n.
C¸c trang Web nhá h¬n th−êng cung cÊp c¸c c¬ së d÷ liÖu vµ
c¸c phÇn mÒm ®−îc thiÕt kÕ cho c¸c môc ®Ých nghiªn cøu hÑp
h¬n, ch¼ng h¹n nh− ®Ó t×m hiÓu vÒ nh÷ng thay ®æi di truyÒn
hoÆc trong hÖ gen liªn quan ®Õn mét bÖnh ung th− nhÊt ®Þnh.
C¸c c¬ së d÷ liÖu vÒ c¸c tr×nh tù cña NCBI ®−îc gäi chung
lµ Ng©n hµng gen (Genbank). TÝnh tíi th¸ng 8 n¨m 2007,
Genbank ®· chøa tr×nh tù cña 76 triÖu ph©n ®o¹n ADN hÖ gen
kh¸c nhau, gåm tæng céng 80 tû cÆp baz¬ ! C¸c tr×nh tù trong
ng©n hµng gen liªn tôc ®−îc cËp nhËt, vµ −íc tÝnh l−îng d÷ liÖu
cña nã cø sau kho¶ng 18 th¸ng l¹i t¨ng lªn gÊp ®«i. Mäi tr×nh
tù trong Genbank cã thÓ ®−îc truy xuÊt vµ ph©n tÝch b»ng c¸c
ph©n mÒm ë trang Web cña NCBI hoÆc tõ c¸c trang Web kh¸c.
Mét ch−¬ng tr×nh phÇn mÒm s½n cã trªn trang Web cña
NCBI, gäi lµ BLAST, cho phÐp bÊt cø ai truy cËp cã thÓ so s¸nh
®−îc mét tr×nh tù ADN nhÊt ®Þnh víi bÊt cø tr×nh tù nµo s½n cã
trong Genbank trªn c¬ së ®èi chiÕu tõng cÆp baz¬, qua ®ã t×m
thÊy c¸c vïng tr×nh tù gièng nhau gi÷a chóng. Mét phÇn mÒm
kh¸c cho phÐp so s¸nh c¸c tr×nh tù protein dù ®o¸n. Ngoµi ra,
mét phÇn mÒm thø ba cho phÐp t×m kiÕm mét chuçi axit amin
(miÒn) cã chøc n¨ng sinh häc ®· biÕt hoÆc ®ang ®−îc dù ®o¸n
tõ mäi tr×nh tù protein s½n cã trong Genbank; ®ång thêi, nã cã
thÓ biÓu diÔn m« h×nh kh«ng gian ba chiÒu cña miÒn chøc n¨ng
®ã cïng víi c¸c th«ng tin cã liªn quan phï hîp (xem H×nh 21.4
ë trang sau). ThËm chÝ cßn cã mét ch−¬ng tr×nh phÇn mÒm cã
thÓ so s¸nh mét tËp hîp c¸c tr×nh tù, hoÆc lµ c¸c tr×nh tù axit
nucleic hoÆc lµ c¸c tr×nh tù polypeptit, vµ biÓu diÔn chóng ë
d¹ng c©y tiÕn hãa trªn c¬ së mèi quan hÖ gi÷a c¸c tr×nh tù.
(Chóng ta sÏ ®Ò cËp kü h¬n vÒ nh÷ng s¬ ®å nµy ë Ch−¬ng 26).
Trang Web cña NCBI còng cßn duy tr× mét c¬ së d÷ liÖu
bao gåm tÊt c¶ c¸c cÊu tróc ba chiÒu cña protein ®· ®−îc x¸c
®Þnh (®Ó tæng quan vÒ ph©n tÝch cÊu tróc protein, xem H×nh
5.25). B»ng phÇn mÒm m¸y tÝnh, ng−êi xem cã thÓ quay nh÷ng
cÊu tróc nµy ®Ó cã thÓ quan s¸t protein tõ mäi phÝa. Gi¶ sö mét
nhµ nghiªn cøu cã mét tr×nh tù axit amin lµ tr×nh tù ®Çy ®ñ hoÆc
mét phÇn cña mét protein ch−a biÕt nµo ®ã, mµ nã l¹i cã tr×nh
tù gièng víi mét tr×nh tù axit amin cã cÊu tróc kh«ng gian ®·
biÕt. Trong tr−êng hîp nµy, nhµ nghiªn cøu cã thÓ dù ®o¸n cÊu
tróc cña protein ch−a biÕt b»ng mét phÇn mÒm, vµ sö dông mét
phÇn mÒm kh¸c ®Ó so s¸nh nã víi tÊt c¶ c¸c cÊu tróc protein ®·
biÕt. Nh÷ng th«ng tin nµy cã thÓ gióp nhµ nghiªn cøu x¸c ®Þnh
®−îc chøc n¨ng cña protein ch−a biÕt.
HiÖn nay, trªn toµn thÕ giíi cã rÊt nhiÒu nguån tµi nguyªn
s½n cã cho c¸c nhµ nghiªn cøu sö dông. B©y giê chóng ta sÏ nãi
®Õn c¸c chñ ®Ò mµ nh÷ng nguån tµi nguyªn nµy ®Ò cËp ®Õn.
X¸c ®Þnh c¸c gen m hãa protein trong
c¸c tr×nh tù ADN
B»ng viÖc sö dông c¸c tr×nh tù ADN s½n cã, c¸c nhµ di truyÒn
häc cã thÓ nghiªn cøu trùc tiÕp c¸c gen mµ kh«ng nhÊt thiÕt
ph¶i pháng ®o¸n vÒ kiÓu gen trªn c¬ së ph©n tÝch kiÓu h×nh nh−
trong c¸c nghiªn cøu di truyÒn häc kinh ®iÓn tr−íc ®©y. Tuy
vËy, c¸ch tiÕp cËn nµy l¹i cã mét trë ng¹i kh¸c: ®ã lµ viÖc x¸c
®Þnh kiÓu h×nh trªn c¬ së kiÓu gen ®· biÕt. Trªn c¬ së mét tr×nh
21.2
Kh¸i niÖm
C¸c nhµ khoa häc øng dông tin
sinh häc ®Ó ph©n tÝch c¸c hÖ
gen vµ chøc n¨ng cña chóng
21.1
1. B¶n ®å liªn kÕt vµ b¶n ®å vËt lý cña mét nhiÔm s¾c thÓ
kh¸c nhau c¬ b¶n ë ®Æc ®iÓm g× ?
2. XÐt tæng thÓ, ph−¬ng ph¸p lËp b¶n ®å hÖ gen ®−îc dïng
trong Dù ¸n HÖ gen Ng−êi vµ ph−¬ng ph¸p gi¶i tr×nh tù
ngÉu nhiªn toµn hÖ gen kh¸c nhau nh− thÕ nµo ?
3. Gi¶ sö b¹n quyÕt ®Þnh tiÕn hµnh gi¶i
tr×nh tù hÖ gen cña mét loµi chuét ®ång, vèn lµ mét
loµi cã quan hÖ gÇn gòi víi loµi chuét thÝ nghiÖm cã
tr×nh tù hÖ gen ®· ®−îc x¸c ®Þnh hoµn toµn. T¹i sao
tr×nh tù hÖ gen chuét thÝ nghiÖm ®· biÕt ®−a b¹n ®Õn
quyÕt ®Þnh chän ph−¬ng ph¸p gi¶i tr×nh tù ngÉu nhiªn
toµn hÖ gen thay cho ph−¬ng ph¸p ba giai ®o¹n ?
Xem gîi ý tr¶ lêi ë Phô lôc A.
KiÓm tra kh¸i niÖm
®iÒu g× NÕu
430 khèi kiÕn thøc 3 Di truyÒn häc
tù ADN dµi cã trªn c¬ së d÷ liÖu nh− Genbank, b»ng c¸ch nµo
chóng ta cã thÓ nhËn ra c¸c gen m· hãa protein vèn ch−a tõng
®−îc biÕt tíi vµ x¸c ®Þnh chøc n¨ng cña chóng?
C¸ch th«ng th−êng lµ sö dông mét phÇn mÒm ®Ó t×m kiÕm
trong nh÷ng tr×nh tù nµy sù cã mÆt hay kh«ng cña c¸c tÝn hiÖu
khëi ®Çu vµ kÕt thóc phiªn m· hoÆc dÞch m·, hoÆc lµ c¸c vÞ trÝ
c¾t - nèi ARN hay c¸c tÝn hiÖu kh¸c th−êng cã ë c¸c gen m·
hãa protein. PhÇn mÒm nµy ®ång thêi còng t×m kiÕm c¸c ®o¹n
tr×nh tù ng¾n t−¬ng øng víi c¸c tr×nh tù th−êng cã trªn c¸c ph©n
tö mARN ®· biÕt. Hµng ngh×n c¸c tr×nh tù nh− vËy, ®−îc gäi lµ
c¸c ®o¹n ®¸nh dÊu tr×nh tù biÓu hiÖn hay EST ®−îc thu thËp tõ
c¸c tr×nh tù cADN vµ ®−îc m¸y tÝnh tËp hîp l¹i thµnh c¸c c¬ së
d÷ liÖu. KiÓu ph©n tÝch nµy cho phÐp x¸c ®Þnh ®−îc c¸c tr×nh tù
t−¬ng øng víi c¸c gen m· hãa protein mµ tr−íc ®ã ch−a tõng
®−îc biÕt tíi.
Kho¶ng mét nöa sè gen ë ng−êi ®· ®−îc biÕt tõ tr−íc khi dù
¸n hÖ gen ng−êi b¾t ®Çu. VËy ®èi víi nh÷ng gen cßn l¹i, viÖc
ph©n tÝch c¸c tr×nh tù ADN b»ng c¸ch nµo cho biÕt chóng lµ c¸c
gen ch−a ®−îc biÕt tr−íc ®ã? Manh mèi ®Ó x¸c ®Þnh nh÷ng gen
nµy xuÊt ph¸t tõ viÖc so s¸nh tr×nh tù cña c¸c “gen øng cö viªn”
(c¸c tr×nh tù ®−îc dù ®o¸n lµ gen) víi tr×nh tù cña c¸c gen ®·
biÕt cã nguån gèc tõ c¸c sinh vËt kh¸c b»ng viÖc sö dông c¸c
phÇn mÒm ®· ®−îc nh¾c ®Õn ë trªn. Do tÝnh tho¸i hãa cña m·
di truyÒn, b¶n th©n tr×nh tù ADN cã thÓ cã møc ®é biÕn ®æi lín
h¬n so víi c¸c tr×nh tù protein t−¬ng øng. V× vËy, víi c¸c nhµ
khoa häc quan t©m ®Õn protein, hä th−êng tiÕn hµnh so s¸nh
gi÷a tr×nh tù axit amin cña protein pháng ®o¸n víi c¸c tr×nh tù
cña c¸c protein ®· biÕt.
§«i khi mét tr×nh tù võa míi ®−îc x¸c ®Þnh khíp hoµn toµn
hay mét phÇn víi tr×nh tù cña mét gen hoÆc mét protein mµ
chøc n¨ng ®· biÕt râ. VÝ dô nh−, mét phÇn cña mét gen míi cã
thÓ khíp víi mét gen ®· biÕt m· hãa cho mét protein kinase,
mét protein quan träng tham gia vµo mét con ®−êng truyÒn tÝn
hiÖu (xem Ch−¬ng 11), chØ ra nhiÒu kh¶ n¨ng gen míi nµy cã
thÓ cã chøc n¨ng t−¬ng tù. Theo mét c¸ch kh¸c, tr×nh tù cña
mét gen míi l¹i gièng víi mét tr×nh tù ®· tõng ®−îc biÕt tõ
tr−íc nh−ng ch−a râ chøc n¨ng. Mét kh¶ n¨ng kh¸c lµ tr×nh tù
míi ®−îc x¸c ®Þnh kh«ng gièng víi bÊt cø mét tr×nh tù nµo ®·
tõng ®−îc biÕt ®Õn. §iÒu nµy lµ ®óng ®èi víi Ýt nhÊt mét phÇn
ba c¸c gen cña E. coli khi hÖ gen cña vi khuÈn nµy ®−îc gi¶i
tr×nh tù. Trong tr−êng hîp cuèi cïng, chøc n¨ng cña protein
th−êng ®−îc suy diÔn b»ng viÖc kÕt hîp gi÷a c¸c nghiªn cøu vÒ
chøc n¨ng ph©n tö vµ hãa sinh häc. C¸c nghiªn cøu vÒ hãa sinh
nh»m x¸c ®Þnh cÊu tróc kh«ng gian ba chiÒu còng nh− c¸c
thuéc tÝnh hãa lý cña protein, ch¼ng h¹n nh− c¸c vÞ trÝ liªn kÕt
cña protein víi c¸c ph©n tö kh¸c. Trong khi ®ã, c¸c nghiªn cøu
vÒ chøc n¨ng ph©n tö th−êng tiÕn hµnh lµm bÊt ho¹t hoÆc lµm
gi¶m møc ®é biÓu hiÖn cña c¸c gen míi x¸c ®Þnh råi theo dâi
 H×nh 21.4 C¸c c«ng cô tin sinh
häc s½n cã trªn internet. Mét trang
web ®−îc Trung t©m Quèc gia Th«ng tin
vÒ C«ng nghÖ Sinh häc (Mü) duy tr× cho
phÐp c¸c nhµ khoa häc vµ céng ®ång tiÕp
cËn c¸c tr×nh tù protein vµ ADN. Trang
web nµy gåm c¶ kÕt nèi tíi mét c¬ së d÷
liÖu cÊu tróc protein - CDD (Conserved
Domain Database) gióp t×m vµ m« t¶
nh÷ng miÒn gièng nhau ë c¸c protein cã
quan hÖ víi nhau, còng nh− c¸c phÇn
mÒm quan s¸t ba chiÒu - Cn3D - cho phÐp
quan s¸t m« h×nh ba chiÒu cña c¸c miÒn
cÊu tróc ®· ®−îc x¸c ®Þnh. H×nh ¶nh
®−îc minh häa ë trªn lµ kÕt qu¶ t×m
kiÕm c¸c vïng protein gièng víi mét
tr×nh tù axit amin t×m thÊy ë mét protein
cña d−a hÊu.
Trong cöa sæ nµy, mét phÇn tr×nh tù axit amin tõ mét protein ch−a biÕt
(Query) ë d−a hÊu ®−îc xÕp th¼ng hµng víi c¸c tr×nh tù cña c¸c protein
kh¸c mµ ch−¬ng tr×nh m¸y tÝnh t×m thÊy gièng víi nã. C¸c tr×nh tù ë ®©y biÓu
diÔn mét miÒn ®−îc gäi lµ WD40. Bèn dÊu hiÖu ®iÓn h×nh cña miÒn nµy ®−îc
nhÊn m¹nh b»ng nÒn mµu vµng. (Sù gièng nhau gi÷a c¸c tr×nh tù ®−îc nhËn
biÕt chñ yÕu dùa trªn c¸c ®Æc ®iÓm hãa häc cña c¸c axit amin, v× vËy c¸c axit
amin ë c¸c vïng ®−îc nhÊn m¹nh kh«ng nhÊt thiÕt gièng nhau hoµn toµn.)
Ch−¬ng tr×nh Cn3D hiÓn thÞ
mét m« h×nh ruy b¨ng ba
chiÒu cña protein transductin
cña bß (protein ®−îc t« b»ng
nÒn mµu tÝm nh¹t trong cöa sæ
Sequence Aligment Viewer).
Protein nµy lµ lo¹i duy nhÊt
trong c¸c protein tr×nh diÖn ë
®©y cã cÊu tróc ®· ®−îc x¸c
®Þnh. Sù gièng víi transductin
bß cña c¸c protein kh¸c cho
thÊy cÊu tróc cña chóng cã thÓ
gièng víi m« h×nh ®−îc hiÓn
thÞ ë ®©y.
Transductin bß chøa b¶y miÒn
WD40; mét trong nh÷ng miÒn nµy
®−îc nhÊn m¹nh b»ng mµu ghi.
C¸c vïng ®−îc t« mµu vµng nµy
t−¬ng øng víi c¸c axit amin dÊu
hiÖu ®iÓn h×nh ®−îc t« mµu vµng ë
cöa sæ bªn trªn.
Cöa sæ nµy
hiÓn thÞ th«ng
tin vÒ miÒn
WD40 tõ C¬ së
d÷ liÖu cÊu tróc
protein – CDD.
Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 431
sù thay ®æi cña kiÓu h×nh, qua ®ã x¸c ®Þnh chøc n¨ng cña gen.
ARNi, ®−îc m« t¶ ë Ch−¬ng 20, lµ mét vÝ dô vÒ kü thuËt phßng
thÝ nghiÖm ®−îc dïng ®Ó bÊt ho¹t chøc n¨ng cña gen.
T×m hiÓu c¸c gen vµ c¸c s¶n phÈm cña
gen ë cÊp ®é sinh häc hÖ thèng
Søc m¹nh ®Çy Ên t−îng cña c¸c c«ng cô sinh tin häc vµ m¸y
tÝnh cho phÐp c¸c nhµ khoa häc giê ®©y cã thÓ nghiªn cøu toµn
bé c¸c gen thuéc c¸c bé nhiÔm s¾c thÓ vµ sù t−¬ng t¸c cña
chóng víi nhau, còng nh− cã thÓ so s¸nh hÖ gen tõ c¸c loµi
kh¸c nhau. HÖ gen häc lµ mét tµi nguyªn th«ng tin phong phó
vµ chuyªn s©u cã thÓ tr¶ lêi c¸c c©u hái c¬ b¶n vÒ c¸ch tæ chøc
cña c¸c hÖ gen, vÒ sù ®iÒu hßa sù biÓu hiÖn c¸c gen, vÒ c¸c qu¸
tr×nh sinh tr−ëng vµ ph¸t triÓn, kÓ c¶ tiÕn hãa.
Nh÷ng thµnh c«ng trong lÜnh vùc gi¶i tr×nh tù c¸c hÖ gen vµ
kh¶ n¨ng nghiªn cøu toµn bé c¸c gen thuéc c¸c bé nhiÔm s¾c
thÓ kh¸c nhau ®· thóc ®Èy c¸c nhµ khoa häc nç lùc nghiªn cøu
mét hÖ thèng t−¬ng tù c¸c bé protein ®Çy ®ñ (proteom) ®−îc
m· hãa t−¬ng øng bëi c¸c hÖ gen, tõ ®ã h×nh thµnh nªn mét
lÜnh vùc nghiªn cøu míi gäi lµ hÖ protein häc (proteomics).
C¸c protein, chø kh«ng ph¶i c¸c gen m· hãa chóng, trong thùc
tÕ thùc hiÖn phÇn lín c¸c ho¹t ®éng sèng cña tÕ bµo. V× vËy, ®Ó
t×m hiÓu sù biÓu hiÖn chøc n¨ng sinh häc cña c¸c tÕ bµo vµ c¬
thÓ, chóng ta ph¶i t×m hiÓu c¸c protein ®−îc t¹o ra khi nµo vµ ë
®©u trong mçi c¬ thÓ, còng nh− viÖc chóng t−¬ng t¸c víi nhau
thÕ nµo trong c¸c m¹ng l−íi t−¬ng t¸c ph©n tö.
C¸c hÖ thèng ®−îc t×m hiÓu thÕ nµo: mét vÝ dô
C¸c lÜnh vùc hÖ gen häc vµ hÖ protein häc cho phÐp c¸c nhµ
sinh häc tiÕn hµnh c¸c nghiªn cøu vÒ sù sèng ë qui m« ngµy
cµng réng lín vµ theo xu h−íng toµn cÇu. B»ng viÖc sö dông
c¸c c«ng cô mµ chóng ta ®· m« t¶, c¸c nhµ sinh häc ®· b¾t ®Çu
tËp hîp c¸c d÷ liÖu vÒ c¸c gen vµ c¸c protein, tøc lµ liÖt kª tÊt
c¶ c¸c “cÊu phÇn” tham gia vµo viÖc ®iÒu hµnh c¸c ho¹t ®éng
cña tÕ bµo, m« vµ c¬ thÓ. Víi tËp hîp c¸c d÷ liÖu nh− vËy, c¸c
nhµ nghiªn cøu cã thÓ chuyÓn mèi quan t©m cña hä tõ mçi cÊu
phÇn ®¬n lÎ sang sù biÓu hiÖn chøc n¨ng ë d¹ng tæ hîp gåm
nhiÒu cÊu phÇn ë c¸c cÊp ®é cña hÖ thèng sinh häc. Nhí l¹i ë
Ch−¬ng 1, chóng ta ®· ®Ò cËp ®Õn “sinh häc hÖ thèng” lµ lÜnh
vùc m« h×nh hãa c¸c biÓu hiÖn ho¹t ®éng n¨ng ®éng cña c¸c hÖ
thèng sinh häc toµn bé.
Mét øng dông c¬ b¶n cña h−íng nghiªn cøu sinh häc hÖ
thèng lµ x¸c ®Þnh ®−îc c¸c m¹ch nèi tiÕp gi÷a c¸c gen vµ c¸c
m¹ng l−íi t−¬ng t¸c cña c¸c protein. Ch¼ng h¹n nh−, ®Ó x©y
dùng ®−îc s¬ ®å m¹ng l−íi t−¬ng t¸c gi÷a c¸c protein ë ruåi
Drosophila nh− ®−îc nªu ë Ch−¬ng 1, c¸c nhµ nghiªn cøu ®·
b¾t ®Çu tõ trªn 10.000 b¶n phiªn m· ARN dù ®o¸n. Sau ®ã,
b»ng c¸c ph−¬ng ph¸p ph©n tö, hä ®· kiÓm tra sù t−¬ng t¸c gi÷a
toµn bé hoÆc mét phÇn c¸c s¶n phÈm protein thu ®−îc c¸c b¶n
phiªn m· nµy. B»ng viÖc sö dông c¸c phÐp ph©n tÝch thèng kª
®Ó chän ra c¸c mèi t−¬ng t¸c cã sè liÖu thuyÕt phôc nhÊt, hä ®·
t×m ra kho¶ng 4700 lo¹i protein biÓu hiÖn tham gia vµo 4000
mèi t−¬ng t¸c kh¸c nhau. Mét phÇn trong nh÷ng mèi t−¬ng t¸c
nµy ®−îc minh häa ë d¹ng s¬ ®å trªn H×nh 21.5; chi tiÕt cã thÓ
®−îc nh×n dÔ h¬n ë hai h×nh phãng to bªn d−íi. §Ó cã thÓ xö lý
mét sè lín c¸c d÷ liÖu thu ®−îc vÒ c¸c mèi t−¬ng t¸c protein -
protein phøc t¹p thu ®−îc tõ c¸c thÝ nghiÖm nµy, ®ång thêi cã
thÓ tæ hîp chóng víi nhau d−íi d¹ng c¸c s¬ ®å m« h×nh, chóng
ta cÇn ®Õn c¸c hÖ thèng m¸y tÝnh hiÖu n¨ng cao, c¸c c«ng cô
to¸n häc vµ c¸c phÇn mÒm ®−îc ph¸t triÓn míi. Nh− vËy, cã
thÓ nãi sinh häc hÖ thèng trong thùc tÕ ®· trë thµnh hiÖn thùc
nhê c¸c tiÕn bé cña tin sinh häc.
øng dông sinh häc hÖ thèng trong y häc
Dù ¸n Atl¸t HÖ gen Ung th− lµ mét vÝ dô kh¸c vÒ sinh häc hÖ
thèng mµ ë ®ã ng−êi ta ®ång thêi tiÕn hµnh ph©n tÝch mét sè
lín c¸c gen vµ s¶n phÈm cña gen t−¬ng t¸c víi nhau. Dù ¸n nµy
®Æt d−íi sù chØ ®¹o phèi hîp cña ViÖn Ung th− Quèc gia
(Mü)vµ NIH nh»m t×m hiÓu nh÷ng thay ®æi trong c¸c hÖ thèng
sinh häc dÉn ®Õn sù ph¸t sinh ung th−. Trong giai ®o¹n 3 n¨m
thö nghiÖm dù ¸n (tõ 2007 ®Õn 2010), c¸c nhµ nghiªn cøu tËp
trung ph©n tÝch ba lo¹i ung th− lµ ung th− phæi, ung th− buång
trøng vµ u nguyªn bµo ®Öm (glioblastoma) th«ng qua viÖc t×m
hiÓu sù kh¸c nhau trong tr×nh tù cña c¸c gen vµ sù biÓu hiÖn
cña chóng ë c¸c tÕ bµo ung th− so víi c¸c tÕ bµo b×nh th−êng.
Mét tËp hîp gåm kho¶ng 2000 gen ë c¸c tÕ bµo ung th− sÏ
®−îc gi¶i tr×nh tù vµo c¸c thêi ®iÓm kh¸c nhau trong qu¸ tr×nh
tiÕn triÓn cña bÖnh nh»m t×m ra nh÷ng thay ®æi hoÆc g©y ra do
®ét biÕn hoÆc g©y ra bëi c¸c c¬ chÕ s¾p xÕp l¹i nhiÔm s¾c thÓ
kh¸c. NÕu nh÷ng nghiªn cøu nµy thµnh c«ng, chóng sÏ ®−îc
më réng ¸p dông ®Ó nghiªn cøu c¸c lo¹i bÖnh ung th− kh¸c.
 H×nh 21.5 Sinh häc hÖ thèng tiÕp cËn c¸c t−¬ng t¸c
protein. B¶n ®å t−¬ng t¸c protein tæng thÓ nµy hiÓn thÞ mét tËp
hîp con cña c¸c t−¬ng t¸c nhiÒu kh¶ n¨ng nhÊt (®−êng kÎ nèi)
tõ 2300 protein (vßng trßn nhá) ë ruåi Drosophila. Ba mµu nÒn
kh¸c nhau trªn b¶n ®å t−¬ng øng víi vÞ trÝ chung cña mçi
protein: mµu xanh lôc lµ nh©n, xanh lam lµ tÕ bµo chÊt vµ vµng
lµ mµng sinh chÊt. C¸c protein ®−îc “m· hãa” b»ng mµu t−¬ng
øng víi vÞ trÝ ®Þnh vÞ trong tÕ bµo ®Æc thï cña chóng; vÝ dô, c¸c
vßng trßn mµu xanh lôc lµ c¸c protein trong nh©n.
C¸c protein
432 khèi kiÕn thøc 3 Di truyÒn häc
Sinh häc hÖ thèng cã tiÒm n¨ng øng dông to lín trong y häc,
mÆc dï hiÖn nay nã míi b¾t ®Çu ®−îc triÓn khai. §Õn nay,
ng−êi ta ®· t¹o ra ®−îc c¸c lo¹i chip vi d·y (microarray) lµm
b»ng thñy tinh hoÆc silicon chøa phÇn lín c¸c gen ®· biÕt cña
ng−êi (H×nh 21.6). Nh÷ng chip nh− vËy ®ang ®−îc sö dông ®Ó
ph©n tÝch sù biÓu hiÖn cña c¸c gen ë nh÷ng bÖnh nh©n m¾c c¸c
chøng bÖnh ung th− kh¸c nhau vµ mét sè bÖnh lý kh¸c n÷a.
Môc ®Ých cuèi cïng cña nh÷ng nghiªn cøu nµy lµ ®Ò ra c¸c
ph¸c ®å ®iÒu trÞ phï hîp ®Æc thï víi b¶n chÊt di truyÒn cña mçi
bÖnh nh©n vµ ®Æc tr−ng ®èi víi mçi lo¹i bÖnh ung th− mµ hä
m¾c ph¶i. C¸ch tiÕp cËn nµy ®· ®¹t ®−îc mét sè thµnh c«ng
nhÊt ®Þnh trong viÖc x¸c ®Þnh ®−îc ®Æc tÝnh ë mét sè nhãm
bÖnh ung th−.
Cuèi cïng, mçi ng−êi chóng ta cã thÓ cã mét “hå s¬ y häc”
cïng víi c¸c tr×nh tù ADN cña m×nh; ®ã lµ mét tËp hîp nhá
th«ng tin di truyÒn víi c¸c vïng hÖ gen ®−îc “®¸nh dÊu” cho
biÕt xu h−íng mÉn c¶m víi nh÷ng bÖnh nhÊt ®Þnh. Lóc nµy,
tiÒm n¨ng øng dông trong phßng tr¸nh vµ ®iÒu trÞ bÖnh ®èi víi
mçi ng−êi sÏ thµnh hiÖn thùc.
Sinh häc hÖ thèng lµ mét c¸ch tiÕp cËn nghiªn cøu hiÖu qu¶
vÒ c¸c thuéc tÝnh ë cÊp ®é ph©n tö. Tõ Ch−¬ng 1 chóng ta nhí
l¹i r»ng, c¸c thuéc tÝnh míi ®−îc t×m thÊy ë cÊp ®é tæ chøc
phøc t¹p h¬n th−êng b¾t nguån tõ sù s¾p xÕp c¸c “khèi cÊu
tróc” cña cÊp ®é tæ chøc thÊp h¬n. Khi chóng ta hiÓu biÕt ngµy
cµng ®Çy ®ñ h¬n vÒ c¸ch s¾p xÕp vµ tæ hîp cña c¸c cÊu phÇn
thuéc c¸c hÖ thèng di truyÒn, chóng ta cµng hiÓu biÕt s©u h¬n
vÒ ho¹t ®éng cña c¸c c¬ thÓ sèng. PhÇn cßn l¹i cña ch−¬ng nµy
sÏ ®Ò cËp ®Õn nh÷ng kiÕn thøc mµ chóng ta ®· häc ®−îc ®Õn
nµy nhê c¸c nghiªn cøu thuéc lÜnh vùc hÖ gen häc.
TÝnh ®Õn ®Çu n¨m 2008, viÖc gi¶i tr×nh tù cña trªn 700 hÖ gen
®· hoµn thµnh vµ kho¶ng trªn 2700 hÖ gen kh¸c ®ang tiÕp tôc
®−îc gi¶i tr×nh tù. Trong nhãm c¸c hÖ gen ®· ®−îc gi¶i tr×nh tù
hoµn toµn, cã kho¶ng 600 hÖ gen vi khuÈn vµ 50 hÖ gen vi
khuÈn cæ. Trong sè 65 loµi sinh vËt nh©n thËt thuéc nhãm nµy
cã c¸c loµi ®éng vËt cã x−¬ng sèng, c¸c loµi ®éng vËt kh«ng
x−¬ng sèng, c¸c nguyªn sinh ®éng vËt, nÊm vµ thùc vËt. C¸c
tr×nh tù hÖ gen ®· ®−îc tÝch lòy chøa ®ùng mét tµi nguyªn
th«ng tin phong phó mµ hiÖn nay chóng ta míi b¾t ®Çu khai
th¸c. Cho ®Õn nay chóng ta ®· häc ®−îc g× tõ viÖc so s¸nh c¸c
hÖ gen ®· ®−îc gi¶i tr×nh tù? Trong môc nµy, chóng ta sÏ xem
xÐt c¸c ®Æc tÝnh vÒ kÝch cì hÖ gen, sè gen vµ mËt ®é gen cña
chóng. Do xÐt vÒ chi tiÕt, c¸c ®Æc tÝnh nµy rÊt ®a d¹ng, nªn
chóng ta chØ nhÊn m¹nh vµo c¸c xu h−íng chung; tuy vËy, bªn
c¹nh c¸c xu h−íng chung th× th−êng xuÊt hiÖn c¸c ngo¹i lÖ.
KÝch cì hÖ gen
Khi so s¸nh hÖ gen gi÷a ba liªn giíi (vi khuÈn, vi khuÈn cæ vµ
sinh vËt nh©n thËt), chóng ta nhËn thÊy mét xu h−íng kh¸c biÖt
chung vÒ kÝch cì hÖ gen gi÷a c¸c sinh vËt nh©n s¬ (vi khuÈn vµ
vi khuÈn cæ) víi sinh vËt nh©n thËt (B¶ng 21.1). Ngoµi mét sè
ngo¹i lÖ, phÇn lín hÖ gen vi khuÈn cã kÝch cì tõ 1 ®Õn 6 triÖu
cÆp baz¬ (bp); ch¼ng h¹n nh− hÖ gen cña E. coli lµ 4,6 triÖu bp.
HÖ gen cña c¸c vi khuÈn cæ trong phÇn lín tr−êng hîp cã kÝch
cì gièng víi hÖ gen vi khuÈn. (Tuy vËy, cÇn ph¶i nhí r»ng míi
chØ cã mét sè Ýt hÖ gen vi khuÈn cæ ®· ®−îc gi¶i tr×nh tù hoµn
toµn, v× vËy “bøc tranh toµn c¶nh” nµy còng cã thÓ sÏ thay ®æi.)
C¸c hÖ gen sinh vËt nh©n thËt cã xu h−íng lín h¬n. HÖ gen cña
nÊm men ®¬n bµo Saccharomyces cerevisiae lµ kho¶ng 13 Mb
(triÖu cÆp baz¬); trong khi ®ã, phÇn lín c¸c loµi ®éng vËt vµ
thùc vËt, tøc lµ c¸c sinh vËt ®a bµo, cã kÝch cì hÖ gen Ýt nhÊt lµ
100 Mb. HÖ gen ruåi giÊm cã kÝch cì lµ 180 Mb, cßn hÖ gen
ng−êi lµ 3.200 Mb, nghÜa lµ lín h¬n tõ 500 ®Õn 3000 lÇn so víi
mét hÖ gen vi khuÈn ®iÓn h×nh.
Bªn c¹nh sù kh¸c biÖt chung gi÷a hÖ gen cña c¸c sinh vËt
nh©n s¬ vµ sinh vËt nh©n thËt, th× viÖc so s¸nh kÝch cì hÖ gen
trong ph¹m vi c¸c loµi sinh vËt nh©n thËt l¹i kh«ng ph¶n ¸nh
mèi t−¬ng quan cã hÖ thèng gi÷a kÝch cì hÖ gen víi kiÓu h×nh
cña c¸c loµi sinh vËt. Ch¼ng h¹n nh−, hÖ gen cña loµi Fritillaria
assyriaca, mét loµi hoa thuéc hä lily, cã kÝch cì lµ 120 tØ cÆp
baz¬ (120.000 Mb), tøc lµ lín h¬n kho¶ng 40 lÇn so víi hÖ gen
ng−êi. Nh−ng cßn kinh ng¹c h¬n lµ hÖ gen mét loµi amip ®¬n
bµo, Amoeba dubia, cã kÝch cì kho¶ng 670.000 Mb. (HÖ gen
loµi nµy ch−a ®−îc gi¶i tr×nh tù.) Trong ph¹m vi hÑp h¬n, viÖc
so s¸nh hÖ gen gi÷a hai loµi c«n trïng cho thÊy hÖ gen cña dÕ
(Anabrus simplex) lín h¬n 11 lÇn so víi hÖ gen cña ruåi giÊm
(Drosophila melanogaster). KÝch cì hÖ gen còng biÕn ®éng
réng trong ph¹m vi mçi nhãm loµi nguyªn sinh ®éng vËt, c«n
trïng, l−ìng c− vµ thùc vËt; nh−ng Ýt biÕn ®éng h¬n trong ph¹m
vi c¸c loµi thó vµ bß s¸t.
Sè gen
Mét xu h−íng kh¸c biÖt t−¬ng tù còng ®óng khi xÐt vÒ sè gen:
nghÜa lµ, nh×n chung c¸c vi khuÈn vµ vi khuÈn cæ cã Ýt gen h¬n
so víi sinh vËt nh©n thËt. C¸c vi khuÈn vµ vi khuÈn cæ sèng tù
21.3
Kh¸i niÖm
C¸c hÖ gen kh¸c nhau vÒ kÝch
cì, sè gen vµ mËt ®é gen
 H×nh 21.6 Mét chip
ph©n tÝch gen ng−êi. C¸c
®iÓm nhá chøa ADN ®−îc xÕp thµnh
c¸c ®−êng kÎ « trªn b¶n silicon nµy
®¹i diÖn cho hÇu hÕt c¸c gen trong hÖ
gen ng−êi. Nhê sö dông chip nµy, c¸c
nhµ nghiªn cøu cã thÓ ph©n tÝch cïng
lóc møc biÓu hiÖn cña tÊt c¶ c¸c gen,
qua ®ã gióp gi¶m l−îng hãa chÊt cÇn
dïng tèi ®a ®ång thêi ®¶m b¶o ®iÒu
kiÖn ®ång ®Òu cho tÊt c¶ c¸c gen.
21.2
1. Internet cã vai trß nh− thÕ nµo trong c¸c nghiªn cøu hiÖn
nay vÒ c¸c hÖ gen häc vµ protein häc ?
2. H·y gi¶i thÝch −u thÕ cña c¸c nghiªn cøu theo h−íng sinh
häc hÖ thèng khi t×m hiÓu vÒ ung th− so víi ph−¬ng ph¸p
nghiªn cøu ®éc lËp tõng gen vµo mçi thêi ®iÓm.
3. Gi¶ sö b¹n ®ang dïng mét ph−¬ng
ph¸p nghiªn cøu di truyÒn kinh ®iÓn ®Ó t×m hiÓu mét
tÝnh tr¹ng di truyÒn ë ruåi Drosophila. Cô thÓ, b¹n ®·
g©y ®ét biÕn ë ruåi vµ chän läc ra ®−îc c¸c c¸ thÓ cã
kiÓu h×nh mµ b¹n quan t©m. Gi¶ thiÕt b¹n còng cã thÓ
sö dông c¸c c«ng cô sinh häc ph©n tö ®Ó thu ®−îc vïng
ADN mang ®ét biÕn. B¹n sÏ tiÕp tôc ph©n tÝch ®ét biÕn
®ã nh− thÕ nµo ®Ó cã thÓ x¸c ®Þnh ®−îc c¸ch mµ nã
liªn quan ®Õn kiÓu h×nh ®−îc quan t©m ?
Xem gîi ý tr¶ lêi ë Phô lôc A.
KiÓm tra kh¸i niÖm
®iÒu g× NÕu
Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 433
do cã tõ 1500 ®Õn 7500 gen, trong khi sè gen ë c¸c sinh vËt
nh©n thËt dao ®éng tõ kho¶ng 5000 gen ë c¸c nÊm ®¬n bµo cho
®Õn Ýt nhÊt 40.000 gen ë mét sè loµi sinh vËt nh©n thËt ®a bµo
(xem B¶ng 21.1).
Trong ph¹m vi c¸c loµi sinh vËt nh©n thËt, sè gen ë mçi loµi
th−êng thÊp h¬n sè gen ®−îc dù ®o¸n ®¬n thuÇn trªn c¬ së kÝch
cì hÖ gen cña chóng. Nh×n vµo B¶ng 21.1, b¹n cã thÓ thÊy hÖ
gen giun trßn C. elegans cã kÝch cì lµ 100 Mb vµ chøa kho¶ng
20.000 gen. Trong khi ®ã, hÖ gen Drosophila cã kÝch c¬ gÇn
gÊp ®«i (180 Mb), song chØ cã sè gen b»ng kho¶ng hai phÇn ba
- tøc lµ, chØ cã 13.700 gen.
H·y xem mét vÝ dô kh¸c gÇn gòi h¬n, chóng ta ®Ó ý thÊy hÖ
gen ng−êi chøa 3200 Mb, tøc lµ lín h¬n kho¶ng trªn 10 lÇn so
víi c¸c hÖ gen Drosophila vµ C. elegans. Khi Dù ¸n HÖ gen
Ng−êi khëi ®éng, trªn c¬ së sè protein ®· biÕt, c¸c nhµ sinh häc
mong ®îi sÏ cã kho¶ng tõ 50.000 ®Õn 100.000 gen sÏ ®−îc x¸c
®Þnh sau khi hoµn thµnh viÖc gi¶i tr×nh tù hÖ gen. Däc theo tiÕn
tr×nh triÓn khai dù ¸n, sè gen −íc l−îng cã trong hÖ gen ng−êi
®−îc söa ®æi nhiÒu lÇn theo xu h−íng gi¶m dÇn; vµ ®Õn n¨m
2007, sè gen −íc l−îng ®−îc tin cËy h¬n c¶ dõng ë con sè
20.488 gen. Sè l−îng gen t−¬ng ®èi thÊp nµy, chØ gÇn gièng sè
gen cã ë loµi giun trßn C. elegans, ®· g©y söng sèt nhiÒu nhµ
sinh häc vèn ®· lu«n mong ®îi hÖ gen ng−êi cã nhiÒu gen h¬n.
Thuéc tÝnh di truyÒn nµo ®· cho phÐp loµi ng−êi (vµ nhiÒu
loµi ®éng vËt cã x−¬ng sèng kh¸c) tiÕn hãa mµ kh«ng cÇn
nhiÒu gen h¬n so víi giun trßn? Mét yÕu tè quan träng ®ã lµ
c¸c tr×nh tù m· hãa trong c¸c hÖ gen ®éng vËt cã x−¬ng sèng cã
®Æc ®iÓm “mét vèn bèn lêi” do chóng cã nhiÒu c¸ch c¾t - nèi
c¸c b¶n phiªn m· kh¸c nhau. Chóng ta nhí l¹i r»ng qu¸ tr×nh
nµy cã thÓ t¹o ra nhiÒu h¬n mét lo¹i protein biÓu hiÖn chøc
n¨ng xuÊt ph¸t tõ mét gen duy nhÊt (xem H×nh 18.11). VÝ dô
nh−, hÇu hÕt c¸c gen ë ng−êi ®Òu chøa nhiÒu exon, vµ −íc
l−îng cã kho¶ng 75% sè gen gåm nhiÒu exon nµy ®−îc c¾t -
nèi Ýt nhÊt b»ng hai c¸ch kh¸c nhau. NÕu chóng ta gi¶ thiÕt mçi
gen khi ®−îc c¾t nèi theo c¸c c¸ch kh¸c nhau trung b×nh x¸c
®Þnh 3 chuçi polypeptit kh¸c nhau, th× tæng sè chuçi polypeptit
kh¸c nhau ë ng−êi sÏ ®¹t con sè kho¶ng 75.000. Sù ®a d¹ng cña
c¸c chuçi polypeptit thùc tÕ cßn bæ sung thªm bëi c¸c biÕn ®æi
sau dÞch m·, ch¼ng h¹n bëi sù c¾t tØa c¸c axit amin hay g¾n
thªm c¸c gèc cacbohydrat diÔn ra kh¸c nhau ë c¸c tÕ bµo kh¸c
nhau hoÆc ë c¸c giai ®o¹n kh¸c nhau cña qu¸ tr×nh ph¸t triÓn.
MËt ®é gen vµ c¸c tr×nh tù ADN kh«ng
m· hãa
Bªn c¹nh kÝch cì hÖ gen vµ sè gen, chóng ta còng cã thÓ so
s¸nh mËt ®é gen ë nh÷ng loµi kh¸c nhau, nghÜa lµ cã bao nhiªu
gen trªn mét ®¬n vÞ chiÒu dµi cña ADN. Khi chóng ta so s¸nh
hÖ gen gi÷a c¸c loµi vi khuÈn, vi khuÈn cæ vµ sinh vËt nh©n thËt,
chóng ta thÊy sinh vËt nh©n thËt th−êng cã hÖ gen lín h¬n
nh−ng l¹i cã sè gen Ýt h¬n trªn cïng mét sè nhÊt ®Þnh c¸c cÆp
baz¬. Ng−êi cã kÝch cì hÖ gen lín h¬n hµng tr¨m thËm chÝ
hµng ngh×n lÇn so víi hÖ gen cña phÇn lín c¸c loµi vi khuÈn,
nh−ng nh− chóng ta ®· nãi, ng−êi chØ cã sè gen gÊp tõ 5 ®Õn 15
lÇn so víi nh÷ng loµi nµy; nh− vËy, mËt ®é gen ë ng−êi lµ thÊp
h¬n (xem B¶ng 21.1). Ngay c¶ c¸c loµi sinh vËt nh©n thËt ®¬n
bµo, nh− nÊm men, còng cã Ýt gen h¬n trong mçi mét triÖu cÆp
baz¬ so víi c¸c loµi vi khuÈn vµ vi khuÈn cæ. Trong sè c¸c hÖ
gen ®· ®−îc gi¶i tr×nh tù hoµn toµn ®Õn nay, ng−êi vµ c¸c loµi
thó cã mËt ®é gen thÊp nhÊt.
Trong tÊt c¶ c¸c hÖ gen vi khuÈn ®·
®−îc nghiªn cøu ®Õn nay, phÇn lín ADN
chøa c¸c gen m· hãa cho protein, tARN
hoÆc rARN; mét l−îng nhá cña c¸c tr×nh
tù ADN cßn l¹i gåm chñ yÕu lµ c¸c tr×nh
tù ®iÒu hßa kh«ng ®−îc phiªn m·, ch¼ng
h¹n nh− c¸c tr×nh tù khëi ®Çu phiªn m·
(promoter). Tr×nh tù c¸c nucleotit däc theo
mét gen m· hãa protein ë vi khuÈn th−êng
kh«ng bÞ ng¾t qu·ng tõ vÞ trÝ b¾t ®Çu cho
®Õn vÞ trÝ kÕt thóc bëi c¸c tr×nh tù kh«ng
m· hãa (intron). Ng−îc l¹i, ë c¸c hÖ gen
sinh vËt nh©n thËt, phÇn lín ADN hoÆc
kh«ng ®−îc dïng ®Ó m· hãa cho protein
hoÆc kh«ng ®−îc phiªn m· thµnh c¸c ph©n
tö ARN biÓu hiÖn chøc n¨ng (nh− tARN
ch¼ng h¹n), ®ång thêi ADN chøa nhiÒu
tr×nh tù ®iÒu hßa phøc t¹p. Trong thùc tÕ,
hÖ gen ng−êi chøa ADN kh«ng m· hãa
nhiÒu h¬n kho¶ng 10.000 lÇn so víi hÖ
gen vi khuÈn. Mét sè tr×nh tù ADN kh«ng
m· hãa nµy ë sinh vËt nh©n thËt ®a bµo
xuÊt hiÖn trong c¸c intron cña c¸c gen.
Thùc tiÔn cho thÊy c¸c intron lµ nh©n tè
chÝnh dÉn ®Õn phÇn lín c¸c kh¸c biÖt vÒ
chiÒu dµi trung b×nh gi÷a c¸c gen cña
ng−êi (27.000 bp) so víi c¸c gen cña vi
khuÈn (1000 bp).
B¶ng 21.1 KÝch cì hÖ gen vµ sè gen −íc tÝnh*
Loµi
KÝch cì hÖ
gen ®¬n
béi (Mb)
Sè
gen
Sè gen /
Mb
Vi khuÈn
Haemophilus influenzae 1,8 1700 940
Escherichia coli 4,6 4400 950
Vi khuÈn cæ
Archaeoglobus fulgidus 2,2 2500 1130
Methanosarcina barkeri 4,8 3600 750
Sinh vËt nh©n thËt
Saccharomyces cerevisiae (nÊm men) 13 6200 480
Caenorhabditis elegans (giun trßn) 100 20.000 200
Arabidopsis thaliana (c©y thuéc hä mï t¹t) 118 25.500 215
Drosophila melanogaster (ruåi giÊm) 180 13.700 76
Oryza sativa (lóa g¹o) 390 40.000 140
Danio rerio (c¸ ngùa) 1700 23.000 13
Mus musculus (chuét nhµ) 2600 22.000 11
Homo sapiens (ng−êi) 3200 20.500 7
Fritillaria assyriaca (c©y thuéc hä lily) 120.000 ND ND
* Mét sè sè liÖu trªn ®©y cã thÓ sÏ ®−îc chØnh lý sau nµy do c¸c ph©n tÝch hÖ gen vÉn ®ang tiÕp tôc tiÕn hµnh. Mb = 1 triÖu
cÆp baz¬ (bp). ND = ch−a x¸c ®Þnh.
434 khèi kiÕn thøc 3 Di truyÒn häc
Bªn c¹nh c¸c intron, c¸c sinh vËt nh©n thËt ®a bµo chøa mét
l−îng lín ADN kh«ng m· hãa ë gi÷a c¸c gen. Trong môc tiÕp
theo, chóng ta sÏ m« t¶ thµnh phÇn vµ c¸ch s¾p xÕp c¸c chuçi
tr×nh tù lín cña ADN nh− vËy trong hÖ gen ng−êi.
§Õn ®©y, cã thÓ nãi chóng ta ®· dïng phÇn lín dung l−îng cña
ch−¬ng nµy, mµ thùc tÕ lµ cña c¶ khèi kiÕn thøc nµy, ®Ó tËp
trung nãi vÒ c¸c gen m· hãa protein. Nh−ng trong thùc tÕ, c¸c
vïng m· hãa cña nh÷ng gen nµy vµ c¸c gen m· hãa cho c¸c s¶n
phÈm ARN nh− rARN, tARN vµ tiÓu-ARN (miARN hay
microARN) chØ chiÕm mét tØ lÖ nhá trong hÖ gen cña phÇn lín
c¸c sinh vËt nh©n thËt ®a bµo. Mét phÇn lín hÖ gen cña hÇu hÕt
sinh vËt nh©n thËt lµ c¸c tr×nh tù ADN hoÆc kh«ng m· hãa cho
protein hoÆc kh«ng ®−îc phiªn m· ®Ó t¹o nªn c¸c lo¹i ARN cã
chøc n¨ng ®· biÕt; nh÷ng tr×nh tù ADN kh«ng m· hãa nµy
tr−íc kia th−êng ®−îc m« t¶ nh− c¸c “ADN d− thõa”. Tuy vËy,
ngµy cµng cã nhiÒu b»ng chøng cho thÊy nh÷ng tr×nh tù ADN
nµy gi÷ vai trß quan träng trong ho¹t ®éng sèng cña tÕ bµo; ý
t−ëng nµy ®ång thêi ®−îc cñng cè bëi sù tån t¹i mét c¸ch “bÒn
v÷ng” qua hµng tr¨m thÕ hÖ cña nh÷ng tr×nh tù nµy ë nhiÒu hÖ
gen kh¸c nhau. Ch¼ng h¹n, khi so s¸nh hÖ gen gi÷a ng−êi víi
chuét ®ång vµ chuét nhµ, c¸c nhµ nghiªn cøu t×m thÊy cã ®Õn
500 vïng ADN kh«ng m· hãa trong hÖ gen gièng hÖt nhau ë c¶
ba loµi. ë nh÷ng loµi nµy, møc ®é b¶o thñ cña nh÷ng tr×nh tù
nµy thËm chÝ cßn cao h¬n so víi c¸c vïng m· hãa protein; ®iÒu
nµy ñng hé m¹nh mÏ cho gi¶ thiÕt c¸c vïng kh«ng m· hãa cã
nh÷ng chøc n¨ng quan träng. Trong môc nµy chóng ta sÏ t×m
hiÓu c¸c gen vµ c¸c tr×nh tù ADN kh«ng m· hãa ®−îc tæ chøc
nh− thÕ nµo trong hÖ gen cña c¸c sinh vËt nh©n thËt, víi vÝ dô
chñ yÕu chÝnh lµ hÖ gen ng−êi cña chóng ta. C¸ch tæ chøc cña
hÖ gen cho chóng ta biÕt con ®−êng mµ c¸c hÖ gen ®· vµ ®ang
tiÕp tôc tiÕn hãa; ®©y còng lµ néi dung ®−îc ®Ò cËp tiÕp theo.
Khi hÖ gen ng−êi ®· ®−îc gi¶i tr×nh tù hoµn toµn, mét sù
thËt ®−îc béc lé râ rµng lµ chØ cã 1,5% tr×nh tù nucleotit trong
hÖ gen ®−îc dïng hoÆc ®Ó m· hãa cho c¸c protein hoÆc ®−îc
phiªn m· thµnh c¸c ph©n tö rARN vµ tARN. H×nh 21.7 cho thÊy
thµnh phÇn cÊu tróc nªn 98,5% tr×nh tù cßn l¹i cña hÖ gen
ng−êi. C¸c tr×nh tù ®iÒu hßa liªn quan ®Õn c¸c gen vµ c¸c tr×nh
tù intron chiÕm 24% hÖ gen ng−êi; phÇn cßn l¹i, n»m gi÷a c¸c
gen biÓu hiÖn chøc n¨ng (c¸c tr×nh tù liªn gen), gåm c¸c tr×nh
tù kh«ng m· hãa ®¬n nhÊt, ch¼ng h¹n nh− c¸c ph©n ®o¹n cña
gen vµ c¸c gen gi¶, tøc lµ c¸c gen cò vèn tõng tån t¹i nh−ng
sau ®ã do tÝch lòy c¸c ®ét biÕn ®· trë nªn mÊt chøc n¨ng. Tuy
vËy, phÇn lín c¸c tr×nh tù ADN liªn gen lµ nh÷ng tr×nh tù
ADN lÆp l¹i, tøc lµ c¸c tr×nh tù cã mÆt víi nhiÒu b¶n sao trong
hÖ gen. §iÒu ®¸ng ng¹c nhiªn lµ ba phÇn t− cña c¸c tr×nh tù
ADN lÆp l¹i nµy (t−¬ng øng víi 44% cña toµn bé hÖ gen ng−êi)
t¹o nªn c¸c ®¬n vÞ ®−îc gäi lµ c¸c yÕu tè di truyÒn vËn ®éng
hoÆc c¸c tr×nh tù cã liªn quan ®Õn chóng.
21.4
Kh¸i niÖm
Sinh vËt nh©n thËt ®a bµo cã
nhiÒu ADN kh«ng m hãa vµ
nhiÒu hä ®a gen
21.3
1. Theo c¸c sè liÖu −íc tÝnh hiÖn nay, hÖ gen ng−êi chøa
kho¶ng 20.500 gen. Tuy vËy, cã b»ng chøng cho thÊy c¸c
tÕ bµo ng−êi cã thÓ s¶n sinh nhiÒu h¬n 20.500 lo¹i chuçi
polypeptide kh¸c nhau. Nh÷ng qu¸ tr×nh nµo cã thÓ gióp
gi¶i thÝch cho sù “kh«ng nhÊt qu¸n” nµy?
2. Sè hÖ gen ®−îc gi¶i tr×nh tù ®ang tiÕp tôc t¨ng lªn ®Òu
®Æn. H·y sö dông trang web www.genomesonline.org ®Ó
t×m sè hÖ gen hiÖn t¹i thuéc c¸c liªn giíi kh¸c nhau ®·
®−îc gi¶i tr×nh tù hoµn toµn, còng nh− sè hÖ gen ®ang tiÕp
tôc ®−îc gi¶i tr×nh tù (gîi ý: H·y dïng chuét nh¸y kÐp
vµo khÈu lÖnh “GOLD tables” råi sau ®ã nh¸y kÐp vµo
“Published Complete Genomes” ®Ó cã thªm th«ng tin.)
3. C¸c qu¸ tr×nh tiÕn hãa nµo cã thÓ gi¶i
thÝch cho viÖc c¸c sinh vËt nh©n s¬ cã hÖ gen nhá h¬n
so víi c¸c sinh vËt nh©n thËt ?
Xem gîi ý tr¶ lêi ë Phô lôc A.
KiÓm tra kh¸i niÖm
®iÒu g× NÕu
 H×nh 21.7 C¸c lo¹i tr×nh tù ADN trong hÖ gen ng−êi.
C¸c tr×nh tù gen m· hãa cho protein hoÆc ®−îc phiªn m· thµnh c¸c ph©n tö
rARN hay tARN chØ chiÕm kho¶ng 1,5% hÖ gen ng−êi (mµu tÝa sÉm trªn biÓu
®å táa trßn), trong khi c¸c tr×nh tù ®iÒu hßa vµ c¸c intron liªn quan ®Õn c¸c
gen (mµu tÝa nh¹t) chiÕm kho¶ng 1/4 hÖ gen. PhÇn lín h¬n c¶ cña hÖ gen
ng−êi lµ nh÷ng tr×nh tù kh«ng m· hãa cho protein vµ còng kh«ng ®−îc dïng
®Ó t¹o ra c¸c lo¹i ARN ®· biÕt, mµ phÇn nhiÒu trong nh÷ng tr×nh tù nµy lµ c¸c
ADN lÆp l¹i (mµu xanh lôc sÉm vµ nh¹t). Do ADN lÆp l¹i lµ nh÷ng tr×nh tù khã
ph©n tÝch vµ khã gi¶i tr×nh tù h¬n c¶, nªn sù ph©n lo¹i cña mét phÇn nh÷ng
tr×nh tù nµy ë trªn chØ cã tÝnh −íc ®o¸n, vµ c¸c tØ lÖ phÇn tr¨m ®−îc nªu cã thÓ
sÏ thay ®æi ®«i chót khi c¸c nghiªn cøu ph©n tÝch hÖ gen vÉn ®ang tiÕp diÔn.
Nh÷ng gen m· hãa c¸c miARN míi ®−îc t×m thÊy gÇn ®©y thuéc c¸c vïng
ADN kh«ng m· hãa ®¬n nhÊt (tøc lµ kh«ng lÆp l¹i) vµ trong c¸c intron; nghÜa
lµ, chóng thuéc hai vïng cña ®å thÞ táa trßn trªn ®©y.
C¸c exon (c¸c vïng gen m· hãa cho protein hoÆc
®−îc phiªn m· thµnh rARN vµ tARN) (1,5%)
Intron vµ c¸c tr×nh tù
®iÒu hßa liªn quan
®Õn c¸c gen (24%)
C¸c tr×nh tù ADN
kh«ng m· hãa
®¬n nhÊt (15%)
ADN lÆp l¹i
kh«ng liªn quan
®Õn c¸c yÕu tè
vËn ®éng (15%)
ADN lÆp l¹i
bao gåm c¸c
yÕu tè vËn
®éng vµ c¸c
tr×nh tù liªn
quan ®Õn
chóng (44%)
C¸c ®o¹n lÆp kÝch th−íc lín (5 - 6%)
ADN tr×nh tù
®¬n gi¶n (3%)
C¸c yÕu tè
Alu (3%)
C¸c tr×nh tù
L1 (17%)
Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 435
C¸c yÕu tè di truyÒn vËn ®éng vµ c¸c
tr×nh tù cã liªn quan ®Õn chóng
C¶ sinh vËt nh©n s¬ còng nh− sinh vËt nh©n thËt ®Òu cã trong hÖ
gen nh÷ng ®o¹n tr×nh tù ADN cã thÓ di chuyÓn tõ vÞ trÝ nµy
sang vÞ trÝ kh¸c trong hÖ gen. Nh÷ng ®o¹n tr×nh tù ADN nh−
vËy ®−îc gäi lµ c¸c yÕu tè di truyÒn vËn ®éng, hay ®−îc gäi t¾t
lµ c¸c yÕu tè vËn ®éng. Trong qu¸ tr×nh ®−îc gäi lµ vËn ®éng,
mét yÕu tè vËn ®éng sÏ di chuyÓn tõ mét vÞ trÝ trªn ADN trong
tÕ bµo tíi mét vÞ trÝ ®Ých kh¸c nhê mét qu¸ tr×nh t¸i tæ hîp. §«i
khi c¸c yÕu tè vËn ®éng ®−îc gäi lµ c¸c “gen nh¶y”, nh−ng
thuËt ng÷ nµy thùc tÕ dÔ g©y hiÓu nhÇm bëi trong thùc tÕ nh÷ng
®o¹n tr×nh tù ADN vËn ®éng kh«ng bao giê rêi khái ADN cña
tÕ bµo. (C¸c vÞ trÝ gèc vµ vÞ trÝ ®Ých míi cña c¸c yÕu tè vËn
®éng ®−îc ®−a ®Õn gÇn nhau bëi c¬ chÕ “bÎ cong” ADN.)
B»ng chøng ®Çu tiªn vÒ c¸c ph©n ®o¹n ADN cã thÓ di
chuyÓn ®−îc ph¸t hiÖn tõ c¸c thÝ nghiÖm lai gièng ë c©y ng«
®−îc nhµ n÷ di truyÒn häc ng−êi Mü lµ Barbara McClintock
tiÕn hµnh vµo nh÷ng n¨m 1940 vµ 1950 (H×nh 21.8). Khi theo
dâi c¸c c©y ng« qua nhiÒu thÕ hÖ, McClintock x¸c ®Þnh ®−îc sù
thay ®æi mµu néi nhò cña c¸c h¹t ng« chØ cã thÓ gi¶i thÝch ®−îc
nÕu nh− cã sù tån t¹i cña c¸c yÕu tè di truyÒn cã thÓ vËn ®éng
tõ nh÷ng vÞ trÝ kh¸c trong hÖ gen vµo trong c¸c gen qui ®Þnh
tÝnh tr¹ng mµu néi nhò, lµm “ph¸ vì” nh÷ng gen nµy vµ dÉn
®Õn hiÖn t−îng mµu néi nhò thay ®æi. Ph¸t hiÖn cña
McClintock ban ®Çu ®−îc ®ãn nhËn b»ng nhiÒu “hoµi nghi” vµ
thËm chÝ bÞ ph¶n ®èi. Ph¶i mÊt nhiÒu n¨m sau ®ã, c«ng tr×nh
nghiªn cøu kú c«ng cïng nh÷ng ý t−ëng s©u s¾c cña
McClintock vÒ c¸c yÕu tè vËn ®éng míi ®−îc x¸c nhËn bëi c¸c
nhµ di truyÒn häc vi khuÈn vµ vi sinh vËt khi hä t×m ra c¬ së
ph©n tö cña qu¸ tr×nh vËn ®éng cña nh÷ng yÕu tè nµy.
Sù vËn ®éng cña c¸c transposon vµ
retrotransposon
C¸c sinh vËt nh©n thËt cã hai lo¹i yÕu tè vËn ®éng. Lo¹i thø
nhÊt ®−îc gäi lµ c¸c transposon; lo¹i yÕu tè nµy vËn ®éng
trong hÖ gen th«ng qua mét ADN trung gian. C¸c transposon
cã thÓ vËn ®éng hoÆc bëi c¬ chÕ “c¾t - d¸n” vµ chóng ®−îc
chuyÓn dêi khái vÞ trÝ gèc, hoÆc bëi c¬ chÕ “sao chÐp - d¸n” vµ
chóng ®Ó l¹i mét b¶n sao t¹i vÞ trÝ gèc (H×nh 21.9a).
PhÇn lín c¸c yÕu tè vËn ®éng trong hÖ gen sinh vËt nh©n
thËt thuéc lo¹i thø hai, ®−îc gäi lµ c¸c retrotransposon; lo¹i
yÕu tè nµy vËn ®éng trong hÖ gen th«ng qua mét ARN trung
gian; ®©y lµ b¶n phiªn m· cña chÝnh ADN retrostransposon.
C¸c retrotransposon lu«n ®Ó l¹i mét b¶n sao t¹i vÞ trÝ ®Ých trong
qu¸ tr×nh vËn ®éng, do chóng ®−îc phiªn m· thµnh ARN trung
gian (H×nh 21.9b). Tr−íc khi cµi vµo vÞ trÝ ®Ých, ph©n tö ARN
trung gian ®−îc phiªn m· ng−îc trë l¹i thµnh ADN bëi enzym
phiªn m· ng−îc - reverse transcriptase - do chÝnh
retrotransposon m· hãa. §iÒu nµy cã nghÜa lµ enzym phiªn m·
ng−îc cã thÓ cã mÆt trong c¸c tÕ bµo mµ chóng kh«ng nhÊt
thiÕt ph¶i bÞ l©y nhiÔm bëi retrovirut. (Trong thùc tÕ, c¸c
retrovirut, nh− ®· ®−îc ®Ò cËp ë Ch−¬ng 19, cã thÓ ®· tiÕn hãa
b¾t nguån tõ chÝnh c¸c retrotransposon.) Ho¹t ®éng cµi tr×nh tù
ADN ®−îc phiªn m· ng−îc vµo vÞ trÝ míi ®−îc xóc t¸c bëi
enzym trong tÕ bµo.
 H×nh 21.8 ¶nh h−ëng cña c¸c yÕu tè vËn ®éng ®Õn
mµu h¹t ng«. Barbara McClintock lµ ng−êi ®Çu tiªn ®−a ra ý t−ëng vÒ
nh÷ng yÕu tè di truyÒn cã kh¶ n¨ng vËn ®éng khi quan s¸t hiÖn t−îng cã
nhiÒu ®èm mµu kh¸c nhau trong nh©n cña c¸c h¹t ng«. Tuy ban ®Çu ý t−ëng
cña bµ vµo nh÷ng n¨m 1940 ®−îc ®ãn nhËn bëi nh÷ng mèi hoµi nghi, nh−ng
sau nµy ®· ®−îc kiÓm chøng lµ hoµn toµn x¸c thùc. Bµ ®−îc nhËn gi¶i Nobel
n¨m 1983 khi ë tuæi 81 nhê c«ng tr×nh mang tÝnh tiªn phong cña m×nh.
 H×nh 21.9 Sù di chuyÓn cña c¸c yÕu tè vËn ®éng
ë sinh vËt nh©n thËt. (a) Sù di chuyÓn cña c¸c transposon hoÆc
theo c¬ chÕ “c¾t - d¸n” hoÆc theo c¬ chÕ “sao chÐp - d¸n” (®−îc minh häa ë
®©y) liªn quan ®Õn mét ph©n tö ADN sîi kÐp trung gian sau ®ã ®−îc cµi vµo
hÖ gen. (b) Sù di chuyÓn cña c¸c retrotransposon b¾t ®Çu b»ng sù h×nh
thµnh mét ph©n tö ARN m¹ch ®¬n trung gian. C¸c b−íc cßn l¹i vÒ b¶n chÊt
gièng víi mét phÇn chu kú sinh s¶n cña retrovirut (xem H×nh 19.8). Trong
kiÓu di chuyÓn cña c¸c transposon theo kiÓu “sao chÐp - d¸n” vµ kiÓu di
chuyÓn cña retrotransposon, tr×nh tù ADN võa ®−îc duy tr× ë vÞ trÝ gèc võa
xuÊt hiÖn ë vÞ trÝ míi.
PhÇn (a) ë trªn sÏ kh¸c nh− thÕ nµo nÕu c¬ chÕ ®−îc minh häa ë ®©y
lµ c¬ chÕ di chuyÓn kiÓu “c¾t - d¸n” ?
Transposon
ADN hÖ gen
Transposon
®−îc sao chÐp
Transposon vËn ®éng
Cµi vµo
hÖ gen
B¶n sao míi
cña transposon
(a) Sù di chuyÓn cña transposon (c¬ chÕ kiÓu “sao chÐp - d¸n”)
Retrotransposon
ARN
Reverse
transcriptase
Cµi vµo
hÖ gen
B¶n sao míi cña
retrotransposon
(b) Sù di chuyÓn cña retrotransposon
436 khèi kiÕn thøc 3 Di truyÒn häc
C¸c tr×nh tù liªn quan ®Õn
c¸c yÕu tè vËn ®éng
ë sinh vËt nh©n thËt, nhiÒu b¶n sao cña c¸c yÕu tè vËn ®éng vµ
c¸c tr×nh tù liªn quan ®Õn chóng n»m r¶i r¸c kh¾p hÖ gen. Mçi
®¬n vÞ riªng lÎ cña yÕu tè vËn ®éng th−êng dµi tõ vµi tr¨m ®Õn
vµi ngh×n cÆp baz¬, vµ c¸c b¶n sao n»m ph©n t¸n th−êng
gièng nhau, nh−ng kh«ng gièng hÖt nhau. Mét sè yÕu tè vËn
®éng nh− vËy cã kh¶ n¨ng vËn ®éng; c¸c enzym cÇn thiÕt cho
sù vËn ®éng cña nã cã thÓ ®−îc m· hãa bëi mét yÕu tè vËn
®éng bÊt kú, bao gåm c¶ chÝnh yÕu tè vËn ®éng ®ang ho¹t
®éng. Nh÷ng tr×nh tù kh¸c lµ nh÷ng tr×nh tù cã liªn quan nh−ng
®· mÊt hoµn toµn kh¶ n¨ng vËn ®éng. C¸c yÕu tè vËn ®éng vµ
c¸c tr×nh tù cã liªn quan chiÕm kho¶ng 25% - 50% hÖ gen ë
phÇn lín ®éng vËt cã vó (xem H×nh 21.7); tØ lÖ nµy thËm chÝ
cßn cao h¬n ë c¸c loµi l−ìng c− vµ nhiÒu loµi thùc vËt.
ë ng−êi vµ nhiÒu loµi linh tr−ëng kh¸c, mét tØ lÖ lín c¸c
tr×nh tù ADN liªn quan ®Õn c¸c yÕu tè vËn ®éng bao gåm mét
hä c¸c tr×nh tù gièng nhau ®−îc gäi lµ c¸c yÕu tè Alu. Riªng
nh÷ng tr×nh tù nµy ®· chiÕm kho¶ng 10% hÖ gen ng−êi. C¸c
yÕu tè Alu cã chiÒu dµi kho¶ng 300 nucleotit, tøc lµ ng¾n h¬n
nhiÒu so víi phÇn lín c¸c yÕu tè vËn ®éng cßn ho¹t ®éng kh¸c,
vµ chóng kh«ng m· hãa cho bÊt cø protein nµo. Tuy vËy, nhiÒu
yÕu tè Alu ®−îc phiªn m· thµnh ARN; chøc n¨ng trong tÕ bµo
cña chóng (nÕu cã) ®Õn nay ch−a râ.
Mét tØ lÖ lín h¬n (17%) cña hÖ gen ng−êi lµ mét lo¹i
retrotransposon kh¸c, ®−îc gäi lµ c¸c yÕu tè LINE-1 hay L1.
Nh÷ng yÕu tè nµy dµi h¬n nhiÒu so víi c¸c yÕu tè Alu (kho¶ng
6500 bp) vµ cã tØ lÖ vËn ®éng thÊp. T¹i sao tØ lÖ vËn ®éng cña
c¸c yÕu tè lo¹i nµy l¹i thÊp? C¸c nghiªn cøu gÇn ®©y ph¸t hiÖn
ra r»ng trong c¸c yÕu tè L1 cã c¸c tr×nh tù ng¨n c¶n ho¹t ®éng
cña ARN polymerase vèn cÇn thiÕt cho sù vËn ®éng. Mét
nghiªn cøu bæ sung t×m thÊy c¸c tr×nh tù L1 cã trong intron cña
kho¶ng 80% sè gen ng−êi ®−îc ®em ph©n tÝch, ®iÒu nµy cho
thÊy cã kh¶ n¨ng L1 gióp ®iÒu hßa biÓu hiÖn gen. Mét sè nhµ
nghiªn cøu kh¸c cho r»ng: c¸c retrotransposon L1 cã thÓ cã
hiÖu qu¶ biÖt hãa qua ®iÒu hßa biÓu hiÖn gen dÉn ®Õn sù ph¸t
triÓn c¸c lo¹i n¬ron, gãp phÇn t¹o nªn sù ®a d¹ng cña c¸c lo¹i
tÕ bµo n¬ron (xem Ch−¬ng 48).
MÆc dï cã nhiÒu yÕu tè vËn ®éng m· hãa cho c¸c protein,
nh−ng nh÷ng protein nµy kh«ng thùc hiÖn nh÷ng chøc n¨ng tÕ
bµo b×nh th−êng. Do vËy, c¸c yÕu tè vËn ®éng th−êng ®−îc qui
vµo nhãm ADN “kh«ng m· hãa”, cïng víi c¸c tr×nh tù lÆp l¹i
dµi kh¸c cã trong hÖ gen.
C¸c tr×nh tù ADN lÆp l¹i kh¸c, bao gåm
c¶ c¸c ADN tr×nh tù ®¬n gi¶n
C¸c tr×nh tù ADN lÆp l¹i vèn kh«ng liªn quan ®Õn c¸c yÕu tè
vËn ®éng cã vÎ xuÊt hiÖn do c¸c sai sãt trong c¸c qu¸ tr×nh sao
chÐp hoÆc t¸i tæ hîp cña ADN. Nh÷ng tr×nh tù ADN nh− vËy
chiÕm kho¶ng 15% hÖ gen ng−êi (xem H×nh 21.7). Kho¶ng mét
phÇn ba trong sè nµy (tøc lµ kho¶ng 5 - 6% hÖ gen ng−êi) lµ
nh÷ng ®o¹n ADN dµi lÆp l¹i hai lÇn víi mçi ®¬n vÞ lÆp l¹i dµi tõ
10.000 ®Õn 30.000 cÆp baz¬. C¸c ®o¹n ADN dµi nh− vËy d−êng
nh− ®· ®−îc sao chÐp tõ vÞ trÝ nµy sang vÞ trÝ kh¸c thuéc cïng
mét nhiÔm s¾c thÓ hoÆc thuéc hai nhiÔm s¾c thÓ kh¸c nhau.
Kh«ng gièng nh− c¸c b¶n sao cña c¸c tr×nh tù ADN dµi
ph©n t¸n kh¾p hÖ gen, c¸c ADN tr×nh tù ®¬n gi¶n th−êng gåm
nhiÒu b¶n sao cña c¸c ®o¹n tr×nh tù ng¾n lÆp l¹i liªn tiÕp nh− vÝ
dô ®−îc minh häa d−íi ®©y (ë ®©y, chØ minh häa mét m¹ch):
…GTTACGTTACGTTACGTTACGTTACGTTAC…
Trong tr−êng hîp nµy, ®¬n vÞ lÆp l¹i (GTTAC) gåm 5 nucleotit.
Trong thùc tÕ, c¸c ®¬n vÞ lÆp l¹i nh− vËy cã thÓ dµi ®Õn 500
nucleotit, nh−ng th−êng th× ng¾n h¬n 15 nucleotit nh− vÝ dô
trªn ®©y. Khi ®¬n vÞ lÆp l¹i chØ chøa tõ 2 ®Õn 5 nucleotit, th×
®o¹n tr×nh tù lÆp l¹i liªn tiÕp nh− vËy ®−îc gäi lµ tr×nh tù ng¾n
lÆp l¹i liªn tiÕp, hay cßn gäi lµ STR (short tandem repeats).
Chóng ta ®· nãi vÒ viÖc sö dông chØ thÞ STR trong x©y dùng
tµng th− di truyÒn ë Ch−¬ng 20. Sè b¶n sao cña cïng mét ®¬n
vÞ lÆp l¹i cã thÓ kh¸c nhau ë nh÷ng vÞ trÝ kh¸c nhau trong hÖ
gen. Ch¼ng h¹n nh−, ®¬n vÞ lÆp l¹i GTTAC cã thÓ xuÊt hiÖn liªn
tiÕp hµng tr¨m ngh×n lÇn t¹i mét vÞ trÝ trong hÖ gen; nh−ng ë
mét vÞ trÝ kh¸c, sè lÇn lÆp l¹i cña ®¬n vÞ nµy chØ b»ng mét nöa.
Sè lÇn lÆp l¹i còng rÊt kh¸c nhau gi÷a ng−êi nµy víi ng−êi
kh¸c, t¹o nªn sù kh¸c biÖt trong tµng th− di truyÒn cña mçi c¸
nh©n trªn c¬ së ph©n tÝch c¸c tr×nh tù STR. TÝnh tæng céng, c¸c
ADN tr×nh tù ®¬n gi¶n chiÕm kho¶ng 3% hÖ gen ng−êi.
Thµnh phÇn nucleotit cña c¸c ®o¹n ADN tr×nh tù ®¬n gi¶n
kh¸c biÖt víi thµnh phÇn cña c¸c ®o¹n tr×nh tù ADN kh¸c trong
hÖ gen ®Õn møc chóng t¹o nªn sù kh¸c biÖt vÒ tØ träng. NÕu
ADN hÖ gen ®−îc c¾t thµnh c¸c ph©n ®o¹n nhá, råi ®−îc ly t©m
ë tèc ®é cao, th× c¸c ph©n ®o¹n ADN cã tØ träng kh¸c nhau sÏ
“®Þnh vÞ” ë nh÷ng vÞ trÝ kh¸c nhau trong èng ly t©m. C¸c ®o¹n
ADN lÆp l¹i vèn ban ®Çu ®−îc ph©n lËp theo c¸ch nµy ®−îc gäi
lµ c¸c tr×nh tù ADN vÖ tinh bëi v× c¸c b¨ng ly t©m cña chóng
t¸ch biÖt khái phÇn b¨ng ly t©m chung gåm c¸c tr×nh tù ADN
cßn l¹i cña hÖ gen gièng nh− mét “vÖ tinh”. ThuËt ng÷ “ADN
vÖ tinh” vµ ADN tr×nh tù ®¬n gi¶n hiÖn nay th−êng ®−îc dïng
thay thÕ cho nhau.
Mét l−îng lín ADN tr×nh tù ®¬n gi¶n cña hÖ gen tËp trung
ë c¸c ®Çu mót vµ t©m ®éng cña nhiÔm s¾c thÓ, cho thÊy nh÷ng
tr×nh tù ADN nµy gi÷ vai trß cÊu tróc nhiÔm s¾c thÓ. C¸c tr×nh
tù ADN t¹i t©m ®éng lµ thiÕt yÕu cho ho¹t ®éng ph©n ly cña c¸c
nhiÔm s¾c tö trong qu¸ tr×nh ph©n bµo (xem Ch−¬ng 12). Tr×nh
tù ADN t©m ®éng, cïng víi c¸c ADN tr×nh tù ®¬n gi¶n kh¸c,
cã thÓ ®ãng vai trß tæ chøc chÊt nhiÔm s¾c trong nh©n t¹i kú
trung gian cña chu tr×nh tÕ bµo. C¸c ADN tr×nh tù ®¬n gi¶n t¹i
c¸c ®Çu mót nhiÔm s¾c thÓ gióp b¶o vÖ c¸c gen kh«ng bÞ mÊt do
ADN ng¾n l¹i sau mçi lÇn sao chÐp (xem Ch−¬ng 16). ADN
®Çu mót ®ång thêi liªn kÕt víi c¸c protein gióp b¶o vÖ ®Çu mót
nhiÔm s¾c thÓ khái bÞ biÕn tÝnh, ®ång thêi kh«ng bÞ dÝnh chËp
víi c¸c nhiÔm s¾c thÓ kh¸c.
C¸c gen vµ c¸c hä ®a gen
Chóng ta kÕt thóc bµn luËn vÒ c¸c lo¹i tr×nh tù ADN kh¸c nhau
trong c¸c hÖ gen sinh vËt nh©n thËt b»ng viÖc nh×n gÇn c¸c gen
h¬n. Chóng ta nhí l¹i r»ng tæng céng c¸c tr×nh tù ADN m· hãa
hoÆc cho c¸c protein hoÆc cho c¸c lo¹i tARN vµ rARN chØ
chiÕm cã 1,5% hÖ gen ng−êi (xem H×nh 21.7). NÕu chóng ta
tÝnh c¶ c¸c tr×nh tù intron vµ c¸c tr×nh tù ®iÒu hßa liªn quan ®Õn
gen, th× tæng céng tÊt c¶ c¸c tr×nh tù ADN cã liªn quan ®Õn gen
(bao gåm c¶ nh÷ng ®o¹n m· hãa vµ kh«ng m· hãa) chiÕm
Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 437
kho¶ng 25% hÖ gen ng−êi. Nãi c¸ch kh¸c, trung b×nh chØ cã
kho¶ng 6% (tøc lµ 1,5% cña 25%) tr×nh tù ®Çy ®ñ cña mét gen
cã mÆt trong s¶n phÈm cuèi cïng cña gen.
Gièng víi c¸c gen cña vi khuÈn, nhiÒu gen ë sinh vËt nh©n
thËt lµ nh÷ng tr×nh tù ®¬n nhÊt vµ chØ cã mét b¶n sao duy nhÊt
trong mçi bé nhiÔm s¾c thÓ ®¬n béi. Tuy vËy, trong hÖ gen
ng−êi vµ hÖ gen cña nhiÒu ®éng vËt vµ thùc vËt kh¸c, nh÷ng
gen “®¬n ®éc” nh− vËy chiÕm Ýt h¬n mét nöa tæng sè tr×nh tù
ADN ®−îc phiªn m·. C¸c gen cßn l¹i xuÊt hiÖn thµnh c¸c hä
®a gen, tøc lµ tËp hîp cña hai hay nhiÒu gen gièng hÖt hoÆc rÊt
gièng nhau.
Trong c¸c hä ®a gen gåm c¸c tr×nh tù ADN gièng hÖt nhau,
c¸c tr×nh tù ADN lÆp l¹i liÒn kÒ nhau, vµ ngo¹i trõ c¸c gen m·
hãa protein histone, chóng m· hãa cho s¶n phÈm cuèi cïng lµ
ARN. Mét vÝ dô vÒ hä c¸c tr×nh tù ADN gièng hÖt nhau lµ côm
c¸c gen m· hãa cho ba lo¹i ph©n tö rARN lín nhÊt (H×nh
21.10a). Nh÷ng ph©n tö rARN nµy ®−îc phiªn m· thµnh c¸c
b¶n phiªn m· duy nhÊt gåm hµng tr¨m thËm chÝ hµng ngh×n lÇn
lÆp l¹i kÕ tiÕp nhau vµ tËp hîp thµnh mét hoÆc mét sè côm
trong hÖ gen sinh vËt nh©n thËt. Víi nhiÒu b¶n sao cïng cã mÆt
trong mét ®¬n vÞ phiªn m· nh− vËy, tÕ bµo cã thÓ nhanh chãng
t¹o ra hµng triÖu ribosome cÇn cho qu¸ tr×nh tæng hîp protein.
B¶n phiªn m· s¬ cÊp cña c¸c gen rARN sau ®ã ®−îc c¾t xÐn ®Ó
h×nh thµnh nªn ba lo¹i ph©n tö rARN. Nh÷ng ph©n tö rARN
nµy sau ®ã ®−îc kÕt hîp víi c¸c protein vµ mét lo¹i rARN kh¸c
(rARN 5S) ®Ó t¹o nªn c¸c tiÓu phÇn ribosome.
C¸c vÝ dô kinh ®iÓn vÒ c¸c hä ®a gen cã tr×nh tù kh«ng
gièng hÖt nhau gåm hai hä gen cã quan hÖ víi nhau m· hãa cho
globin; ®©y lµ mét nhãm c¸c protein gåm c¸c tiÓu phÇn (chuçi
polypeptit) α vµ β cña hemoglobin. Cã mét hä gen n»m trªn
NST sè 16 ë ng−êi m· hãa cho c¸c d¹ng kh¸c nhau cña α-
globin; mét hä gen cßn l¹i n»m trªn NST sè 11 m· hãa cho c¸c
d¹ng kh¸c nhau cña β-globin (H×nh 21.10b). C¸c d¹ng kh¸c
nhau cña mçi tiÓu phÇn globin ®−îc biÓu hiÖn vµo c¸c thêi
®iÓm kh¸c nhau cña qu¸ tr×nh ph¸t triÓn, qua ®ã gióp
hemoglobin biÓu hiÖn chøc n¨ng hiÖu qu¶ trong c¸c ®iÒu kiÖn
m«i tr−êng thay ®æi trong qu¸ tr×nh ph¸t triÓn ë ®éng vËt.
Ch¼ng h¹n nh−, ë ng−êi, c¸c d¹ng hemoglobin cã trong ph«i vµ
thai cã ¸i lùc víi oxy cao h¬n so víi d¹ng hemoglobin ë ng−êi
tr−ëng thµnh; ®iÒu nµy gióp ®¶m b¶o hiÖu qu¶ vËn chuyÓn oxy
tõ mÑ sang thai nhi. Trong c¸c côm hä gen m· hãa globin,
ng−êi ta cßn t×m thÊy mét sè gen gi¶.
 H×nh 21.10 C¸c hä gen.
Trong phÇn (a) cña trªn h×nh, b»ng c¸ch nµo b¹n cã thÓ x¸c ®Þnh ®−îc chiÒu phiªn m·, nÕu nh− kh«ng cã mòi tªn mµu ®á?
Nh©n hem
Hä gen α-globin
ADN
Hä gen β-globin
NhiÔm s¾c thÓ sè 16 NhiÔm s¾c thÓ sè 11
Ph«i
Thai vµ ng−êi
tr−ëng thµnh Ph«i Thai Ng−êi tr−ëng
thµnh
§o¹n ®Öm kh«ng
®−îc phiªn m· §¬n vÞ phiªn m·
C¸c b¶n
phiªn m· ARN
ADN
rARN
(a) Mét phÇn hä gen m hãa ARN ribosom. Ba trong sè hµng
tr¨m b¶n sao cña c¸c ®¬n vÞ phiªn m· rARN trong hÖ gen cña loµi kú
gi«ng ®−îc minh häa ë phÇn trªn (¶nh TEM). Mçi mét “chiÕc l«ng” t−¬ng
øng víi mét ®¬n vÞ phiªn m· víi kho¶ng 100 ph©n tö ®ang ®−îc tæng hîp
bëi ARN polymerase (®iÓm mµu sÉm däc theo sîi ADN) dÞch chuyÓn tõ
tr¸i qua ph¶i. C¸c b¶n phiªn m· ARN ®ang ®−îc “më réng” tõ ADN. S¬ ®å
bªn d−íi ¶nh TEM m« t¶ mét ®¬n vÞ phiªn m·. Nã bao gåm c¸c gen (mµu
xanh lam) m· hãa ba lo¹i rARN xen gi÷a c¸c vïng ®−îc phiªn m· nh−ng
sau ®ã ®−îc c¾t bá (mµu vµng). Ban ®Çu chØ mét b¶n phiªn m· ARN duy
nhÊt ®−îc t¹o ra, nh−ng sau ®ã nã ®−îc c¾t xÐn ®Ó t¹o nªn ba ph©n tö
rARN kh¸c nhau (mçi lo¹i mét ph©n tö); chóng lµ c¸c thµnh phÇn thiÕt yÕu
cña ribosom. Mét lo¹i rARN thø t− (5S rARN) còng lµ thµnh phÇn cña
ribosom, nh−ng gen m· hãa nã kh«ng thuéc cïng ®¬n vÞ phiªn m· nµy.
(b) C¸c hä gen α
α
α
α-globin vµ β
β
β
β-globin ë ng−êi. Hemoglobin ®−îc
cÊu t¹o tõ hai tiÓu phÇn (chuçi) polypeptide lo¹i α-globin vµ hai tiÓu phÇn
lo¹i β-globin. C¸c gen (mµu xanh lam) m· hãa cho α-globin vµ β-globin
®−îc t×m thÊy trong hai hä gen cã cÊu tróc tæ chøc nh− minh häa trªn
h×nh. C¸c tr×nh tù ADN kh«ng m· hãa xen gi÷a c¸c gen chøc n¨ng trong
mçi hä gen gåm c¸c gen gi¶ (mµu xanh lôc) vµ c¸c d¹ng biÕn ®æi kh«ng
biÓu hiÖn chøc n¨ng cña c¸c gen chøc n¨ng b×nh th−êng. Tªn gäi c¸c
gen vµ c¸c gen gi¶ ®−îc kÝ hiÖu vµ ®äc theo tiÕng Hy l¹p.
438 khèi kiÕn thøc 3 Di truyÒn häc
Sù s¾p xÕp c¸c gen thµnh c¸c hä gen ®· gióp c¸c nhµ sinh
häc cã nh÷ng hiÓu biÕt s©u h¬n vÒ qu¸ tr×nh tiÕn hãa cña c¸c hÖ
gen. Trong môc tiÕp theo, chóng ta sÏ ®Ò cËp ®Õn mét sè qu¸
tr×nh dÉn ®Õn sù ®Þnh h×nh c¸c hÖ gen cña c¸c loµi kh¸c nhau
qua qu¸ tr×nh tiÕn hãa.
C¬ së thay ®æi ë cÊp ®é hÖ gen lµ ®ét biÕn vµ ®ã còng lµ nÒn
t¶ng cña tiÕn hãa häc hÖ gen. D−êng nh− nh÷ng d¹ng sèng ®Çu
tiªn chØ chøa mét sè tèi thiÓu c¸c gen, nghÜa lµ chØ cã c¸c gen
thiÕt yÕu cho sù tån t¹i vµ sinh s¶n. NÕu ®iÒu nµy lµ ®óng, th×
mét chiÒu h−íng tiÕn hãa h¼n lµ ®· diÔn ra cïng víi sù t¨ng lªn
vÒ kÝch th−íc hÖ gen, vµ vËt chÊt di truyÒn bæ sung ®· cung cÊp
nguyªn liÖu s¬ cÊp cho tÝnh ®a d¹ng t¨ng lªn cña c¸c gen.
Trong môc nµy, ®Çu tiªn chóng ta sÏ m« t¶ b»ng c¸ch nµo
nh÷ng b¶n sao bæ sung cña toµn bé hay mét phÇn cña hÖ gen cã
thÓ xuÊt hiÖn, råi sau ®ã ®Ò cËp ®Õn nh÷ng qu¸ tr×nh x¶y ra tiÕp
theo dÉn ®Õn sù tiÕn hãa cña c¸c protein (hoÆc c¸c s¶n phÈm
ARN) cã chøc n¨ng hoµn toµn míi hoÆc thay ®æi chót Ýt.
Sù nh©n ®«i c¸c bé nhiÔm s¾c thÓ
C¸c sù kiÖn ngÉu nhiªn trong gi¶m ph©n cã thÓ dÉn ®Õn tÕ bµo
cã thÓ cã mét hoÆc nhiÒu bé nhiÔm s¾c thÓ bæ sung thªm; hiÖn
t−îng nµy ®−îc gäi lµ ®a béi thÓ. MÆc dï, trong phÇn lín
tr−êng hîp nh÷ng sù kiÖn ngÉu nhiªn ®ã th−êng g©y chÕt,
nh−ng trong mét sè hiÕm tr−êng hîp, chóng l¹i thóc ®Èy sù tiÕn
hãa cña c¸c gen. ë mét c¬ thÓ ®a béi, mét bé c¸c gen cã thÓ
cung cÊp ®ñ c¸c chøc n¨ng thiÕt yÕu cho c¬ thÓ ®ã. Nh÷ng gen
ë nh÷ng bé nhiÔm s¾c thÓ bæ sung cã thÓ ph©n ly bëi qu¸ tr×nh
tÝch lòy c¸c ®ét biÕn; nh÷ng biÕn dÞ nµy cã thÓ ®−îc duy tr× nÕu
nh− c¬ thÓ mang c¸c ®ét biÕn sèng sãt vµ sinh s¶n ®−îc. B»ng
c¸ch ®ã, c¸c gen cã thÓ tiÕn hãa víi nh÷ng chøc n¨ng míi.
Cïng víi viÖc mét b¶n sao cña gen thiÕt yÕu ®−îc biÓu hiÖn, sù
ph©n ly cña mét b¶n sao kh¸c cã thÓ dÉn ®Õn mét lo¹i protein
vÉn do gen ®ã m· hãa song ho¹t ®éng theo mét c¸ch míi, qua
®ã lµm thay ®æi kiÓu h×nh cña sinh vËt. KÕt qu¶ cña sù tÝch lòy
c¸c ®ét biÕn nµy cã thÓ dÉn ®Õn sù ph©n nh¸nh tiÕn hãa cña mét
loµi míi, gièng nh− biÓu hiÖn th−êng thÊy ë thùc vËt (xem
Ch−¬ng 24). C¸c ®éng vËt ®a béi còng tån t¹i, song rÊt hiÕm.
Sù thay ®æi cÊu tróc nhiÔm s¾c thÓ
Tõ l©u c¸c nhµ khoa häc ®· biÕt r»ng vµo mét thêi ®iÓm nµo ®ã
trong vßng 6 triÖu n¨m tr−íc khi c¸c d¹ng tæ tiªn cña ng−êi
hiÖn ®¹i vµ tinh tinh ph©n ly khái nhau vµ h×nh thµnh nªn c¸c
loµi riªng biÖt, mét sù dung hîp hai nhiÔm s¾c thÓ kh¸c nhau
vèn cã ë d¹ng tæ tiªn ®· dÉn ®Õn loµi ng−êi cã sè nhiÔm s¾c thÓ
®¬n béi (n = 23) kh¸c víi cña tinh tinh (n = 24). Víi sù bïng
næ th«ng tin vÒ tr×nh tù c¸c hÖ gen, giê ®©y chóng ta cã thÓ so
s¸nh cÊu tróc vµ tæ chøc nhiÔm s¾c thÓ gi÷a nhiÒu loµi ë cÊp ®é
ph©n tÝch chi tiÕt h¬n. Nh÷ng th«ng tin nµy gióp chóng ta cã thÓ
t×m hiÓu s©u h¬n vÒ c¸c qu¸ tr×nh tiÕn hãa ®· dÉn ®Õn sù h×nh
thµnh c¸c nhiÔm s¾c thÓ còng nh− sù ph¸t sinh c¸c loµi.
VÝ dô nh−, trong mét nghiªn cøu, c¸c nhµ khoa häc ®· tiÕn
hµnh so s¸nh tr×nh tù ADN gi÷a mçi nhiÔm s¾c thÓ cña ng−êi
víi tr×nh tù toµn bé hÖ gen cña chuét. H×nh 21.11 cho thÊy kÕt
qu¶ so s¸nh víi nhiÔm s¾c thÓ sè 16 cña ng−êi lµ: nh÷ng “khèi”
gen lín trªn nhiÔm s¾c thÓ nµy ®−îc t×m thÊy trªn 4 nhiÔm s¾c
thÓ kh¸c nhau cña chuét; ®iÒu nµy cho thÊy c¸c gen trong mçi
“khèi” ®· tån t¹i cïng víi nhau trong qu¸ tr×nh tiÕn hãa cña
21.5
Kh¸i niÖm
LÆp ®o¹n, t¸i s¾p xÕp vµ ®ét
biÕn trong tr×nh tù ADN ®ãng
gãp vµo qu¸ tr×nh tiÕn hãa
21.4
1. H·y nªu c¸c ®Æc ®iÓm cña hÖ gen ®éng vËt cã vó lµm
chóng trë nªn lín h¬n so víi c¸c hÖ gen sinh vËt nh©n s¬?
2. C¸c intron, c¸c yÕu tè vËn ®éng vµ c¸c tr×nh tù ADN lÆp
l¹i ®¬n gi¶n ph©n bè trong hÖ gen kh¸c nhau nh− thÕ nµo?
3. Nªu sù kh¸c nhau trong cÊu tróc cña c¸c hä gen m· hãa
rARN vµ m· hãa c¸c protein globin ë ng−êi. Víi mçi hä
gen, h·y gi¶i thÝch lîi thÕ cña sù tån t¹i cÊu tróc kiÓu hä
gen ®èi víi sinh vËt.
4. Gi¶ sö b¹n t×m thÊy mét tr×nh tù ADN
gièng víi tr×nh tù cña mét gen ®· biÕt, nh−ng chóng l¹i
kh¸c nhau râ rÖt ë mét vµi nucleotide nhÊt ®Þnh. B»ng
c¸ch nµo b¹n cã thÓ x¸c ®Þnh tr×nh tù míi t×m thÊy cã
ph¶i lµ mét “gen” biÓu hiÖn chøc n¨ng hay kh«ng??
Xem gîi ý tr¶ lêi ë Phô lôc A.
KiÓm tra kh¸i niÖm
®iÒu g× NÕu
 H×nh 21.11 C¸c khèi tr×nh tù gièng nhau trªn c¸c
nhiÔm s¾c thÓ cña ng−êi vµ chuét. C¸c tr×nh tù ADN rÊt gièng
nhau ®−îc t×m thÊy trong mét khèi tr×nh tù lín thuéc nhiÔm s¾c thÓ sè 16 cña
ng−êi ®−îc t×m thÊy trªn c¸c nhiÔm s¾c thÓ sè 7, 8, 16 vµ 17 cña chuét. §iÒu
nµy cho thÊy c¸c tr×nh tù ADN trong mçi khèi ®· lu«n tån t¹i cïng nhau ë c¸c
dßng tiÕn hãa dÉn ®Õn sù h×nh thµnh ng−êi vµ chuét kÓ tõ thêi ®iÓm chóng
ph©n ly khái nhau tõ tæ tiªn chung.
NhiÔm s¾c thÓ sè 16 cña ng−êi
C¸c khèi
tr×nh tù ADN
C¸c khèi tr×nh tù t−¬ng øng ®−îc t×m thÊy trªn 4 nhiÔm s¾c thÓ cña chuét
Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 439
chuét còng nh− ë c¸c nh¸nh tiÕn hãa cña ng−êi. Thùc hiÖn phÐp
so s¸nh t−¬ng tù gi÷a nhiÔm s¾c thÓ cña ng−êi víi s¸u loµi ®éng
vËt cã vó kh¸c còng ®· gióp c¸c nhµ nghiªn cøu t¸i thiÕt ®−îc
lÞch sö tiÕn hãa tæ chøc nhiÔm s¾c thÓ ë t¸m loµi ®éng vËt cã vó
nµy. Qua ®ã, c¸c nhµ nghiªn cøu ®· t×m ra nhiÒu lÆp ®o¹n vµ
®¶o ®o¹n trªn c¸c ph©n ®o¹n lín cña NST lµ kÕt qu¶ cña c¸c lçi
t¸i tæ hîp x¶y ra trong gi¶m ph©n dÉn ®Õn sù ®øt g·y vµ nèi l¹i
kh«ng chÝnh x¸c cña ADN. TÇn sè suÊt hiÖn nh÷ng sù kiÖn nµy
d−êng nh− ®· t¨ng nhanh trong kho¶ng 100 triÖu n¨m tr−íc, tøc
lµ kho¶ng thêi gian nh÷ng loµi khñng long kÝch th−íc lín trë
nªn tuyÖt chñng vµ sè loµi ®éng vËt cã vó t¨ng lªn nhanh
chãng. Sù trïng lÆp ngÉu nhiªn nµy râ rµng lµ rÊt thó vÞ bëi v×
sù t¸i s¾p xÕp nhiÔm s¾c thÓ ®−îc cho lµ ®· ®ãng gãp vµo sù
h×nh thµnh c¸c loµi míi. MÆc dï hai c¸ thÓ mang c¸c nhiÔm s¾c
thÓ ®−îc s¾p xÕp kh¸c nhau vÉn cã thÓ giao phèi víi nhau vµ
sinh s¶n, nh−ng c¸c c¸ thÓ con sinh ra sÏ cã hai bé nhiÔm s¾c
thÓ kh«ng t−¬ng ®ång. V× vËy, sù s¾p xÕp l¹i c¸c nhiÔm s¾c thÓ
cã thÓ dÉn ®Õn sù h×nh thµnh hai quÇn thÓ kh«ng cßn cã kh¶
n¨ng giao phèi víi nhau n÷a, vµ nã trë thµnh mét b−íc trong
con ®−êng dÉn ®Õn sù h×nh thµnh hai loµi t¸ch biÖt (chóng ta sÏ
®Ò cËp kü h¬n vÒ vÊn ®Ò nµy ë Ch−¬ng 24).
§iÒu g©y ng¹c nhiªn mét chót lµ nh÷ng nghiªn cøu t−¬ng tù
®· ph¸t hiÖn ra nh÷ng mèi liªn quan ®Õn y häc. ViÖc ph©n tÝch
c¸c ®iÓm ®øt g·y nhiÔm s¾c thÓ liªn quan ®Õn sù t¸i s¾p xÕp cña
chóng cho thÊy nh÷ng ®iÓm nµy kh«ng hÒ ph©n bè ngÉu nhiªn,
mµ chóng lµ nh÷ng ®iÓm ®Æc thï ®−îc dïng ®i dïng l¹i nhiÒu
lÇn. NhiÒu “®iÓm nãng” t¸i tæ hîp nh− vËy t−¬ng øng víi vÞ trÝ
s¾p xÕp l¹i nhiÔm s¾c thÓ trong hÖ gen ng−êi vèn cã liªn quan
®Õn c¸c bÖnh bÈm sinh. TÊt nhiªn, c¸c nhµ nghiªn cøu cßn quan
t©m c¶ nh÷ng vÞ trÝ kh¸c cã thÓ liªn quan ®Õn nh÷ng bÖnh cho
®Õn nay ch−a ®−îc x¸c ®Þnh.
LÆp ®o¹n vµ sù ph©n ly cña c¸c vïng
ADN cã kÝch th−íc t−¬ng øng víi gen
C¸c lçi trong gi¶m ph©n còng cã thÓ dÉn ®Õn hiÖn t−îng lÆp c¸c
vïng nhiÔm s¾c thÓ cã kÝch th−íc nhá h¬n nh÷ng vïng lÆp mµ
chóng ta ®· ®Ò cËp trªn ®©y, trong ®ã bao gåm c¸c vïng t−¬ng
øng víi chiÒu dµi cña c¸c gen ®¬n lÎ. Ch¼ng h¹n nh−, trao ®æi
chÐo kh«ng c©n trong kú ®Çu gi¶m ph©n I cã thÓ dÉn ®Õn mét
nhiÔm s¾c thÓ mÊt ®o¹n, trong khi mét nhiÔm s¾c thÓ kh¸c lÆp
®o¹n. Nh− minh häa trªn H×nh 21.12, c¸c yÕu tè vËn ®éng trong
hÖ gen lµ nh÷ng vÞ trÝ mµ c¸c nhiÔm s¾c tö kh«ng chÞ em cã thÓ
trao ®æi chÐo víi nhau, thËm chÝ ngay c¶ khi chóng kh«ng cã
nh÷ng tr×nh t−¬ng ®ång xÕp th¼ng hµng chÝnh x¸c víi nhau.
Ngoµi ra, hiÖn t−îng “tr−ît” cã thÓ x¶y ra trong sao chÐp
ADN, ch¼ng h¹n nh− m¹ch lµm khu«n xª dÞch so víi m¹ch
t−¬ng ®ång míi ®−îc tæng hîp, hoÆc mét phÇn cña m¹ch lµm
khu«n bÞ bé m¸y sao chÐp bá qua hay trong tr−êng hîp kh¸c nã
®−îc dïng lµm khu«n hai lÇn. KÕt qu¶ lµ mét ph©n ®o¹n ADN
bÞ mÊt ®i hoÆc lÆp l¹i. Cã thÓ dÔ dµng t−ëng t−îng ra c¸ch mµ
nh÷ng lçi nh− vËy cã thÓ xuÊt hiÖn trong c¸c vïng tr×nh tù lÆp
l¹i gièng nh− c¸c tr×nh tù ADN lÆp l¹i ®¬n gi¶n ®· ®−îc m« t¶ ë
trªn. C¸c tr×nh tù ADN lÆp l¹i ®¬n gi¶n víi sè l−îng biÕn ®éng
t¹i mét vÞ trÝ nhÊt ®Þnh, vèn ®−îc dïng cho ph©n tÝch STR, cã
thÓ lµ do nh÷ng lçi gièng nh− vËy. C¸c b»ng chøng vÒ trao ®æi
chÐo kh«ng c©n vµ hiÖn t−îng “tr−ît” cña m¹ch khu«n trong
sao chÐp ADN dÉn ®Õn lÆp gen ®−îc t×m thÊy ë nhiÒu hä ®a gen
tån t¹i trong c¸c hÖ gen hiÖn nay.
Sù tiÕn hãa c¸c gen cã chøc n¨ng liªn
quan víi nhau: C¸c gen globin ë ng−êi
C¸c sù kiÖn lÆp ®o¹n nhiÔm s¾c thÓ hay lÆp gen cã thÓ dÉn ®Õn
sù tiÕn hãa cña c¸c gen cã chøc n¨ng liªn quan ®Õn nhau, ch¼ng
h¹n nh− c¸c hä gen m· hãa cho α-globin vµ β-globin (xem
H×nh 21.10b). ViÖc so s¸nh c¸c tr×nh tù gen trong mét hä ®a
gen cã thÓ chØ ra thø tù c¸c gen xuÊt hiÖn. C¸ch tiÕp cËn ®Ó “t¸i
t¹o” l¹i lÞch sö tiÕn hãa cña c¸c gen m· hãa globin ®· chØ ra
r»ng tÊt c¶ nh÷ng gen nµy ®Òu cã nguån gèc tõ mét gen globin
tæ tiªn chung; gen tæ tiªn nµy ®· tr¶i qua hiÖn t−îng lÆp gen råi
ph©n ly thµnh c¸c gen α-globin vµ β-globin tæ tiªn kho¶ng 450
- 500 triÖu n¨m tr−íc (H×nh 21.13, ë trang sau). Mçi gen tæ tiªn
nµy sau ®ã tiÕp tôc ®−îc nh©n ®«i mét vµi lÇn, råi nh÷ng b¶n
sao cña chóng ph©n ly khái nhau vÒ tr×nh tù, dÉn ®Õn h×nh
thµnh c¸c gen thµnh viªn thuéc hä gen nh− hiÖn nay. Trong
thùc tÕ, gen globin tæ tiªn chung còng cã thÓ lµ nguån gèc cña
gen m· hãa protein c¬ liªn kÕt «xy cã tªn gäi lµ myoglobin vµ
protein ë thùc vËt lµ leghemoglobin. Hai lo¹i protein nµy hoÆc
®éng ë d¹ng ®¬n ph©n, vµ c¸c gen cña chóng thuéc “siªu hä
globin”.
TiÕp theo sau c¸c sù kiÖn lÆp gen, sù kh¸c biÖt gi÷a c¸c gen
trong c¸c hä globin râ rµng xuÊt ph¸t tõ c¸c ®ét biÕn ®−îc tÝch
lòy trong c¸c b¶n sao cña gen qua nhiÒu thÕ hÖ. VÝ dô, mét m«
h×nh hiÖn nay cho r»ng chøc n¨ng thiÕt yÕu cña protein α-
globin tr−íc ®©y cã thÓ ®−îc ®¸p øng chØ bëi mét gen duy nhÊt,
do vËy c¸c b¶n sao kh¸c cña gen α-globin ®· cã thÓ tÝch lòy c¸c
®ét biÕn ngÉu nhiªn. RÊt nhiÒu ®ét biÕn cã thÓ ®· g©y h¹i cho
 H×nh 21.12 LÆp gen do trao ®æi chÐo kh«ng c©n. Mét
c¬ chÕ mµ qua ®ã mét gen (hoÆc mét ®o¹n ADN kh¸c) cã thÓ bÞ
lÆp l¹i (nh©n ®«i) lµ sù t¸i tæ hîp x¶y ra trong qu¸ tr×nh gi¶m
ph©n gi÷a c¸c b¶n sao kh¸c nhau cña mét yÕu tè vËn ®éng
n»m s¸t vïng biªn cña c¸c gen. Sù t¸i tæ hîp nh− vËy x¶y ra do
sù “s¾p hµng lÖch” cña hai nhiÔm s¾c tö kh«ng chÞ em thuéc
cÆp nhiÔm s¾c thÓ t−¬ng ®ång dÉn ®Õn sù h×nh thµnh mét
nhiÔm s¾c tö mang hai b¶n sao cña gen, trong khi nhiÔm s¾c tö
cßn l¹i th× kh«ng cã b¶n sao nµo cña gen ®ã.
YÕu tè
vËn ®éng
Gen
C¸c nhiÔm s¾c
tö kh«ng chÞ em
VÞ trÝ
trao ®æi chÐo
Sù b¾t cÆp kh«ng
chÝnh x¸c cña hai
nhiÔm s¾c thÓ t−¬ng
®ång trong gi¶m ph©n
vµ
440 khèi kiÕn thøc 3 Di truyÒn häc
c¬ thÓ sinh vËt, trong khi mét sè ®ét biÕn kh¸c kh«ng g©y hËu
qu¶ g×, nh−ng cã mét sè Ýt ®ét biÕn h¼n lµ ®· lµm thay ®æi chøc
n¨ng cña s¶n phÈm protein theo c¸ch cã lîi cho c¬ thÓ sinh vËt
vµo mét giai ®o¹n sèng nhÊt ®Þnh cña nã ®ång thêi kh«ng lµm
thay ®æi chøc n¨ng vËn chuyÓn «xy cña protein. Cã thÓ gi¶ thiÕt
r»ng: chän läc tù nhiªn ®· t¸c ®éng lªn nh÷ng gen nµy vµ duy
tr× chóng trong quÇn thÓ.
Sù gièng nhau vÒ c¸c tr×nh tù axit amin cña c¸c chuçi
polypeptit α-globin vµ β-globin ñng hé cho m« h×nh lÆp gen vµ
tÝch lòy ®ét biÕn (B¶ng 21.2). Ch¼ng h¹n nh−, tr×nh tù axit
amin cña c¸c β-globin gièng nhau h¬n rÊt nhiÒu so víi tr×nh tù
cña α-globin. Sù tån t¹i cña mét sè gen gi¶ n»m gi÷a c¸c gen
globin ho¹t ®éng lµ mét b»ng chøng bæ sung kh¸c ñng hé cho
m« h×nh nµy (xem H×nh 21.10b). C¸c ®ét biÕn ngÉu nhiªn x¶y
ra ë nh÷ng “gen” nµy qua thêi gian tiÕn hãa cã thÓ ®· lµm háng
sù biÓu hiÖn chøc n¨ng b×nh th−êng cña chóng.
TiÕn hãa cña c¸c gen cã chøc n¨ng míi
Trong qu¸ tr×nh tiÕn hãa cña c¸c hä gen globin, hiÖn t−îng lÆp
gen vµ ph©n ly sau ®ã ®· t¹o nªn c¸c gen thµnh viªn mµ s¶n
phÈm cña chóng ®Òu thùc hiÖn chøc n¨ng gièng nhau (vËn
chuyÓn «xy). Theo mét c¸ch kh¸c, mét b¶n sao cña gen ®−îc
nh©n ®«i cã thÓ tr¶i qua nh÷ng biÕn ®æi dÉn ®Õn sù xuÊt hiÖn
mét chøc n¨ng hoµn toµn míi cña s¶n phÈm protein. C¸c gen
m· hãa lysozyme vµ α-lactalbumin lµ mét vÝ dô nh− vËy.
Lysozyme lµ mét enzym gióp b¶o vÖ c¬ thÓ ®éng vËt khái
sù l©y nhiÔm cña vi khuÈn b»ng viÖc xóc t¸c thñy ph©n thµnh tÕ
bµo vi khuÈn; α-lactalbumin lµ mét protein kh«ng cã chøc n¨ng
enzym, thay vµo ®ã nã gi÷ vai trß trong qu¸ tr×nh s¶n xuÊt s÷a ë
®éng vËt cã vó. Hai protein nµy rÊt gièng nhau vÒ tr×nh tù axit
amin vµ cÊu tróc kh«ng gian ba chiÒu. C¶ hai gen ®−îc t×m thÊy
®ång thêi cã mÆt ë c¸c loµi ®éng vËt cã vó, nh−ng ë chim chØ
t×m thÊy gen m· hãa lysozyme. §iÒu nµy chØ ra r»ng vµo mét
thêi ®iÓm nhÊt ®Þnh nµo ®ã trong qu¸ khø, sau khi c¸c nh¸nh
dÉn ®Õn h×nh thµnh c¸c loµi ®éng vËt cã vó
vµ chim ph©n ly khái nhau, gen lysozyme
®· tr¶i qua mét sù kiÖn lÆp gen trong nh¸nh
tiÕn hãa h×nh thµnh c¸c ®éng vËt cã x−¬ng
sèng, nh−ng kh«ng x¶y ra trong nh¸nh tiÕn
hãa cña chim. Cuèi cïng, mét b¶n sao cña
gen lysozym ®· ®−îc nh©n ®«i dÉn ®Õn sù
tiÕn hãa h×nh thµnh gen m· hãa α-
lactanbomin vèn lµ mét protein cã chøc
n¨ng kh¸c biÖt ho¹t toµn.
Sù s¾p xÕp l¹i c¸c phÇn cña
gen: nh©n ®«i vµ tr¸o exon
Sù s¾p xÕp l¹i c¸c tr×nh tù ADN s½n cã
trong c¸c gen còng ®· gãp phÇn vµo sù tiÕn
hãa hÖ gen. Sù cã mÆt cña intron trong phÇn
lín c¸c gen ë sinh vËt nh©n thËt ®a bµo cã
thÓ ®· thóc ®Èy sù tiÕn hãa cña c¸c protein
cã tiÒm n¨ng h÷u dông míi b»ng viÖc gia
t¨ng hiÖn t−îng lÆp ®o¹n hay s¾p xÕp l¹i vÞ
trÝ cña c¸c exon trong hÖ gen. Chóng ta nhí
l¹i tõ Ch−¬ng 17 r»ng mçi exon th−êng m·
hãa cho mét miÒn cã cÊu tróc vµ chøc n¨ng
®Æc thï cña protein.
Chóng ta còng ®· biÕt trao ®æi chÐo
kh«ng c©n trong qu¸ tr×nh gi¶m ph©n cã thÓ
dÉn ®Õn hiÖn t−îng lÆp gen trªn mét nhiÔm
s¾c thÓ ®ång thêi lµm mÊt gen trªn nhiÔm
s¾c thÓ t−¬ng ®ång víi nã (xem H×nh
21.12). B»ng mét qu¸ tr×nh t−¬ng tù, mét
exon nhÊt ®Þnh trong gen cã thÓ bÞ nh©n ®«i
trªn mét nhiÔm s¾c thÓ, song l¹i bÞ mÊt ®i
trªn nhiÔm s¾c thÓ kia. C¸c gen mang c¸c
exon lÆp l¹i cã thÓ m· hãa cho mét lo¹i
protein chøa hai b¶n sao cña mét miÒn
protein. Sù thay ®æi nµy trong cÊu tróc cã
thÓ lµm t¨ng c−êng sù biÓu hiÖn chøc n¨ng
cña protein nÕu protein ®ã lóc nµy trë nªn
æn ®Þnh h¬n, vµ t¨ng kh¶ n¨ng liªn kÕt víi
mét chÊt g¾n nhÊt ®Þnh hoÆc lµm thay ®æi
mét sè thuéc tÝnh kh¸c. Kh¸ nhiÒu gen m·
 H×nh 21.13 Mét m« h×nh tiÕn hãa cña c¸c hä gen α-globin vµ β-globin
tõ gen globin “tæ tiªn” duy nhÊt.
C¸c yÕu tè tr×nh tù mµu xanh lôc lµ c¸c gen gi¶. H·y gi¶i thÝch b»ng c¸ch nµo chóng cã thÓ xuÊt hiÖn
sau khi ®· x¶y ra c¸c sù kiÖn lÆp gen.
B¶ng 21.2 TØ lÖ gièng nhau trong tr×nh tù axit amin
gi÷a c¸c protein globin ë ng−êi
Gen globin “tæ tiªn”
Gen “tæ tiªn” ®−îc
nh©n ®«i (lÆp gen)
§ét biÕn tÝch lòy ë
c¶ hai b¶n sao
VËn ®éng tíi c¸c
nhiÔm s¾c thÓ kh¸c
TiÕp tôc lÆp gen vµ
tÝch lòy ®ét biÕn
Hä gen α-globin trªn
nhiÔm s¾c thÓ sè 16
Hä gen α-globin trªn
nhiÔm s¾c thÓ sè 11
Thêi
gian
tiÕn
hãa
C¸c lo¹i α
α
α
α-globin C¸c lo¹i β
β
β
β-globin
C¸c lo¹i
α
α
α
α-globin
C¸c lo¹i
β
β
β
β-globin
[hsgs.edu.vn] Campbell_Ch21_HeGen&TienHoa (1).pdf
[hsgs.edu.vn] Campbell_Ch21_HeGen&TienHoa (1).pdf
[hsgs.edu.vn] Campbell_Ch21_HeGen&TienHoa (1).pdf
[hsgs.edu.vn] Campbell_Ch21_HeGen&TienHoa (1).pdf
[hsgs.edu.vn] Campbell_Ch21_HeGen&TienHoa (1).pdf
[hsgs.edu.vn] Campbell_Ch21_HeGen&TienHoa (1).pdf
[hsgs.edu.vn] Campbell_Ch21_HeGen&TienHoa (1).pdf
[hsgs.edu.vn] Campbell_Ch21_HeGen&TienHoa (1).pdf
[hsgs.edu.vn] Campbell_Ch21_HeGen&TienHoa (1).pdf

Contenu connexe

Similaire à [hsgs.edu.vn] Campbell_Ch21_HeGen&TienHoa (1).pdf

Gt benh noi_khoa_gia_suc
Gt benh noi_khoa_gia_sucGt benh noi_khoa_gia_suc
Gt benh noi_khoa_gia_sucnowty
 
Vi sinh ký sinh trùng
Vi sinh ký sinh trùngVi sinh ký sinh trùng
Vi sinh ký sinh trùngTS DUOC
 
Tài liệu vi sinh ký sinh trùng - Bộ Y Tế
Tài liệu vi sinh ký sinh trùng - Bộ Y TếTài liệu vi sinh ký sinh trùng - Bộ Y Tế
Tài liệu vi sinh ký sinh trùng - Bộ Y TếĐiều Dưỡng
 
Ds kythuat sxdp_t2_w12
Ds kythuat sxdp_t2_w12Ds kythuat sxdp_t2_w12
Ds kythuat sxdp_t2_w12Phi Phi
 
Nghiên cứu quy trình công nghệ lên men bã dứa làm thức ăn cho bò sữa
Nghiên cứu quy trình công nghệ lên men bã dứa làm thức ăn cho bò sữa  Nghiên cứu quy trình công nghệ lên men bã dứa làm thức ăn cho bò sữa
Nghiên cứu quy trình công nghệ lên men bã dứa làm thức ăn cho bò sữa Buu Dang
 
Giáo trình dạy học hiện đại
Giáo trình dạy học hiện đạiGiáo trình dạy học hiện đại
Giáo trình dạy học hiện đạijackjohn45
 
Bai giang doc hoc moi truong
Bai giang doc hoc moi truongBai giang doc hoc moi truong
Bai giang doc hoc moi truongtuanvuls
 
Benh ngoai phu khoa - dao tao bs yhct
Benh ngoai   phu khoa - dao tao bs yhctBenh ngoai   phu khoa - dao tao bs yhct
Benh ngoai phu khoa - dao tao bs yhctThanh Đặng
 
03 benhhoc ngoai phu yhct
03 benhhoc ngoai phu yhct03 benhhoc ngoai phu yhct
03 benhhoc ngoai phu yhctTS DUOC
 
Ds kythuat sxdp_t1_w
Ds kythuat sxdp_t1_wDs kythuat sxdp_t1_w
Ds kythuat sxdp_t1_wTu Sắc
 
Đóng góp của ngành Công nghệ sinh học Việt Nam vào nền kinh tế tri thức: Thực...
Đóng góp của ngành Công nghệ sinh học Việt Nam vào nền kinh tế tri thức: Thực...Đóng góp của ngành Công nghệ sinh học Việt Nam vào nền kinh tế tri thức: Thực...
Đóng góp của ngành Công nghệ sinh học Việt Nam vào nền kinh tế tri thức: Thực...Kien Thuc
 
Xq nhi bat thuong bam sinh than
Xq nhi bat thuong bam sinh thanXq nhi bat thuong bam sinh than
Xq nhi bat thuong bam sinh thanMartin Dr
 
Chon hoc sinh gioi 8
Chon hoc sinh gioi 8Chon hoc sinh gioi 8
Chon hoc sinh gioi 8lollipop_ikuz
 
Giáo trình Toán sinh thái
Giáo trình Toán sinh thái Giáo trình Toán sinh thái
Giáo trình Toán sinh thái Trong Nguyen Dinh
 
KIEM-NGHIEM-DUOC-PHAM.pdf
KIEM-NGHIEM-DUOC-PHAM.pdfKIEM-NGHIEM-DUOC-PHAM.pdf
KIEM-NGHIEM-DUOC-PHAM.pdfNgô Vân
 
Làm phân ủ thật đơn giản
Làm phân ủ thật đơn giảnLàm phân ủ thật đơn giản
Làm phân ủ thật đơn giảnLoc Nguyen
 

Similaire à [hsgs.edu.vn] Campbell_Ch21_HeGen&TienHoa (1).pdf (20)

Gt benh noi_khoa_gia_suc
Gt benh noi_khoa_gia_sucGt benh noi_khoa_gia_suc
Gt benh noi_khoa_gia_suc
 
Vi sinh ký sinh trùng
Vi sinh ký sinh trùngVi sinh ký sinh trùng
Vi sinh ký sinh trùng
 
Tài liệu vi sinh ký sinh trùng - Bộ Y Tế
Tài liệu vi sinh ký sinh trùng - Bộ Y TếTài liệu vi sinh ký sinh trùng - Bộ Y Tế
Tài liệu vi sinh ký sinh trùng - Bộ Y Tế
 
Ds kythuat sxdp_t2_w12
Ds kythuat sxdp_t2_w12Ds kythuat sxdp_t2_w12
Ds kythuat sxdp_t2_w12
 
Nghiên cứu quy trình công nghệ lên men bã dứa làm thức ăn cho bò sữa
Nghiên cứu quy trình công nghệ lên men bã dứa làm thức ăn cho bò sữa  Nghiên cứu quy trình công nghệ lên men bã dứa làm thức ăn cho bò sữa
Nghiên cứu quy trình công nghệ lên men bã dứa làm thức ăn cho bò sữa
 
Giáo trình dạy học hiện đại
Giáo trình dạy học hiện đạiGiáo trình dạy học hiện đại
Giáo trình dạy học hiện đại
 
Bai giang doc hoc moi truong
Bai giang doc hoc moi truongBai giang doc hoc moi truong
Bai giang doc hoc moi truong
 
Benh ngoai phu khoa - dao tao bs yhct
Benh ngoai   phu khoa - dao tao bs yhctBenh ngoai   phu khoa - dao tao bs yhct
Benh ngoai phu khoa - dao tao bs yhct
 
03 benhhoc ngoai phu yhct
03 benhhoc ngoai phu yhct03 benhhoc ngoai phu yhct
03 benhhoc ngoai phu yhct
 
Đề tài: Tình trạng dinh dưỡng, thiếu máu, nhiễm ký sinh trùng đường ruột
Đề tài: Tình trạng dinh dưỡng, thiếu máu, nhiễm ký sinh trùng đường ruộtĐề tài: Tình trạng dinh dưỡng, thiếu máu, nhiễm ký sinh trùng đường ruột
Đề tài: Tình trạng dinh dưỡng, thiếu máu, nhiễm ký sinh trùng đường ruột
 
Ds kythuat sxdp_t1_w
Ds kythuat sxdp_t1_wDs kythuat sxdp_t1_w
Ds kythuat sxdp_t1_w
 
bai giang di truyen1
bai giang di truyen1bai giang di truyen1
bai giang di truyen1
 
Đóng góp của ngành Công nghệ sinh học Việt Nam vào nền kinh tế tri thức: Thực...
Đóng góp của ngành Công nghệ sinh học Việt Nam vào nền kinh tế tri thức: Thực...Đóng góp của ngành Công nghệ sinh học Việt Nam vào nền kinh tế tri thức: Thực...
Đóng góp của ngành Công nghệ sinh học Việt Nam vào nền kinh tế tri thức: Thực...
 
Xq nhi bat thuong bam sinh than
Xq nhi bat thuong bam sinh thanXq nhi bat thuong bam sinh than
Xq nhi bat thuong bam sinh than
 
Chon hoc sinh gioi 8
Chon hoc sinh gioi 8Chon hoc sinh gioi 8
Chon hoc sinh gioi 8
 
Giáo trình Toán sinh thái
Giáo trình Toán sinh thái Giáo trình Toán sinh thái
Giáo trình Toán sinh thái
 
KIEM-NGHIEM-DUOC-PHAM.pdf
KIEM-NGHIEM-DUOC-PHAM.pdfKIEM-NGHIEM-DUOC-PHAM.pdf
KIEM-NGHIEM-DUOC-PHAM.pdf
 
Làm phân ủ thật đơn giản
Làm phân ủ thật đơn giảnLàm phân ủ thật đơn giản
Làm phân ủ thật đơn giản
 
Ppdt dich hai1
Ppdt dich hai1Ppdt dich hai1
Ppdt dich hai1
 
Viemkhop (1)
Viemkhop (1)Viemkhop (1)
Viemkhop (1)
 

[hsgs.edu.vn] Campbell_Ch21_HeGen&TienHoa (1).pdf

  • 1. 426 21.1. C¸c ph−¬ng ph¸p míi ® gióp gia t¨ng tèc ®é gi¶i tr×nh tù c¸c hÖ gen 21.2. C¸c nhµ khoa häc øng dông tin sinh häc ®Ó ph©n tÝch c¸c hÖ gen vµ chøc n¨ng cña chóng 21.3. C¸c hÖ gen kh¸c nhau vÒ kÝch cì, sè gen vµ mËt ®é gen 21.4. Sinh vËt nh©n thËt ®a bµo cã nhiÒu ADN kh«ng m hãa vµ nhiÒu hä ®a gen 21.5. LÆp ®o¹n, t¸i s¾p xÕp vµ ®ét biÕn trong tr×nh tù ADN ®ãng gãp vµo qu¸ tr×nh tiÕn hãa 21.6. So s¸nh c¸c tr×nh tù hÖ gen cung cÊp b»ng chøng vÒ c¸c qu¸ tr×nh tiÕn hãa vµ ph¸t triÓn g−êi phô n÷ trªn Hinh 21.1 vµ con tinh tinh bªn c¹nh c« ®ang c−êi ®ïa víi nhau – cã thËt vËy kh«ng? Hä cã hiÓu nh÷ng “c©u ®ïa giìn” vµ ®¸p l¹i b»ng vÎ mÆt cïng víi c¸c tiÕng ph¸t ©m cña nhau kh«ng? Nhê nh÷ng kü thuËt ®−îc ph¸t triÓn gÇn ®©y trong viÖc gi¶i tr×nh tù nhanh toµn bé c¸c hÖ gen, giê ®©y chóng ta cã thÓ tuyªn bè vÒ c¬ së di truyÒn liªn quan ®Õn c¸c c©u hái hÊp dÉn nh− võa ®−îc nªu. Tinh tinh (Pan troglodytes) lµ loµi cã quan hÖ sèng gÇn chóng ta nhÊt trªn c©y tiÕn hãa cña sù sèng. HÖ gen cña nã ®−îc gi¶i tr×nh tù hoµn toµn vµo n¨m 2005, nghÜa lµ kho¶ng 2 n¨m sau khi viÖc gi¶i tr×nh tù hÖ gen ng−êi hoµn thµnh phÇn lín. Giê ®©y chóng ta ®· cã thÓ so s¸nh hÖ gen cña chóng ta víi hÖ gen cña tinh tinh vµ ®èi chiÕu tõng baz¬ nit¬ nh»m lµm s¸ng tá nh÷ng th«ng tin di truyÒn kh¸c nhau nµo ®· dÉn ®Õn c¸c ®Æc ®iÓm kh¸c biÖt gi÷a hai loµi linh tr−ëng nµy. Ngoµi viÖc ®· x¸c ®Þnh ®−îc tr×nh tù hÖ gen ®Çy ®ñ cña ng−êi vµ tinh tinh, c¸c nhµ nghiªn cøu còng ®· thu ®−îc tr×nh tù hÖ gen ®Çy ®ñ cña vi khuÈn E. coli vµ nhiÒu loµi sinh vËt nh©n s¬ kh¸c, còng nh− cña mét sè loµi sinh vËt nh©n thËt, bao gåm Saccharomyces ceriviseae (nÊm men bia), Caenorhabitis elegans (mét loµi giun trßn), Drosophila melanogaster (ruåi giÊm), Mus musculus (chuét b¹ch) vµ Macaca mulatta (khØ rhezut). ThËm chÝ c¸c ph©n ®o¹n ADN tõ c¸c loµi ®· bÞ tuyÖt chñng, nh− gÊu hang (Ursus spelaneus) hay voi mamót l«ng (Mammuthus primigenius) còng ®· ®−îc gi¶i tr×nh tù. C¸c tr×nh tù hÖ gen ®Çy ®ñ hoÆc tõng phÇn b¶n th©n chóng lµ ®èi t−îng ®−îc quan t©m nghiªn cøu, ®ång thêi chóng cung cÊp nh÷ng th«ng tin s©u h¬n vÒ tiÕn hãa vµ nhiÒu qu¸ tr×nh sinh häc kh¸c. B»ng viÖc më réng so s¸nh hÖ gen ng−êi vµ tinh tinh víi c¸c loµi linh tr−ëng kh¸c còng nh− víi c¸c loµi ®éng vËt cã quan hÖ di truyÒn xa h¬n, chóng ta cã thÓ t×m thÊy tËp hîp c¸c gen quy ®Þnh sù kh¸c biÖt râ rÖt cña mçi nhãm sinh vËt. Xa h¬n mét chót, sù so s¸nh víi c¸c hÖ gen vi khuÈn, vi khuÈn cæ (archaea), nguyªn sinh ®éng vËt vµ c¸c loµi thùc vËt sÏ gióp chóng ta lµm s¸ng tá lÞch sö tiÕn hãa l©u dµi liªn quan ®Õn c¸c gen ®−îc c¸c loµi cïng nhau “chia sΔ cïng víi c¸c s¶n phÈm cña chóng. Víi viÖc hÖ gen cña nhiÒu loµi ®· ®−îc gi¶i tr×nh tù ®Çy ®ñ, c¸c nhµ khoa häc cã thÓ nghiªn cøu c¸c tËp hîp gen hoµn chØnh vµ sù t−¬ng t¸c cña chóng theo mét h−íng nghiªn cøu ®−îc gäi lµ hÖ gen häc (genomics). C¸c nç lùc gi¶i tr×nh tù theo h−íng nghiªn cøu nµy ®· vµ ®ang tiÕp tôc t¹o ra nh÷ng khèi d÷ liÖu khæng lå. Nhu cÇu cÇn xö lý mét l−îng th«ng tin trµn ngËp ®ang t¨ng lªn nhanh chãng ®· dÉn ®Õn sù h×nh thµnh cña lÜnh vùc tin sinh häc (bioinformatics), lÜnh vùc øng dông c¸c ph−¬ng ph¸p khoa häc m¸y tÝnh vµo viÖc l−u gi÷ vµ ph©n tÝch c¸c sè liÖu sinh häc. Chóng ta sÏ b¾t ®Çu ch−¬ng nµy b»ng viÖc th¶o luËn vÒ hai h−íng nghiªn cøu, gåm c¸c kü thuËt gi¶i tr×nh tù hÖ gen vµ mét sè tiÕn bé trong viÖc øng dông tin sinh häc. Sau ®ã chóng ta sÏ s¬ l−îc vÒ nh÷ng hiÓu biÕt thu nhËn ®−îc tõ viÖc gi¶i tr×nh tù c¸c hÖ gen ®· ®−îc tiÕn hµnh ®Õn nay. Sau ®ã chóng ta sÏ m« t¶ vÒ thµnh phÇn hÖ gen ng−êi nh− mét hÖ gen ®¹i diÖn cho c¸c sinh vËt nh©n thËt ®a bµo. Cuèi cïng, chóng ta sÏ cïng t×m hiÓu nh÷ng quan ®iÓm vÒ qu¸ tr×nh tiÕn hãa vµ c¸c c¬ chÕ ph¸t triÓn vèn lµ c¬ së t¹o nªn sù ®a d¹ng vÜ ®¹i cña sù sèng hiÖn cã trªn Tr¸i §Êt. N C¸c kh¸i niÖm chÝnh Tæng quan §äc c¸c l¸ trªn c©y sù sèng H×nh 21.1 Th«ng tin nµo trong hÖ gen ®· t¹o nªn con ng−êi vµ tinh tinh ? C¸c hÖ gen vµ sù tiÕn hãa cña chóng
  • 2. Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 427 ViÖc gi¶i tr×nh tù hÖ gen ng−êi, mét dù ¸n tham väng víi tªn gäi Dù ¸n HÖ gen Ng−êi (HGP) ®−îc b¾t ®Çu vµo n¨m 1990. §−îc tæ chøc thµnh mét Tæ hîp (conxoocxi«m) gåm nhiÒu nhµ khoa häc quèc tÕ ®−îc céng ®ång tµi trî, dù ¸n ®· ®−îc triÓn khai ë 20 trung t©m gi¶i tr×nh tù lín thuéc 6 quèc gia bªn c¹nh nhiÒu phßng thÝ nghiÖm nhá thùc hiÖn c¸c nh¸nh cña dù ¸n. Sau khi viÖc gi¶i tr×nh tù hÖ gen ng−êi ®−îc hoµn thµnh phÇn lín vµo n¨m 2003, tr×nh tù cña mçi nhiÔm s¾c thÓ ®· ®−îc ph©n tÝch kü l−ìng vµ ®−îc m« t¶ trong hµng lo¹t c¸c bµi b¸o khoa häc, trong ®ã bµi b¸o cuèi cïng liªn quan ®Õn tr×nh tù cña nhiÔm s¾c thÓ sè 1 ®−îc c«ng bè vµo n¨m 2006. Víi kÕt qu¶ nµy, c¸c nhµ nghiªn cøu coi viÖc gi¶i tr×nh tù hÖ gen ng−êi ®· “chÝnh thøc hoµn thµnh”. §Ó ®¹t ®−îc nh÷ng cét mèc ®ã, dù ¸n ®· ®−îc triÓn khai qua ba giai ®o¹n víi c¸c ph¸t hiÖn ngµy cµng chi tiÕt h¬n vÒ hÖ gen ng−êi; ba giai ®o¹n ®ã gåm: lËp b¶n ®å liªn kÕt, lËp b¶n ®å vËt lý vµ gi¶i tr×nh tù ADN. Gi¶i tr×nh tù hÖ gen qua ba giai ®o¹n Tr−íc khi Dù ¸n HÖ gen Ng−êi b¾t ®Çu, c¸c nghiªn cøu tr−íc ®ã ®· ph¸c th¶o ®−îc mét b−íc tranh s¬ bé vÒ tæ chøc hÖ gen cña nhiÒu c¬ thÓ sinh vËt kh¸c nhau. VÝ dô nh−, viÖc ph©n tÝch kiÓu h×nh nhiÔm s¾c thÓ cña nhiÒu loµi ®· cho biÕt sè l−îng nhiÔm s¾c thÓ vµ kiÓu h×nh nhuém b¨ng cña chóng (xem H×nh 13.3). Vµ ®èi víi mét sè gen, vÞ trÝ cña chóng trªn nhiÔm s¾c thÓ ®· ®−îc x¸c ®Þnh bëi ph−¬ng ph¸p lai huúnh quang t¹i chç (FISH), ph−¬ng ph¸p mµ trong ®ã ng−êi ta ®em lai c¸c mÉu dß ph¸t huúnh quang víi c¸c nhiÔm s¾c thÓ nguyªn vÑn ®−îc cè ®Þnh (xem H×nh 15.1). B¶n ®å di truyÒn tÕ bµo ®−îc x©y dùng theo c¸ch nµy ®· cung cÊp nh÷ng th«ng tin khëi ®Çu cho viÖc lËp b¶n ®å chi tiÕt h¬n sau nµy. Khi ®· cã trong tay b¶n ®å di truyÒn tÕ bµo cña c¸c nhiÔm s¾c thÓ, giai ®o¹n ®Çu tiªn cña tiÕn tr×nh gi¶i tr×nh tù hÖ gen ng−êi lµ x©y dùng mét b¶n ®å liªn kÕt (mét lo¹i b¶n ®å di truyÒn; xem Ch−¬ng 15) cña kho¶ng vµi ngh×n dÊu chuÈn di truyÒn ®−îc ph©n bè kh¾p c¸c nhiÔm s¾c thÓ (Hinh 21.2 giai ®o¹n ). TrËt tù vÞ trÝ cña c¸c dÊu chuÈn vµ kho¶ng c¸ch gi÷a chóng trªn b¶n ®å ®−îc x¸c ®Þnh trªn c¬ së tÇn sè t¸i tæ hîp (xem H×nh 15.11). C¸c dÊu chuÈn di truyÒn cã thÓ lµ c¸c gen hoÆc lµ c¸c ®o¹n tr×nh tù ADN kh¸c cã thÓ x¸c ®Þnh ®−îc, ch¼ng h¹n nh− c¸c RFLP hay c¸c tr×nh tù lÆp l¹i kÕ tiÕp ng¾n (STR) ®· ®−îc ®Ò cËp ë Ch−¬ng 20. TÝnh ®Õn n¨m 1992, c¸c nhµ nghiªn cøu ®· tËp hîp ®−îc mét b¶n ®å liªn kÕt ë ng−êi gåm kho¶ng 5000 dÊu chuÈn kh¸c nhau. Mét b¶n ®å nh− vËy ®· gióp hä x¸c ®Þnh ®−îc vÞ trÝ cña c¸c dÊu chuÈn kh¸c, bao gåm c¶ c¸c gen, b»ng viÖc kiÓm tra tÝnh liªn kÕt di truyÒn cña chóng víi c¸c dÊu chuÈn ®· biÕt tr−íc ®ã. Ngoµi ra, nã cßn cã gi¸ trÞ lµ phÇn cèt lâi cña viÖc lËp b¶n ®å chi tiÕt h¬n t¹i nh÷ng vïng nhÊt ®Þnh trong hÖ gen. Giai ®o¹n tiÕp theo lµ viÖc lËp b¶n ®å vËt lý hÖ gen ng−êi. Trong b¶n ®å vËt lý, kho¶ng c¸ch gi÷a c¸c dÊu chuÈn ®−îc biÓu diÔn bëi ®¬n vÞ vËt lý, th−êng lµ sè cÆp baz¬ nit¬ (bp) däc theo ph©n tö ADN. §Ó lËp mét b¶n ®å hÖ gen hoµn chØnh, mét b¶n ®å vËt lý ®−îc thiÕt lËp b»ng c¸ch c¾t ph©n tö ADN t−¬ng øng víi mét nhiÔm s¾c thÓ thµnh mét sè c¸c ph©n ®o¹n giíi h¹n råi x¸c ®Þnh trËt tù cña c¸c ph©n ®o¹n trªn ph©n tö ADN nhiÔm s¾c thÓ gèc. Ch×a khãa ®Ó thùc hiÖn ®iÒu nµy lµ cÇn t¹o ra c¸c ph©n ®o¹n ADN gèi lªn nhau, råi sö dông c¸c mÉu dß hoÆc ph−¬ng ph¸p gi¶i tr×nh tù tù ®éng c¸c tr×nh tù ®Çu cuèi cña nh÷ng ph©n ®o¹n nµy ®Ó t×m ra c¸c tr×nh tù gèi lªn nhau ®ã (H×nh 21.2, giai ®o¹n ). B»ng c¸ch ®ã, cã thÓ ®Æt c¸c ph©n ®o¹n vµo ®óng trËt tù t−¬ng øng cña chóng trªn nhiÔm s¾c thÓ. Nguån cung cÊp c¸c ph©n ®o¹n ADN dïng cho viÖc lËp b¶n ®å vËt lý dùa trªn viÖc nh©n dßng ADN. §Ó gi¶i tr×nh tù c¸c hÖ gen lín, c¸c nhµ khoa häc ph¶i thùc hiÖn lÆp l¹i nhiÒu lÇn c¸c c«ng viÖc c¾t ADN, nh©n dßng vµ lËp b¶n ®å vËt lý. C¸c vect¬ nh©n dßng ®Çu tiªn th−êng ®−îc sö dông lµ nhiÔm s¾c thÓ nh©n t¹o nÊm men (YAC) cho phÐp mang nh÷ng ®o¹n ADN cµi dµi ®Õn hµng triÖu bp, hoÆc nhiÔm s¾c thÓ nh©n t¹o vi khuÈn (BAC) vèn ®iÓn h×nh cã thÓ mang c¸c ®o¹n cµi dµi tõ 100.000 ®Õn 300.000 bp. Sau khi nh÷ng ®o¹n ADN dµi nh− vËy ®· ®−îc x¸c ®Þnh trËt tù trªn nhiÔm s¾c thÓ chÝnh x¸c, chóng sÏ ®−îc c¾t thµnh nh÷ng ph©n ®o¹n nhá h¬n, råi ®−îc nh©n dßng vµo c¸c 21.1 Kh¸i niÖm C¸c ph−¬ng ph¸p míi ® gióp gia t¨ng tèc ®é gi¶i tr×nh tù c¸c hÖ gen H×nh 21.2 Ph−¬ng ph¸p gi¶i tr×nh tù toµn hÖ gen qua ba giai ®o¹n. B¾t ®Çu tõ mét b¶n ®å di truyÒn tÕ bµo cña mçi nhiÔm s¾c thÓ, c¸c nhµ nghiªn cøu liªn quan ®Õn Dù ¸n HÖ gen Ng−êi ®· tiÕn hµnh c¸c nghiªn cøu qua ba giai ®o¹n ®Ó ®¹t ®−îc môc tiªu cuèi cïng, ®ã lµ gi¶i tr×nh tù toµn bé tõng nucleotide trªn mçi nhiÔm s¾c thÓ. B¶n ®å di truyÒn tÕ bµo KiÓu h×nh nhuém b¨ng cña nhiÔm s¾c thÓ vµ vÞ trÝ c¸c gen ®Æc thï ®−îc x¸c ®Þnh b»ng ph−¬ng ph¸p lai insitu (FISH) VÞ trÝ gen ®−îc x¸c ®Þnh b»ng FISH C¸c b¨ng nhiÔm s¾c thÓ sau khi ®−îc nhuém B¶n ®å liªn kÕt X¸c ®Þnh trËt tù cña c¸c dÊu chuÈn di truyÒn nh− RFLP, STR vµ c¸c ®a h×nh di truyÒn kh¸c (kho¶ng 200 dÊu chuÈn trªn mçi nhiÔm s¾c thÓ) B¶n ®å vËt lý X¸c ®Þnh trËt tù cña c¸c ph©n ®o¹n lín gèi lªn nhau ®−îc nh©n dßng bëi c¸c vect¬ YAC vµ BAC; sau ®ã lµ trËt tù cña c¸c ®o¹n ng¾n h¬n ®−îc nh©n dßng bëi c¸c vect¬ plasmid vµ phag¬ Gi¶i tr×nh tù ADN X¸c ®Þnh tr×nh tù cña c¸c nucleotide trªn mçi ®o¹n ng¾n vµ ghÐp nèi c¸c tr×nh tù thµnh phÇn víi nhau thµnh tr×nh tù hÖ gen hoµn chØnh C¸c dÊu chuÈn di truyÒn C¸c ®o¹n gèi lªn nhau
  • 3. 428 khèi kiÕn thøc 3 Di truyÒn häc vect¬ plasmid hoÆc phag¬, tr−íc khi nh÷ng ph©n ®o¹n nhá nµy ®−îc dïng ®Ó gi¶i tr×nh tù chi tiÕt. Môc tiªu cuèi cïng cña viÖc lËp b¶n ®å mét hÖ gen lµ x¸c ®Þnh ®−îc tr×nh tù nucleotide hoµn chØnh cña mçi nhiÔm s¾c thÓ (H×nh 21.2, giai ®o¹n ). §èi víi hÖ gen ng−êi, giai ®o¹n nµy ®−îc thùc hiÖn nhê c¸c m¸y gi¶i tr×nh tù sö dông ph−¬ng ph¸p kÕt thóc chuçi dideoxy ®−îc m« t¶ trªn H×nh 20.12. Ngay c¶ khi ®· ®−îc tù ®éng hãa, viÖc gi¶i tr×nh tù cña toµn bé 3,2 tØ cÆp baz¬ trong bé nhiÔm s¾c thÓ ®¬n béi cña ng−êi vÉn cßn lµ mét th¸ch thøc khñng khiÕp. Trong thùc tÕ, mét ®ét ph¸ chÝnh cña Dù ¸n HÖ gen Ng−êi lµ sù ph¸t triÓn cña c«ng nghÖ gi¶i tr×nh tù nhanh. Nh÷ng c¶i tiÕn kü thuËt ®−îc tÝch lòy qua nhiÒu n¨m ®· “mµi dòa” tõng b−íc cña qui tr×nh kü thuËt vèn tèn nhiÒu thêi gian, vµ nhê vËy tèc ®é gi¶i tr×nh tù ®· ®−îc gia tèc mét c¸ch Ên t−îng. NÕu nh− mét phßng thÝ nghiÖm hiÖu qu¶ cã thÓ gi¶i tr×nh tù ®−îc 1000 bp mçi ngµy vµo nh÷ng n¨m 1980, th× ®Õn n¨m 2000, mçi trung t©m nghiªn cøu thuéc Dù ¸n HÖ gen Ng−êi cã thÓ gi¶i tr×nh tù 1000 bp mçi gi©y trong suèt 24 giê mçi ngµy vµ 7 ngµy mçi tuÇn. C¸c ph−¬ng ph¸p nh− vËy cã thÓ ph©n tÝch rÊt nhanh c¸c vËt liÖu sinh häc vµ t¹o ra c¸c khèi d÷ liÖu khæng lå trong thêi gian ng¾n vµ ®−îc gäi chung lµ c¸c ph−¬ng ph¸p “hiÖu n¨ng cao”. C¸c m¸y gi¶i tr×nh tù tù ®éng lµ mét vÝ dô vÒ c¸c thiÕt bÞ thÝ nghiÖm hiÖu n¨ng cao. Trong thùc tiÔn, ba giai ®o¹n ®−îc m« t¶ trªn H×nh 21.2 gèi lªn nhau theo mét c¸ch phøc t¹p h¬n m« h×nh gi¶n l−îc võa ®−îc chóng ta ®Ò cËp; tuy vËy, m« h×nh nµy ph¶n ¸nh ®óng chiÕn l−îc nghiªn cøu tæng thÓ ®−îc dïng trong Dù ¸n HÖ gen Ng−êi. Trong qu¸ tr×nh thùc hiÖn dù ¸n, mét chiÕn l−îc kh¸c nh»m gi¶i tr×nh tù hÖ gen ®· xuÊt hiÖn vµ sau ®ã ®−îc ¸p dông réng r·i nhê hiÖu qu¶ cùc kú cao cña nã. PhÇn tiÕp theo, chóng ta ®Ò cËp ®Õn chiÕn l−îc gi¶i tr×nh tù nµy. Gi¶i tr×nh tù ngÉu nhiªn toµn hÖ gen N¨m 1992, m¹nh d¹n dùa trªn c¸c thµnh tùu míi cña kü thuËt gi¶i tr×nh tù vµ c«ng nghÖ m¸y tÝnh, J. Craig Venter - mét nhµ sinh häc ph©n tö - ®· ph¸t minh ra mét ph−¬ng ph¸p gi¶i tr×nh tù toµn hÖ gen míi. §−îc ®Æt tªn lµ ph−¬ng ph¸p gi¶i tr×nh tù ngÉu nhiªn toµn hÖ gen (hay ph−¬ng ph¸p shotgun), thùc chÊt ph−¬ng ph¸p nµy ®· bá qua c¸c giai ®o¹n lËp b¶n ®å liªn kÕt vµ b¶n ®å vËt lý; thay vµo ®ã, nã b¾t ®Çu ngay b»ng viÖc gi¶i tr×nh tù c¸c ph©n ®o¹n ADN ngÉu nhiªn cña toµn hÖ gen. Sau ®ã, c¸c ch−¬ng tr×nh m¸y tÝnh m¹nh sÏ tiÕn hµnh s¾p xÕp mét sè l−îng lín c¸c ph©n ®o¹n ADN ®· ®−îc gi¶i tr×nh tù, dùa trªn c¸c ®o¹n tr×nh tù ng¾n n»m gèi lªn nhau cña chóng, thµnh mét tr×nh tù liªn tôc duy nhÊt (Hinh 21.3). MÆc dï ban ®Çu bÞ hoµi nghi bëi nhiÒu nhµ khoa häc, gi¸ trÞ cña ph−¬ng ph¸p Vender trë nªn râ rµng vµo n¨m 1995 khi «ng vµ céng sù c«ng bè hÖ gen cña mét loµi sinh vËt ®−îc gi¶i tr×nh tù hoµn chØnh ®Çu tiªn, ®ã lµ vi khuÈn g©y bÖnh tiªu ch¶y Haemophilus influenza. N¨m 1998, Venter thµnh lËp mét c«ng ty cã tªn lµ Celera Genomics vµ tuyªn bè dù ®Þnh gi¶i tr×nh tù toµn bé hÖ gen ng−êi cña m×nh. N¨m n¨m sau, Cerela Genomics vµ Tæ hîp HGP ®ång thêi th«ng b¸o viÖc gi¶i tr×nh tù hÖ gen ng−êi ®· hoµn thµnh phÇn lín, nghÜa lµ sím h¬n hai n¨m so víi tiÕn ®é dù kiÕn ban ®Çu cña Dù ¸n HÖ gen Ng−êi. C¸c ®¹i diÖn cña Tæ hîp HGP chØ ra r»ng viÖc hoµn thµnh gi¶i tr×nh tù hÖ gen ng−êi cña Celera ph¶i dùa nhiÒu vµo c¸c b¶n ®å di truyÒn vµ sè liÖu tr×nh tù cña hä, còng nh− c¸c trang thiÕt bÞ mµ hä thiÕt lËp cho dù ¸n ®· hç trî nhiÒu cho c¸c nç lùc cña Celera. Ng−îc l¹i, Venter còng ®· dïng lý lÏ ®Ó biÖn hé cho hiÖu qu¶ vµ gi¸ thµnh h¹ trong ph−¬ng ph¸p gi¶i tr×nh tù cña Celera, ®ång thêi chØ ra r»ng Tæ hîp HGP còng ®· sö dông c¸c sè liÖu cña hä. Râ rµng c¶ hai ph−¬ng ph¸p ®Òu cã gi¸ trÞ vµ cïng ®ãng gãp vµo viÖc nhanh chãng hoµn thµnh viÖc gi¶i tr×nh tù hÖ gen cña mét sè loµi. HiÖn nay ph−¬ng ph¸p gi¶i tr×nh tù ngÉu nhiªn toµn hÖ gen ®ang ®−îc dïng réng r·i. Theo mét c¸ch ®iÓn h×nh, c¸c ph©n ®o¹n ADN ®−îc nh©n dßng b»ng ba lo¹i vect¬ kh¸c nhau, mçi lo¹i ®−îc cµi mét ph©n ®o¹n x¸c ®Þnh. Kho¶ng c¸ch ®· biÕt gi÷a c¸c ®Çu cña ph©n ®o¹n ADN cµi lµ mét th«ng tin bæ sung gióp m¸y tÝnh cã thÓ s¾p xÕp ®óng c¸c tr×nh tù. Mét nghiªn cøu gÇn ®©y so s¸nh hai chiÕn l−îc gi¶i tr×nh tù ®· chØ ra r»ng ph−¬ng ph¸p shotgun cã thÓ m¾c lçi bá qua mét sè tr×nh tù lÆp l¹i, v× vËy cã thÓ ph¶n ¸nh kh«ng chÝnh x¸c kÝnh th−íc thùc cña hÖ gen vµ cã thÓ bá qua mét sè gen trong nh÷ng vïng nh− vËy trªn nhiÔm s¾c thÓ. C¸c ph−¬ng ph¸p phèi hîp cuèi cïng ®· ®−îc ¸p dông cho hÖ gen ng−êi; trong ®ã ph−¬ng ph¸p shotgun cã tèc ®é nhanh ®−îc hç trî bëi b¶n ®å di truyÒn cña c¸c dßng gen cã lÏ lµ c¸ch h÷u hiÖu nhÊt cho nh÷ng øng dông l©u dµi. §Õn n¨m 2007, vÉn cßn mét phÇn nhá cña hÖ gen ng−êi ch−a ®−îc gi¶i tr×nh tù. Do sù cã mÆt cña tr×nh tù ADN lÆp l¹i vµ bëi mét sè nguyªn nh©n ch−a biÕt kh¸c, mét sè phÇn nhÊt C¾t ADN tõ nhiÒu b¶n sao cña mét nhiÔm s¾c thÓ thµnh c¸c ph©n ®o¹n gèi lªn nhau cã chiÒu dµi ®ñ ng¾n ®Ó cã thÓ gi¶i tr×nh tù. Nh©n dßng mçi ph©n ®o¹n trong c¸c vect¬ plasmid hoÆc phag¬ (xem c¸c H×nh 20.4 vµ 20.5) Gi¶i tr×nh tù tõng ph©n ®o¹n (xem H×nh 20.12) Sö dông phÇn mÒm m¸y tÝnh s¾p xÕp c¸c ph©n ®o¹n theo ®óng trËt tù vÞ trÝ cña chóng H×nh 21.3 Gi¶i tr×nh tù ngÉu nhiªn toµn hÖ gen. Theo ph−¬ng ph¸p nµy, ®−îc ph¸t triÓn bëi Craig Venter vµ c¸c ®ång nghiÖp t¹i C«ng ty Celera Genomics do chÝnh «ng s¸ng lËp, c¸c ®o¹n ADN ®−îc gi¶i tr×nh tù ngÉu nhiªn, råi sau ®ã chóng ®−îc s¾p xÕp theo ®óng trËt tù vÞ trÝ t−¬ng ®èi víi nhau. H·y so s¸nh ph−¬ng ph¸p nµy víi ph−¬ng ph¸p gi¶i tr×nh tù toµn hÖ gen qua ba giai ®o¹n ®−îc m« t¶ trªn H×nh 21.2. C¸c ph©n ®o¹n ë giai ®o¹n 2 trªn h×nh nµy ®−îc vÏ n»m r¶i r¸c, trong khi nh÷ng ph©n ®o¹n ë giai ®o¹n 2 trªn H×nh 21.2 ®−îc vÏ n»m theo trËt tù vÞ trÝ. Sù kh¸c biÖt trong c¸ch vÏ nh− vËy ph¶n ¸nh sù kh¸c biÖt gi÷a hai ph−¬ng ph¸p nh− thÕ nµo?.
  • 4. Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 429 ®Þnh trªn nhiÔm s¾c thÓ cña c¸c c¬ thÓ ®a bµo rÊt khã gi¶i tr×nh tù chi tiÕt bëi c¸c ph−¬ng ph¸p th«ng th−êng. Tho¹t nh×n th× d−êng nh− tr×nh tù hÖ gen cña ng−êi vµ c¸c sinh vËt kh¸c ®¬n gi¶n chØ lµ nh÷ng tr×nh tù “kh« khèc” cña c¸c nucleotide, nghÜa lµ hµng triÖu c¸c “ch÷ c¸i” A, T, G vµ C s¾p xÕp kÕ tiÕp nhau mét c¸ch “buån ch¸n”. §iÒu cèt yÕu ®Ó l−îng d÷ liÖu khæng lå nµy trë nªn cã nghÜa lµ c¸c ph−¬ng ph¸p ph©n tÝch mµ chóng ta sÏ ®Ò cËp ®Õn ë tiÓu môc tiÕp theo. Mçi mét trung t©m trong sè kho¶ng 20 trung t©m gi¶i tr×nh tù tham gia dù ¸n HÖ gen Ng−êi ngµy nµy qua ngµy kh¸c ®· t¹o ra mét l−îng khæng lå c¸c tr×nh tù ADN. Khi sè liÖu ngµy cµng ®−îc tÝch lòy, th× nhu cÇu n¶y sinh lµ ph¶i cã c¸ch qu¶n lý vµ theo dâi tÊt c¶ c¸c tr×nh tù ®· ®−îc ph¸t hiÖn. Nhê ®· chuÈn bÞ tõ tr−íc, c¸c nhµ khoa häc vµ c¸c c¬ quan qu¶n lý tham gia Dù ¸n HÖ gen Ng−êi ®· ®Æt ra mét môc tiªu ngay tõ ®Çu lµ thiÕt lËp c¸c ng©n hµng d÷ liÖu, hay cßn gäi lµ c¬ së d÷ liÖu, vµ ngµy cµng hoµn thiÖn c¸c phÇn mÒm ph©n tÝch d÷ liÖu. Nh÷ng c¬ së d÷ liÖu vµ nh÷ng phÇn mÒm nµy sau ®ã ®−îc tËp hîp l¹i vµ cã thÓ dÔ dµng truy cËp vµ sö dông trªn m«i tr−êng Internet. ViÖc hoµn thµnh môc tiªu nµy cña dù ¸n ®· gãp phÇn thóc ®Èy viÖc ph©n tÝch c¸c tr×nh tù ADN nhê t¹o ®iÒu kiÖn cho c¸c céng ®ång khoa häc toµn thÕ giíi cã thÓ tiÕp cËn c¸c tµi nguyªn tin sinh häc, còng nh− thóc ®Èy viÖc truyÒn b¸ vµ trao ®æi c¸c th«ng tin cã liªn quan. TËp hîp d÷ liÖu ®Ó ph©n tÝch c¸c hÖ gen C¸c c¬ quan ®−îc chÝnh phñ tµi trî thùc hiÖn vai trß thiÕt lËp c¸c c¬ së d÷ liÖu vµ cung cÊp c¸c ph©n mÒm nhê ®ã c¸c nhµ khoa häc cã thÓ ph©n tÝch c¸c d÷ liÖu tr×nh tù hÖ gen. Ch¼ng h¹n, ë Mü, mét ch−¬ng tr×nh hîp t¸c gi÷a Th− viÖn Y häc Quèc gia vµ ViÖn Y häc Quèc gia (NIH) ®· thiÕt lËp nªn Trung t©m Quèc gia vÒ Th«ng tin C«ng nghÖ Sinh häc (NCBI) ®ång thêi duy tr× mét trang Web (www.ncbi.nlm.nih.gov) l−u gi÷ c¸c tµi nguyªn tin sinh häc hÕt søc phong phó. T¹i trang Web nµy, c¸c ®−êng “link” dÉn ®Õn c¸c c¬ së d÷ liÖu, c¸c phÇn mÒm vµ c¸c kho chøa c¸c th«ng tin vÒ c¸c hÖ gen vµ c¸c chñ ®Ò cã liªn quan kh¸c. C¸c trang Web t−¬ng tù còng ®· ®−îc thiÕt lËp bëi Phßng thÝ nghiÖm Sinh häc ph©n tö Ch©u ¢u vµ Ng©n hµng D÷ liÖu ADN NhËt B¶n; ®©y còng chÝnh lµ hai trung t©m nghiªn cøu hÖ gen cïng hîp t¸c víi NCBI. Nh÷ng trang Web lín vµ toµn diÖn nµy cßn ®−îc bæ sung thªm bëi nh÷ng trang Web kh¸c ®−îc duy tr× bëi c¸c phßng thÝ nghiÖm nhá h¬n hoÆc bëi c¸c c¸ nh©n. C¸c trang Web nhá h¬n th−êng cung cÊp c¸c c¬ së d÷ liÖu vµ c¸c phÇn mÒm ®−îc thiÕt kÕ cho c¸c môc ®Ých nghiªn cøu hÑp h¬n, ch¼ng h¹n nh− ®Ó t×m hiÓu vÒ nh÷ng thay ®æi di truyÒn hoÆc trong hÖ gen liªn quan ®Õn mét bÖnh ung th− nhÊt ®Þnh. C¸c c¬ së d÷ liÖu vÒ c¸c tr×nh tù cña NCBI ®−îc gäi chung lµ Ng©n hµng gen (Genbank). TÝnh tíi th¸ng 8 n¨m 2007, Genbank ®· chøa tr×nh tù cña 76 triÖu ph©n ®o¹n ADN hÖ gen kh¸c nhau, gåm tæng céng 80 tû cÆp baz¬ ! C¸c tr×nh tù trong ng©n hµng gen liªn tôc ®−îc cËp nhËt, vµ −íc tÝnh l−îng d÷ liÖu cña nã cø sau kho¶ng 18 th¸ng l¹i t¨ng lªn gÊp ®«i. Mäi tr×nh tù trong Genbank cã thÓ ®−îc truy xuÊt vµ ph©n tÝch b»ng c¸c ph©n mÒm ë trang Web cña NCBI hoÆc tõ c¸c trang Web kh¸c. Mét ch−¬ng tr×nh phÇn mÒm s½n cã trªn trang Web cña NCBI, gäi lµ BLAST, cho phÐp bÊt cø ai truy cËp cã thÓ so s¸nh ®−îc mét tr×nh tù ADN nhÊt ®Þnh víi bÊt cø tr×nh tù nµo s½n cã trong Genbank trªn c¬ së ®èi chiÕu tõng cÆp baz¬, qua ®ã t×m thÊy c¸c vïng tr×nh tù gièng nhau gi÷a chóng. Mét phÇn mÒm kh¸c cho phÐp so s¸nh c¸c tr×nh tù protein dù ®o¸n. Ngoµi ra, mét phÇn mÒm thø ba cho phÐp t×m kiÕm mét chuçi axit amin (miÒn) cã chøc n¨ng sinh häc ®· biÕt hoÆc ®ang ®−îc dù ®o¸n tõ mäi tr×nh tù protein s½n cã trong Genbank; ®ång thêi, nã cã thÓ biÓu diÔn m« h×nh kh«ng gian ba chiÒu cña miÒn chøc n¨ng ®ã cïng víi c¸c th«ng tin cã liªn quan phï hîp (xem H×nh 21.4 ë trang sau). ThËm chÝ cßn cã mét ch−¬ng tr×nh phÇn mÒm cã thÓ so s¸nh mét tËp hîp c¸c tr×nh tù, hoÆc lµ c¸c tr×nh tù axit nucleic hoÆc lµ c¸c tr×nh tù polypeptit, vµ biÓu diÔn chóng ë d¹ng c©y tiÕn hãa trªn c¬ së mèi quan hÖ gi÷a c¸c tr×nh tù. (Chóng ta sÏ ®Ò cËp kü h¬n vÒ nh÷ng s¬ ®å nµy ë Ch−¬ng 26). Trang Web cña NCBI còng cßn duy tr× mét c¬ së d÷ liÖu bao gåm tÊt c¶ c¸c cÊu tróc ba chiÒu cña protein ®· ®−îc x¸c ®Þnh (®Ó tæng quan vÒ ph©n tÝch cÊu tróc protein, xem H×nh 5.25). B»ng phÇn mÒm m¸y tÝnh, ng−êi xem cã thÓ quay nh÷ng cÊu tróc nµy ®Ó cã thÓ quan s¸t protein tõ mäi phÝa. Gi¶ sö mét nhµ nghiªn cøu cã mét tr×nh tù axit amin lµ tr×nh tù ®Çy ®ñ hoÆc mét phÇn cña mét protein ch−a biÕt nµo ®ã, mµ nã l¹i cã tr×nh tù gièng víi mét tr×nh tù axit amin cã cÊu tróc kh«ng gian ®· biÕt. Trong tr−êng hîp nµy, nhµ nghiªn cøu cã thÓ dù ®o¸n cÊu tróc cña protein ch−a biÕt b»ng mét phÇn mÒm, vµ sö dông mét phÇn mÒm kh¸c ®Ó so s¸nh nã víi tÊt c¶ c¸c cÊu tróc protein ®· biÕt. Nh÷ng th«ng tin nµy cã thÓ gióp nhµ nghiªn cøu x¸c ®Þnh ®−îc chøc n¨ng cña protein ch−a biÕt. HiÖn nay, trªn toµn thÕ giíi cã rÊt nhiÒu nguån tµi nguyªn s½n cã cho c¸c nhµ nghiªn cøu sö dông. B©y giê chóng ta sÏ nãi ®Õn c¸c chñ ®Ò mµ nh÷ng nguån tµi nguyªn nµy ®Ò cËp ®Õn. X¸c ®Þnh c¸c gen m hãa protein trong c¸c tr×nh tù ADN B»ng viÖc sö dông c¸c tr×nh tù ADN s½n cã, c¸c nhµ di truyÒn häc cã thÓ nghiªn cøu trùc tiÕp c¸c gen mµ kh«ng nhÊt thiÕt ph¶i pháng ®o¸n vÒ kiÓu gen trªn c¬ së ph©n tÝch kiÓu h×nh nh− trong c¸c nghiªn cøu di truyÒn häc kinh ®iÓn tr−íc ®©y. Tuy vËy, c¸ch tiÕp cËn nµy l¹i cã mét trë ng¹i kh¸c: ®ã lµ viÖc x¸c ®Þnh kiÓu h×nh trªn c¬ së kiÓu gen ®· biÕt. Trªn c¬ së mét tr×nh 21.2 Kh¸i niÖm C¸c nhµ khoa häc øng dông tin sinh häc ®Ó ph©n tÝch c¸c hÖ gen vµ chøc n¨ng cña chóng 21.1 1. B¶n ®å liªn kÕt vµ b¶n ®å vËt lý cña mét nhiÔm s¾c thÓ kh¸c nhau c¬ b¶n ë ®Æc ®iÓm g× ? 2. XÐt tæng thÓ, ph−¬ng ph¸p lËp b¶n ®å hÖ gen ®−îc dïng trong Dù ¸n HÖ gen Ng−êi vµ ph−¬ng ph¸p gi¶i tr×nh tù ngÉu nhiªn toµn hÖ gen kh¸c nhau nh− thÕ nµo ? 3. Gi¶ sö b¹n quyÕt ®Þnh tiÕn hµnh gi¶i tr×nh tù hÖ gen cña mét loµi chuét ®ång, vèn lµ mét loµi cã quan hÖ gÇn gòi víi loµi chuét thÝ nghiÖm cã tr×nh tù hÖ gen ®· ®−îc x¸c ®Þnh hoµn toµn. T¹i sao tr×nh tù hÖ gen chuét thÝ nghiÖm ®· biÕt ®−a b¹n ®Õn quyÕt ®Þnh chän ph−¬ng ph¸p gi¶i tr×nh tù ngÉu nhiªn toµn hÖ gen thay cho ph−¬ng ph¸p ba giai ®o¹n ? Xem gîi ý tr¶ lêi ë Phô lôc A. KiÓm tra kh¸i niÖm ®iÒu g× NÕu
  • 5. 430 khèi kiÕn thøc 3 Di truyÒn häc tù ADN dµi cã trªn c¬ së d÷ liÖu nh− Genbank, b»ng c¸ch nµo chóng ta cã thÓ nhËn ra c¸c gen m· hãa protein vèn ch−a tõng ®−îc biÕt tíi vµ x¸c ®Þnh chøc n¨ng cña chóng? C¸ch th«ng th−êng lµ sö dông mét phÇn mÒm ®Ó t×m kiÕm trong nh÷ng tr×nh tù nµy sù cã mÆt hay kh«ng cña c¸c tÝn hiÖu khëi ®Çu vµ kÕt thóc phiªn m· hoÆc dÞch m·, hoÆc lµ c¸c vÞ trÝ c¾t - nèi ARN hay c¸c tÝn hiÖu kh¸c th−êng cã ë c¸c gen m· hãa protein. PhÇn mÒm nµy ®ång thêi còng t×m kiÕm c¸c ®o¹n tr×nh tù ng¾n t−¬ng øng víi c¸c tr×nh tù th−êng cã trªn c¸c ph©n tö mARN ®· biÕt. Hµng ngh×n c¸c tr×nh tù nh− vËy, ®−îc gäi lµ c¸c ®o¹n ®¸nh dÊu tr×nh tù biÓu hiÖn hay EST ®−îc thu thËp tõ c¸c tr×nh tù cADN vµ ®−îc m¸y tÝnh tËp hîp l¹i thµnh c¸c c¬ së d÷ liÖu. KiÓu ph©n tÝch nµy cho phÐp x¸c ®Þnh ®−îc c¸c tr×nh tù t−¬ng øng víi c¸c gen m· hãa protein mµ tr−íc ®ã ch−a tõng ®−îc biÕt tíi. Kho¶ng mét nöa sè gen ë ng−êi ®· ®−îc biÕt tõ tr−íc khi dù ¸n hÖ gen ng−êi b¾t ®Çu. VËy ®èi víi nh÷ng gen cßn l¹i, viÖc ph©n tÝch c¸c tr×nh tù ADN b»ng c¸ch nµo cho biÕt chóng lµ c¸c gen ch−a ®−îc biÕt tr−íc ®ã? Manh mèi ®Ó x¸c ®Þnh nh÷ng gen nµy xuÊt ph¸t tõ viÖc so s¸nh tr×nh tù cña c¸c “gen øng cö viªn” (c¸c tr×nh tù ®−îc dù ®o¸n lµ gen) víi tr×nh tù cña c¸c gen ®· biÕt cã nguån gèc tõ c¸c sinh vËt kh¸c b»ng viÖc sö dông c¸c phÇn mÒm ®· ®−îc nh¾c ®Õn ë trªn. Do tÝnh tho¸i hãa cña m· di truyÒn, b¶n th©n tr×nh tù ADN cã thÓ cã møc ®é biÕn ®æi lín h¬n so víi c¸c tr×nh tù protein t−¬ng øng. V× vËy, víi c¸c nhµ khoa häc quan t©m ®Õn protein, hä th−êng tiÕn hµnh so s¸nh gi÷a tr×nh tù axit amin cña protein pháng ®o¸n víi c¸c tr×nh tù cña c¸c protein ®· biÕt. §«i khi mét tr×nh tù võa míi ®−îc x¸c ®Þnh khíp hoµn toµn hay mét phÇn víi tr×nh tù cña mét gen hoÆc mét protein mµ chøc n¨ng ®· biÕt râ. VÝ dô nh−, mét phÇn cña mét gen míi cã thÓ khíp víi mét gen ®· biÕt m· hãa cho mét protein kinase, mét protein quan träng tham gia vµo mét con ®−êng truyÒn tÝn hiÖu (xem Ch−¬ng 11), chØ ra nhiÒu kh¶ n¨ng gen míi nµy cã thÓ cã chøc n¨ng t−¬ng tù. Theo mét c¸ch kh¸c, tr×nh tù cña mét gen míi l¹i gièng víi mét tr×nh tù ®· tõng ®−îc biÕt tõ tr−íc nh−ng ch−a râ chøc n¨ng. Mét kh¶ n¨ng kh¸c lµ tr×nh tù míi ®−îc x¸c ®Þnh kh«ng gièng víi bÊt cø mét tr×nh tù nµo ®· tõng ®−îc biÕt ®Õn. §iÒu nµy lµ ®óng ®èi víi Ýt nhÊt mét phÇn ba c¸c gen cña E. coli khi hÖ gen cña vi khuÈn nµy ®−îc gi¶i tr×nh tù. Trong tr−êng hîp cuèi cïng, chøc n¨ng cña protein th−êng ®−îc suy diÔn b»ng viÖc kÕt hîp gi÷a c¸c nghiªn cøu vÒ chøc n¨ng ph©n tö vµ hãa sinh häc. C¸c nghiªn cøu vÒ hãa sinh nh»m x¸c ®Þnh cÊu tróc kh«ng gian ba chiÒu còng nh− c¸c thuéc tÝnh hãa lý cña protein, ch¼ng h¹n nh− c¸c vÞ trÝ liªn kÕt cña protein víi c¸c ph©n tö kh¸c. Trong khi ®ã, c¸c nghiªn cøu vÒ chøc n¨ng ph©n tö th−êng tiÕn hµnh lµm bÊt ho¹t hoÆc lµm gi¶m møc ®é biÓu hiÖn cña c¸c gen míi x¸c ®Þnh råi theo dâi H×nh 21.4 C¸c c«ng cô tin sinh häc s½n cã trªn internet. Mét trang web ®−îc Trung t©m Quèc gia Th«ng tin vÒ C«ng nghÖ Sinh häc (Mü) duy tr× cho phÐp c¸c nhµ khoa häc vµ céng ®ång tiÕp cËn c¸c tr×nh tù protein vµ ADN. Trang web nµy gåm c¶ kÕt nèi tíi mét c¬ së d÷ liÖu cÊu tróc protein - CDD (Conserved Domain Database) gióp t×m vµ m« t¶ nh÷ng miÒn gièng nhau ë c¸c protein cã quan hÖ víi nhau, còng nh− c¸c phÇn mÒm quan s¸t ba chiÒu - Cn3D - cho phÐp quan s¸t m« h×nh ba chiÒu cña c¸c miÒn cÊu tróc ®· ®−îc x¸c ®Þnh. H×nh ¶nh ®−îc minh häa ë trªn lµ kÕt qu¶ t×m kiÕm c¸c vïng protein gièng víi mét tr×nh tù axit amin t×m thÊy ë mét protein cña d−a hÊu. Trong cöa sæ nµy, mét phÇn tr×nh tù axit amin tõ mét protein ch−a biÕt (Query) ë d−a hÊu ®−îc xÕp th¼ng hµng víi c¸c tr×nh tù cña c¸c protein kh¸c mµ ch−¬ng tr×nh m¸y tÝnh t×m thÊy gièng víi nã. C¸c tr×nh tù ë ®©y biÓu diÔn mét miÒn ®−îc gäi lµ WD40. Bèn dÊu hiÖu ®iÓn h×nh cña miÒn nµy ®−îc nhÊn m¹nh b»ng nÒn mµu vµng. (Sù gièng nhau gi÷a c¸c tr×nh tù ®−îc nhËn biÕt chñ yÕu dùa trªn c¸c ®Æc ®iÓm hãa häc cña c¸c axit amin, v× vËy c¸c axit amin ë c¸c vïng ®−îc nhÊn m¹nh kh«ng nhÊt thiÕt gièng nhau hoµn toµn.) Ch−¬ng tr×nh Cn3D hiÓn thÞ mét m« h×nh ruy b¨ng ba chiÒu cña protein transductin cña bß (protein ®−îc t« b»ng nÒn mµu tÝm nh¹t trong cöa sæ Sequence Aligment Viewer). Protein nµy lµ lo¹i duy nhÊt trong c¸c protein tr×nh diÖn ë ®©y cã cÊu tróc ®· ®−îc x¸c ®Þnh. Sù gièng víi transductin bß cña c¸c protein kh¸c cho thÊy cÊu tróc cña chóng cã thÓ gièng víi m« h×nh ®−îc hiÓn thÞ ë ®©y. Transductin bß chøa b¶y miÒn WD40; mét trong nh÷ng miÒn nµy ®−îc nhÊn m¹nh b»ng mµu ghi. C¸c vïng ®−îc t« mµu vµng nµy t−¬ng øng víi c¸c axit amin dÊu hiÖu ®iÓn h×nh ®−îc t« mµu vµng ë cöa sæ bªn trªn. Cöa sæ nµy hiÓn thÞ th«ng tin vÒ miÒn WD40 tõ C¬ së d÷ liÖu cÊu tróc protein – CDD.
  • 6. Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 431 sù thay ®æi cña kiÓu h×nh, qua ®ã x¸c ®Þnh chøc n¨ng cña gen. ARNi, ®−îc m« t¶ ë Ch−¬ng 20, lµ mét vÝ dô vÒ kü thuËt phßng thÝ nghiÖm ®−îc dïng ®Ó bÊt ho¹t chøc n¨ng cña gen. T×m hiÓu c¸c gen vµ c¸c s¶n phÈm cña gen ë cÊp ®é sinh häc hÖ thèng Søc m¹nh ®Çy Ên t−îng cña c¸c c«ng cô sinh tin häc vµ m¸y tÝnh cho phÐp c¸c nhµ khoa häc giê ®©y cã thÓ nghiªn cøu toµn bé c¸c gen thuéc c¸c bé nhiÔm s¾c thÓ vµ sù t−¬ng t¸c cña chóng víi nhau, còng nh− cã thÓ so s¸nh hÖ gen tõ c¸c loµi kh¸c nhau. HÖ gen häc lµ mét tµi nguyªn th«ng tin phong phó vµ chuyªn s©u cã thÓ tr¶ lêi c¸c c©u hái c¬ b¶n vÒ c¸ch tæ chøc cña c¸c hÖ gen, vÒ sù ®iÒu hßa sù biÓu hiÖn c¸c gen, vÒ c¸c qu¸ tr×nh sinh tr−ëng vµ ph¸t triÓn, kÓ c¶ tiÕn hãa. Nh÷ng thµnh c«ng trong lÜnh vùc gi¶i tr×nh tù c¸c hÖ gen vµ kh¶ n¨ng nghiªn cøu toµn bé c¸c gen thuéc c¸c bé nhiÔm s¾c thÓ kh¸c nhau ®· thóc ®Èy c¸c nhµ khoa häc nç lùc nghiªn cøu mét hÖ thèng t−¬ng tù c¸c bé protein ®Çy ®ñ (proteom) ®−îc m· hãa t−¬ng øng bëi c¸c hÖ gen, tõ ®ã h×nh thµnh nªn mét lÜnh vùc nghiªn cøu míi gäi lµ hÖ protein häc (proteomics). C¸c protein, chø kh«ng ph¶i c¸c gen m· hãa chóng, trong thùc tÕ thùc hiÖn phÇn lín c¸c ho¹t ®éng sèng cña tÕ bµo. V× vËy, ®Ó t×m hiÓu sù biÓu hiÖn chøc n¨ng sinh häc cña c¸c tÕ bµo vµ c¬ thÓ, chóng ta ph¶i t×m hiÓu c¸c protein ®−îc t¹o ra khi nµo vµ ë ®©u trong mçi c¬ thÓ, còng nh− viÖc chóng t−¬ng t¸c víi nhau thÕ nµo trong c¸c m¹ng l−íi t−¬ng t¸c ph©n tö. C¸c hÖ thèng ®−îc t×m hiÓu thÕ nµo: mét vÝ dô C¸c lÜnh vùc hÖ gen häc vµ hÖ protein häc cho phÐp c¸c nhµ sinh häc tiÕn hµnh c¸c nghiªn cøu vÒ sù sèng ë qui m« ngµy cµng réng lín vµ theo xu h−íng toµn cÇu. B»ng viÖc sö dông c¸c c«ng cô mµ chóng ta ®· m« t¶, c¸c nhµ sinh häc ®· b¾t ®Çu tËp hîp c¸c d÷ liÖu vÒ c¸c gen vµ c¸c protein, tøc lµ liÖt kª tÊt c¶ c¸c “cÊu phÇn” tham gia vµo viÖc ®iÒu hµnh c¸c ho¹t ®éng cña tÕ bµo, m« vµ c¬ thÓ. Víi tËp hîp c¸c d÷ liÖu nh− vËy, c¸c nhµ nghiªn cøu cã thÓ chuyÓn mèi quan t©m cña hä tõ mçi cÊu phÇn ®¬n lÎ sang sù biÓu hiÖn chøc n¨ng ë d¹ng tæ hîp gåm nhiÒu cÊu phÇn ë c¸c cÊp ®é cña hÖ thèng sinh häc. Nhí l¹i ë Ch−¬ng 1, chóng ta ®· ®Ò cËp ®Õn “sinh häc hÖ thèng” lµ lÜnh vùc m« h×nh hãa c¸c biÓu hiÖn ho¹t ®éng n¨ng ®éng cña c¸c hÖ thèng sinh häc toµn bé. Mét øng dông c¬ b¶n cña h−íng nghiªn cøu sinh häc hÖ thèng lµ x¸c ®Þnh ®−îc c¸c m¹ch nèi tiÕp gi÷a c¸c gen vµ c¸c m¹ng l−íi t−¬ng t¸c cña c¸c protein. Ch¼ng h¹n nh−, ®Ó x©y dùng ®−îc s¬ ®å m¹ng l−íi t−¬ng t¸c gi÷a c¸c protein ë ruåi Drosophila nh− ®−îc nªu ë Ch−¬ng 1, c¸c nhµ nghiªn cøu ®· b¾t ®Çu tõ trªn 10.000 b¶n phiªn m· ARN dù ®o¸n. Sau ®ã, b»ng c¸c ph−¬ng ph¸p ph©n tö, hä ®· kiÓm tra sù t−¬ng t¸c gi÷a toµn bé hoÆc mét phÇn c¸c s¶n phÈm protein thu ®−îc c¸c b¶n phiªn m· nµy. B»ng viÖc sö dông c¸c phÐp ph©n tÝch thèng kª ®Ó chän ra c¸c mèi t−¬ng t¸c cã sè liÖu thuyÕt phôc nhÊt, hä ®· t×m ra kho¶ng 4700 lo¹i protein biÓu hiÖn tham gia vµo 4000 mèi t−¬ng t¸c kh¸c nhau. Mét phÇn trong nh÷ng mèi t−¬ng t¸c nµy ®−îc minh häa ë d¹ng s¬ ®å trªn H×nh 21.5; chi tiÕt cã thÓ ®−îc nh×n dÔ h¬n ë hai h×nh phãng to bªn d−íi. §Ó cã thÓ xö lý mét sè lín c¸c d÷ liÖu thu ®−îc vÒ c¸c mèi t−¬ng t¸c protein - protein phøc t¹p thu ®−îc tõ c¸c thÝ nghiÖm nµy, ®ång thêi cã thÓ tæ hîp chóng víi nhau d−íi d¹ng c¸c s¬ ®å m« h×nh, chóng ta cÇn ®Õn c¸c hÖ thèng m¸y tÝnh hiÖu n¨ng cao, c¸c c«ng cô to¸n häc vµ c¸c phÇn mÒm ®−îc ph¸t triÓn míi. Nh− vËy, cã thÓ nãi sinh häc hÖ thèng trong thùc tÕ ®· trë thµnh hiÖn thùc nhê c¸c tiÕn bé cña tin sinh häc. øng dông sinh häc hÖ thèng trong y häc Dù ¸n Atl¸t HÖ gen Ung th− lµ mét vÝ dô kh¸c vÒ sinh häc hÖ thèng mµ ë ®ã ng−êi ta ®ång thêi tiÕn hµnh ph©n tÝch mét sè lín c¸c gen vµ s¶n phÈm cña gen t−¬ng t¸c víi nhau. Dù ¸n nµy ®Æt d−íi sù chØ ®¹o phèi hîp cña ViÖn Ung th− Quèc gia (Mü)vµ NIH nh»m t×m hiÓu nh÷ng thay ®æi trong c¸c hÖ thèng sinh häc dÉn ®Õn sù ph¸t sinh ung th−. Trong giai ®o¹n 3 n¨m thö nghiÖm dù ¸n (tõ 2007 ®Õn 2010), c¸c nhµ nghiªn cøu tËp trung ph©n tÝch ba lo¹i ung th− lµ ung th− phæi, ung th− buång trøng vµ u nguyªn bµo ®Öm (glioblastoma) th«ng qua viÖc t×m hiÓu sù kh¸c nhau trong tr×nh tù cña c¸c gen vµ sù biÓu hiÖn cña chóng ë c¸c tÕ bµo ung th− so víi c¸c tÕ bµo b×nh th−êng. Mét tËp hîp gåm kho¶ng 2000 gen ë c¸c tÕ bµo ung th− sÏ ®−îc gi¶i tr×nh tù vµo c¸c thêi ®iÓm kh¸c nhau trong qu¸ tr×nh tiÕn triÓn cña bÖnh nh»m t×m ra nh÷ng thay ®æi hoÆc g©y ra do ®ét biÕn hoÆc g©y ra bëi c¸c c¬ chÕ s¾p xÕp l¹i nhiÔm s¾c thÓ kh¸c. NÕu nh÷ng nghiªn cøu nµy thµnh c«ng, chóng sÏ ®−îc më réng ¸p dông ®Ó nghiªn cøu c¸c lo¹i bÖnh ung th− kh¸c. H×nh 21.5 Sinh häc hÖ thèng tiÕp cËn c¸c t−¬ng t¸c protein. B¶n ®å t−¬ng t¸c protein tæng thÓ nµy hiÓn thÞ mét tËp hîp con cña c¸c t−¬ng t¸c nhiÒu kh¶ n¨ng nhÊt (®−êng kÎ nèi) tõ 2300 protein (vßng trßn nhá) ë ruåi Drosophila. Ba mµu nÒn kh¸c nhau trªn b¶n ®å t−¬ng øng víi vÞ trÝ chung cña mçi protein: mµu xanh lôc lµ nh©n, xanh lam lµ tÕ bµo chÊt vµ vµng lµ mµng sinh chÊt. C¸c protein ®−îc “m· hãa” b»ng mµu t−¬ng øng víi vÞ trÝ ®Þnh vÞ trong tÕ bµo ®Æc thï cña chóng; vÝ dô, c¸c vßng trßn mµu xanh lôc lµ c¸c protein trong nh©n. C¸c protein
  • 7. 432 khèi kiÕn thøc 3 Di truyÒn häc Sinh häc hÖ thèng cã tiÒm n¨ng øng dông to lín trong y häc, mÆc dï hiÖn nay nã míi b¾t ®Çu ®−îc triÓn khai. §Õn nay, ng−êi ta ®· t¹o ra ®−îc c¸c lo¹i chip vi d·y (microarray) lµm b»ng thñy tinh hoÆc silicon chøa phÇn lín c¸c gen ®· biÕt cña ng−êi (H×nh 21.6). Nh÷ng chip nh− vËy ®ang ®−îc sö dông ®Ó ph©n tÝch sù biÓu hiÖn cña c¸c gen ë nh÷ng bÖnh nh©n m¾c c¸c chøng bÖnh ung th− kh¸c nhau vµ mét sè bÖnh lý kh¸c n÷a. Môc ®Ých cuèi cïng cña nh÷ng nghiªn cøu nµy lµ ®Ò ra c¸c ph¸c ®å ®iÒu trÞ phï hîp ®Æc thï víi b¶n chÊt di truyÒn cña mçi bÖnh nh©n vµ ®Æc tr−ng ®èi víi mçi lo¹i bÖnh ung th− mµ hä m¾c ph¶i. C¸ch tiÕp cËn nµy ®· ®¹t ®−îc mét sè thµnh c«ng nhÊt ®Þnh trong viÖc x¸c ®Þnh ®−îc ®Æc tÝnh ë mét sè nhãm bÖnh ung th−. Cuèi cïng, mçi ng−êi chóng ta cã thÓ cã mét “hå s¬ y häc” cïng víi c¸c tr×nh tù ADN cña m×nh; ®ã lµ mét tËp hîp nhá th«ng tin di truyÒn víi c¸c vïng hÖ gen ®−îc “®¸nh dÊu” cho biÕt xu h−íng mÉn c¶m víi nh÷ng bÖnh nhÊt ®Þnh. Lóc nµy, tiÒm n¨ng øng dông trong phßng tr¸nh vµ ®iÒu trÞ bÖnh ®èi víi mçi ng−êi sÏ thµnh hiÖn thùc. Sinh häc hÖ thèng lµ mét c¸ch tiÕp cËn nghiªn cøu hiÖu qu¶ vÒ c¸c thuéc tÝnh ë cÊp ®é ph©n tö. Tõ Ch−¬ng 1 chóng ta nhí l¹i r»ng, c¸c thuéc tÝnh míi ®−îc t×m thÊy ë cÊp ®é tæ chøc phøc t¹p h¬n th−êng b¾t nguån tõ sù s¾p xÕp c¸c “khèi cÊu tróc” cña cÊp ®é tæ chøc thÊp h¬n. Khi chóng ta hiÓu biÕt ngµy cµng ®Çy ®ñ h¬n vÒ c¸ch s¾p xÕp vµ tæ hîp cña c¸c cÊu phÇn thuéc c¸c hÖ thèng di truyÒn, chóng ta cµng hiÓu biÕt s©u h¬n vÒ ho¹t ®éng cña c¸c c¬ thÓ sèng. PhÇn cßn l¹i cña ch−¬ng nµy sÏ ®Ò cËp ®Õn nh÷ng kiÕn thøc mµ chóng ta ®· häc ®−îc ®Õn nµy nhê c¸c nghiªn cøu thuéc lÜnh vùc hÖ gen häc. TÝnh ®Õn ®Çu n¨m 2008, viÖc gi¶i tr×nh tù cña trªn 700 hÖ gen ®· hoµn thµnh vµ kho¶ng trªn 2700 hÖ gen kh¸c ®ang tiÕp tôc ®−îc gi¶i tr×nh tù. Trong nhãm c¸c hÖ gen ®· ®−îc gi¶i tr×nh tù hoµn toµn, cã kho¶ng 600 hÖ gen vi khuÈn vµ 50 hÖ gen vi khuÈn cæ. Trong sè 65 loµi sinh vËt nh©n thËt thuéc nhãm nµy cã c¸c loµi ®éng vËt cã x−¬ng sèng, c¸c loµi ®éng vËt kh«ng x−¬ng sèng, c¸c nguyªn sinh ®éng vËt, nÊm vµ thùc vËt. C¸c tr×nh tù hÖ gen ®· ®−îc tÝch lòy chøa ®ùng mét tµi nguyªn th«ng tin phong phó mµ hiÖn nay chóng ta míi b¾t ®Çu khai th¸c. Cho ®Õn nay chóng ta ®· häc ®−îc g× tõ viÖc so s¸nh c¸c hÖ gen ®· ®−îc gi¶i tr×nh tù? Trong môc nµy, chóng ta sÏ xem xÐt c¸c ®Æc tÝnh vÒ kÝch cì hÖ gen, sè gen vµ mËt ®é gen cña chóng. Do xÐt vÒ chi tiÕt, c¸c ®Æc tÝnh nµy rÊt ®a d¹ng, nªn chóng ta chØ nhÊn m¹nh vµo c¸c xu h−íng chung; tuy vËy, bªn c¹nh c¸c xu h−íng chung th× th−êng xuÊt hiÖn c¸c ngo¹i lÖ. KÝch cì hÖ gen Khi so s¸nh hÖ gen gi÷a ba liªn giíi (vi khuÈn, vi khuÈn cæ vµ sinh vËt nh©n thËt), chóng ta nhËn thÊy mét xu h−íng kh¸c biÖt chung vÒ kÝch cì hÖ gen gi÷a c¸c sinh vËt nh©n s¬ (vi khuÈn vµ vi khuÈn cæ) víi sinh vËt nh©n thËt (B¶ng 21.1). Ngoµi mét sè ngo¹i lÖ, phÇn lín hÖ gen vi khuÈn cã kÝch cì tõ 1 ®Õn 6 triÖu cÆp baz¬ (bp); ch¼ng h¹n nh− hÖ gen cña E. coli lµ 4,6 triÖu bp. HÖ gen cña c¸c vi khuÈn cæ trong phÇn lín tr−êng hîp cã kÝch cì gièng víi hÖ gen vi khuÈn. (Tuy vËy, cÇn ph¶i nhí r»ng míi chØ cã mét sè Ýt hÖ gen vi khuÈn cæ ®· ®−îc gi¶i tr×nh tù hoµn toµn, v× vËy “bøc tranh toµn c¶nh” nµy còng cã thÓ sÏ thay ®æi.) C¸c hÖ gen sinh vËt nh©n thËt cã xu h−íng lín h¬n. HÖ gen cña nÊm men ®¬n bµo Saccharomyces cerevisiae lµ kho¶ng 13 Mb (triÖu cÆp baz¬); trong khi ®ã, phÇn lín c¸c loµi ®éng vËt vµ thùc vËt, tøc lµ c¸c sinh vËt ®a bµo, cã kÝch cì hÖ gen Ýt nhÊt lµ 100 Mb. HÖ gen ruåi giÊm cã kÝch cì lµ 180 Mb, cßn hÖ gen ng−êi lµ 3.200 Mb, nghÜa lµ lín h¬n tõ 500 ®Õn 3000 lÇn so víi mét hÖ gen vi khuÈn ®iÓn h×nh. Bªn c¹nh sù kh¸c biÖt chung gi÷a hÖ gen cña c¸c sinh vËt nh©n s¬ vµ sinh vËt nh©n thËt, th× viÖc so s¸nh kÝch cì hÖ gen trong ph¹m vi c¸c loµi sinh vËt nh©n thËt l¹i kh«ng ph¶n ¸nh mèi t−¬ng quan cã hÖ thèng gi÷a kÝch cì hÖ gen víi kiÓu h×nh cña c¸c loµi sinh vËt. Ch¼ng h¹n nh−, hÖ gen cña loµi Fritillaria assyriaca, mét loµi hoa thuéc hä lily, cã kÝch cì lµ 120 tØ cÆp baz¬ (120.000 Mb), tøc lµ lín h¬n kho¶ng 40 lÇn so víi hÖ gen ng−êi. Nh−ng cßn kinh ng¹c h¬n lµ hÖ gen mét loµi amip ®¬n bµo, Amoeba dubia, cã kÝch cì kho¶ng 670.000 Mb. (HÖ gen loµi nµy ch−a ®−îc gi¶i tr×nh tù.) Trong ph¹m vi hÑp h¬n, viÖc so s¸nh hÖ gen gi÷a hai loµi c«n trïng cho thÊy hÖ gen cña dÕ (Anabrus simplex) lín h¬n 11 lÇn so víi hÖ gen cña ruåi giÊm (Drosophila melanogaster). KÝch cì hÖ gen còng biÕn ®éng réng trong ph¹m vi mçi nhãm loµi nguyªn sinh ®éng vËt, c«n trïng, l−ìng c− vµ thùc vËt; nh−ng Ýt biÕn ®éng h¬n trong ph¹m vi c¸c loµi thó vµ bß s¸t. Sè gen Mét xu h−íng kh¸c biÖt t−¬ng tù còng ®óng khi xÐt vÒ sè gen: nghÜa lµ, nh×n chung c¸c vi khuÈn vµ vi khuÈn cæ cã Ýt gen h¬n so víi sinh vËt nh©n thËt. C¸c vi khuÈn vµ vi khuÈn cæ sèng tù 21.3 Kh¸i niÖm C¸c hÖ gen kh¸c nhau vÒ kÝch cì, sè gen vµ mËt ®é gen H×nh 21.6 Mét chip ph©n tÝch gen ng−êi. C¸c ®iÓm nhá chøa ADN ®−îc xÕp thµnh c¸c ®−êng kÎ « trªn b¶n silicon nµy ®¹i diÖn cho hÇu hÕt c¸c gen trong hÖ gen ng−êi. Nhê sö dông chip nµy, c¸c nhµ nghiªn cøu cã thÓ ph©n tÝch cïng lóc møc biÓu hiÖn cña tÊt c¶ c¸c gen, qua ®ã gióp gi¶m l−îng hãa chÊt cÇn dïng tèi ®a ®ång thêi ®¶m b¶o ®iÒu kiÖn ®ång ®Òu cho tÊt c¶ c¸c gen. 21.2 1. Internet cã vai trß nh− thÕ nµo trong c¸c nghiªn cøu hiÖn nay vÒ c¸c hÖ gen häc vµ protein häc ? 2. H·y gi¶i thÝch −u thÕ cña c¸c nghiªn cøu theo h−íng sinh häc hÖ thèng khi t×m hiÓu vÒ ung th− so víi ph−¬ng ph¸p nghiªn cøu ®éc lËp tõng gen vµo mçi thêi ®iÓm. 3. Gi¶ sö b¹n ®ang dïng mét ph−¬ng ph¸p nghiªn cøu di truyÒn kinh ®iÓn ®Ó t×m hiÓu mét tÝnh tr¹ng di truyÒn ë ruåi Drosophila. Cô thÓ, b¹n ®· g©y ®ét biÕn ë ruåi vµ chän läc ra ®−îc c¸c c¸ thÓ cã kiÓu h×nh mµ b¹n quan t©m. Gi¶ thiÕt b¹n còng cã thÓ sö dông c¸c c«ng cô sinh häc ph©n tö ®Ó thu ®−îc vïng ADN mang ®ét biÕn. B¹n sÏ tiÕp tôc ph©n tÝch ®ét biÕn ®ã nh− thÕ nµo ®Ó cã thÓ x¸c ®Þnh ®−îc c¸ch mµ nã liªn quan ®Õn kiÓu h×nh ®−îc quan t©m ? Xem gîi ý tr¶ lêi ë Phô lôc A. KiÓm tra kh¸i niÖm ®iÒu g× NÕu
  • 8. Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 433 do cã tõ 1500 ®Õn 7500 gen, trong khi sè gen ë c¸c sinh vËt nh©n thËt dao ®éng tõ kho¶ng 5000 gen ë c¸c nÊm ®¬n bµo cho ®Õn Ýt nhÊt 40.000 gen ë mét sè loµi sinh vËt nh©n thËt ®a bµo (xem B¶ng 21.1). Trong ph¹m vi c¸c loµi sinh vËt nh©n thËt, sè gen ë mçi loµi th−êng thÊp h¬n sè gen ®−îc dù ®o¸n ®¬n thuÇn trªn c¬ së kÝch cì hÖ gen cña chóng. Nh×n vµo B¶ng 21.1, b¹n cã thÓ thÊy hÖ gen giun trßn C. elegans cã kÝch cì lµ 100 Mb vµ chøa kho¶ng 20.000 gen. Trong khi ®ã, hÖ gen Drosophila cã kÝch c¬ gÇn gÊp ®«i (180 Mb), song chØ cã sè gen b»ng kho¶ng hai phÇn ba - tøc lµ, chØ cã 13.700 gen. H·y xem mét vÝ dô kh¸c gÇn gòi h¬n, chóng ta ®Ó ý thÊy hÖ gen ng−êi chøa 3200 Mb, tøc lµ lín h¬n kho¶ng trªn 10 lÇn so víi c¸c hÖ gen Drosophila vµ C. elegans. Khi Dù ¸n HÖ gen Ng−êi khëi ®éng, trªn c¬ së sè protein ®· biÕt, c¸c nhµ sinh häc mong ®îi sÏ cã kho¶ng tõ 50.000 ®Õn 100.000 gen sÏ ®−îc x¸c ®Þnh sau khi hoµn thµnh viÖc gi¶i tr×nh tù hÖ gen. Däc theo tiÕn tr×nh triÓn khai dù ¸n, sè gen −íc l−îng cã trong hÖ gen ng−êi ®−îc söa ®æi nhiÒu lÇn theo xu h−íng gi¶m dÇn; vµ ®Õn n¨m 2007, sè gen −íc l−îng ®−îc tin cËy h¬n c¶ dõng ë con sè 20.488 gen. Sè l−îng gen t−¬ng ®èi thÊp nµy, chØ gÇn gièng sè gen cã ë loµi giun trßn C. elegans, ®· g©y söng sèt nhiÒu nhµ sinh häc vèn ®· lu«n mong ®îi hÖ gen ng−êi cã nhiÒu gen h¬n. Thuéc tÝnh di truyÒn nµo ®· cho phÐp loµi ng−êi (vµ nhiÒu loµi ®éng vËt cã x−¬ng sèng kh¸c) tiÕn hãa mµ kh«ng cÇn nhiÒu gen h¬n so víi giun trßn? Mét yÕu tè quan träng ®ã lµ c¸c tr×nh tù m· hãa trong c¸c hÖ gen ®éng vËt cã x−¬ng sèng cã ®Æc ®iÓm “mét vèn bèn lêi” do chóng cã nhiÒu c¸ch c¾t - nèi c¸c b¶n phiªn m· kh¸c nhau. Chóng ta nhí l¹i r»ng qu¸ tr×nh nµy cã thÓ t¹o ra nhiÒu h¬n mét lo¹i protein biÓu hiÖn chøc n¨ng xuÊt ph¸t tõ mét gen duy nhÊt (xem H×nh 18.11). VÝ dô nh−, hÇu hÕt c¸c gen ë ng−êi ®Òu chøa nhiÒu exon, vµ −íc l−îng cã kho¶ng 75% sè gen gåm nhiÒu exon nµy ®−îc c¾t - nèi Ýt nhÊt b»ng hai c¸ch kh¸c nhau. NÕu chóng ta gi¶ thiÕt mçi gen khi ®−îc c¾t nèi theo c¸c c¸ch kh¸c nhau trung b×nh x¸c ®Þnh 3 chuçi polypeptit kh¸c nhau, th× tæng sè chuçi polypeptit kh¸c nhau ë ng−êi sÏ ®¹t con sè kho¶ng 75.000. Sù ®a d¹ng cña c¸c chuçi polypeptit thùc tÕ cßn bæ sung thªm bëi c¸c biÕn ®æi sau dÞch m·, ch¼ng h¹n bëi sù c¾t tØa c¸c axit amin hay g¾n thªm c¸c gèc cacbohydrat diÔn ra kh¸c nhau ë c¸c tÕ bµo kh¸c nhau hoÆc ë c¸c giai ®o¹n kh¸c nhau cña qu¸ tr×nh ph¸t triÓn. MËt ®é gen vµ c¸c tr×nh tù ADN kh«ng m· hãa Bªn c¹nh kÝch cì hÖ gen vµ sè gen, chóng ta còng cã thÓ so s¸nh mËt ®é gen ë nh÷ng loµi kh¸c nhau, nghÜa lµ cã bao nhiªu gen trªn mét ®¬n vÞ chiÒu dµi cña ADN. Khi chóng ta so s¸nh hÖ gen gi÷a c¸c loµi vi khuÈn, vi khuÈn cæ vµ sinh vËt nh©n thËt, chóng ta thÊy sinh vËt nh©n thËt th−êng cã hÖ gen lín h¬n nh−ng l¹i cã sè gen Ýt h¬n trªn cïng mét sè nhÊt ®Þnh c¸c cÆp baz¬. Ng−êi cã kÝch cì hÖ gen lín h¬n hµng tr¨m thËm chÝ hµng ngh×n lÇn so víi hÖ gen cña phÇn lín c¸c loµi vi khuÈn, nh−ng nh− chóng ta ®· nãi, ng−êi chØ cã sè gen gÊp tõ 5 ®Õn 15 lÇn so víi nh÷ng loµi nµy; nh− vËy, mËt ®é gen ë ng−êi lµ thÊp h¬n (xem B¶ng 21.1). Ngay c¶ c¸c loµi sinh vËt nh©n thËt ®¬n bµo, nh− nÊm men, còng cã Ýt gen h¬n trong mçi mét triÖu cÆp baz¬ so víi c¸c loµi vi khuÈn vµ vi khuÈn cæ. Trong sè c¸c hÖ gen ®· ®−îc gi¶i tr×nh tù hoµn toµn ®Õn nay, ng−êi vµ c¸c loµi thó cã mËt ®é gen thÊp nhÊt. Trong tÊt c¶ c¸c hÖ gen vi khuÈn ®· ®−îc nghiªn cøu ®Õn nay, phÇn lín ADN chøa c¸c gen m· hãa cho protein, tARN hoÆc rARN; mét l−îng nhá cña c¸c tr×nh tù ADN cßn l¹i gåm chñ yÕu lµ c¸c tr×nh tù ®iÒu hßa kh«ng ®−îc phiªn m·, ch¼ng h¹n nh− c¸c tr×nh tù khëi ®Çu phiªn m· (promoter). Tr×nh tù c¸c nucleotit däc theo mét gen m· hãa protein ë vi khuÈn th−êng kh«ng bÞ ng¾t qu·ng tõ vÞ trÝ b¾t ®Çu cho ®Õn vÞ trÝ kÕt thóc bëi c¸c tr×nh tù kh«ng m· hãa (intron). Ng−îc l¹i, ë c¸c hÖ gen sinh vËt nh©n thËt, phÇn lín ADN hoÆc kh«ng ®−îc dïng ®Ó m· hãa cho protein hoÆc kh«ng ®−îc phiªn m· thµnh c¸c ph©n tö ARN biÓu hiÖn chøc n¨ng (nh− tARN ch¼ng h¹n), ®ång thêi ADN chøa nhiÒu tr×nh tù ®iÒu hßa phøc t¹p. Trong thùc tÕ, hÖ gen ng−êi chøa ADN kh«ng m· hãa nhiÒu h¬n kho¶ng 10.000 lÇn so víi hÖ gen vi khuÈn. Mét sè tr×nh tù ADN kh«ng m· hãa nµy ë sinh vËt nh©n thËt ®a bµo xuÊt hiÖn trong c¸c intron cña c¸c gen. Thùc tiÔn cho thÊy c¸c intron lµ nh©n tè chÝnh dÉn ®Õn phÇn lín c¸c kh¸c biÖt vÒ chiÒu dµi trung b×nh gi÷a c¸c gen cña ng−êi (27.000 bp) so víi c¸c gen cña vi khuÈn (1000 bp). B¶ng 21.1 KÝch cì hÖ gen vµ sè gen −íc tÝnh* Loµi KÝch cì hÖ gen ®¬n béi (Mb) Sè gen Sè gen / Mb Vi khuÈn Haemophilus influenzae 1,8 1700 940 Escherichia coli 4,6 4400 950 Vi khuÈn cæ Archaeoglobus fulgidus 2,2 2500 1130 Methanosarcina barkeri 4,8 3600 750 Sinh vËt nh©n thËt Saccharomyces cerevisiae (nÊm men) 13 6200 480 Caenorhabditis elegans (giun trßn) 100 20.000 200 Arabidopsis thaliana (c©y thuéc hä mï t¹t) 118 25.500 215 Drosophila melanogaster (ruåi giÊm) 180 13.700 76 Oryza sativa (lóa g¹o) 390 40.000 140 Danio rerio (c¸ ngùa) 1700 23.000 13 Mus musculus (chuét nhµ) 2600 22.000 11 Homo sapiens (ng−êi) 3200 20.500 7 Fritillaria assyriaca (c©y thuéc hä lily) 120.000 ND ND * Mét sè sè liÖu trªn ®©y cã thÓ sÏ ®−îc chØnh lý sau nµy do c¸c ph©n tÝch hÖ gen vÉn ®ang tiÕp tôc tiÕn hµnh. Mb = 1 triÖu cÆp baz¬ (bp). ND = ch−a x¸c ®Þnh.
  • 9. 434 khèi kiÕn thøc 3 Di truyÒn häc Bªn c¹nh c¸c intron, c¸c sinh vËt nh©n thËt ®a bµo chøa mét l−îng lín ADN kh«ng m· hãa ë gi÷a c¸c gen. Trong môc tiÕp theo, chóng ta sÏ m« t¶ thµnh phÇn vµ c¸ch s¾p xÕp c¸c chuçi tr×nh tù lín cña ADN nh− vËy trong hÖ gen ng−êi. §Õn ®©y, cã thÓ nãi chóng ta ®· dïng phÇn lín dung l−îng cña ch−¬ng nµy, mµ thùc tÕ lµ cña c¶ khèi kiÕn thøc nµy, ®Ó tËp trung nãi vÒ c¸c gen m· hãa protein. Nh−ng trong thùc tÕ, c¸c vïng m· hãa cña nh÷ng gen nµy vµ c¸c gen m· hãa cho c¸c s¶n phÈm ARN nh− rARN, tARN vµ tiÓu-ARN (miARN hay microARN) chØ chiÕm mét tØ lÖ nhá trong hÖ gen cña phÇn lín c¸c sinh vËt nh©n thËt ®a bµo. Mét phÇn lín hÖ gen cña hÇu hÕt sinh vËt nh©n thËt lµ c¸c tr×nh tù ADN hoÆc kh«ng m· hãa cho protein hoÆc kh«ng ®−îc phiªn m· ®Ó t¹o nªn c¸c lo¹i ARN cã chøc n¨ng ®· biÕt; nh÷ng tr×nh tù ADN kh«ng m· hãa nµy tr−íc kia th−êng ®−îc m« t¶ nh− c¸c “ADN d− thõa”. Tuy vËy, ngµy cµng cã nhiÒu b»ng chøng cho thÊy nh÷ng tr×nh tù ADN nµy gi÷ vai trß quan träng trong ho¹t ®éng sèng cña tÕ bµo; ý t−ëng nµy ®ång thêi ®−îc cñng cè bëi sù tån t¹i mét c¸ch “bÒn v÷ng” qua hµng tr¨m thÕ hÖ cña nh÷ng tr×nh tù nµy ë nhiÒu hÖ gen kh¸c nhau. Ch¼ng h¹n, khi so s¸nh hÖ gen gi÷a ng−êi víi chuét ®ång vµ chuét nhµ, c¸c nhµ nghiªn cøu t×m thÊy cã ®Õn 500 vïng ADN kh«ng m· hãa trong hÖ gen gièng hÖt nhau ë c¶ ba loµi. ë nh÷ng loµi nµy, møc ®é b¶o thñ cña nh÷ng tr×nh tù nµy thËm chÝ cßn cao h¬n so víi c¸c vïng m· hãa protein; ®iÒu nµy ñng hé m¹nh mÏ cho gi¶ thiÕt c¸c vïng kh«ng m· hãa cã nh÷ng chøc n¨ng quan träng. Trong môc nµy chóng ta sÏ t×m hiÓu c¸c gen vµ c¸c tr×nh tù ADN kh«ng m· hãa ®−îc tæ chøc nh− thÕ nµo trong hÖ gen cña c¸c sinh vËt nh©n thËt, víi vÝ dô chñ yÕu chÝnh lµ hÖ gen ng−êi cña chóng ta. C¸ch tæ chøc cña hÖ gen cho chóng ta biÕt con ®−êng mµ c¸c hÖ gen ®· vµ ®ang tiÕp tôc tiÕn hãa; ®©y còng lµ néi dung ®−îc ®Ò cËp tiÕp theo. Khi hÖ gen ng−êi ®· ®−îc gi¶i tr×nh tù hoµn toµn, mét sù thËt ®−îc béc lé râ rµng lµ chØ cã 1,5% tr×nh tù nucleotit trong hÖ gen ®−îc dïng hoÆc ®Ó m· hãa cho c¸c protein hoÆc ®−îc phiªn m· thµnh c¸c ph©n tö rARN vµ tARN. H×nh 21.7 cho thÊy thµnh phÇn cÊu tróc nªn 98,5% tr×nh tù cßn l¹i cña hÖ gen ng−êi. C¸c tr×nh tù ®iÒu hßa liªn quan ®Õn c¸c gen vµ c¸c tr×nh tù intron chiÕm 24% hÖ gen ng−êi; phÇn cßn l¹i, n»m gi÷a c¸c gen biÓu hiÖn chøc n¨ng (c¸c tr×nh tù liªn gen), gåm c¸c tr×nh tù kh«ng m· hãa ®¬n nhÊt, ch¼ng h¹n nh− c¸c ph©n ®o¹n cña gen vµ c¸c gen gi¶, tøc lµ c¸c gen cò vèn tõng tån t¹i nh−ng sau ®ã do tÝch lòy c¸c ®ét biÕn ®· trë nªn mÊt chøc n¨ng. Tuy vËy, phÇn lín c¸c tr×nh tù ADN liªn gen lµ nh÷ng tr×nh tù ADN lÆp l¹i, tøc lµ c¸c tr×nh tù cã mÆt víi nhiÒu b¶n sao trong hÖ gen. §iÒu ®¸ng ng¹c nhiªn lµ ba phÇn t− cña c¸c tr×nh tù ADN lÆp l¹i nµy (t−¬ng øng víi 44% cña toµn bé hÖ gen ng−êi) t¹o nªn c¸c ®¬n vÞ ®−îc gäi lµ c¸c yÕu tè di truyÒn vËn ®éng hoÆc c¸c tr×nh tù cã liªn quan ®Õn chóng. 21.4 Kh¸i niÖm Sinh vËt nh©n thËt ®a bµo cã nhiÒu ADN kh«ng m hãa vµ nhiÒu hä ®a gen 21.3 1. Theo c¸c sè liÖu −íc tÝnh hiÖn nay, hÖ gen ng−êi chøa kho¶ng 20.500 gen. Tuy vËy, cã b»ng chøng cho thÊy c¸c tÕ bµo ng−êi cã thÓ s¶n sinh nhiÒu h¬n 20.500 lo¹i chuçi polypeptide kh¸c nhau. Nh÷ng qu¸ tr×nh nµo cã thÓ gióp gi¶i thÝch cho sù “kh«ng nhÊt qu¸n” nµy? 2. Sè hÖ gen ®−îc gi¶i tr×nh tù ®ang tiÕp tôc t¨ng lªn ®Òu ®Æn. H·y sö dông trang web www.genomesonline.org ®Ó t×m sè hÖ gen hiÖn t¹i thuéc c¸c liªn giíi kh¸c nhau ®· ®−îc gi¶i tr×nh tù hoµn toµn, còng nh− sè hÖ gen ®ang tiÕp tôc ®−îc gi¶i tr×nh tù (gîi ý: H·y dïng chuét nh¸y kÐp vµo khÈu lÖnh “GOLD tables” råi sau ®ã nh¸y kÐp vµo “Published Complete Genomes” ®Ó cã thªm th«ng tin.) 3. C¸c qu¸ tr×nh tiÕn hãa nµo cã thÓ gi¶i thÝch cho viÖc c¸c sinh vËt nh©n s¬ cã hÖ gen nhá h¬n so víi c¸c sinh vËt nh©n thËt ? Xem gîi ý tr¶ lêi ë Phô lôc A. KiÓm tra kh¸i niÖm ®iÒu g× NÕu H×nh 21.7 C¸c lo¹i tr×nh tù ADN trong hÖ gen ng−êi. C¸c tr×nh tù gen m· hãa cho protein hoÆc ®−îc phiªn m· thµnh c¸c ph©n tö rARN hay tARN chØ chiÕm kho¶ng 1,5% hÖ gen ng−êi (mµu tÝa sÉm trªn biÓu ®å táa trßn), trong khi c¸c tr×nh tù ®iÒu hßa vµ c¸c intron liªn quan ®Õn c¸c gen (mµu tÝa nh¹t) chiÕm kho¶ng 1/4 hÖ gen. PhÇn lín h¬n c¶ cña hÖ gen ng−êi lµ nh÷ng tr×nh tù kh«ng m· hãa cho protein vµ còng kh«ng ®−îc dïng ®Ó t¹o ra c¸c lo¹i ARN ®· biÕt, mµ phÇn nhiÒu trong nh÷ng tr×nh tù nµy lµ c¸c ADN lÆp l¹i (mµu xanh lôc sÉm vµ nh¹t). Do ADN lÆp l¹i lµ nh÷ng tr×nh tù khã ph©n tÝch vµ khã gi¶i tr×nh tù h¬n c¶, nªn sù ph©n lo¹i cña mét phÇn nh÷ng tr×nh tù nµy ë trªn chØ cã tÝnh −íc ®o¸n, vµ c¸c tØ lÖ phÇn tr¨m ®−îc nªu cã thÓ sÏ thay ®æi ®«i chót khi c¸c nghiªn cøu ph©n tÝch hÖ gen vÉn ®ang tiÕp diÔn. Nh÷ng gen m· hãa c¸c miARN míi ®−îc t×m thÊy gÇn ®©y thuéc c¸c vïng ADN kh«ng m· hãa ®¬n nhÊt (tøc lµ kh«ng lÆp l¹i) vµ trong c¸c intron; nghÜa lµ, chóng thuéc hai vïng cña ®å thÞ táa trßn trªn ®©y. C¸c exon (c¸c vïng gen m· hãa cho protein hoÆc ®−îc phiªn m· thµnh rARN vµ tARN) (1,5%) Intron vµ c¸c tr×nh tù ®iÒu hßa liªn quan ®Õn c¸c gen (24%) C¸c tr×nh tù ADN kh«ng m· hãa ®¬n nhÊt (15%) ADN lÆp l¹i kh«ng liªn quan ®Õn c¸c yÕu tè vËn ®éng (15%) ADN lÆp l¹i bao gåm c¸c yÕu tè vËn ®éng vµ c¸c tr×nh tù liªn quan ®Õn chóng (44%) C¸c ®o¹n lÆp kÝch th−íc lín (5 - 6%) ADN tr×nh tù ®¬n gi¶n (3%) C¸c yÕu tè Alu (3%) C¸c tr×nh tù L1 (17%)
  • 10. Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 435 C¸c yÕu tè di truyÒn vËn ®éng vµ c¸c tr×nh tù cã liªn quan ®Õn chóng C¶ sinh vËt nh©n s¬ còng nh− sinh vËt nh©n thËt ®Òu cã trong hÖ gen nh÷ng ®o¹n tr×nh tù ADN cã thÓ di chuyÓn tõ vÞ trÝ nµy sang vÞ trÝ kh¸c trong hÖ gen. Nh÷ng ®o¹n tr×nh tù ADN nh− vËy ®−îc gäi lµ c¸c yÕu tè di truyÒn vËn ®éng, hay ®−îc gäi t¾t lµ c¸c yÕu tè vËn ®éng. Trong qu¸ tr×nh ®−îc gäi lµ vËn ®éng, mét yÕu tè vËn ®éng sÏ di chuyÓn tõ mét vÞ trÝ trªn ADN trong tÕ bµo tíi mét vÞ trÝ ®Ých kh¸c nhê mét qu¸ tr×nh t¸i tæ hîp. §«i khi c¸c yÕu tè vËn ®éng ®−îc gäi lµ c¸c “gen nh¶y”, nh−ng thuËt ng÷ nµy thùc tÕ dÔ g©y hiÓu nhÇm bëi trong thùc tÕ nh÷ng ®o¹n tr×nh tù ADN vËn ®éng kh«ng bao giê rêi khái ADN cña tÕ bµo. (C¸c vÞ trÝ gèc vµ vÞ trÝ ®Ých míi cña c¸c yÕu tè vËn ®éng ®−îc ®−a ®Õn gÇn nhau bëi c¬ chÕ “bÎ cong” ADN.) B»ng chøng ®Çu tiªn vÒ c¸c ph©n ®o¹n ADN cã thÓ di chuyÓn ®−îc ph¸t hiÖn tõ c¸c thÝ nghiÖm lai gièng ë c©y ng« ®−îc nhµ n÷ di truyÒn häc ng−êi Mü lµ Barbara McClintock tiÕn hµnh vµo nh÷ng n¨m 1940 vµ 1950 (H×nh 21.8). Khi theo dâi c¸c c©y ng« qua nhiÒu thÕ hÖ, McClintock x¸c ®Þnh ®−îc sù thay ®æi mµu néi nhò cña c¸c h¹t ng« chØ cã thÓ gi¶i thÝch ®−îc nÕu nh− cã sù tån t¹i cña c¸c yÕu tè di truyÒn cã thÓ vËn ®éng tõ nh÷ng vÞ trÝ kh¸c trong hÖ gen vµo trong c¸c gen qui ®Þnh tÝnh tr¹ng mµu néi nhò, lµm “ph¸ vì” nh÷ng gen nµy vµ dÉn ®Õn hiÖn t−îng mµu néi nhò thay ®æi. Ph¸t hiÖn cña McClintock ban ®Çu ®−îc ®ãn nhËn b»ng nhiÒu “hoµi nghi” vµ thËm chÝ bÞ ph¶n ®èi. Ph¶i mÊt nhiÒu n¨m sau ®ã, c«ng tr×nh nghiªn cøu kú c«ng cïng nh÷ng ý t−ëng s©u s¾c cña McClintock vÒ c¸c yÕu tè vËn ®éng míi ®−îc x¸c nhËn bëi c¸c nhµ di truyÒn häc vi khuÈn vµ vi sinh vËt khi hä t×m ra c¬ së ph©n tö cña qu¸ tr×nh vËn ®éng cña nh÷ng yÕu tè nµy. Sù vËn ®éng cña c¸c transposon vµ retrotransposon C¸c sinh vËt nh©n thËt cã hai lo¹i yÕu tè vËn ®éng. Lo¹i thø nhÊt ®−îc gäi lµ c¸c transposon; lo¹i yÕu tè nµy vËn ®éng trong hÖ gen th«ng qua mét ADN trung gian. C¸c transposon cã thÓ vËn ®éng hoÆc bëi c¬ chÕ “c¾t - d¸n” vµ chóng ®−îc chuyÓn dêi khái vÞ trÝ gèc, hoÆc bëi c¬ chÕ “sao chÐp - d¸n” vµ chóng ®Ó l¹i mét b¶n sao t¹i vÞ trÝ gèc (H×nh 21.9a). PhÇn lín c¸c yÕu tè vËn ®éng trong hÖ gen sinh vËt nh©n thËt thuéc lo¹i thø hai, ®−îc gäi lµ c¸c retrotransposon; lo¹i yÕu tè nµy vËn ®éng trong hÖ gen th«ng qua mét ARN trung gian; ®©y lµ b¶n phiªn m· cña chÝnh ADN retrostransposon. C¸c retrotransposon lu«n ®Ó l¹i mét b¶n sao t¹i vÞ trÝ ®Ých trong qu¸ tr×nh vËn ®éng, do chóng ®−îc phiªn m· thµnh ARN trung gian (H×nh 21.9b). Tr−íc khi cµi vµo vÞ trÝ ®Ých, ph©n tö ARN trung gian ®−îc phiªn m· ng−îc trë l¹i thµnh ADN bëi enzym phiªn m· ng−îc - reverse transcriptase - do chÝnh retrotransposon m· hãa. §iÒu nµy cã nghÜa lµ enzym phiªn m· ng−îc cã thÓ cã mÆt trong c¸c tÕ bµo mµ chóng kh«ng nhÊt thiÕt ph¶i bÞ l©y nhiÔm bëi retrovirut. (Trong thùc tÕ, c¸c retrovirut, nh− ®· ®−îc ®Ò cËp ë Ch−¬ng 19, cã thÓ ®· tiÕn hãa b¾t nguån tõ chÝnh c¸c retrotransposon.) Ho¹t ®éng cµi tr×nh tù ADN ®−îc phiªn m· ng−îc vµo vÞ trÝ míi ®−îc xóc t¸c bëi enzym trong tÕ bµo. H×nh 21.8 ¶nh h−ëng cña c¸c yÕu tè vËn ®éng ®Õn mµu h¹t ng«. Barbara McClintock lµ ng−êi ®Çu tiªn ®−a ra ý t−ëng vÒ nh÷ng yÕu tè di truyÒn cã kh¶ n¨ng vËn ®éng khi quan s¸t hiÖn t−îng cã nhiÒu ®èm mµu kh¸c nhau trong nh©n cña c¸c h¹t ng«. Tuy ban ®Çu ý t−ëng cña bµ vµo nh÷ng n¨m 1940 ®−îc ®ãn nhËn bëi nh÷ng mèi hoµi nghi, nh−ng sau nµy ®· ®−îc kiÓm chøng lµ hoµn toµn x¸c thùc. Bµ ®−îc nhËn gi¶i Nobel n¨m 1983 khi ë tuæi 81 nhê c«ng tr×nh mang tÝnh tiªn phong cña m×nh. H×nh 21.9 Sù di chuyÓn cña c¸c yÕu tè vËn ®éng ë sinh vËt nh©n thËt. (a) Sù di chuyÓn cña c¸c transposon hoÆc theo c¬ chÕ “c¾t - d¸n” hoÆc theo c¬ chÕ “sao chÐp - d¸n” (®−îc minh häa ë ®©y) liªn quan ®Õn mét ph©n tö ADN sîi kÐp trung gian sau ®ã ®−îc cµi vµo hÖ gen. (b) Sù di chuyÓn cña c¸c retrotransposon b¾t ®Çu b»ng sù h×nh thµnh mét ph©n tö ARN m¹ch ®¬n trung gian. C¸c b−íc cßn l¹i vÒ b¶n chÊt gièng víi mét phÇn chu kú sinh s¶n cña retrovirut (xem H×nh 19.8). Trong kiÓu di chuyÓn cña c¸c transposon theo kiÓu “sao chÐp - d¸n” vµ kiÓu di chuyÓn cña retrotransposon, tr×nh tù ADN võa ®−îc duy tr× ë vÞ trÝ gèc võa xuÊt hiÖn ë vÞ trÝ míi. PhÇn (a) ë trªn sÏ kh¸c nh− thÕ nµo nÕu c¬ chÕ ®−îc minh häa ë ®©y lµ c¬ chÕ di chuyÓn kiÓu “c¾t - d¸n” ? Transposon ADN hÖ gen Transposon ®−îc sao chÐp Transposon vËn ®éng Cµi vµo hÖ gen B¶n sao míi cña transposon (a) Sù di chuyÓn cña transposon (c¬ chÕ kiÓu “sao chÐp - d¸n”) Retrotransposon ARN Reverse transcriptase Cµi vµo hÖ gen B¶n sao míi cña retrotransposon (b) Sù di chuyÓn cña retrotransposon
  • 11. 436 khèi kiÕn thøc 3 Di truyÒn häc C¸c tr×nh tù liªn quan ®Õn c¸c yÕu tè vËn ®éng ë sinh vËt nh©n thËt, nhiÒu b¶n sao cña c¸c yÕu tè vËn ®éng vµ c¸c tr×nh tù liªn quan ®Õn chóng n»m r¶i r¸c kh¾p hÖ gen. Mçi ®¬n vÞ riªng lÎ cña yÕu tè vËn ®éng th−êng dµi tõ vµi tr¨m ®Õn vµi ngh×n cÆp baz¬, vµ c¸c b¶n sao n»m ph©n t¸n th−êng gièng nhau, nh−ng kh«ng gièng hÖt nhau. Mét sè yÕu tè vËn ®éng nh− vËy cã kh¶ n¨ng vËn ®éng; c¸c enzym cÇn thiÕt cho sù vËn ®éng cña nã cã thÓ ®−îc m· hãa bëi mét yÕu tè vËn ®éng bÊt kú, bao gåm c¶ chÝnh yÕu tè vËn ®éng ®ang ho¹t ®éng. Nh÷ng tr×nh tù kh¸c lµ nh÷ng tr×nh tù cã liªn quan nh−ng ®· mÊt hoµn toµn kh¶ n¨ng vËn ®éng. C¸c yÕu tè vËn ®éng vµ c¸c tr×nh tù cã liªn quan chiÕm kho¶ng 25% - 50% hÖ gen ë phÇn lín ®éng vËt cã vó (xem H×nh 21.7); tØ lÖ nµy thËm chÝ cßn cao h¬n ë c¸c loµi l−ìng c− vµ nhiÒu loµi thùc vËt. ë ng−êi vµ nhiÒu loµi linh tr−ëng kh¸c, mét tØ lÖ lín c¸c tr×nh tù ADN liªn quan ®Õn c¸c yÕu tè vËn ®éng bao gåm mét hä c¸c tr×nh tù gièng nhau ®−îc gäi lµ c¸c yÕu tè Alu. Riªng nh÷ng tr×nh tù nµy ®· chiÕm kho¶ng 10% hÖ gen ng−êi. C¸c yÕu tè Alu cã chiÒu dµi kho¶ng 300 nucleotit, tøc lµ ng¾n h¬n nhiÒu so víi phÇn lín c¸c yÕu tè vËn ®éng cßn ho¹t ®éng kh¸c, vµ chóng kh«ng m· hãa cho bÊt cø protein nµo. Tuy vËy, nhiÒu yÕu tè Alu ®−îc phiªn m· thµnh ARN; chøc n¨ng trong tÕ bµo cña chóng (nÕu cã) ®Õn nay ch−a râ. Mét tØ lÖ lín h¬n (17%) cña hÖ gen ng−êi lµ mét lo¹i retrotransposon kh¸c, ®−îc gäi lµ c¸c yÕu tè LINE-1 hay L1. Nh÷ng yÕu tè nµy dµi h¬n nhiÒu so víi c¸c yÕu tè Alu (kho¶ng 6500 bp) vµ cã tØ lÖ vËn ®éng thÊp. T¹i sao tØ lÖ vËn ®éng cña c¸c yÕu tè lo¹i nµy l¹i thÊp? C¸c nghiªn cøu gÇn ®©y ph¸t hiÖn ra r»ng trong c¸c yÕu tè L1 cã c¸c tr×nh tù ng¨n c¶n ho¹t ®éng cña ARN polymerase vèn cÇn thiÕt cho sù vËn ®éng. Mét nghiªn cøu bæ sung t×m thÊy c¸c tr×nh tù L1 cã trong intron cña kho¶ng 80% sè gen ng−êi ®−îc ®em ph©n tÝch, ®iÒu nµy cho thÊy cã kh¶ n¨ng L1 gióp ®iÒu hßa biÓu hiÖn gen. Mét sè nhµ nghiªn cøu kh¸c cho r»ng: c¸c retrotransposon L1 cã thÓ cã hiÖu qu¶ biÖt hãa qua ®iÒu hßa biÓu hiÖn gen dÉn ®Õn sù ph¸t triÓn c¸c lo¹i n¬ron, gãp phÇn t¹o nªn sù ®a d¹ng cña c¸c lo¹i tÕ bµo n¬ron (xem Ch−¬ng 48). MÆc dï cã nhiÒu yÕu tè vËn ®éng m· hãa cho c¸c protein, nh−ng nh÷ng protein nµy kh«ng thùc hiÖn nh÷ng chøc n¨ng tÕ bµo b×nh th−êng. Do vËy, c¸c yÕu tè vËn ®éng th−êng ®−îc qui vµo nhãm ADN “kh«ng m· hãa”, cïng víi c¸c tr×nh tù lÆp l¹i dµi kh¸c cã trong hÖ gen. C¸c tr×nh tù ADN lÆp l¹i kh¸c, bao gåm c¶ c¸c ADN tr×nh tù ®¬n gi¶n C¸c tr×nh tù ADN lÆp l¹i vèn kh«ng liªn quan ®Õn c¸c yÕu tè vËn ®éng cã vÎ xuÊt hiÖn do c¸c sai sãt trong c¸c qu¸ tr×nh sao chÐp hoÆc t¸i tæ hîp cña ADN. Nh÷ng tr×nh tù ADN nh− vËy chiÕm kho¶ng 15% hÖ gen ng−êi (xem H×nh 21.7). Kho¶ng mét phÇn ba trong sè nµy (tøc lµ kho¶ng 5 - 6% hÖ gen ng−êi) lµ nh÷ng ®o¹n ADN dµi lÆp l¹i hai lÇn víi mçi ®¬n vÞ lÆp l¹i dµi tõ 10.000 ®Õn 30.000 cÆp baz¬. C¸c ®o¹n ADN dµi nh− vËy d−êng nh− ®· ®−îc sao chÐp tõ vÞ trÝ nµy sang vÞ trÝ kh¸c thuéc cïng mét nhiÔm s¾c thÓ hoÆc thuéc hai nhiÔm s¾c thÓ kh¸c nhau. Kh«ng gièng nh− c¸c b¶n sao cña c¸c tr×nh tù ADN dµi ph©n t¸n kh¾p hÖ gen, c¸c ADN tr×nh tù ®¬n gi¶n th−êng gåm nhiÒu b¶n sao cña c¸c ®o¹n tr×nh tù ng¾n lÆp l¹i liªn tiÕp nh− vÝ dô ®−îc minh häa d−íi ®©y (ë ®©y, chØ minh häa mét m¹ch): …GTTACGTTACGTTACGTTACGTTACGTTAC… Trong tr−êng hîp nµy, ®¬n vÞ lÆp l¹i (GTTAC) gåm 5 nucleotit. Trong thùc tÕ, c¸c ®¬n vÞ lÆp l¹i nh− vËy cã thÓ dµi ®Õn 500 nucleotit, nh−ng th−êng th× ng¾n h¬n 15 nucleotit nh− vÝ dô trªn ®©y. Khi ®¬n vÞ lÆp l¹i chØ chøa tõ 2 ®Õn 5 nucleotit, th× ®o¹n tr×nh tù lÆp l¹i liªn tiÕp nh− vËy ®−îc gäi lµ tr×nh tù ng¾n lÆp l¹i liªn tiÕp, hay cßn gäi lµ STR (short tandem repeats). Chóng ta ®· nãi vÒ viÖc sö dông chØ thÞ STR trong x©y dùng tµng th− di truyÒn ë Ch−¬ng 20. Sè b¶n sao cña cïng mét ®¬n vÞ lÆp l¹i cã thÓ kh¸c nhau ë nh÷ng vÞ trÝ kh¸c nhau trong hÖ gen. Ch¼ng h¹n nh−, ®¬n vÞ lÆp l¹i GTTAC cã thÓ xuÊt hiÖn liªn tiÕp hµng tr¨m ngh×n lÇn t¹i mét vÞ trÝ trong hÖ gen; nh−ng ë mét vÞ trÝ kh¸c, sè lÇn lÆp l¹i cña ®¬n vÞ nµy chØ b»ng mét nöa. Sè lÇn lÆp l¹i còng rÊt kh¸c nhau gi÷a ng−êi nµy víi ng−êi kh¸c, t¹o nªn sù kh¸c biÖt trong tµng th− di truyÒn cña mçi c¸ nh©n trªn c¬ së ph©n tÝch c¸c tr×nh tù STR. TÝnh tæng céng, c¸c ADN tr×nh tù ®¬n gi¶n chiÕm kho¶ng 3% hÖ gen ng−êi. Thµnh phÇn nucleotit cña c¸c ®o¹n ADN tr×nh tù ®¬n gi¶n kh¸c biÖt víi thµnh phÇn cña c¸c ®o¹n tr×nh tù ADN kh¸c trong hÖ gen ®Õn møc chóng t¹o nªn sù kh¸c biÖt vÒ tØ träng. NÕu ADN hÖ gen ®−îc c¾t thµnh c¸c ph©n ®o¹n nhá, råi ®−îc ly t©m ë tèc ®é cao, th× c¸c ph©n ®o¹n ADN cã tØ träng kh¸c nhau sÏ “®Þnh vÞ” ë nh÷ng vÞ trÝ kh¸c nhau trong èng ly t©m. C¸c ®o¹n ADN lÆp l¹i vèn ban ®Çu ®−îc ph©n lËp theo c¸ch nµy ®−îc gäi lµ c¸c tr×nh tù ADN vÖ tinh bëi v× c¸c b¨ng ly t©m cña chóng t¸ch biÖt khái phÇn b¨ng ly t©m chung gåm c¸c tr×nh tù ADN cßn l¹i cña hÖ gen gièng nh− mét “vÖ tinh”. ThuËt ng÷ “ADN vÖ tinh” vµ ADN tr×nh tù ®¬n gi¶n hiÖn nay th−êng ®−îc dïng thay thÕ cho nhau. Mét l−îng lín ADN tr×nh tù ®¬n gi¶n cña hÖ gen tËp trung ë c¸c ®Çu mót vµ t©m ®éng cña nhiÔm s¾c thÓ, cho thÊy nh÷ng tr×nh tù ADN nµy gi÷ vai trß cÊu tróc nhiÔm s¾c thÓ. C¸c tr×nh tù ADN t¹i t©m ®éng lµ thiÕt yÕu cho ho¹t ®éng ph©n ly cña c¸c nhiÔm s¾c tö trong qu¸ tr×nh ph©n bµo (xem Ch−¬ng 12). Tr×nh tù ADN t©m ®éng, cïng víi c¸c ADN tr×nh tù ®¬n gi¶n kh¸c, cã thÓ ®ãng vai trß tæ chøc chÊt nhiÔm s¾c trong nh©n t¹i kú trung gian cña chu tr×nh tÕ bµo. C¸c ADN tr×nh tù ®¬n gi¶n t¹i c¸c ®Çu mót nhiÔm s¾c thÓ gióp b¶o vÖ c¸c gen kh«ng bÞ mÊt do ADN ng¾n l¹i sau mçi lÇn sao chÐp (xem Ch−¬ng 16). ADN ®Çu mót ®ång thêi liªn kÕt víi c¸c protein gióp b¶o vÖ ®Çu mót nhiÔm s¾c thÓ khái bÞ biÕn tÝnh, ®ång thêi kh«ng bÞ dÝnh chËp víi c¸c nhiÔm s¾c thÓ kh¸c. C¸c gen vµ c¸c hä ®a gen Chóng ta kÕt thóc bµn luËn vÒ c¸c lo¹i tr×nh tù ADN kh¸c nhau trong c¸c hÖ gen sinh vËt nh©n thËt b»ng viÖc nh×n gÇn c¸c gen h¬n. Chóng ta nhí l¹i r»ng tæng céng c¸c tr×nh tù ADN m· hãa hoÆc cho c¸c protein hoÆc cho c¸c lo¹i tARN vµ rARN chØ chiÕm cã 1,5% hÖ gen ng−êi (xem H×nh 21.7). NÕu chóng ta tÝnh c¶ c¸c tr×nh tù intron vµ c¸c tr×nh tù ®iÒu hßa liªn quan ®Õn gen, th× tæng céng tÊt c¶ c¸c tr×nh tù ADN cã liªn quan ®Õn gen (bao gåm c¶ nh÷ng ®o¹n m· hãa vµ kh«ng m· hãa) chiÕm
  • 12. Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 437 kho¶ng 25% hÖ gen ng−êi. Nãi c¸ch kh¸c, trung b×nh chØ cã kho¶ng 6% (tøc lµ 1,5% cña 25%) tr×nh tù ®Çy ®ñ cña mét gen cã mÆt trong s¶n phÈm cuèi cïng cña gen. Gièng víi c¸c gen cña vi khuÈn, nhiÒu gen ë sinh vËt nh©n thËt lµ nh÷ng tr×nh tù ®¬n nhÊt vµ chØ cã mét b¶n sao duy nhÊt trong mçi bé nhiÔm s¾c thÓ ®¬n béi. Tuy vËy, trong hÖ gen ng−êi vµ hÖ gen cña nhiÒu ®éng vËt vµ thùc vËt kh¸c, nh÷ng gen “®¬n ®éc” nh− vËy chiÕm Ýt h¬n mét nöa tæng sè tr×nh tù ADN ®−îc phiªn m·. C¸c gen cßn l¹i xuÊt hiÖn thµnh c¸c hä ®a gen, tøc lµ tËp hîp cña hai hay nhiÒu gen gièng hÖt hoÆc rÊt gièng nhau. Trong c¸c hä ®a gen gåm c¸c tr×nh tù ADN gièng hÖt nhau, c¸c tr×nh tù ADN lÆp l¹i liÒn kÒ nhau, vµ ngo¹i trõ c¸c gen m· hãa protein histone, chóng m· hãa cho s¶n phÈm cuèi cïng lµ ARN. Mét vÝ dô vÒ hä c¸c tr×nh tù ADN gièng hÖt nhau lµ côm c¸c gen m· hãa cho ba lo¹i ph©n tö rARN lín nhÊt (H×nh 21.10a). Nh÷ng ph©n tö rARN nµy ®−îc phiªn m· thµnh c¸c b¶n phiªn m· duy nhÊt gåm hµng tr¨m thËm chÝ hµng ngh×n lÇn lÆp l¹i kÕ tiÕp nhau vµ tËp hîp thµnh mét hoÆc mét sè côm trong hÖ gen sinh vËt nh©n thËt. Víi nhiÒu b¶n sao cïng cã mÆt trong mét ®¬n vÞ phiªn m· nh− vËy, tÕ bµo cã thÓ nhanh chãng t¹o ra hµng triÖu ribosome cÇn cho qu¸ tr×nh tæng hîp protein. B¶n phiªn m· s¬ cÊp cña c¸c gen rARN sau ®ã ®−îc c¾t xÐn ®Ó h×nh thµnh nªn ba lo¹i ph©n tö rARN. Nh÷ng ph©n tö rARN nµy sau ®ã ®−îc kÕt hîp víi c¸c protein vµ mét lo¹i rARN kh¸c (rARN 5S) ®Ó t¹o nªn c¸c tiÓu phÇn ribosome. C¸c vÝ dô kinh ®iÓn vÒ c¸c hä ®a gen cã tr×nh tù kh«ng gièng hÖt nhau gåm hai hä gen cã quan hÖ víi nhau m· hãa cho globin; ®©y lµ mét nhãm c¸c protein gåm c¸c tiÓu phÇn (chuçi polypeptit) α vµ β cña hemoglobin. Cã mét hä gen n»m trªn NST sè 16 ë ng−êi m· hãa cho c¸c d¹ng kh¸c nhau cña α- globin; mét hä gen cßn l¹i n»m trªn NST sè 11 m· hãa cho c¸c d¹ng kh¸c nhau cña β-globin (H×nh 21.10b). C¸c d¹ng kh¸c nhau cña mçi tiÓu phÇn globin ®−îc biÓu hiÖn vµo c¸c thêi ®iÓm kh¸c nhau cña qu¸ tr×nh ph¸t triÓn, qua ®ã gióp hemoglobin biÓu hiÖn chøc n¨ng hiÖu qu¶ trong c¸c ®iÒu kiÖn m«i tr−êng thay ®æi trong qu¸ tr×nh ph¸t triÓn ë ®éng vËt. Ch¼ng h¹n nh−, ë ng−êi, c¸c d¹ng hemoglobin cã trong ph«i vµ thai cã ¸i lùc víi oxy cao h¬n so víi d¹ng hemoglobin ë ng−êi tr−ëng thµnh; ®iÒu nµy gióp ®¶m b¶o hiÖu qu¶ vËn chuyÓn oxy tõ mÑ sang thai nhi. Trong c¸c côm hä gen m· hãa globin, ng−êi ta cßn t×m thÊy mét sè gen gi¶. H×nh 21.10 C¸c hä gen. Trong phÇn (a) cña trªn h×nh, b»ng c¸ch nµo b¹n cã thÓ x¸c ®Þnh ®−îc chiÒu phiªn m·, nÕu nh− kh«ng cã mòi tªn mµu ®á? Nh©n hem Hä gen α-globin ADN Hä gen β-globin NhiÔm s¾c thÓ sè 16 NhiÔm s¾c thÓ sè 11 Ph«i Thai vµ ng−êi tr−ëng thµnh Ph«i Thai Ng−êi tr−ëng thµnh §o¹n ®Öm kh«ng ®−îc phiªn m· §¬n vÞ phiªn m· C¸c b¶n phiªn m· ARN ADN rARN (a) Mét phÇn hä gen m hãa ARN ribosom. Ba trong sè hµng tr¨m b¶n sao cña c¸c ®¬n vÞ phiªn m· rARN trong hÖ gen cña loµi kú gi«ng ®−îc minh häa ë phÇn trªn (¶nh TEM). Mçi mét “chiÕc l«ng” t−¬ng øng víi mét ®¬n vÞ phiªn m· víi kho¶ng 100 ph©n tö ®ang ®−îc tæng hîp bëi ARN polymerase (®iÓm mµu sÉm däc theo sîi ADN) dÞch chuyÓn tõ tr¸i qua ph¶i. C¸c b¶n phiªn m· ARN ®ang ®−îc “më réng” tõ ADN. S¬ ®å bªn d−íi ¶nh TEM m« t¶ mét ®¬n vÞ phiªn m·. Nã bao gåm c¸c gen (mµu xanh lam) m· hãa ba lo¹i rARN xen gi÷a c¸c vïng ®−îc phiªn m· nh−ng sau ®ã ®−îc c¾t bá (mµu vµng). Ban ®Çu chØ mét b¶n phiªn m· ARN duy nhÊt ®−îc t¹o ra, nh−ng sau ®ã nã ®−îc c¾t xÐn ®Ó t¹o nªn ba ph©n tö rARN kh¸c nhau (mçi lo¹i mét ph©n tö); chóng lµ c¸c thµnh phÇn thiÕt yÕu cña ribosom. Mét lo¹i rARN thø t− (5S rARN) còng lµ thµnh phÇn cña ribosom, nh−ng gen m· hãa nã kh«ng thuéc cïng ®¬n vÞ phiªn m· nµy. (b) C¸c hä gen α α α α-globin vµ β β β β-globin ë ng−êi. Hemoglobin ®−îc cÊu t¹o tõ hai tiÓu phÇn (chuçi) polypeptide lo¹i α-globin vµ hai tiÓu phÇn lo¹i β-globin. C¸c gen (mµu xanh lam) m· hãa cho α-globin vµ β-globin ®−îc t×m thÊy trong hai hä gen cã cÊu tróc tæ chøc nh− minh häa trªn h×nh. C¸c tr×nh tù ADN kh«ng m· hãa xen gi÷a c¸c gen chøc n¨ng trong mçi hä gen gåm c¸c gen gi¶ (mµu xanh lôc) vµ c¸c d¹ng biÕn ®æi kh«ng biÓu hiÖn chøc n¨ng cña c¸c gen chøc n¨ng b×nh th−êng. Tªn gäi c¸c gen vµ c¸c gen gi¶ ®−îc kÝ hiÖu vµ ®äc theo tiÕng Hy l¹p.
  • 13. 438 khèi kiÕn thøc 3 Di truyÒn häc Sù s¾p xÕp c¸c gen thµnh c¸c hä gen ®· gióp c¸c nhµ sinh häc cã nh÷ng hiÓu biÕt s©u h¬n vÒ qu¸ tr×nh tiÕn hãa cña c¸c hÖ gen. Trong môc tiÕp theo, chóng ta sÏ ®Ò cËp ®Õn mét sè qu¸ tr×nh dÉn ®Õn sù ®Þnh h×nh c¸c hÖ gen cña c¸c loµi kh¸c nhau qua qu¸ tr×nh tiÕn hãa. C¬ së thay ®æi ë cÊp ®é hÖ gen lµ ®ét biÕn vµ ®ã còng lµ nÒn t¶ng cña tiÕn hãa häc hÖ gen. D−êng nh− nh÷ng d¹ng sèng ®Çu tiªn chØ chøa mét sè tèi thiÓu c¸c gen, nghÜa lµ chØ cã c¸c gen thiÕt yÕu cho sù tån t¹i vµ sinh s¶n. NÕu ®iÒu nµy lµ ®óng, th× mét chiÒu h−íng tiÕn hãa h¼n lµ ®· diÔn ra cïng víi sù t¨ng lªn vÒ kÝch th−íc hÖ gen, vµ vËt chÊt di truyÒn bæ sung ®· cung cÊp nguyªn liÖu s¬ cÊp cho tÝnh ®a d¹ng t¨ng lªn cña c¸c gen. Trong môc nµy, ®Çu tiªn chóng ta sÏ m« t¶ b»ng c¸ch nµo nh÷ng b¶n sao bæ sung cña toµn bé hay mét phÇn cña hÖ gen cã thÓ xuÊt hiÖn, råi sau ®ã ®Ò cËp ®Õn nh÷ng qu¸ tr×nh x¶y ra tiÕp theo dÉn ®Õn sù tiÕn hãa cña c¸c protein (hoÆc c¸c s¶n phÈm ARN) cã chøc n¨ng hoµn toµn míi hoÆc thay ®æi chót Ýt. Sù nh©n ®«i c¸c bé nhiÔm s¾c thÓ C¸c sù kiÖn ngÉu nhiªn trong gi¶m ph©n cã thÓ dÉn ®Õn tÕ bµo cã thÓ cã mét hoÆc nhiÒu bé nhiÔm s¾c thÓ bæ sung thªm; hiÖn t−îng nµy ®−îc gäi lµ ®a béi thÓ. MÆc dï, trong phÇn lín tr−êng hîp nh÷ng sù kiÖn ngÉu nhiªn ®ã th−êng g©y chÕt, nh−ng trong mét sè hiÕm tr−êng hîp, chóng l¹i thóc ®Èy sù tiÕn hãa cña c¸c gen. ë mét c¬ thÓ ®a béi, mét bé c¸c gen cã thÓ cung cÊp ®ñ c¸c chøc n¨ng thiÕt yÕu cho c¬ thÓ ®ã. Nh÷ng gen ë nh÷ng bé nhiÔm s¾c thÓ bæ sung cã thÓ ph©n ly bëi qu¸ tr×nh tÝch lòy c¸c ®ét biÕn; nh÷ng biÕn dÞ nµy cã thÓ ®−îc duy tr× nÕu nh− c¬ thÓ mang c¸c ®ét biÕn sèng sãt vµ sinh s¶n ®−îc. B»ng c¸ch ®ã, c¸c gen cã thÓ tiÕn hãa víi nh÷ng chøc n¨ng míi. Cïng víi viÖc mét b¶n sao cña gen thiÕt yÕu ®−îc biÓu hiÖn, sù ph©n ly cña mét b¶n sao kh¸c cã thÓ dÉn ®Õn mét lo¹i protein vÉn do gen ®ã m· hãa song ho¹t ®éng theo mét c¸ch míi, qua ®ã lµm thay ®æi kiÓu h×nh cña sinh vËt. KÕt qu¶ cña sù tÝch lòy c¸c ®ét biÕn nµy cã thÓ dÉn ®Õn sù ph©n nh¸nh tiÕn hãa cña mét loµi míi, gièng nh− biÓu hiÖn th−êng thÊy ë thùc vËt (xem Ch−¬ng 24). C¸c ®éng vËt ®a béi còng tån t¹i, song rÊt hiÕm. Sù thay ®æi cÊu tróc nhiÔm s¾c thÓ Tõ l©u c¸c nhµ khoa häc ®· biÕt r»ng vµo mét thêi ®iÓm nµo ®ã trong vßng 6 triÖu n¨m tr−íc khi c¸c d¹ng tæ tiªn cña ng−êi hiÖn ®¹i vµ tinh tinh ph©n ly khái nhau vµ h×nh thµnh nªn c¸c loµi riªng biÖt, mét sù dung hîp hai nhiÔm s¾c thÓ kh¸c nhau vèn cã ë d¹ng tæ tiªn ®· dÉn ®Õn loµi ng−êi cã sè nhiÔm s¾c thÓ ®¬n béi (n = 23) kh¸c víi cña tinh tinh (n = 24). Víi sù bïng næ th«ng tin vÒ tr×nh tù c¸c hÖ gen, giê ®©y chóng ta cã thÓ so s¸nh cÊu tróc vµ tæ chøc nhiÔm s¾c thÓ gi÷a nhiÒu loµi ë cÊp ®é ph©n tÝch chi tiÕt h¬n. Nh÷ng th«ng tin nµy gióp chóng ta cã thÓ t×m hiÓu s©u h¬n vÒ c¸c qu¸ tr×nh tiÕn hãa ®· dÉn ®Õn sù h×nh thµnh c¸c nhiÔm s¾c thÓ còng nh− sù ph¸t sinh c¸c loµi. VÝ dô nh−, trong mét nghiªn cøu, c¸c nhµ khoa häc ®· tiÕn hµnh so s¸nh tr×nh tù ADN gi÷a mçi nhiÔm s¾c thÓ cña ng−êi víi tr×nh tù toµn bé hÖ gen cña chuét. H×nh 21.11 cho thÊy kÕt qu¶ so s¸nh víi nhiÔm s¾c thÓ sè 16 cña ng−êi lµ: nh÷ng “khèi” gen lín trªn nhiÔm s¾c thÓ nµy ®−îc t×m thÊy trªn 4 nhiÔm s¾c thÓ kh¸c nhau cña chuét; ®iÒu nµy cho thÊy c¸c gen trong mçi “khèi” ®· tån t¹i cïng víi nhau trong qu¸ tr×nh tiÕn hãa cña 21.5 Kh¸i niÖm LÆp ®o¹n, t¸i s¾p xÕp vµ ®ét biÕn trong tr×nh tù ADN ®ãng gãp vµo qu¸ tr×nh tiÕn hãa 21.4 1. H·y nªu c¸c ®Æc ®iÓm cña hÖ gen ®éng vËt cã vó lµm chóng trë nªn lín h¬n so víi c¸c hÖ gen sinh vËt nh©n s¬? 2. C¸c intron, c¸c yÕu tè vËn ®éng vµ c¸c tr×nh tù ADN lÆp l¹i ®¬n gi¶n ph©n bè trong hÖ gen kh¸c nhau nh− thÕ nµo? 3. Nªu sù kh¸c nhau trong cÊu tróc cña c¸c hä gen m· hãa rARN vµ m· hãa c¸c protein globin ë ng−êi. Víi mçi hä gen, h·y gi¶i thÝch lîi thÕ cña sù tån t¹i cÊu tróc kiÓu hä gen ®èi víi sinh vËt. 4. Gi¶ sö b¹n t×m thÊy mét tr×nh tù ADN gièng víi tr×nh tù cña mét gen ®· biÕt, nh−ng chóng l¹i kh¸c nhau râ rÖt ë mét vµi nucleotide nhÊt ®Þnh. B»ng c¸ch nµo b¹n cã thÓ x¸c ®Þnh tr×nh tù míi t×m thÊy cã ph¶i lµ mét “gen” biÓu hiÖn chøc n¨ng hay kh«ng?? Xem gîi ý tr¶ lêi ë Phô lôc A. KiÓm tra kh¸i niÖm ®iÒu g× NÕu H×nh 21.11 C¸c khèi tr×nh tù gièng nhau trªn c¸c nhiÔm s¾c thÓ cña ng−êi vµ chuét. C¸c tr×nh tù ADN rÊt gièng nhau ®−îc t×m thÊy trong mét khèi tr×nh tù lín thuéc nhiÔm s¾c thÓ sè 16 cña ng−êi ®−îc t×m thÊy trªn c¸c nhiÔm s¾c thÓ sè 7, 8, 16 vµ 17 cña chuét. §iÒu nµy cho thÊy c¸c tr×nh tù ADN trong mçi khèi ®· lu«n tån t¹i cïng nhau ë c¸c dßng tiÕn hãa dÉn ®Õn sù h×nh thµnh ng−êi vµ chuét kÓ tõ thêi ®iÓm chóng ph©n ly khái nhau tõ tæ tiªn chung. NhiÔm s¾c thÓ sè 16 cña ng−êi C¸c khèi tr×nh tù ADN C¸c khèi tr×nh tù t−¬ng øng ®−îc t×m thÊy trªn 4 nhiÔm s¾c thÓ cña chuét
  • 14. Ch−¬ng 21 C¸c hÖ gen vµ sù tiÕn hãa cña chóng 439 chuét còng nh− ë c¸c nh¸nh tiÕn hãa cña ng−êi. Thùc hiÖn phÐp so s¸nh t−¬ng tù gi÷a nhiÔm s¾c thÓ cña ng−êi víi s¸u loµi ®éng vËt cã vó kh¸c còng ®· gióp c¸c nhµ nghiªn cøu t¸i thiÕt ®−îc lÞch sö tiÕn hãa tæ chøc nhiÔm s¾c thÓ ë t¸m loµi ®éng vËt cã vó nµy. Qua ®ã, c¸c nhµ nghiªn cøu ®· t×m ra nhiÒu lÆp ®o¹n vµ ®¶o ®o¹n trªn c¸c ph©n ®o¹n lín cña NST lµ kÕt qu¶ cña c¸c lçi t¸i tæ hîp x¶y ra trong gi¶m ph©n dÉn ®Õn sù ®øt g·y vµ nèi l¹i kh«ng chÝnh x¸c cña ADN. TÇn sè suÊt hiÖn nh÷ng sù kiÖn nµy d−êng nh− ®· t¨ng nhanh trong kho¶ng 100 triÖu n¨m tr−íc, tøc lµ kho¶ng thêi gian nh÷ng loµi khñng long kÝch th−íc lín trë nªn tuyÖt chñng vµ sè loµi ®éng vËt cã vó t¨ng lªn nhanh chãng. Sù trïng lÆp ngÉu nhiªn nµy râ rµng lµ rÊt thó vÞ bëi v× sù t¸i s¾p xÕp nhiÔm s¾c thÓ ®−îc cho lµ ®· ®ãng gãp vµo sù h×nh thµnh c¸c loµi míi. MÆc dï hai c¸ thÓ mang c¸c nhiÔm s¾c thÓ ®−îc s¾p xÕp kh¸c nhau vÉn cã thÓ giao phèi víi nhau vµ sinh s¶n, nh−ng c¸c c¸ thÓ con sinh ra sÏ cã hai bé nhiÔm s¾c thÓ kh«ng t−¬ng ®ång. V× vËy, sù s¾p xÕp l¹i c¸c nhiÔm s¾c thÓ cã thÓ dÉn ®Õn sù h×nh thµnh hai quÇn thÓ kh«ng cßn cã kh¶ n¨ng giao phèi víi nhau n÷a, vµ nã trë thµnh mét b−íc trong con ®−êng dÉn ®Õn sù h×nh thµnh hai loµi t¸ch biÖt (chóng ta sÏ ®Ò cËp kü h¬n vÒ vÊn ®Ò nµy ë Ch−¬ng 24). §iÒu g©y ng¹c nhiªn mét chót lµ nh÷ng nghiªn cøu t−¬ng tù ®· ph¸t hiÖn ra nh÷ng mèi liªn quan ®Õn y häc. ViÖc ph©n tÝch c¸c ®iÓm ®øt g·y nhiÔm s¾c thÓ liªn quan ®Õn sù t¸i s¾p xÕp cña chóng cho thÊy nh÷ng ®iÓm nµy kh«ng hÒ ph©n bè ngÉu nhiªn, mµ chóng lµ nh÷ng ®iÓm ®Æc thï ®−îc dïng ®i dïng l¹i nhiÒu lÇn. NhiÒu “®iÓm nãng” t¸i tæ hîp nh− vËy t−¬ng øng víi vÞ trÝ s¾p xÕp l¹i nhiÔm s¾c thÓ trong hÖ gen ng−êi vèn cã liªn quan ®Õn c¸c bÖnh bÈm sinh. TÊt nhiªn, c¸c nhµ nghiªn cøu cßn quan t©m c¶ nh÷ng vÞ trÝ kh¸c cã thÓ liªn quan ®Õn nh÷ng bÖnh cho ®Õn nay ch−a ®−îc x¸c ®Þnh. LÆp ®o¹n vµ sù ph©n ly cña c¸c vïng ADN cã kÝch th−íc t−¬ng øng víi gen C¸c lçi trong gi¶m ph©n còng cã thÓ dÉn ®Õn hiÖn t−îng lÆp c¸c vïng nhiÔm s¾c thÓ cã kÝch th−íc nhá h¬n nh÷ng vïng lÆp mµ chóng ta ®· ®Ò cËp trªn ®©y, trong ®ã bao gåm c¸c vïng t−¬ng øng víi chiÒu dµi cña c¸c gen ®¬n lÎ. Ch¼ng h¹n nh−, trao ®æi chÐo kh«ng c©n trong kú ®Çu gi¶m ph©n I cã thÓ dÉn ®Õn mét nhiÔm s¾c thÓ mÊt ®o¹n, trong khi mét nhiÔm s¾c thÓ kh¸c lÆp ®o¹n. Nh− minh häa trªn H×nh 21.12, c¸c yÕu tè vËn ®éng trong hÖ gen lµ nh÷ng vÞ trÝ mµ c¸c nhiÔm s¾c tö kh«ng chÞ em cã thÓ trao ®æi chÐo víi nhau, thËm chÝ ngay c¶ khi chóng kh«ng cã nh÷ng tr×nh t−¬ng ®ång xÕp th¼ng hµng chÝnh x¸c víi nhau. Ngoµi ra, hiÖn t−îng “tr−ît” cã thÓ x¶y ra trong sao chÐp ADN, ch¼ng h¹n nh− m¹ch lµm khu«n xª dÞch so víi m¹ch t−¬ng ®ång míi ®−îc tæng hîp, hoÆc mét phÇn cña m¹ch lµm khu«n bÞ bé m¸y sao chÐp bá qua hay trong tr−êng hîp kh¸c nã ®−îc dïng lµm khu«n hai lÇn. KÕt qu¶ lµ mét ph©n ®o¹n ADN bÞ mÊt ®i hoÆc lÆp l¹i. Cã thÓ dÔ dµng t−ëng t−îng ra c¸ch mµ nh÷ng lçi nh− vËy cã thÓ xuÊt hiÖn trong c¸c vïng tr×nh tù lÆp l¹i gièng nh− c¸c tr×nh tù ADN lÆp l¹i ®¬n gi¶n ®· ®−îc m« t¶ ë trªn. C¸c tr×nh tù ADN lÆp l¹i ®¬n gi¶n víi sè l−îng biÕn ®éng t¹i mét vÞ trÝ nhÊt ®Þnh, vèn ®−îc dïng cho ph©n tÝch STR, cã thÓ lµ do nh÷ng lçi gièng nh− vËy. C¸c b»ng chøng vÒ trao ®æi chÐo kh«ng c©n vµ hiÖn t−îng “tr−ît” cña m¹ch khu«n trong sao chÐp ADN dÉn ®Õn lÆp gen ®−îc t×m thÊy ë nhiÒu hä ®a gen tån t¹i trong c¸c hÖ gen hiÖn nay. Sù tiÕn hãa c¸c gen cã chøc n¨ng liªn quan víi nhau: C¸c gen globin ë ng−êi C¸c sù kiÖn lÆp ®o¹n nhiÔm s¾c thÓ hay lÆp gen cã thÓ dÉn ®Õn sù tiÕn hãa cña c¸c gen cã chøc n¨ng liªn quan ®Õn nhau, ch¼ng h¹n nh− c¸c hä gen m· hãa cho α-globin vµ β-globin (xem H×nh 21.10b). ViÖc so s¸nh c¸c tr×nh tù gen trong mét hä ®a gen cã thÓ chØ ra thø tù c¸c gen xuÊt hiÖn. C¸ch tiÕp cËn ®Ó “t¸i t¹o” l¹i lÞch sö tiÕn hãa cña c¸c gen m· hãa globin ®· chØ ra r»ng tÊt c¶ nh÷ng gen nµy ®Òu cã nguån gèc tõ mét gen globin tæ tiªn chung; gen tæ tiªn nµy ®· tr¶i qua hiÖn t−îng lÆp gen råi ph©n ly thµnh c¸c gen α-globin vµ β-globin tæ tiªn kho¶ng 450 - 500 triÖu n¨m tr−íc (H×nh 21.13, ë trang sau). Mçi gen tæ tiªn nµy sau ®ã tiÕp tôc ®−îc nh©n ®«i mét vµi lÇn, råi nh÷ng b¶n sao cña chóng ph©n ly khái nhau vÒ tr×nh tù, dÉn ®Õn h×nh thµnh c¸c gen thµnh viªn thuéc hä gen nh− hiÖn nay. Trong thùc tÕ, gen globin tæ tiªn chung còng cã thÓ lµ nguån gèc cña gen m· hãa protein c¬ liªn kÕt «xy cã tªn gäi lµ myoglobin vµ protein ë thùc vËt lµ leghemoglobin. Hai lo¹i protein nµy hoÆc ®éng ë d¹ng ®¬n ph©n, vµ c¸c gen cña chóng thuéc “siªu hä globin”. TiÕp theo sau c¸c sù kiÖn lÆp gen, sù kh¸c biÖt gi÷a c¸c gen trong c¸c hä globin râ rµng xuÊt ph¸t tõ c¸c ®ét biÕn ®−îc tÝch lòy trong c¸c b¶n sao cña gen qua nhiÒu thÕ hÖ. VÝ dô, mét m« h×nh hiÖn nay cho r»ng chøc n¨ng thiÕt yÕu cña protein α- globin tr−íc ®©y cã thÓ ®−îc ®¸p øng chØ bëi mét gen duy nhÊt, do vËy c¸c b¶n sao kh¸c cña gen α-globin ®· cã thÓ tÝch lòy c¸c ®ét biÕn ngÉu nhiªn. RÊt nhiÒu ®ét biÕn cã thÓ ®· g©y h¹i cho H×nh 21.12 LÆp gen do trao ®æi chÐo kh«ng c©n. Mét c¬ chÕ mµ qua ®ã mét gen (hoÆc mét ®o¹n ADN kh¸c) cã thÓ bÞ lÆp l¹i (nh©n ®«i) lµ sù t¸i tæ hîp x¶y ra trong qu¸ tr×nh gi¶m ph©n gi÷a c¸c b¶n sao kh¸c nhau cña mét yÕu tè vËn ®éng n»m s¸t vïng biªn cña c¸c gen. Sù t¸i tæ hîp nh− vËy x¶y ra do sù “s¾p hµng lÖch” cña hai nhiÔm s¾c tö kh«ng chÞ em thuéc cÆp nhiÔm s¾c thÓ t−¬ng ®ång dÉn ®Õn sù h×nh thµnh mét nhiÔm s¾c tö mang hai b¶n sao cña gen, trong khi nhiÔm s¾c tö cßn l¹i th× kh«ng cã b¶n sao nµo cña gen ®ã. YÕu tè vËn ®éng Gen C¸c nhiÔm s¾c tö kh«ng chÞ em VÞ trÝ trao ®æi chÐo Sù b¾t cÆp kh«ng chÝnh x¸c cña hai nhiÔm s¾c thÓ t−¬ng ®ång trong gi¶m ph©n vµ
  • 15. 440 khèi kiÕn thøc 3 Di truyÒn häc c¬ thÓ sinh vËt, trong khi mét sè ®ét biÕn kh¸c kh«ng g©y hËu qu¶ g×, nh−ng cã mét sè Ýt ®ét biÕn h¼n lµ ®· lµm thay ®æi chøc n¨ng cña s¶n phÈm protein theo c¸ch cã lîi cho c¬ thÓ sinh vËt vµo mét giai ®o¹n sèng nhÊt ®Þnh cña nã ®ång thêi kh«ng lµm thay ®æi chøc n¨ng vËn chuyÓn «xy cña protein. Cã thÓ gi¶ thiÕt r»ng: chän läc tù nhiªn ®· t¸c ®éng lªn nh÷ng gen nµy vµ duy tr× chóng trong quÇn thÓ. Sù gièng nhau vÒ c¸c tr×nh tù axit amin cña c¸c chuçi polypeptit α-globin vµ β-globin ñng hé cho m« h×nh lÆp gen vµ tÝch lòy ®ét biÕn (B¶ng 21.2). Ch¼ng h¹n nh−, tr×nh tù axit amin cña c¸c β-globin gièng nhau h¬n rÊt nhiÒu so víi tr×nh tù cña α-globin. Sù tån t¹i cña mét sè gen gi¶ n»m gi÷a c¸c gen globin ho¹t ®éng lµ mét b»ng chøng bæ sung kh¸c ñng hé cho m« h×nh nµy (xem H×nh 21.10b). C¸c ®ét biÕn ngÉu nhiªn x¶y ra ë nh÷ng “gen” nµy qua thêi gian tiÕn hãa cã thÓ ®· lµm háng sù biÓu hiÖn chøc n¨ng b×nh th−êng cña chóng. TiÕn hãa cña c¸c gen cã chøc n¨ng míi Trong qu¸ tr×nh tiÕn hãa cña c¸c hä gen globin, hiÖn t−îng lÆp gen vµ ph©n ly sau ®ã ®· t¹o nªn c¸c gen thµnh viªn mµ s¶n phÈm cña chóng ®Òu thùc hiÖn chøc n¨ng gièng nhau (vËn chuyÓn «xy). Theo mét c¸ch kh¸c, mét b¶n sao cña gen ®−îc nh©n ®«i cã thÓ tr¶i qua nh÷ng biÕn ®æi dÉn ®Õn sù xuÊt hiÖn mét chøc n¨ng hoµn toµn míi cña s¶n phÈm protein. C¸c gen m· hãa lysozyme vµ α-lactalbumin lµ mét vÝ dô nh− vËy. Lysozyme lµ mét enzym gióp b¶o vÖ c¬ thÓ ®éng vËt khái sù l©y nhiÔm cña vi khuÈn b»ng viÖc xóc t¸c thñy ph©n thµnh tÕ bµo vi khuÈn; α-lactalbumin lµ mét protein kh«ng cã chøc n¨ng enzym, thay vµo ®ã nã gi÷ vai trß trong qu¸ tr×nh s¶n xuÊt s÷a ë ®éng vËt cã vó. Hai protein nµy rÊt gièng nhau vÒ tr×nh tù axit amin vµ cÊu tróc kh«ng gian ba chiÒu. C¶ hai gen ®−îc t×m thÊy ®ång thêi cã mÆt ë c¸c loµi ®éng vËt cã vó, nh−ng ë chim chØ t×m thÊy gen m· hãa lysozyme. §iÒu nµy chØ ra r»ng vµo mét thêi ®iÓm nhÊt ®Þnh nµo ®ã trong qu¸ khø, sau khi c¸c nh¸nh dÉn ®Õn h×nh thµnh c¸c loµi ®éng vËt cã vó vµ chim ph©n ly khái nhau, gen lysozyme ®· tr¶i qua mét sù kiÖn lÆp gen trong nh¸nh tiÕn hãa h×nh thµnh c¸c ®éng vËt cã x−¬ng sèng, nh−ng kh«ng x¶y ra trong nh¸nh tiÕn hãa cña chim. Cuèi cïng, mét b¶n sao cña gen lysozym ®· ®−îc nh©n ®«i dÉn ®Õn sù tiÕn hãa h×nh thµnh gen m· hãa α- lactanbomin vèn lµ mét protein cã chøc n¨ng kh¸c biÖt ho¹t toµn. Sù s¾p xÕp l¹i c¸c phÇn cña gen: nh©n ®«i vµ tr¸o exon Sù s¾p xÕp l¹i c¸c tr×nh tù ADN s½n cã trong c¸c gen còng ®· gãp phÇn vµo sù tiÕn hãa hÖ gen. Sù cã mÆt cña intron trong phÇn lín c¸c gen ë sinh vËt nh©n thËt ®a bµo cã thÓ ®· thóc ®Èy sù tiÕn hãa cña c¸c protein cã tiÒm n¨ng h÷u dông míi b»ng viÖc gia t¨ng hiÖn t−îng lÆp ®o¹n hay s¾p xÕp l¹i vÞ trÝ cña c¸c exon trong hÖ gen. Chóng ta nhí l¹i tõ Ch−¬ng 17 r»ng mçi exon th−êng m· hãa cho mét miÒn cã cÊu tróc vµ chøc n¨ng ®Æc thï cña protein. Chóng ta còng ®· biÕt trao ®æi chÐo kh«ng c©n trong qu¸ tr×nh gi¶m ph©n cã thÓ dÉn ®Õn hiÖn t−îng lÆp gen trªn mét nhiÔm s¾c thÓ ®ång thêi lµm mÊt gen trªn nhiÔm s¾c thÓ t−¬ng ®ång víi nã (xem H×nh 21.12). B»ng mét qu¸ tr×nh t−¬ng tù, mét exon nhÊt ®Þnh trong gen cã thÓ bÞ nh©n ®«i trªn mét nhiÔm s¾c thÓ, song l¹i bÞ mÊt ®i trªn nhiÔm s¾c thÓ kia. C¸c gen mang c¸c exon lÆp l¹i cã thÓ m· hãa cho mét lo¹i protein chøa hai b¶n sao cña mét miÒn protein. Sù thay ®æi nµy trong cÊu tróc cã thÓ lµm t¨ng c−êng sù biÓu hiÖn chøc n¨ng cña protein nÕu protein ®ã lóc nµy trë nªn æn ®Þnh h¬n, vµ t¨ng kh¶ n¨ng liªn kÕt víi mét chÊt g¾n nhÊt ®Þnh hoÆc lµm thay ®æi mét sè thuéc tÝnh kh¸c. Kh¸ nhiÒu gen m· H×nh 21.13 Mét m« h×nh tiÕn hãa cña c¸c hä gen α-globin vµ β-globin tõ gen globin “tæ tiªn” duy nhÊt. C¸c yÕu tè tr×nh tù mµu xanh lôc lµ c¸c gen gi¶. H·y gi¶i thÝch b»ng c¸ch nµo chóng cã thÓ xuÊt hiÖn sau khi ®· x¶y ra c¸c sù kiÖn lÆp gen. B¶ng 21.2 TØ lÖ gièng nhau trong tr×nh tù axit amin gi÷a c¸c protein globin ë ng−êi Gen globin “tæ tiªn” Gen “tæ tiªn” ®−îc nh©n ®«i (lÆp gen) §ét biÕn tÝch lòy ë c¶ hai b¶n sao VËn ®éng tíi c¸c nhiÔm s¾c thÓ kh¸c TiÕp tôc lÆp gen vµ tÝch lòy ®ét biÕn Hä gen α-globin trªn nhiÔm s¾c thÓ sè 16 Hä gen α-globin trªn nhiÔm s¾c thÓ sè 11 Thêi gian tiÕn hãa C¸c lo¹i α α α α-globin C¸c lo¹i β β β β-globin C¸c lo¹i α α α α-globin C¸c lo¹i β β β β-globin