SlideShare une entreprise Scribd logo
1  sur  23
BÀI GIẢNG THỐNG KÊ SINH HỌC




BÀI GIẢNG THỐNG KÊ SINH HỌC
nguyên bản tiếng Anh: Nguyễn Văn Tuấn
người dịch: Phan Văn Song




THAY LỜI NÓI ĐẦU
Hơn một thế kỉ trước, nhà toán học Pháp Pierre Louis đã xây dựng và cổ vũ "phương pháp số" dùng để
thẩm định việc điều trị. Tuy nhiên, ông đã bị hầu hết các thầy thuốc hàng đầu lúc bấy giờ phản đối. Đáng
tranh cãi là Claude Bernard, cha đẻ của y học thưc nghiệm hiện đại đã phê phán việc áp dụng toán học
vào y học; ông tuyên bố: các nhà toán học cào bằng quá nhiều và suy luận về các hiện tượng như họ vẽ
ra trong đầu chứ không như chúng tồn tại trong tự nhiên. Ông không ngừng kêu gọi các thầy thuốc "từ
khước việc dùng thống kê làm cơ sở cho khoa học thực nghiệm về điều trị và bệnh lí.” Trớ trêu thay, gần
100 năm sau, các học trò của ông đã vứt bỏ hoàn toàn lời khuyên của ông. Thống kê đã trở nên một
phần thiết yếu trong nghiên cứu y học. Ngày nay hầu như mọi công bố y học đều có phần "phương pháp
thống kê" để chứng tỏ tính đáng tin cậy của công trình.

Tuy nhiên, trong những năm gần đây, việc sử dụng phổ biến thống kê đã trở thành việc lạm dụng phổ
biến thống kê. Y văn bị nhét đầy với thông tin thống kê bề bộn và với những phát hiện mâu thuẫn không
dứt. Có nhiều bằng chứng hùng hồn cho thấy rằng việc sử dụng không phù hợp và thao tác chưa thuần
thục về các số liệu thống kê đã góp phần đáng kể vào bi kịch về sự nhầm lẫn này của tri thức. Nhiều
người viết sách và các bài báo dựa trên ứng dụng không phù hợp của thống kê. Một số tác giả rất được
nhiều người biết đến vì họ chẳng ngại ngùng tung ra các lời giải cho các vấn đề chưa được giải quyết.
Tuy nhiên, một số nhà điều tra không nhận ra rằng họ đã phạm các lỗi lầm trong thống kê hoặc do dốt nát
hoặc do thiếu kiến thức thống kê. Dù với lí do gì, dựa vào phân tích thống kê khi không hiểu bản chất của
nó là bước đầu tiên trong việc đánh mất tính trung thực trí tuệ. Vì vậy, hiểu biết nguyên tắc đứng phía sau
một phân tích thống kê là rất quan yếu trong việc giải thích dữ liệu.

Mười một chủ đề thống kê sinh học sau đây tiêu biểu cho một tập hợp các nguyên lí thống kê, định lí, tiên
đề và định nghĩa sơ đẳng được trình bày dưới dạng gần như phi kĩ thuật. Các chủ đề được chia thành
hai phần: phần một bàn về xác suất và các khái niệm thống kê; phần hai bàn về thống kê ứng dụng, trong
đó sẽ thảo luận về phân tích thống kê dữ liệu và các kết luận. Do đối tượng dự kiến của khóa học này là
những người nghiên cứu với ít hoặc không có kiến thức thống kê, do đó, tất cả các phát biểu thống kê
trong các bài học này được trình bày không có chứng minh toán học kèm theo.

Bất kì việc học tập nào cũng sẽ không đầy đủ nếu không có một sự tiêu hóa nào đó các nguyên lí bộ
môn. Để minh họa cho ý tưởng và nguyên lí đằng sau mỗi chủ đề, tôi cũng có trình bày một bộ sưu tập
các bài tập và các bài toán để giải hay thảo luận. Một số câu hỏi có thể được xếp loại như là "bài tập"
nhằm mục đích minh họa nguyên tắc cơ bản; các câu hỏi khác có thể được xếp loại như là "bài toán" mà
thông thường sẽ đòi hỏi nhiều kĩ năng hơn để giải quyết chúng. Hầu hết những câu hỏi này đã được trích
ra từ các tạp chí y học và kinh nghiệm của cuộc sống thực. Nếu bạn không thể giải được một câu hỏi,
đừng tuyệt vọng. Phương pháp giảng dạy của Socrate không nhằm vào việc luyện tập để người ta đưa ra
nhanh chóng những câu trả lời, nhưng để giáo dục qua các câu hỏi. Nếu đã nỗ lực nhiều lần nhưng
không thành công, bạn có thể liên hệ với tôi và chúng ta hi vọng sẽ có cách xử lí nó. Hãy nhớ rằng các lời
giải cho bất kì bài toán có giá trị nào hiếm khi đến với chúng ta một cách dễ dàng mà không cần sự làm
việc chăm chỉ, đó phải là kết quả của nỗ lực trí tuệ trong nhiều ngày, nhiều tuần, hoặc nhiều tháng, thậm


                                                    1
BÀI GIẢNG THỐNG KÊ SINH HỌC



chí nhiều năm. Vâng, không có câu hỏi nào trong khóa học này đòi hỏi bạn mất nhiều năm hay nhiều
tháng để giải, nhưng có thể phải mất nhiều giờ để giải ra.

Sự xuất hiện của máy tính điện tử chắc chắn đã cách mạng hóa việc thực hành thống kê . Máy tính đã
thay thế bút chì để giải các phương trình phức tạp khi phân tích dữ liệu. Tuy nhiên, thống kê không chỉ là
một tập hợp các định lí hoặc công thức, nó là một phong cách tư duy. Máy tính cũng là một phong cách
tư duy. Vì vậy, tôi không tin rằng số liệu thống kê có thể được rút gọn thành một cái nhấn nút trên máy
tính mà vẫn giữ được phong cách suy nghĩ, mặc dù có những người tuyên bố đã làm như vậy. Với niềm
tin này trong đầu, hầu hết các bài tập trong khóa học này có dụng ý để giải bằng tay với sự trợ giúp của
một máy tính hoặc một phần mềm bảng tính (spreadsheet) nói chung - không phải bởi một phần mềm
thống kê. Tôi luôn luôn tin rằng trong làm bài tập, một lời giải bằng tay sẽ thú vị hơn và trọn vẹn hơn một
lời giải "tự động".

Các bài giảng này là kết quả từ nỗ lực của một người thiếu kinh nghiệm. Nó khó có thể hoàn hảo và còn
rất nhiều vấn đề bỏ ngõ. Hơn nữa, tài liệu này đã được viết trong một thời gian rất ngắn và do đó sai sót
là không thể tránh khỏi. Nếu bạn tìm thấy xin vui lòng cho tôi biết để chỉnh lại cho đúng.

Chúc may mắn.




                                                     2
BÀI GIẢNG THỐNG KÊ SINH HỌC



Chủ đề 1: MỘT SỐ KIẾN THỨC TOÁN HỌC CƠ BẢN
                                    Ngay cả một người chậm trí mà được đào tạo và luyện tập trong số
                                    học, nếu anh ta không thu được cái gì khác từ nó, ít ra cũng hoàn
                                    thiện và trở nên sắc nét hơn trước.
                                                                                Plato

Nhà thông thái Bertrand Russell gần đây đã viết trong một cuốn sách của ông: "có một lối đi dẫn qua các
cánh đồng ở New Southgate, và tôi thường đi đến đó một mình đề ngắm hoàng hôn và dự định tự tử. Tuy
nhiên tôi không tự tử bởi vì tôi muốn tìm hiểu thêm về toán học”. Tôi chắc chắn hầu hết chúng ta sẽ
không phủ nhận sức mạnh của toán học, nhưng có thể có nhiều hơn một người trong chúng ta đã không
ưa môn học này. Nếu chúng ta suy nghĩ nghiêm túc về toán học, chúng ta thấy rằng nó là cơ sở cho tất
cả mọi thứ mà chúng ta làm hiện nay. Không ngạc nhiên rằng toán học được coi là hoàng tử của khoa
học. Một trong những đồng nghiệp của tôi ở viện Garvan mô tả ý tưởng toán học như là “chân lí vĩnh cửu
". Tôi thích cách mô tả đó. Trong hầu hết các khoa học, đặc biệt là khoa sinh học, tốc độ các "khám phá"
làm ta chóng mặt; rủi thay, những cái gọi là khám phá thường phá đổ những ý tưởng mà người khác đã
cố xây dựng nên. Thậm chí tệ hơn, cái người này thiết lập lại bị người khác dỡ bỏ đi. Riêng trong toán
học mỗi thế hệ lại thêm một câu chuyện mới vào cấu trúc cũ (thường trực), bởi vì đơn giản ý tưởng là vô
tận.

Thống kê thường được định nghĩa như là một ngành của toán học ứng dụng, tới lượt mình nó lại là một
ngành hiện đại của của toán học hiện đại. Trong thực hành, toán học hiện đại là một trong những công cụ
chủ yếu của thống kê. Vì vậy, để hiểu thống kê, có được một số kiến thức về toán học sơ đẳng là một
điều bắt buộc. Trong chủ đề này, chúng ta sẽ khảo sát một số ý tưởng cơ bản của toán học hiện đại như
các khái niệm về hàm số, phương trình, các phép toán lấy tổng, v.v… trước khi đi vào các cuộc thảo luận
thống kê.




                                                   3
BÀI GIẢNG THỐNG KÊ SINH HỌC



0. BẢNG CHỮ HI LẠP THÔNG DỤNG VÀ CÁC KÍ HIỆU TOÁN
A.       CÁC CHỮ CÁI HI LẠP THÔNG DỤNG
Trong thống kê, gần như quy ước người ta kí hiệu các tham số của một quần thể (dân số) bằng chữ cái
Hi Lạp và các tham số tương ứng bằng chữ cái Latin, Chữ cái Latin mọi người đều quen thuộc trong khi
chữ cái Hi Lạp có lẽ cần phải ôn lại. Bảng sau đây liệt kê các chữ cái Hi Lạp thông dụng nhất mà ta sẽ
dùng hoặc gặp trong các bài học sau này.

CHỮ IN        CHỮ THƯỜNG            CÁCH ĐỌC
Α             α                     alpha
Β             β                     beta
Χ             χ                     chi
Γ             δ                     delta
Δ             ε                     epsilon
Φ             φ                     phi
Γ             γ                     gamma
Μ             μ                     mu(y)
Ν             ν                     nu(y)
Π             π                     pi
Θ             θ                     theta
Ρ             ρ                     rho
΢             ζ                     sigma
Λ             λ                     lambda
Κ             κ                     kappa

B.       CÁC KÍ HIỆU TOÁN THÔNG DỤNG
Và tất nhiên, việc học toán không thể hoàn thành nếu không thể giao tiếp bằng ngôn ngữ toán học. Đây
là một số trong những kí hiệu thường được sử dụng trong toán học đòi hỏi bạn phải thông thạo:

KÍ HIỆU  Ý NGHĨA
─────────────────────────────────────────────────
∈             thuộc về
∉             không thuộc về
⇒             bao hàm / suy ra rằng
⇐             được suy ra từ
⇔             tương đương với / nếu và chỉ nếu
N             số tự nhiên
Z             số nguyên
Q             số hữu tỉ
R             số thực
[a, b]        khoảng đóng a, b (tập hợp các số x ∈ R: a ≤ x ≤ b)
(a, b)        khoảng mở a, b (tập hợp các số x ∈ R: a < x < b)
[a,b)         khoảng nửa mở (đóng) a, b (tập hợp các số x ∈ R: a ≤ x < b)
(a,b]         khoảng nửa đóng(mở) a, b (tập hợp các số x ∈ R: a < x ≤ b)
∀             với mọi
∃             tồn tại

                                                   4
BÀI GIẢNG THỐNG KÊ SINH HỌC



I. KÍ HIỆU TỔNG Σ
Nhiều tính toán thống kê dính dáng tới kí hiệu này. Trước khi đi vào thống kê chúng ta cần quen thuộc
với kí hiệu sigma      Σ, đây là một cách viết tắt của tổng.
Ví dụ, thay vì viết x1 + x2 + x3 + x4 + x5 ta viết
                                5

                                    ������������
                            ������=1
(đọc là tổng của x chỉ số i, với i chạy từ 1 đến 5).

Hay
                                                                  5
                ������0 + ������2 + ������4 + ⋯ + ������10 =                                ������2������
                                                                 ������=0
Tương tự, chúng ta cũng có thể viết
                                                                       ������

                ������ 1 + ������ 2 + ������ 3 + ⋯ + ������ ������ =                                 ������ ������
                                                                   ������ =1

Lưu ý rằng ������ ������������ = ������ =1 ������������ vì chúng đều là cách viết tắt của tổng ������1 + ������2 + ������3 + … + ������������ tức là tên gọi
              ������=1     ������
của chỉ số là không quan trọng.

Ngoài ra trong trường hợp không có nhầm lẫn về các giá trị đầu và cuối của chỉ số, thay vì viết đầy đủ
 ������
 ������=������ ������������ ta có thể viết ngắn gọn là ������ ������������ hay đơn giản hơn là ������������ .

Dễ dàng suy ra các đẳng thức sau đây:
                 ������

                       ������ = ������������
                ������=1
                  ������                  ������

                       ������������������ = ������          ������������
                ������=1                 ������=1

                  ������                                ������                      ������

                       (������������ + ������������ ) =                       ������������ +                ������������
                ������=1                               ������=1                ������=1

Ví dụ: cho cấp số nhân xi = aq i , i = 0, 1, 2, 3, ..... Ta đã biết: tổng của n số hạng đầu tiên của cấp số này
có công thức là:
                           ������               ������                         ������
                                                         ������
                                                                                           ������(1 − ������ ������+1 )
                ������������ =          ������������ =             ������������ = ������                  ������ ������ =
                                                                                               1 − ������
                         ������=0              ������=0                    ������=0




                                                                                            5
BÀI GIẢNG THỐNG KÊ SINH HỌC



                                                                        ������
Giả sử |q| < 1, khi n → ∞ thì qn+1 → 0, do đó ������������ →                          , từ đó khá hợp lí khi nói rằng tổng vô hạn các số
                                                                       1−������
                                                    ������
hạng của cấp số nhân này là ������ =                         và ta viết:
                                                  1−������
                         ∞
                                             ������
                ������ =           ������������ ������ =
                                           1 − ������
                        ������=0

Tổng quát, người ta cũng đã mở rộng kí hiệu cho tổng vô hạn các số hạng khi tổng này “tính được” như
trong ví dụ trên:
                 ∞

                       ������������ = ������1 + ������2 + ������2 + … + ������������−1 + ������������ + …
                ������=1

Ví dụ: Ta có:
                 ∞                            ∞
                       1                            ������ ������
                           = 1,                           = ������ ������
                       2������                          ������!
                ������=1                         ������=0

Hiển nhiên nhiều biểu thức cũng có thể viết đơn giản hơn bằng kí hiệu này. Một số đẳng thức thú vị khác
sẽ được đưa vào phần bài tập để các bạn tự làm.


II. KÍ HIỆU TÍCH Π
1.1. KÍ HIỆU GIAI THỪA
Giả sử chúng ta có n vật, người ta có thể chứng mình rằng số các cách sắp xếp (hoán vị) n vật này trên
một đường thẳng là n! (đọc là n giai thừa), kí hiệu này được định nghĩa như sau:

                n! = n(n – 1)(n – 2)(n – 3). ... .3.2.1

Để tiện trình bày các kết quả tổng quát người ta cũng quy ước thêm: 0! = 1! =1.

Ví dụ: 3! = 3 × 2 × 1 = 6
       5! = 1× 2 ×3 ×4 × 5 = 120

Như chúng ta có thể thấy, với n lớn thì n! sẽ hết sức lớn và có thể không tính nổi bằng các máy tính cầm
tay, lúc đó ta có thể dùng công thức tính xấp xỉ sau đây:

                ������! ≈ 2������������������������ ������ −������
Trong đó e ≈ 2.71828…là cơ số của logarit tự nhiên và π≈ 3.14158… Công thức này được gọi là công
thức xấp xỉ Stirling.

2.2. KÍ HIỆU TÍCH Π
Kí hiệu này được định nghĩa như sau:
                 ������

                       ������������ = ������1 ������2 ������3 … ������������
                ������=1

                                                                       6
BÀI GIẢNG THỐNG KÊ SINH HỌC



Theo đó:
                     ������

                           ������ = ������ ������
                    ������=1
và
                     ������                          ������
                                          ������
                           ������������������ = ������                   ������������
                    ������=1                        ������ =1
Cũng có thể chứng minh được:
                     ������                    ������              ������

                           ������������ ������������ =            ������������           ������������
                    ������=1                  ������=1           ������ =1
Với kí hiệu tích ta có thể viết lại định nghĩa giai thừa trên đây như sau:
                              ������

                   ������! =            (������ + 1 − ������)
                            ������=1
hay cũng có thể viết cách khác là
                            ������ −1

                   ������! =             ������ − ������
                            ������=0
hoặc đơn giản hơn là
                              ������

                   ������! =            ������.
                            ������=1
Việc kiểm chứng các đẳng thức này hoặc viết lại dưới dạng khác hơn nữa xem như bài tập nhỏ dành cho
các bạn.

Người ta cũng mở rộng kí hiệu này cho tích vô hạn các thừa số như ở kí hiệu tổng miễn là tích đó “tính
được”:
                                    ∞

                                          ������������ = ������1 ������2 ������3 … ������������ −1 ������������ ������������+1 …
                                   ������=1




III. HỆ THỐNG SỐ THỰC
Trong phần này, chúng ta sẽ ôn lại ngắn gọn cấu trúc của hệ thống số thực.

3.1. Số tự nhiên:
Các số 1, 2, 3, và cứ thế tiếp tục được gọi là số tự nhiên.1]

Tập hợp các số tự nhiên được kí hiệu là N.

          N = {1, 2, 3, … n, ... }



1
    Để thuận tiện, nhiều tác giả coi tập số tự nhiên N có chứa cả số 0.
                                                                        7
BÀI GIẢNG THỐNG KÊ SINH HỌC



Nếu chúng ta cộng hoặc nhân hai số tự nhiên bất kì, kết quả luôn luôn là một số tự nhiên. Tuy nhiên, nếu
chúng ta trừ hoặc chia hai số tự nhiên, kết quả không luôn luôn là một số tự nhiên. Chẳng hạn, 8 - 5 = 3
và 8 ÷ 2 = 4 là số tự nhiên, nhưng 5 - 8 = -3 và 2 ÷ 7 không cho kết quả trong số tự nhiên.
Như vậy, trong hệ thống số tự nhiên, chúng ta có thể cộng và nhân, nhưng không phải luôn luôn có thể
trừ hoặc chia.

3.2. Số nguyên:
Để khắc phục những hạn chế trong phép trừ, chúng ta mở rộng hệ thống số tự nhiên ra thành hệ thống
các số nguyên bằng cách lấy hết tất cả các số tự nhiên rồi thêm vào các số đối của chúng (số âm) và số
không (0).
Tập hợp các số nguyên được kí hiệu là Z .

        Z = { ... -3, -2, -1, 0, 1, 2, 3,… }

3.3. Số hữu tỉ:
Nhưng chúng ta vẫn không thể luôn luôn chia được hai số nguyên bất kì.
Chẳng hạn, 8 ÷ (-2) = -4 là một số nguyên, nhưng 8 ÷ 3 không phải là một số nguyên.
Để khắc phục vấn đề này, chúng ta mở rộng hệ thống số nguyên thành hệ thống số hữu tỉ. Chúng ta
định nghĩa một số là hữu tỉ nếu nó có thể biểu diễn được như là một tỉ số của hai số nguyên.

Tập hợp các số hữu tỉ được kí hiệu là Q.

        Q = { m/n | ∀ m, n ∊ Z & n ≠ 0}

(Kí hiệu ∀ đọc là với mọi và kí hiệu ∊ đọc là thuộc về)
Theo đó, tất cả bốn phép tính số học cơ bản (cộng, trừ, nhân và chia) đều có thể thực hiện được trong Q.

3.4. Số vô tỉ:
Trong sử dụng hàng ngày cũng tồn tại nhiều số không phải là số hữu tỉ; nghĩa là chúng không thể biểu
diễn được dưới dạng một tỉ số của hai số nguyên.

Ví dụ   2, 3, π, v.v... không là số hữu tỉ; những số như thế gọi là số vô tỉ.

3.5.    Số thực
Từ số thực được dùng để chỉ chung cho số hữu tỉ hoặc vô tỉ.
Tập hợp các số thực được kí hiệu là R.

Để có một định nghĩa đầy đủ của số thực sẽ phải liên quan đến việc giới thiệu một số ý tưởng mới, và
chúng ta không đi vào nhiệm vụ này ở đây. Tuy nhiên, có thể có được một ý niệm đúng đắn về số thực
bằng cách hiểu nó dưới dạng số thập phân. Bất kì số hữu tỉ nào cũng có thể được biểu diễn dưới dạng
thập phân, đơn giản bằng cách chia tử cho mẫu trong phép chia dài (chia bằng tay). Có hai trường hợp
xảy ra:
    phần thập phân dừng lại hẳn ở một vị trí nào đó;
    kể từ một vị trí nào đó phần thập phân phát triển theo hướng lập lại vô hạn một nhóm chữ số theo
        một khuôn mẫu nào đó (được gọi là vô hạn tuần hoàn).




                                                     8
BÀI GIẢNG THỐNG KÊ SINH HỌC



Ví dụ ¼ = 0.252 (dừng sau 2 chữ số thập phân) còn 1/6 = 0.161616... (lặp lại vô hạn cặp số 16 ngay từ
chữ số thập phân đầu tiên).

Đối với trường hợp hai, trong thực hành tính toán, ta không thể làm việc với vô hạn chữ số của phần thập
phân mà phải chấp nhận tính toán với một số nhất định các chữ số sau dấu phẩy tuỳ độ chính xác cho
phép, tức là ta chỉ tính toán gần đúng mà thôi3.

Số vô tỉ cũng có thể biểu diễn với dạng thập phân4 nhưng phần thập phân không bao giờ dừng lại và
cũng không lập lại tuần hoàn như số hữu tỉ.5

3.6. Số phức:
Trong hệ thống số thực, phép lấy căn bậc hai chỉ có thể thực hiện cho các số không âm (dương hay
bằng 0). Mỗi số a > 0 có 2 căn bậc hai đối nhau và ta dùng kí hiệu ������ để chỉ căn bậc hai dương của a.
Nếu chúng ta chỉ xem xét số thực thì căn bậc hai của một số âm không có nghĩa, chẳng hạn −2 hoặc
      3
    − 5 không tồn tại và chẳng có ý nghĩa gì trong hệ thống số thực. Tuy nhiên, những con số này lại tồn tại
trong hệ thống số phức (một hệ mở rộng của hệ thống số thực, kí hiệu là C) mà chúng ta không xét tới
ở đây.



IV. LUỸ THỪA NGUYÊN VÀ PHÉP TOÁN MŨ.
Nếu x, y là 2 số thực bất kì và m, n là 2 số nguyên bất kì thì các quan hệ sau đây là đúng:
                                                                1
     (a) ������ ������ ������ ������ = ������ ������ +������            (b) ������ −������ = ������ ������ (������ ≠ 0)
          ������ ������
     (c) ������ ������ = ������ ������ −������ (������ ≠ 0)         (d) ������ ������     ������
                                                               = ������ ������������
                  ������                              ������ ������        ������ ������
     (e) ������������          = ������ ������ ������ ������        (f)   ������
                                                          = ������ ������ (������ ≠ 0)
                          ������
     (g) ������ ������ /������ =
                  ������ ������ (������ ≥ 0 ������������������ ������ ������������ẵ������)
Từ (g) ta suy ra:       (h) ������ = ������ 1/2 ������ ≥ 0
và:                     (i) ������ 2 = |������|

 Biểu thức (g) là một mở rộng của khái niệm luỹ thừa với số mũ nguyên sang số mũ hữu tỉ và từ (g),
người ta có thể tiếp tục mở rộng định nghĩa luỹ thừa sang số mũ thực để có phép toán mũ: ������ ������ với x > 0
và r là một số thực bất kì.

Phép toán mũ có đủ tất cả các tính chất (a) – (g) ở trên với m, n bây giờ là số thực.



2
  Thật ra có thể viết ¼ = 0.250000…. (phần thập phân lập lại vô hạn theo khuôn mẫu là 0,0,0… từ chữ số thập phân thứ 3).
3
  Trong tính toán ta chỉ làm việc với tập các số hữu tỉ thập phân
          ������10 = ������ ∈ ������ |������ = ������            ������
                               ������=−������ ������������ 10 ; ������������ ∈ 0,1,2, … ,9 ; ������, ������ ∈ ������ mà thôi.
4
  Việc biểu diễn số thập phân thường đòi hỏi phải có kiến thức toán học cao cấp nên ta sẽ không bàn ở đây. Một ví dụ mịnh hoạ
là ta có thể biểu diễn e dưới dạng thập phân bằng cách tính toán dựa vào công thức:
           e =1/1! + 1/2! + 1/3! + ..... + 1/n! + …
5
  Trong thực hành tính toán, ta chỉ sử dụng dạng thập phân gần đúng của số vô tỉ, ví dụ π ≈ 3.141592 tức vẫn chỉ dùng số hữu tỉ,
thật ra chỉ dùng số thập phân trong Q10 như đã nêu ở cước chú 4.
                                                                       9
BÀI GIẢNG THỐNG KÊ SINH HỌC



Khi chúng ta ở trong chủ đề này, có thể sẽ hữu ích khi lưu ý rằng có nhiều hơn một sự khác biệt cơ bản
giữa x² + y² và (x + y)² (hãy tự kiểm chứng lại điều này). Sự khác biệt đó sẽ được khai thác về sau trong
loạt bài này, tuy nhiên, một số đẳng thức về nhị thức có thể hữu ích ở đây:

         (x ± y)² = x² ± 2xy + y²
         (x ± y)³ = x³ ± 3x²y + 3xy² ± y³ …

Loại khai triển này sẽ được bàn tới trong chủ đề xác suất.


V. LOGARIT (LOGARITHM)
ĐỊNH NGHĨA:
Cho 0 < a ≠ 1, x > 0 và y là số thực, nếu x = ay , thì y được gọi là logarit cơ số a của x và ta viết
             y = logax .
Như vậy:      y= loga x ⇔ x= a y nên phép lấy mũ cơ số a là phép toán ngược của phép toán lấy loga
nên còn được gọi là phép toán anti loga

* Dễ thấy từ định nghĩa             logaa =1 và loga1 = 0.

Người ta thường kí hiệu logex là lnx (e = 2.71828… là cơ số của logarit tự nhiên hay logarit Napier) và
log10x là logx.

Một vài tính chất quan trọng của logarit như sau:
   (a)           logaxy = logax + logay
   (b)           loga(x/y) = logax - logay
   (c)           loga xn = nlogax
   (d)           loga x = logbx / logba (quy tắc đổi cơ số)


VI. HÀM SỐ
6.1. HÀM SỐ TỔNG QUÁT:
Khái niệm hàm số là một trong những khái niệm cơ bản của toán học hiện đại.
Một hàm số diễn đạt giả thuyết về một đại lượng này phụ thuộc vào (xác định bởi) một đại lượng khác.
  I.   Khối lượng xương phụ thuộc vào tuổi của chủ thể.
 II.   Chiều cao phụ thuộc vào chủng tộc …

Nếu một hàm f gán một giá tri y (duy nhất) cho một đối tượng x nào đó, ta viết:
             y = f(x)

Trong toán học hình thức, ta gọi tập các giá trị có thể có được của x là miền xác định (domain) và tập
các giá trị có thể có được của y (thuộc về một tập nào đó) là miền giá trị (range). Trong thống kê hiện
đại, x được gọi là biến số “độc lập” và y là biến số “phụ thuộc”.

Một hàm f có miền xác định A và (tập chứa) miền giá trị B cũng có thể diễn tả dưới dạng kí hiệu như sau:
              f:A→B
                x→y
                                                        10
BÀI GIẢNG THỐNG KÊ SINH HỌC



Ví dụ: f(x) = 3x² + 7x +2
        với x = -3      ta có f(-3) = 3(-3)² + 7(-3) +2 = 50

Theo thói quen trong toán học, nhiều khi người ta chỉ cho một hàm số dưới dạng công thức. Trong
trường hợp này, chúng ta phải tự xác định miền xác định của hàm số, đó là tập hợp các phần tử làm cho
công thức có nghĩa.

Ví dụ, với hàm số y = ������, miền xác định không phải là toàn bộ tập số thực R mà chỉ là tập các số x≥ 0 vì
chúng ta không thể lấy căn của một số âm; với y = logax, giá trị của x phải lớn hơn 0 vì với x ≤ 0, y không
xác định. Tương tự, đối với hàm số có dạng y = 1/x thì miền xác định phải là tập các số thực x ≠ 0.

Trường hợp miền xác định của một hàm f là tập con của tích 2, 3, … , n tập hợp, ta có hàm với 2, 3, … ,
n biến số. Tương tự như trường hợp một biến, hàm nhiều biến y = f(x1, x2, … , xn) từ tập tích
A1×A2×…×An đến tập B có thể diễn tả bằng kí hiệu như sau:
               f: A1×A2×…×An → B
                  (x1, x2, … , xn) ↦ y

Ví dụ, * y = f(u, v, t) = 1+ 2uvt – u + t2 là một hàm 3 biến
       Ta có f(1, 2,-1) = 1 +2×1×2×(-1) – 1 + (-1)2 = -3
       * mật độ khoáng trong xương(BMD) là một hàm 2 biến (tuổi và trọng lượng):
                BMD = a + b.Age + c.Weight

6.2. HÀM TUYẾN TÍNH
Một hàm tuyến tính có dạng:
              y = a + bx     [1]
trong đó a được gọi là tung độ gốc hay hệ số chắn (intercept) (khi x = 0 thì y = a) và b được gọi là độ
dốc hay hệ số góc (slope/gradient) (biểu thị mức độ thay đổi của y ứng với thay đổi 1 đơn vị của x).

Khi biểu diễn trong không gian 2 chiều x-y (mặt phẳng toạ độ) thì đồ thị của hàm tuyến tính là một đường
thẳng.
Nếu 2 biến x và y thoả mãn [1] ta nói x và y có quan hệ tuyến tính.

Cho 2 điểm bất kì (x1, y1) và (x2, y2) trên đồ thị của hàm tuyến tính (Hình 1A) thì độ dốc có thể xác định
bằng hệ thức sau đây:

                      ������2 − ������1 độ ������������������������ đổ������ ������ủ������ ������
               ������ =            =
                      ������2 − ������1 độ ������������������������ đổ������ ������ủ������ ������

Tuy nhiên trong thực nghiệm, việc đo đạc thường không cho ta các giá trị chính xác của x và y, nhưng ta
có thể đo được một loạt các giá trị gần đúng của x và y. Nếu các cặp số (x, y) thoả một số điều kiện nhất
định, chẳng hạn khi biểu diễn các cặp giá trị (x, y) đó trên một mặt phẳng toạ độ, thấy chúng gần như
thẳng hàng. Khi đó quan hệ của x và y có thể là một quan hệ tuyến tính với các hệ số a và b chưa biết và
với các giá trị (x, y) đo được ta có thể lập ra một hệ nhiều phương trình, từ đó có thể dùng phương pháp
bình phương nhỏ nhất (có trong nhiều phần mềm thống kê) để ước tính a và b. Nếu không dùng các
phần mềm thống kê, ta có thể tính b theo công thức (xem như một mở rộng của công thức trên).

               b = ΢ [ (xi - ������)(yi - ������) ] / ΢ [ (xi - ������)2]


                                                                11
BÀI GIẢNG THỐNG KÊ SINH HỌC



Nếu có 2 đường thẳng y = a1 + b1x và y = a2 + b2y, ta có một vài nhận xét sau:

    a. Hai đường thẳng là song song khi và chỉ khi độ dốc của chúng bằng nhau, tức là b1 =b2.
    b. Mặt khác, nếu b1 ≠ b2 thì hai đường thẳng không song song. Trong thống kê ta gọi hiện tượng này
       là “sự tương tác” (interaction) (Hình 1C).




Hính 1 (A) hàm tuyến tính dạng y = a + bx            (B) 2 đthẳng song song   (C) “tương tác”

Hệ thức [1] có thể mở rộng hơn nữa bao gồm nhiều hơn một biến số như sau:
               y= b0 + b1x1 +b2x2 + … + bnxn    [1’]

Phương trình tuyến tính [1’] xác định một siêu phẳng (n chiều) trong không gian n+1 chiều.

Ví dụ mật độ khoáng trong xương(BMD) phụ thuộc rất nặng vào tuổi và trọng lượng cơ thể, chúng ta có
thể viết mệnh đề về mối quan hệ này như sau:

                BMD = a + b.Age + c.Weight
trong đó a, b, c là 3 hằng số đã được ước tính. Từ đó, với mỗi giá trị của Age và Weight, ta có thể ước
lượng BMD từ công thức trên.
Chúng ta sẽ khảo sát hàm số này trong bối cảnh phân tích hồi quy sau này trong loạt bài giảng này.

6.3. HÀM BẬC HAI
Chúng ta thường gặp những trường hợp mà mối quan hệ hàm số giữa biến phụ thuộc (y) và các biến độc
lập (x) không tuyến tính mà có tính cong.

Một trong những hàm phổ biến là hàm bậc hai, có dạng:
               y = f (x) = ax² + bx + c         [2]
trong đó a, b và c là hằng số và a ≠ 0.

                                                  −������± ������ 2 −4������������
Khi y = 0 và ������2 − 4������������ ≥ 0 ta được: ������      =
                                                        2������
              ������
Khi ������   =−         thì hàm bậc hai đạt giá trị cực đại / cực tiểu
              2������
                                           ������   4������������ − ������2
                    ������������������/������������������ = f −       =
                                          2������       2������
Ví dụ: quan hệ giữa BMD và tuổi (của các đối tượng già) là theo quan hệ bậc hai:
        BMD = a (Age)² + b (Age) + c

                                                               12
BÀI GIẢNG THỐNG KÊ SINH HỌC



6.4. BẤT ĐẲNG THỨC
Ta đã quen thuộc với các kí hiệu bất đẳng thức sau đây:

        > và < "lớn hơn" và "bé hơn", tương ứng.
        ≥ và ≤ "lớn hơn hoặc bằng" và "bé hơn hoặc bằng", tương ứng.

Mốt số tính chất của bất đẳng thức cần lưu ý:

Cho x, y là các số thực:
(i) Nếu y > x thì y ± a > x ± a ∀ a ∈ R
(ii) Nếu y > x thì -y < -x
(iii) Nếu y > x thì y/a > x/a và ay > ax     ∀a > 0
                 và y/a < x/a và ay < ax     ∀a < 0
(iv) Nếu y > x > 0 thì x > y ∀ n. ∈ N
                         n   n

Các tính chất (i) – (iv) vẫn còn đúng nếu thay > và < tương ứng bằng ≥ và ≤.

6.5. TUYẾN TÍNH HOÁ
Có lẽ là không cần thiết để nói rằng một hàm tuyến tính rất dễ giải thích hơn là một hàm không tuyến tính
(phi tuyến). Do đó, nhiều nỗ lực đã được thực hiện để biến đổi các hàm không tuyến tính thành một hàm
tuyến tính.

Ví dụ: nếu ������ = ������ ������ ������ , chúng ta có thể sử dụng logarit để tuyến tính hoá nó như sau:
������������������������ = log⁡ ������ ������ = ������������������������ + ������ ������������������������. Biểu thức cuối cùng cho thấy logy rõ ràng là một hàm tuyến tính đối
              (������
với x.

Ở đây cần lưu ý rằng, chính thức có sự khác biệt giữa hàm tuyến tính và mô hình tuyến tính.
Ví dụ y = a + bx, y = a + bx + cx² v.v... đều là các mô hình tuyến tính nhưng hàm sau là hàm không tuyến
tính trong khi hàm đầu là một hàm tuyến tính. Chúng ta nói "tuyến tính" do các tham số a, b, và c là tuyến
tính. Tuy nhiên, y = a²x + b hoặc y = a bx đều là mô hình "phi tuyến" và hàm phi tuyến bởi vì cả các tham
số lẫn các đường cong đều không tuyến tính.

VII. HỆ PHƯƠNG TRÌNH TUYẾN TÍNH VÀ MA TRẬN
7.1. Ma trận:
7.1.1. Định nghĩa:

Ma trận m hàng n cột (thường được gọi là ma trận m×n) là bảng số có dạng:
                   ������11 ������12      ⋯ ������1������
                        ⋮         ⋱    ⋮
                  ������������ 1 ������������ 2   ⋯ ������������ ������

trong đó aij ∈ R, i =1,2, … , m và j = 1, 2, … , n được gọi là các số hạng của ma trận.

Ma trận không là ma trận mà tất cả cácsố hạng đều bằng 0.
Khi m = n ta có ma trận vuông.


                                                          13
BÀI GIẢNG THỐNG KÊ SINH HỌC



Một ma trận vuông có các số hạng không nằm trên đường chéo chính (đi từ a11, a22… đến ann) đều bằng
0 gọi là ma trận chéo:

Một ma trận chéo có các số hạng trên đường chéo chính đều bằng 1 gọi là ma trận đơn vị và kí hiệu là I,
ví dụ ma trận đơn vị 3×3:
                     1 0 0
               ������3 = 0 1 0
                     0 0 1
7.1.2. Phép toán trên ma trận:
    - Phép cộng: cho 2 ma trận A = (aij) và B = (bij) có cùng kích thước (cùng số hàng và số cột) ta định
        nghĩa: A + B = (aij+bji).
    - Phép nhân với một số : tích của số thực α và ma trận A = (aij) đưọc định nghĩa là:
               α A = ( α×aij)
    - Phép nhân: Cho ma trận A=(aij) có kích thước m×n và ma trận B=(bjk) có kích thước n×p thí tích
        của A và B là ma trận C=(crq) có kích thước m×p trong đó
                          ������

              ������������������ =          ������������������ ������������������
                         ������=1
       Tức là số hạng ở hàng r cột q của C là tổng của tích các số hạng ở hàng r của A tương ứng với
       số hạng ở cột q của B
       Ta chỉ nhân được A cho B khi số cột của A bằng số hàng của B, vì vậy nói chung B×A có thể
       không tồn tại.
   -   Phép chuyển vị: ma trận chuyển vị của ma trận A=(aij) có kích thước m×n là ma trận A’=(a’ji) có
       kích thước n×m với a’ji = aij.

7.1.3. Định thức của ma trận vuông:

   Định thức của ma trận vuông A, kí hiệu là det(A) hay ||jA||, được định nghĩa như sau:

                                                ������    ������
   -   Ma trận 2×2:                                      = ������������ − ������������
                                                ������    ������
                                                ������    ������   ������
                                                                                     ������       ������      ������              ������
   -   Ma trận 3×3:                             ������    ������   ������ = ������ ������        ������
                                                                                − ������             + ������
                                                                   ������        ������      ������       ������      ������              ������
                                                ������    ������   ������

                                                                = aei + bfg + cdh – afh – bdi – ceg
                                                 ������11 ������12      ⋯    ������1������
   -   Ma trận n×n:                                   ⋮         ⋱      ⋮      =   ������
                                                                                  ������=1   −1   ������+������
                                                                                                      ������������������ ������������������
                                                ������������ 1 ������������ 2   ⋯   ������������������
       với Aki là ma trận (n-1)×(n-1) có được bằng cách bỏ đi hàng k và cột i trong ma trận gốc.

Ví dụ: Tìm định thức của ma trận:
             −2 2 −3
        ������ = −1 1 3
              2 0 −1

       Ta có thể dùng công thức cuối cùng, chẳng hạn với i = 2:

                                                                             14
BÀI GIẢNG THỐNG KÊ SINH HỌC



                      2+1       2 −3                       −2 −3                   −2 2
det ������ = −1                 × −1 ×       + (−1)2+2 × 1 ×           + (−1)2+3 × 3 ×
                                0 −1                       2 −1                     2 0
          = (-1)×(-1)×(-2) + 1×1×8 + (-1)×3×(-4) =-2 + 8 +12 = 18.

(Bạn đọc có thể kiểm tra lại kết quả bằng cách khai triển với giá trị i khác hoặc dùng công thức cho ma
trận 3×3).

7.2. Hệ phương trình tuyến tính:
7.2.1. Hệ phương trình tuyến tính theo 2 ẩn x và y là cặp phương trình có dạng:
                 ������������ + ������������ = ������
                   ������������ + ������������ = ������
trong đó a, b, c, d, e, f là những số đã biết và x, y là hai số chưa biết thoả cà 2 phương trình trên mà ta
cần tìm.

Khi ad – bc ≠ 0 thì hệ có nghiệm duy nhất cho bởi công thức Cramer như sau:6
       x= (de – bf)/(ad – bc) và y=(af – ce)/(ad – bc)

Hệ trên cũng có thể viết lại dưới dạng ma trận là:
           ������    ������������     ������              ������
           ������    ������������ = ������ ������������������ ������      ������ = ������
                    ������ ������                ������
          với ������ =         và ������ =       ������
                    ������ ������

Khi det(A) ≠ 0,(hay ad – bc ≠ 0), nghiệm của hệ cho bởi công thức Cramer như sau:
               ������������������(������1 )
          ������ =                 với A1 là ma trận có đưọc bằng cách thay cột 1 trong A bằng B
                det⁡  (������)
               ������������������(������2 )
          ������ =                 với A2 là ma trận có đưọc bằng cách thay cột 2 trong A bằng B
                det⁡  (������)

(Bạn đọc tự kiểm tra lại công thức Cramer dạng định thức và dạng thông thường là như nhau.)

7.2.2. Hệ phương trình tuyến tính n ẩn là n phương trình đồng thời:

         a11x1 + a12x2 + … + a1nxn = b1
         a21x1 + a22x2 + … + a2nxn = b2
         .....................
         .....................
         .....................
         an1x1 + an2x2 + … + annxn = bn
với aij (i, j = 1 , 2, … , n) là những số đã biết và xi (I = 1, 2, …, n) là các số chưa biết thoả cả n phương
trình trên mà ta cần tìm.

Tương tự như trường hợp 2 ẩn cũng có thể viết phương trình này dưới dạng ma trận như sau:




6
    Dĩ nhiên cũng có thể giải bằng các phương pháp thông thường như thế, khử, so sánh như đã biết.
                                                            15
BÀI GIẢNG THỐNG KÊ SINH HỌC



                                                           ������1                ������1
                              ������11     ⋯ ������1������
                                                           ������2                ������2
        ������ ������ = ������ ������ớ������ ������ = ⋮        ⋱   ⋮      , ������ =    ⋮      ������à ������ =
                              ������������1    ⋯ ������������������                                ⋮
                                                           ������������               ������������

Khi det(A) ≠ 0, hệ có nghiệm duy nhất cho bởi công thức Cramer như sau:
                 ������������������(������������ )
        ������������ =                 ������ = 1,2 … , ������, với Ai là ma trận có được bằng cách thay cột i trong A bằng B 7
                 det⁡   (������)

Ví dụ: Giải hệ phương trình sau:
         −2������ + 2������ − 3������ = 1
         −������ + ������ + 3������ = −2
             2������ − ������ = 1

        Hệ này có thể viết dưới dạng ma trận như sau:
         −2 2 −3 ������             1
         −1 1 3         ������ = −2
          2 0 −1 ������             1

        Ta có det(A) = 18, det(A1) = 4, det(A2) =-2 và det(A3) = -10 nên
               x = 4/18 = 2/9, y = -2/18 = -1/9 và z = 10/18 = -5/9.8

VIII. ĐẠO HÀM VÀ TÍCH PHÂN
8.1. Đạo hàm:
8.1.1. Định nghĩa:
                                                                        ������(������ +������)− ������(������ 0 )
Cho hàm số y = f(x) liên tục trên một khoảng (a, b), x0 ∊ (a, b), nếu tỉ 0 ������                 có giới hạn là l khi h→
                                                                                                        ������������ (������ 0 )
0 thì l được gọi là đạo hàm của hàm số y = f(x) tại x0 và được kí hiệu là f’(x0) hay                       ������������
                                                                                                                       ∶
                    ������������(������0 )             ������ ������0 + ������ − ������(������0 )
         ������ ′ ������0 =            = ������ = lim
                       ������������           ������→0           ������

* Ý nghĩa hình học: Gọi M0 và M lần lượt là 2 điểm có hoành độ là x0 và x0+h trên đồ thị của hàm y = f(x).
             ������(������ +������ )− ������(������ 0 )
Lưu ý rằng tỉ 0 ������                  là hệ số góc của cát tuyến M0M (xem hình 2). Khi h→ 0 thì
                                                                                     ������(������ 0 +������ )− ������(������ 0 )
M → M0 và cát tuyến M0M trở thành tiếp tuyến M0t của đồ thị. Do đó, tỉ                         ������
                                                                                                                tiến đến hệ số góc
của cát tuyến M0t., tức là:
       f’(x0) = hệ số số góc của tiếp tuyến M0t




7
  Cũng có thể giải trực tiếp bằng cách nhân cả 2 vế với ma trận nghịch đảo A-1 của A như cách giải phương trình
bậc nhất thông thường và được X= ������−1 ������, tuy nhiên việc tìm ma trận nghịch đảo hơi phức tạp nên không trình bày ở đây.
8
  Hiện nay có nhiều phần mềm có thể giúp ta tính toán định thức tự động sau khi nhập các số hạng của ma trận.
                                                                  16
BÀI GIẢNG THỐNG KÊ SINH HỌC




                     Hình 2 : Đạo hàm bằng hệ số góc của tiếp tuyến

* y’ = f’(x) cũng là một hàm số và nếu f’(x)có đạo hàm thì đạo hàm này đuợc gọi là đạo hàm bậc hai của
                                                         ������ 2 ������(������)
y= f(x) và được kí hiệu là y” = f”(x) hay ������" = ������������ 2 ..
Tương tự ta cũng có thể định nghĩa đạo hàm bậc n của y = f(x) và kí hiệu đạo hàm bậc n là
           (������)      ������             (������)
                                         ������������ ������(������)
        ������      = ������    ������ ������������������ ������ =
                                            ������������ ������


8.1.2. Tính chất:

    Cho f, g, h là các hàm số có đạo hàm, khi đó:
     (i)       (f ± g)’ = f’ ± g’
     (ii)      (fg)’ = f’g + fg’
     (iii)     1/f = - f’/f2
     (iv)      (fn)’ = n f’ fn-1

    Nếu hàm số y = f(x) có đạo hàm trên khoảng (a, b) và x0 ∊ (a, b), khi đó:
     - f(x) đạt giá trị cực đại tại x0 khi và chỉ khi f’(x0) = 0 và f’(x) > 0 với x < x0 , f’(x) < 0 với x > x0.
     - (x) đạt giá trị cực tiểu tại x0 khi và chỉ khi f’(x0) = 0 và f’(x) < 0 với x < x0 , f’(x) > 0 với x > x0.

8.1.3. Đạo hàm một số hàm thông dụng:
(C)’ = 0 (C là hằng số)         (xn)’ = nxn-1 ∀n ∊ Z
(ex)’ =ex                           (lnx )’= 1/x
(sinx)’ = cosx                      (cosx)’ = -sinx
(tgx)’ = 1/(1+tg2x)                 (cotgx)’ = -1/(1+cotg2x)
                        1                                   −1
 ������������������������������������������ ’ =                  ������������������������������������������ ′ =
                      1 − ������ 2                             1 − ������ 2
                       1                                            −1
 ������������������������������������ ’ =                       ������������������������������������������������ ’ =
                   1 + ������������2 ������                              1 + ������������������������2 ������


8.1. 4. Đạo hàm hàm nhiều biến:

Định nghĩa:
                                                                       17
BÀI GIẢNG THỐNG KÊ SINH HỌC



Cho hàm y = f(x1, x2, … , xn) liên tục trên ������ (������������ , ������������ ), và k là số nguyên sao cho
                                              ������=1
1 ≤ k ≤ n. Khi giữ các biến xi cố định với i ≠ k, lúc đó có thể xem y = f(x1, x2, … , xn) như một hàm chỉ theo
biến xk và nếu hàm này có đạo hàm theo xk thì đạo hàm này được gọi là đạo hàm riêng của f theo xk và
được kí hiệu là

               ′
                        ������������(������1 , ������2 , … , ������������ , … , ������������ )
            ������������ ������ =
                                        ������������������

Hàm y = f(x1, x2, … , xn) được gọi là vi phân được (khả vi) khi nó có đạo hàm riêng theo tất cả các biến xi.

Ví dụ: Cho y = f(u, v) = 2u – 3uv2 +5, ta có:
                      ������������(������, ������)                        ������������(������, ������)
               ′
            ������������ =                 = 2 − 3������ 2 ������à ������������ =
                                                      ′
                                                                       = −6������������
                          ������������                                ������������



Tính chất:

Cho y = f(x1, x2, … , xn) khả vi, khi đó:
 y = f(x1, x2, … , xn) đạt cực tiểu (cực đại) tại (x10, x20, … , xn0) nếu và chỉ nếu các đạo hàm riêng đều bằng
0 và đổi dấu từ âm sang dương (từ dương sang âm) khi đi qua xko với k =1, 2, … , n.

8.2. Nguyên hàm và Tích phân:
8.2.1. Nguyên hàm:

Định nghĩa: Cho hàm y = F(x) và y = f(x) cùng xác định trên khoảng (a,b), nếu F có đạo hàm và F’(x) =
f(x) thì hàm được gọi là nguyên hàm của hàm f

Tính chất:
Hàm F và hàm G là đều là nguyên hàm của hàm f khi và chỉ khi tồn tại hằng số C sao cho
G(x) = F(x) + C.

     Một nguyên hàm tổng quát (còn gọi là tích phân bất định) của hàm y = f(x) được kí hiệu là                           ������ ������ ������������.

Nguyên hàm của một số hàm thông dụng:

                   ������ ������ +1                                      ������������
    ������ ������ ������������ =            + ������      ������ ≠ −1                         = ������������������ + ������
                   ������ + 1                                         ������
    ������ ������ ������������ = ������ ������ + ������                                      ������������������ = ������ ������������������ − 1 + ������

    ������������������������ ������������ = −������������������������ + ������                               ������������������������ ������������ = ������������������������ + ������

    ������������������ ������������ = −ln ������������������������ + ������                              ������������������������������ ������������ = ln ������������������������ + ������

    ������������������������������������������ ������������ = ������������������������ ������������������������ + 1 − ������ 2 + ������      ������������������������������������������ ������������ = ������������������������������������������������ − 1 − ������ 2 + ������
                                        1
    ������������������������������������ ������������ = ������������������������������������������ − ln 1 + ������ 2 + ������
                                        2
                                                                            18
BÀI GIẢNG THỐNG KÊ SINH HỌC



8.2.2. Tích phân xác định:

Định nghĩa: Cho y=f(x) xác định trên khoảng [a, b] và các số thực thoả điều kiện a = x0 ≤ t1 ≤ x1 ≤ … < xi-1
≤ ti ≤ xi ≤ …≤ xn-1 ≤tn ≤xn=b. Đặt Sn là tổng sau đây (gọi là tổng tích phân)
                            ������

               ������������ =            ������ ������������ ∆������ ������ớ������ ∆������ = ������������ − ������������−1
                          ������=1
Nếu Sn có giới hạn hữu hạn bằng L khi d = max1≤������≤������ ∆������ → 0 và giới hạn này không phụ thuộc vào cách
lựa chọn các điểm xi, ti (I = 1, 2,…, n) thì L đuợc gọi là tích phân xác định của hàm f trên khoảng [a, b] và
được kí hiệu là:
                  ������                                              ������

                       ������ ������ ������������ = ������ = lim ������������ = lim                 ������ ������������ ∆������
                 ������                          ������ →0       ������→0
                                                                 ������=1

Khi đó ta nói f là tích phân đuợc (khả tích) trên [a, b].




                        Hình 3: Diện tích hình chữ nhật có tô màu bằng số hạng f(tk)Γk trong Sn
                                  ������                     ������                            ������
   Quy ước:                     ������
                                       ������(������)������������ = −   ������
                                                              ������ ������ ������������              ������
                                                                                            ������ ������ ������������ = 0

   Ý nghĩa hình học: Khi f(x) ≥ 0 với mọi x trên [a, b] thì Sn chính là tổng diện tích các hình chữ nhật có
    kích thước là Δk× f(tk) (k=1, 2, ,n). Để ý rằng các hình chữ nhật này có diện tích xấp xỉ diện tích hình
    thang cong bên dưới đồ thị giới hạn bởi trục Ox và 2 đường thẳng
    x =xk-1, x = xk nên Sn xấp xỉ diện tích thang cong bên dưới đồ thị giới hạn bởi Ox và 2 đường thẳng
    x=a, x = b. Vì thế khi d = max0<������<������ (������������ − ������������−1 ) → 0 thì Sn tiến về diện tích của hình thang cong vừa
    nêu, tức là
                  ������
                       ������ ������ ������������ = ������������ệ������ ������í������������ ������ ì������������ ������������ ������������������ ������������������������ ������ướ������ đồ ������������ ị
                 ������




Tính chất:
    Cho f là hàm khả tích trên [a, b], và c là điểm bất kì trên [a, b] thì
                                                                             19
BÀI GIẢNG THỐNG KÊ SINH HỌC



                                       ������                         ������                        ������
                                            ������(������) ������������ =              ������(������) ������������ +             ������(������) ������������.
                                      ������                         ������                    ������
          Cho f, g là hai hàm khả tích trên [a,b] và α, β là 2 số thực thì
                                       ������                                                    ������                         ������
                                              ������������ ������ + ������������(������) ������������ = ������                        ������ ������ ������������ + ������            ������ ������ ������������ .
                                      ������                                                ������                             ������

Định lí:
        Nếu f là hàm số liên tục trên khoảng [a, b] thì f khả tích trên [a, b].

Nhờ định lí trên, khi hàm f liên tục trên [a, b], ta có thể làm việc tính toán tổng tích phân Sn đơn giản hơn
bằng cách chọn xk là các điểm chia [a,b] thành n khoảng bằng nhau và tk là một trong 2 đầu mút hoặc
                                                                  ������−������
trung điểm của các khoảng nhỏ đó, tức là chọn ������������ = ������ + ������            (������ = 0, 1, 2, … , ������) và
                                                                                                                ������
                                           ������ ������−1 +������ ������
������������ = ������������−1 ������ ������������ ������������ ������ ������ặ������                         (������ = 1,2, … , ������).
                                                   2

Định lí cơ bản của toán vi tích phân:

Cho y = F(x) là một nguyên hàm của hàm y = f(x) liên tục trên khoảng [a, b], khi đó
                         ������
                              ������(������) ������������ = ������ ������ − ������ ������ .
                        ������

8.2.3. Mở rộng tích phân xác định:

                                                                                                                 ������                                   ������
- Nếu y = f(x) chỉ xác định và liên tục trên [a,b) ta định nghĩa                                                ������
                                                                                                                      ������ ������ ������������ = lim������ →������          −������
                                                                                                                                                            ������ ������ ������������ khi giới hạn
này tồn tại và hữu hạn.

Có thể mở rộng một cách tương tự tích phân xác định cho hàm chỉ xác định và liên tục trên (a, b], (a, b),
[a, ∞), (a, ∞), ( -∞, b], hay ( -∞, b), đặc biệt cũng có thể mở rộng lên toàn tập số thực R như sau:
                                                                                       +∞                                         +������
- Cho hàm y = f(x) liên tục trên R, ta định nghĩa                                      −∞
                                                                                          ������          ������ ������������ = lim������ →∞          −������
                                                                                                                                          ������ ������ ������������ nếu giới hạn này tồn tại
và hữu hạn.

* Lưu ý rằng với các mở rộng trên, nếu hàm y = f(x) xác định và liên tục trên [a, b] thì tích phân xác định
của f trên [a, b], [a, b). (a, b] và (a, b) là như nhau, tức là:
                                                                                                                                  ������

             [������,������] ������ ������ ������������ =          ������,������   ������ ������ ������������ =        (������,������] ������ ������ ������������ =          (������,������) ������ ������ ������������ =              ������ ������ ������������ .
                                                                                                                                 ������

                                                                                                     ������
Điều này biện minh cho việc dùng cùng một kí hiệu                                                   ������    cho tất cả các tích phân trên.

                                                                           __________________

BÀI TẬP
     1. Bộ gen VDR (Vitamin D receptors) có hai alen (gen đẳng vị), gọi là T và t, chúng tạo ra ba kiểu
        gen TT, Tt và tt. Chú ý rằng số alen T trong kiểu gen TT, Tt và tt lần lượt là 2, 1 và 0. Trong một
        nghiên cứu trên 130 phụ nữ ở Mĩ, các phân bố tần số của kiểu gen VDR như sau:
                       TT:     53
                                                                                                  20
BÀI GIẢNG THỐNG KÊ SINH HỌC



                  Tt:    57
                  tt:    20
     Sử dụng phân bố này để tìm các tần số tương đối của alen T. Tần số tương đối của alen t là bao
     nhiêu?

2. Theo luật cân bằng Hardy-Weinberg, nếu tần số tương đối của alen T và t tương ứng là p và q (p
   + q = 1), thì các tần số của TT, Tt và tt được cho bởi p², 2pq và q², tương ứng. Sử dụng các kết
   quả của Câu hỏi 1 (p và q) để tìm phân bố tần số mong đợi của các kiểu gen VDR cho 130 phụ
   nữ.
   Những dữ liệu quan sát trong Câu hỏi 1 có phù hợp với luật cân bằng Hardy-Weinberg (không
   cần phải sử dụng công cụ thống kê)?

3. Theo lý thuyết về di truyền học, giá trị các trung bình kiểu hình theo lí thuyết của TT, Tt và tt lần
   lượt là (μ + a), (μ + d) và (μ - a), trong đó μ dùng để chỉ trung bình tổng thể của dân số, a dùng để
   chỉ ảnh hưởng di truyền phụ gia và d dùng để chỉ ảnh hưởng gen trội. Trong một mẫu phụ nữ,
   trung bình BMD cho ba kiểu gen tương ứng là1,23; 1,15 và 0,98. Tìm các giá trị của a và d.

4. Xét báo cáo sau đây: "DNA được chiết xuất từ 80 phụ nữ bệnh loãng xương và 85 phụ nữ cùng
   tuổi đối chứng. PCR được dùng để khuếch đại chuỗi ADN và enzyme hạn chế BSM-I được dùng
   để phát hiện alen VDR. Kết quả cho thấy không có khác biệt đáng kể giữa nhóm loãng xương và
   nhóm đối chứng về tần số của alen B (0,44 và 0,39) cũng như về tần số của kiểu gen BB (0,20 và
   0,21). ” (Gallagher JBMR et al 1994).
   Giả sử rằng sự phân bố của kiểu gen ở các đối tượng loãng xương và đối chứng theo luật cân
   bằng Hardy-Weinberg, hãy ước lượng (tìm lại) số đối tượng trong mỗi kiểu gen cho từng nhóm.

5. Với mỗi hàm số sau đây tìm những giá trị của x không thuộc miền xác định của nó:
              ������+2                 ������
   (a) f(x) =          (b) f(x) = 2           (c) f(x) = logx
                  ������−1                                 ������ −4
     (d) g(x) =    ������ 2   −4             (e) h(x) = ������ 2 − ������.

6.   Tốc độ thay đổi về BMD đôi khi được mô hình hóa dưới dạng một hàm bậc hai sau:
     δy = at² + bt + c
     Trong đó δy là tốc độ thay đổi về BMD, t là thời gian (tính theo năm), a, b và c là hằng số. Sử
     dụng kiến thức về bất đẳng thức để tìm ra khi nào (t =?) thì δy dương và khi nào δy âm.

7. Cho f(x) = ln[(x+1)/x], chứng tỏ rằng f(1) + f(2) + f(3) = ln4.

                                      ������ !
8. Cho      ������ ������, ������ =                          , tìm (không phải tính) một biểu thức cho:
                                  ������! ������−������ !
     (i)      C(5,3)
     (ii)     C(n+1,k).

9. Hàm phân bố Bình thường (Gauss) được xác định bởi 2 tham số: trung bình (µ) và độ lệch chuẩn
   (ζ) và được cho bởi:
                              2
                                             1        1 ������ − ������      2
              ������ ������; ������, ������         =        ������������������ −
                                      ������ 2������          2    ������
     Tìm biểu thức cho f(10;15,5).

10. Nếu x = ln2 và y = ln3, biểu diễn các biểu thức sau theo x và y.
    (a) ln9              (b) ln 2       (c) ln(3/2)    (d) ln3 3     (e) ln0.25
                                                 21
BÀI GIẢNG THỐNG KÊ SINH HỌC



   (f) ln(8/9)           (g) ln 6                    (h) ln12      (i) ln4.5       (j) ln72.

11. Nếu ������ ������ − ������ −������ + 1 = 0, chứng tỏ rằng x = ln ( 5 −1) − ln 2.
               ������ −������ +������ ������
   (ii) Nếu                    = 2chứng tỏ rằng x = −½ ln3
               ������ −������ −������ ������
                       ������ ������ −������ −������
   (iii) Nếu   ������ =                           chứng tỏ rằng ������ = ln⁡ + ������ 2 + 1)
                                                                   (������
                               2

12. Chứng tỏ rằng các kết quả sau đây là đúng:
    (a) logae= 1 / logea (b) logpq + logqr + logrp = 1                 (c) lognax = logax /(1+logan).

13. Con cái của một loài côn trùng nào đó sinh ra 20 con cái còn sống sót thuộc thế hệ sau. Có 4 thế
    hệ / năm. Trong một năm sẽ có bao nhiêu con cái thuộc các thế hệ sau?

14. Giả sử rằng chỉ có sẵn đậu lăng khô và đậu nành khô để đáp ứng nhu cầu protein hàng ngày của
    một người vào khoảng 75 g. Một gam đậu lăng có chứa 0,26 g protein và 1 g đậu nành có chứa
    0,35 g protein. Gọi mức tiêu thụ của người đó là x g đậu lăng và y g đậu nành. Hãy biểu thị mối
    quan hệ giữa x và y dưới dạng của một hàm tuyến tính tức là y= a + bx.

15. Phương trình liên kết xác suất gãy xương (P) và mật độ khoáng của xương (BMD) thường có
    dạng một phương trình logistic như sau:
                    ������
                         = ������ ������ (������������������)
                  1 − ������
   trong đó b là một hằng số. Ước lượng b trong phương trình này hơi khó một chút, tuy nhiên, việc
   ước lượng sẽ dễ dàng hơn nếu chúng ta biểu diễn mối quan hệ này duới dạng một hàm tuyến
   tính bằng cách sử dụng logarit. Hãy tìm phương trình tuyến tính này.

16. Trong một thí nghiệm, trọng lượng W của gạc nai được đo với một số nai ở các độ tuổi khác
    nhau. Các kết quả được cho trong bảng sau:
   A:         20         22            30     34     42     43     46      54      56      68      70
   W:         0,08                     0,10          0,15          0,20            0.27            026
              0,31                     0,36          0,40          0,49            0,49
   (W tính theo kg và A tính theo tháng)

   Chứng tỏ bằng phương trình và bằng đồ thị rằng các dữ liệu trên phù hợp khít khao quan hệ
   tuyến tính:
   W = mA + b, trong đó m và b tương ứng là độ dốc và tung độ gốc. Tìm phương trình này.

17. Ngay sau khi tiêu thụ rượu, độ cồn trong máu của một người tăng lên đến một giá trị đỉnh là 0,22
    mg / ml, và sau đó từ từ giảm. Nếu t là thời gian tính bằng giờ sau khi giá trị tối đa đạt được và y
    là mức độ rượu trong máu, bảng sau đây cho các giá trị đo thực nghiệm cho chủ thể này:
    t:       0     0,5     0,75 1,0      1,5      2,0     2,5    3,0
    ________________________________________________________
    y:       0,22 0,18 0,15 0,13 0,10 0,08 0,06 0,05
    Các dữ liệu được cho là theo quan hệ ������ = ������������������ trong đó b và a là hằng số. Bằng cách sử dụng
    lôgarit và phần mềm thống kê phổ biến, ước tính a và b.

18. Cho:
                                                            22
BÀI GIẢNG THỐNG KÊ SINH HỌC



         w1 = 8, w2 = 11, w3 = 3, w4 = 2, w5 = 17, w6 = 9, w7 = 6, w8 = 11
         x1 = 4.7, x2 = 3,9, x3 = 7.2, x4 = 0,5, x5 = 2.8, x6 = 5.1, x7 = 7,9, x8 = 4,6
         y1 = 6, y2 = 1, y3 = 5, y4 = 4, y5 = 4, y6 = 8, y7 = 1, y8 = 7.
         z1 = 31, z2 = 62, z3 = 7, z4 = 15, z5 = 53, z6 = 16, z7 = 94, z8 = 59.
         Hãy tính
           6               8                         4
   (a)     ������=1 ������������ (b)   ������=1 ������������     (c)         ������=1 ������2������
          7                            7
   (d)    ������=3 ������2������−7       (e)       ������ =3(������������   − ������������ −2 )

   Các câu hỏi 19 -24 có cùng giả thiết với câu hỏi 18.

19. Gọi vij = wi yj (ví dụ v23 = w2.y3 = 11 × 5 = 55). Tính:
    (i) 3     7
        ������=1 ������ =1 ������������������           (ìi) 5        4
                                           ������=2 ������ =3 ������������������ .
20. Chứng minh rằng 5 3������������ = 3 5 ������������ .
                           ������=1          ������=1
21. Chứng minh rằng 4 (3������������ − 2������������ ) = 3 5 ������������ − 2 4 ������������ .
                           ������=1                     ������=1       ������=1
22. Chứng minh rằng 4=1(������������ − 6) = 4 ������������ − 24.
                           ������                 ������=1
23. Chứng minh rằng 5 (������������ − 3)2 = 5 ������������2 − 6 5 ������������ + 5 × 9.
                       ������=1                 ������=1       ������=1
24. Chứng minh rằng 6 ������������ 6 ������������ ≠ 6 ������������ ������������
                       ������=1    ������=1       ������=1
25. Chứng minh rằng (i) ������ =0 ������������ = ������ =0 ������������−������
                            ������       ������                  (ii) ������ ������������ = ������ ������������+1−������
                                                              ������=1      ������=1
26. Tìm phần trăm sai số trong công thức của Stirling khi n = 10 và n = 20.




                                                              23

Contenu connexe

En vedette

Löchl Werbung
Löchl WerbungLöchl Werbung
Löchl Werbung
therufus
 
Desenhos - Extremely well done
Desenhos - Extremely well doneDesenhos - Extremely well done
Desenhos - Extremely well done
Sylvi O.
 
sweet animals
sweet animalssweet animals
sweet animals
Sylvi O.
 
Szent Biblia
Szent BibliaSzent Biblia
Szent Biblia
Sylvi O.
 
Falinaptár 2010
Falinaptár 2010Falinaptár 2010
Falinaptár 2010
Sylvi O.
 
Great photos, Tolle Bilder, Jó képek
Great photos, Tolle Bilder, Jó képekGreat photos, Tolle Bilder, Jó képek
Great photos, Tolle Bilder, Jó képek
Sylvi O.
 
Animal babys
Animal babysAnimal babys
Animal babys
Sylvi O.
 
Funny animals
Funny animalsFunny animals
Funny animals
Sylvi O.
 
Presentacion facebook's apps
Presentacion facebook's appsPresentacion facebook's apps
Presentacion facebook's apps
Felix Rivas
 
"Férfiak"
"Férfiak""Férfiak"
"Férfiak"
Sylvi O.
 
Házasságról humorosan...
Házasságról humorosan...Házasságról humorosan...
Házasságról humorosan...
Sylvi O.
 
Orchideák és idézetek
Orchideák és idézetekOrchideák és idézetek
Orchideák és idézetek
Sylvi O.
 
Pillangók
PillangókPillangók
Pillangók
Sylvi O.
 

En vedette (18)

Löchl Werbung
Löchl WerbungLöchl Werbung
Löchl Werbung
 
Indirect Channel Communication
Indirect Channel CommunicationIndirect Channel Communication
Indirect Channel Communication
 
Desenhos - Extremely well done
Desenhos - Extremely well doneDesenhos - Extremely well done
Desenhos - Extremely well done
 
sweet animals
sweet animalssweet animals
sweet animals
 
Szent Biblia
Szent BibliaSzent Biblia
Szent Biblia
 
PLRC Overview Rev2
PLRC Overview Rev2PLRC Overview Rev2
PLRC Overview Rev2
 
Falinaptár 2010
Falinaptár 2010Falinaptár 2010
Falinaptár 2010
 
Great photos, Tolle Bilder, Jó képek
Great photos, Tolle Bilder, Jó képekGreat photos, Tolle Bilder, Jó képek
Great photos, Tolle Bilder, Jó képek
 
Animal babys
Animal babysAnimal babys
Animal babys
 
Funny animals
Funny animalsFunny animals
Funny animals
 
Barátok
BarátokBarátok
Barátok
 
Presentacion facebook's apps
Presentacion facebook's appsPresentacion facebook's apps
Presentacion facebook's apps
 
"Férfiak"
"Férfiak""Férfiak"
"Férfiak"
 
Házasságról humorosan...
Házasságról humorosan...Házasságról humorosan...
Házasságról humorosan...
 
Gender Differences In Attainment
Gender Differences In AttainmentGender Differences In Attainment
Gender Differences In Attainment
 
Orchideák és idézetek
Orchideák és idézetekOrchideák és idézetek
Orchideák és idézetek
 
Pillangók
PillangókPillangók
Pillangók
 
Neid
NeidNeid
Neid
 

Bai 01 mot so kien thuc toan co ban

  • 1. BÀI GIẢNG THỐNG KÊ SINH HỌC BÀI GIẢNG THỐNG KÊ SINH HỌC nguyên bản tiếng Anh: Nguyễn Văn Tuấn người dịch: Phan Văn Song THAY LỜI NÓI ĐẦU Hơn một thế kỉ trước, nhà toán học Pháp Pierre Louis đã xây dựng và cổ vũ "phương pháp số" dùng để thẩm định việc điều trị. Tuy nhiên, ông đã bị hầu hết các thầy thuốc hàng đầu lúc bấy giờ phản đối. Đáng tranh cãi là Claude Bernard, cha đẻ của y học thưc nghiệm hiện đại đã phê phán việc áp dụng toán học vào y học; ông tuyên bố: các nhà toán học cào bằng quá nhiều và suy luận về các hiện tượng như họ vẽ ra trong đầu chứ không như chúng tồn tại trong tự nhiên. Ông không ngừng kêu gọi các thầy thuốc "từ khước việc dùng thống kê làm cơ sở cho khoa học thực nghiệm về điều trị và bệnh lí.” Trớ trêu thay, gần 100 năm sau, các học trò của ông đã vứt bỏ hoàn toàn lời khuyên của ông. Thống kê đã trở nên một phần thiết yếu trong nghiên cứu y học. Ngày nay hầu như mọi công bố y học đều có phần "phương pháp thống kê" để chứng tỏ tính đáng tin cậy của công trình. Tuy nhiên, trong những năm gần đây, việc sử dụng phổ biến thống kê đã trở thành việc lạm dụng phổ biến thống kê. Y văn bị nhét đầy với thông tin thống kê bề bộn và với những phát hiện mâu thuẫn không dứt. Có nhiều bằng chứng hùng hồn cho thấy rằng việc sử dụng không phù hợp và thao tác chưa thuần thục về các số liệu thống kê đã góp phần đáng kể vào bi kịch về sự nhầm lẫn này của tri thức. Nhiều người viết sách và các bài báo dựa trên ứng dụng không phù hợp của thống kê. Một số tác giả rất được nhiều người biết đến vì họ chẳng ngại ngùng tung ra các lời giải cho các vấn đề chưa được giải quyết. Tuy nhiên, một số nhà điều tra không nhận ra rằng họ đã phạm các lỗi lầm trong thống kê hoặc do dốt nát hoặc do thiếu kiến thức thống kê. Dù với lí do gì, dựa vào phân tích thống kê khi không hiểu bản chất của nó là bước đầu tiên trong việc đánh mất tính trung thực trí tuệ. Vì vậy, hiểu biết nguyên tắc đứng phía sau một phân tích thống kê là rất quan yếu trong việc giải thích dữ liệu. Mười một chủ đề thống kê sinh học sau đây tiêu biểu cho một tập hợp các nguyên lí thống kê, định lí, tiên đề và định nghĩa sơ đẳng được trình bày dưới dạng gần như phi kĩ thuật. Các chủ đề được chia thành hai phần: phần một bàn về xác suất và các khái niệm thống kê; phần hai bàn về thống kê ứng dụng, trong đó sẽ thảo luận về phân tích thống kê dữ liệu và các kết luận. Do đối tượng dự kiến của khóa học này là những người nghiên cứu với ít hoặc không có kiến thức thống kê, do đó, tất cả các phát biểu thống kê trong các bài học này được trình bày không có chứng minh toán học kèm theo. Bất kì việc học tập nào cũng sẽ không đầy đủ nếu không có một sự tiêu hóa nào đó các nguyên lí bộ môn. Để minh họa cho ý tưởng và nguyên lí đằng sau mỗi chủ đề, tôi cũng có trình bày một bộ sưu tập các bài tập và các bài toán để giải hay thảo luận. Một số câu hỏi có thể được xếp loại như là "bài tập" nhằm mục đích minh họa nguyên tắc cơ bản; các câu hỏi khác có thể được xếp loại như là "bài toán" mà thông thường sẽ đòi hỏi nhiều kĩ năng hơn để giải quyết chúng. Hầu hết những câu hỏi này đã được trích ra từ các tạp chí y học và kinh nghiệm của cuộc sống thực. Nếu bạn không thể giải được một câu hỏi, đừng tuyệt vọng. Phương pháp giảng dạy của Socrate không nhằm vào việc luyện tập để người ta đưa ra nhanh chóng những câu trả lời, nhưng để giáo dục qua các câu hỏi. Nếu đã nỗ lực nhiều lần nhưng không thành công, bạn có thể liên hệ với tôi và chúng ta hi vọng sẽ có cách xử lí nó. Hãy nhớ rằng các lời giải cho bất kì bài toán có giá trị nào hiếm khi đến với chúng ta một cách dễ dàng mà không cần sự làm việc chăm chỉ, đó phải là kết quả của nỗ lực trí tuệ trong nhiều ngày, nhiều tuần, hoặc nhiều tháng, thậm 1
  • 2. BÀI GIẢNG THỐNG KÊ SINH HỌC chí nhiều năm. Vâng, không có câu hỏi nào trong khóa học này đòi hỏi bạn mất nhiều năm hay nhiều tháng để giải, nhưng có thể phải mất nhiều giờ để giải ra. Sự xuất hiện của máy tính điện tử chắc chắn đã cách mạng hóa việc thực hành thống kê . Máy tính đã thay thế bút chì để giải các phương trình phức tạp khi phân tích dữ liệu. Tuy nhiên, thống kê không chỉ là một tập hợp các định lí hoặc công thức, nó là một phong cách tư duy. Máy tính cũng là một phong cách tư duy. Vì vậy, tôi không tin rằng số liệu thống kê có thể được rút gọn thành một cái nhấn nút trên máy tính mà vẫn giữ được phong cách suy nghĩ, mặc dù có những người tuyên bố đã làm như vậy. Với niềm tin này trong đầu, hầu hết các bài tập trong khóa học này có dụng ý để giải bằng tay với sự trợ giúp của một máy tính hoặc một phần mềm bảng tính (spreadsheet) nói chung - không phải bởi một phần mềm thống kê. Tôi luôn luôn tin rằng trong làm bài tập, một lời giải bằng tay sẽ thú vị hơn và trọn vẹn hơn một lời giải "tự động". Các bài giảng này là kết quả từ nỗ lực của một người thiếu kinh nghiệm. Nó khó có thể hoàn hảo và còn rất nhiều vấn đề bỏ ngõ. Hơn nữa, tài liệu này đã được viết trong một thời gian rất ngắn và do đó sai sót là không thể tránh khỏi. Nếu bạn tìm thấy xin vui lòng cho tôi biết để chỉnh lại cho đúng. Chúc may mắn. 2
  • 3. BÀI GIẢNG THỐNG KÊ SINH HỌC Chủ đề 1: MỘT SỐ KIẾN THỨC TOÁN HỌC CƠ BẢN Ngay cả một người chậm trí mà được đào tạo và luyện tập trong số học, nếu anh ta không thu được cái gì khác từ nó, ít ra cũng hoàn thiện và trở nên sắc nét hơn trước. Plato Nhà thông thái Bertrand Russell gần đây đã viết trong một cuốn sách của ông: "có một lối đi dẫn qua các cánh đồng ở New Southgate, và tôi thường đi đến đó một mình đề ngắm hoàng hôn và dự định tự tử. Tuy nhiên tôi không tự tử bởi vì tôi muốn tìm hiểu thêm về toán học”. Tôi chắc chắn hầu hết chúng ta sẽ không phủ nhận sức mạnh của toán học, nhưng có thể có nhiều hơn một người trong chúng ta đã không ưa môn học này. Nếu chúng ta suy nghĩ nghiêm túc về toán học, chúng ta thấy rằng nó là cơ sở cho tất cả mọi thứ mà chúng ta làm hiện nay. Không ngạc nhiên rằng toán học được coi là hoàng tử của khoa học. Một trong những đồng nghiệp của tôi ở viện Garvan mô tả ý tưởng toán học như là “chân lí vĩnh cửu ". Tôi thích cách mô tả đó. Trong hầu hết các khoa học, đặc biệt là khoa sinh học, tốc độ các "khám phá" làm ta chóng mặt; rủi thay, những cái gọi là khám phá thường phá đổ những ý tưởng mà người khác đã cố xây dựng nên. Thậm chí tệ hơn, cái người này thiết lập lại bị người khác dỡ bỏ đi. Riêng trong toán học mỗi thế hệ lại thêm một câu chuyện mới vào cấu trúc cũ (thường trực), bởi vì đơn giản ý tưởng là vô tận. Thống kê thường được định nghĩa như là một ngành của toán học ứng dụng, tới lượt mình nó lại là một ngành hiện đại của của toán học hiện đại. Trong thực hành, toán học hiện đại là một trong những công cụ chủ yếu của thống kê. Vì vậy, để hiểu thống kê, có được một số kiến thức về toán học sơ đẳng là một điều bắt buộc. Trong chủ đề này, chúng ta sẽ khảo sát một số ý tưởng cơ bản của toán học hiện đại như các khái niệm về hàm số, phương trình, các phép toán lấy tổng, v.v… trước khi đi vào các cuộc thảo luận thống kê. 3
  • 4. BÀI GIẢNG THỐNG KÊ SINH HỌC 0. BẢNG CHỮ HI LẠP THÔNG DỤNG VÀ CÁC KÍ HIỆU TOÁN A. CÁC CHỮ CÁI HI LẠP THÔNG DỤNG Trong thống kê, gần như quy ước người ta kí hiệu các tham số của một quần thể (dân số) bằng chữ cái Hi Lạp và các tham số tương ứng bằng chữ cái Latin, Chữ cái Latin mọi người đều quen thuộc trong khi chữ cái Hi Lạp có lẽ cần phải ôn lại. Bảng sau đây liệt kê các chữ cái Hi Lạp thông dụng nhất mà ta sẽ dùng hoặc gặp trong các bài học sau này. CHỮ IN CHỮ THƯỜNG CÁCH ĐỌC Α α alpha Β β beta Χ χ chi Γ δ delta Δ ε epsilon Φ φ phi Γ γ gamma Μ μ mu(y) Ν ν nu(y) Π π pi Θ θ theta Ρ ρ rho ΢ ζ sigma Λ λ lambda Κ κ kappa B. CÁC KÍ HIỆU TOÁN THÔNG DỤNG Và tất nhiên, việc học toán không thể hoàn thành nếu không thể giao tiếp bằng ngôn ngữ toán học. Đây là một số trong những kí hiệu thường được sử dụng trong toán học đòi hỏi bạn phải thông thạo: KÍ HIỆU Ý NGHĨA ───────────────────────────────────────────────── ∈ thuộc về ∉ không thuộc về ⇒ bao hàm / suy ra rằng ⇐ được suy ra từ ⇔ tương đương với / nếu và chỉ nếu N số tự nhiên Z số nguyên Q số hữu tỉ R số thực [a, b] khoảng đóng a, b (tập hợp các số x ∈ R: a ≤ x ≤ b) (a, b) khoảng mở a, b (tập hợp các số x ∈ R: a < x < b) [a,b) khoảng nửa mở (đóng) a, b (tập hợp các số x ∈ R: a ≤ x < b) (a,b] khoảng nửa đóng(mở) a, b (tập hợp các số x ∈ R: a < x ≤ b) ∀ với mọi ∃ tồn tại 4
  • 5. BÀI GIẢNG THỐNG KÊ SINH HỌC I. KÍ HIỆU TỔNG Σ Nhiều tính toán thống kê dính dáng tới kí hiệu này. Trước khi đi vào thống kê chúng ta cần quen thuộc với kí hiệu sigma Σ, đây là một cách viết tắt của tổng. Ví dụ, thay vì viết x1 + x2 + x3 + x4 + x5 ta viết 5 ������������ ������=1 (đọc là tổng của x chỉ số i, với i chạy từ 1 đến 5). Hay 5 ������0 + ������2 + ������4 + ⋯ + ������10 = ������2������ ������=0 Tương tự, chúng ta cũng có thể viết ������ ������ 1 + ������ 2 + ������ 3 + ⋯ + ������ ������ = ������ ������ ������ =1 Lưu ý rằng ������ ������������ = ������ =1 ������������ vì chúng đều là cách viết tắt của tổng ������1 + ������2 + ������3 + … + ������������ tức là tên gọi ������=1 ������ của chỉ số là không quan trọng. Ngoài ra trong trường hợp không có nhầm lẫn về các giá trị đầu và cuối của chỉ số, thay vì viết đầy đủ ������ ������=������ ������������ ta có thể viết ngắn gọn là ������ ������������ hay đơn giản hơn là ������������ . Dễ dàng suy ra các đẳng thức sau đây: ������ ������ = ������������ ������=1 ������ ������ ������������������ = ������ ������������ ������=1 ������=1 ������ ������ ������ (������������ + ������������ ) = ������������ + ������������ ������=1 ������=1 ������=1 Ví dụ: cho cấp số nhân xi = aq i , i = 0, 1, 2, 3, ..... Ta đã biết: tổng của n số hạng đầu tiên của cấp số này có công thức là: ������ ������ ������ ������ ������(1 − ������ ������+1 ) ������������ = ������������ = ������������ = ������ ������ ������ = 1 − ������ ������=0 ������=0 ������=0 5
  • 6. BÀI GIẢNG THỐNG KÊ SINH HỌC ������ Giả sử |q| < 1, khi n → ∞ thì qn+1 → 0, do đó ������������ → , từ đó khá hợp lí khi nói rằng tổng vô hạn các số 1−������ ������ hạng của cấp số nhân này là ������ = và ta viết: 1−������ ∞ ������ ������ = ������������ ������ = 1 − ������ ������=0 Tổng quát, người ta cũng đã mở rộng kí hiệu cho tổng vô hạn các số hạng khi tổng này “tính được” như trong ví dụ trên: ∞ ������������ = ������1 + ������2 + ������2 + … + ������������−1 + ������������ + … ������=1 Ví dụ: Ta có: ∞ ∞ 1 ������ ������ = 1, = ������ ������ 2������ ������! ������=1 ������=0 Hiển nhiên nhiều biểu thức cũng có thể viết đơn giản hơn bằng kí hiệu này. Một số đẳng thức thú vị khác sẽ được đưa vào phần bài tập để các bạn tự làm. II. KÍ HIỆU TÍCH Π 1.1. KÍ HIỆU GIAI THỪA Giả sử chúng ta có n vật, người ta có thể chứng mình rằng số các cách sắp xếp (hoán vị) n vật này trên một đường thẳng là n! (đọc là n giai thừa), kí hiệu này được định nghĩa như sau: n! = n(n – 1)(n – 2)(n – 3). ... .3.2.1 Để tiện trình bày các kết quả tổng quát người ta cũng quy ước thêm: 0! = 1! =1. Ví dụ: 3! = 3 × 2 × 1 = 6 5! = 1× 2 ×3 ×4 × 5 = 120 Như chúng ta có thể thấy, với n lớn thì n! sẽ hết sức lớn và có thể không tính nổi bằng các máy tính cầm tay, lúc đó ta có thể dùng công thức tính xấp xỉ sau đây: ������! ≈ 2������������������������ ������ −������ Trong đó e ≈ 2.71828…là cơ số của logarit tự nhiên và π≈ 3.14158… Công thức này được gọi là công thức xấp xỉ Stirling. 2.2. KÍ HIỆU TÍCH Π Kí hiệu này được định nghĩa như sau: ������ ������������ = ������1 ������2 ������3 … ������������ ������=1 6
  • 7. BÀI GIẢNG THỐNG KÊ SINH HỌC Theo đó: ������ ������ = ������ ������ ������=1 và ������ ������ ������ ������������������ = ������ ������������ ������=1 ������ =1 Cũng có thể chứng minh được: ������ ������ ������ ������������ ������������ = ������������ ������������ ������=1 ������=1 ������ =1 Với kí hiệu tích ta có thể viết lại định nghĩa giai thừa trên đây như sau: ������ ������! = (������ + 1 − ������) ������=1 hay cũng có thể viết cách khác là ������ −1 ������! = ������ − ������ ������=0 hoặc đơn giản hơn là ������ ������! = ������. ������=1 Việc kiểm chứng các đẳng thức này hoặc viết lại dưới dạng khác hơn nữa xem như bài tập nhỏ dành cho các bạn. Người ta cũng mở rộng kí hiệu này cho tích vô hạn các thừa số như ở kí hiệu tổng miễn là tích đó “tính được”: ∞ ������������ = ������1 ������2 ������3 … ������������ −1 ������������ ������������+1 … ������=1 III. HỆ THỐNG SỐ THỰC Trong phần này, chúng ta sẽ ôn lại ngắn gọn cấu trúc của hệ thống số thực. 3.1. Số tự nhiên: Các số 1, 2, 3, và cứ thế tiếp tục được gọi là số tự nhiên.1] Tập hợp các số tự nhiên được kí hiệu là N. N = {1, 2, 3, … n, ... } 1 Để thuận tiện, nhiều tác giả coi tập số tự nhiên N có chứa cả số 0. 7
  • 8. BÀI GIẢNG THỐNG KÊ SINH HỌC Nếu chúng ta cộng hoặc nhân hai số tự nhiên bất kì, kết quả luôn luôn là một số tự nhiên. Tuy nhiên, nếu chúng ta trừ hoặc chia hai số tự nhiên, kết quả không luôn luôn là một số tự nhiên. Chẳng hạn, 8 - 5 = 3 và 8 ÷ 2 = 4 là số tự nhiên, nhưng 5 - 8 = -3 và 2 ÷ 7 không cho kết quả trong số tự nhiên. Như vậy, trong hệ thống số tự nhiên, chúng ta có thể cộng và nhân, nhưng không phải luôn luôn có thể trừ hoặc chia. 3.2. Số nguyên: Để khắc phục những hạn chế trong phép trừ, chúng ta mở rộng hệ thống số tự nhiên ra thành hệ thống các số nguyên bằng cách lấy hết tất cả các số tự nhiên rồi thêm vào các số đối của chúng (số âm) và số không (0). Tập hợp các số nguyên được kí hiệu là Z . Z = { ... -3, -2, -1, 0, 1, 2, 3,… } 3.3. Số hữu tỉ: Nhưng chúng ta vẫn không thể luôn luôn chia được hai số nguyên bất kì. Chẳng hạn, 8 ÷ (-2) = -4 là một số nguyên, nhưng 8 ÷ 3 không phải là một số nguyên. Để khắc phục vấn đề này, chúng ta mở rộng hệ thống số nguyên thành hệ thống số hữu tỉ. Chúng ta định nghĩa một số là hữu tỉ nếu nó có thể biểu diễn được như là một tỉ số của hai số nguyên. Tập hợp các số hữu tỉ được kí hiệu là Q. Q = { m/n | ∀ m, n ∊ Z & n ≠ 0} (Kí hiệu ∀ đọc là với mọi và kí hiệu ∊ đọc là thuộc về) Theo đó, tất cả bốn phép tính số học cơ bản (cộng, trừ, nhân và chia) đều có thể thực hiện được trong Q. 3.4. Số vô tỉ: Trong sử dụng hàng ngày cũng tồn tại nhiều số không phải là số hữu tỉ; nghĩa là chúng không thể biểu diễn được dưới dạng một tỉ số của hai số nguyên. Ví dụ 2, 3, π, v.v... không là số hữu tỉ; những số như thế gọi là số vô tỉ. 3.5. Số thực Từ số thực được dùng để chỉ chung cho số hữu tỉ hoặc vô tỉ. Tập hợp các số thực được kí hiệu là R. Để có một định nghĩa đầy đủ của số thực sẽ phải liên quan đến việc giới thiệu một số ý tưởng mới, và chúng ta không đi vào nhiệm vụ này ở đây. Tuy nhiên, có thể có được một ý niệm đúng đắn về số thực bằng cách hiểu nó dưới dạng số thập phân. Bất kì số hữu tỉ nào cũng có thể được biểu diễn dưới dạng thập phân, đơn giản bằng cách chia tử cho mẫu trong phép chia dài (chia bằng tay). Có hai trường hợp xảy ra:  phần thập phân dừng lại hẳn ở một vị trí nào đó;  kể từ một vị trí nào đó phần thập phân phát triển theo hướng lập lại vô hạn một nhóm chữ số theo một khuôn mẫu nào đó (được gọi là vô hạn tuần hoàn). 8
  • 9. BÀI GIẢNG THỐNG KÊ SINH HỌC Ví dụ ¼ = 0.252 (dừng sau 2 chữ số thập phân) còn 1/6 = 0.161616... (lặp lại vô hạn cặp số 16 ngay từ chữ số thập phân đầu tiên). Đối với trường hợp hai, trong thực hành tính toán, ta không thể làm việc với vô hạn chữ số của phần thập phân mà phải chấp nhận tính toán với một số nhất định các chữ số sau dấu phẩy tuỳ độ chính xác cho phép, tức là ta chỉ tính toán gần đúng mà thôi3. Số vô tỉ cũng có thể biểu diễn với dạng thập phân4 nhưng phần thập phân không bao giờ dừng lại và cũng không lập lại tuần hoàn như số hữu tỉ.5 3.6. Số phức: Trong hệ thống số thực, phép lấy căn bậc hai chỉ có thể thực hiện cho các số không âm (dương hay bằng 0). Mỗi số a > 0 có 2 căn bậc hai đối nhau và ta dùng kí hiệu ������ để chỉ căn bậc hai dương của a. Nếu chúng ta chỉ xem xét số thực thì căn bậc hai của một số âm không có nghĩa, chẳng hạn −2 hoặc 3 − 5 không tồn tại và chẳng có ý nghĩa gì trong hệ thống số thực. Tuy nhiên, những con số này lại tồn tại trong hệ thống số phức (một hệ mở rộng của hệ thống số thực, kí hiệu là C) mà chúng ta không xét tới ở đây. IV. LUỸ THỪA NGUYÊN VÀ PHÉP TOÁN MŨ. Nếu x, y là 2 số thực bất kì và m, n là 2 số nguyên bất kì thì các quan hệ sau đây là đúng: 1 (a) ������ ������ ������ ������ = ������ ������ +������ (b) ������ −������ = ������ ������ (������ ≠ 0) ������ ������ (c) ������ ������ = ������ ������ −������ (������ ≠ 0) (d) ������ ������ ������ = ������ ������������ ������ ������ ������ ������ ������ (e) ������������ = ������ ������ ������ ������ (f) ������ = ������ ������ (������ ≠ 0) ������ (g) ������ ������ /������ = ������ ������ (������ ≥ 0 ������������������ ������ ������������ẵ������) Từ (g) ta suy ra: (h) ������ = ������ 1/2 ������ ≥ 0 và: (i) ������ 2 = |������| Biểu thức (g) là một mở rộng của khái niệm luỹ thừa với số mũ nguyên sang số mũ hữu tỉ và từ (g), người ta có thể tiếp tục mở rộng định nghĩa luỹ thừa sang số mũ thực để có phép toán mũ: ������ ������ với x > 0 và r là một số thực bất kì. Phép toán mũ có đủ tất cả các tính chất (a) – (g) ở trên với m, n bây giờ là số thực. 2 Thật ra có thể viết ¼ = 0.250000…. (phần thập phân lập lại vô hạn theo khuôn mẫu là 0,0,0… từ chữ số thập phân thứ 3). 3 Trong tính toán ta chỉ làm việc với tập các số hữu tỉ thập phân ������10 = ������ ∈ ������ |������ = ������ ������ ������=−������ ������������ 10 ; ������������ ∈ 0,1,2, … ,9 ; ������, ������ ∈ ������ mà thôi. 4 Việc biểu diễn số thập phân thường đòi hỏi phải có kiến thức toán học cao cấp nên ta sẽ không bàn ở đây. Một ví dụ mịnh hoạ là ta có thể biểu diễn e dưới dạng thập phân bằng cách tính toán dựa vào công thức: e =1/1! + 1/2! + 1/3! + ..... + 1/n! + … 5 Trong thực hành tính toán, ta chỉ sử dụng dạng thập phân gần đúng của số vô tỉ, ví dụ π ≈ 3.141592 tức vẫn chỉ dùng số hữu tỉ, thật ra chỉ dùng số thập phân trong Q10 như đã nêu ở cước chú 4. 9
  • 10. BÀI GIẢNG THỐNG KÊ SINH HỌC Khi chúng ta ở trong chủ đề này, có thể sẽ hữu ích khi lưu ý rằng có nhiều hơn một sự khác biệt cơ bản giữa x² + y² và (x + y)² (hãy tự kiểm chứng lại điều này). Sự khác biệt đó sẽ được khai thác về sau trong loạt bài này, tuy nhiên, một số đẳng thức về nhị thức có thể hữu ích ở đây: (x ± y)² = x² ± 2xy + y² (x ± y)³ = x³ ± 3x²y + 3xy² ± y³ … Loại khai triển này sẽ được bàn tới trong chủ đề xác suất. V. LOGARIT (LOGARITHM) ĐỊNH NGHĨA: Cho 0 < a ≠ 1, x > 0 và y là số thực, nếu x = ay , thì y được gọi là logarit cơ số a của x và ta viết y = logax . Như vậy: y= loga x ⇔ x= a y nên phép lấy mũ cơ số a là phép toán ngược của phép toán lấy loga nên còn được gọi là phép toán anti loga * Dễ thấy từ định nghĩa logaa =1 và loga1 = 0. Người ta thường kí hiệu logex là lnx (e = 2.71828… là cơ số của logarit tự nhiên hay logarit Napier) và log10x là logx. Một vài tính chất quan trọng của logarit như sau: (a) logaxy = logax + logay (b) loga(x/y) = logax - logay (c) loga xn = nlogax (d) loga x = logbx / logba (quy tắc đổi cơ số) VI. HÀM SỐ 6.1. HÀM SỐ TỔNG QUÁT: Khái niệm hàm số là một trong những khái niệm cơ bản của toán học hiện đại. Một hàm số diễn đạt giả thuyết về một đại lượng này phụ thuộc vào (xác định bởi) một đại lượng khác. I. Khối lượng xương phụ thuộc vào tuổi của chủ thể. II. Chiều cao phụ thuộc vào chủng tộc … Nếu một hàm f gán một giá tri y (duy nhất) cho một đối tượng x nào đó, ta viết: y = f(x) Trong toán học hình thức, ta gọi tập các giá trị có thể có được của x là miền xác định (domain) và tập các giá trị có thể có được của y (thuộc về một tập nào đó) là miền giá trị (range). Trong thống kê hiện đại, x được gọi là biến số “độc lập” và y là biến số “phụ thuộc”. Một hàm f có miền xác định A và (tập chứa) miền giá trị B cũng có thể diễn tả dưới dạng kí hiệu như sau: f:A→B x→y 10
  • 11. BÀI GIẢNG THỐNG KÊ SINH HỌC Ví dụ: f(x) = 3x² + 7x +2 với x = -3 ta có f(-3) = 3(-3)² + 7(-3) +2 = 50 Theo thói quen trong toán học, nhiều khi người ta chỉ cho một hàm số dưới dạng công thức. Trong trường hợp này, chúng ta phải tự xác định miền xác định của hàm số, đó là tập hợp các phần tử làm cho công thức có nghĩa. Ví dụ, với hàm số y = ������, miền xác định không phải là toàn bộ tập số thực R mà chỉ là tập các số x≥ 0 vì chúng ta không thể lấy căn của một số âm; với y = logax, giá trị của x phải lớn hơn 0 vì với x ≤ 0, y không xác định. Tương tự, đối với hàm số có dạng y = 1/x thì miền xác định phải là tập các số thực x ≠ 0. Trường hợp miền xác định của một hàm f là tập con của tích 2, 3, … , n tập hợp, ta có hàm với 2, 3, … , n biến số. Tương tự như trường hợp một biến, hàm nhiều biến y = f(x1, x2, … , xn) từ tập tích A1×A2×…×An đến tập B có thể diễn tả bằng kí hiệu như sau: f: A1×A2×…×An → B (x1, x2, … , xn) ↦ y Ví dụ, * y = f(u, v, t) = 1+ 2uvt – u + t2 là một hàm 3 biến Ta có f(1, 2,-1) = 1 +2×1×2×(-1) – 1 + (-1)2 = -3 * mật độ khoáng trong xương(BMD) là một hàm 2 biến (tuổi và trọng lượng): BMD = a + b.Age + c.Weight 6.2. HÀM TUYẾN TÍNH Một hàm tuyến tính có dạng: y = a + bx [1] trong đó a được gọi là tung độ gốc hay hệ số chắn (intercept) (khi x = 0 thì y = a) và b được gọi là độ dốc hay hệ số góc (slope/gradient) (biểu thị mức độ thay đổi của y ứng với thay đổi 1 đơn vị của x). Khi biểu diễn trong không gian 2 chiều x-y (mặt phẳng toạ độ) thì đồ thị của hàm tuyến tính là một đường thẳng. Nếu 2 biến x và y thoả mãn [1] ta nói x và y có quan hệ tuyến tính. Cho 2 điểm bất kì (x1, y1) và (x2, y2) trên đồ thị của hàm tuyến tính (Hình 1A) thì độ dốc có thể xác định bằng hệ thức sau đây: ������2 − ������1 độ ������������������������ đổ������ ������ủ������ ������ ������ = = ������2 − ������1 độ ������������������������ đổ������ ������ủ������ ������ Tuy nhiên trong thực nghiệm, việc đo đạc thường không cho ta các giá trị chính xác của x và y, nhưng ta có thể đo được một loạt các giá trị gần đúng của x và y. Nếu các cặp số (x, y) thoả một số điều kiện nhất định, chẳng hạn khi biểu diễn các cặp giá trị (x, y) đó trên một mặt phẳng toạ độ, thấy chúng gần như thẳng hàng. Khi đó quan hệ của x và y có thể là một quan hệ tuyến tính với các hệ số a và b chưa biết và với các giá trị (x, y) đo được ta có thể lập ra một hệ nhiều phương trình, từ đó có thể dùng phương pháp bình phương nhỏ nhất (có trong nhiều phần mềm thống kê) để ước tính a và b. Nếu không dùng các phần mềm thống kê, ta có thể tính b theo công thức (xem như một mở rộng của công thức trên). b = ΢ [ (xi - ������)(yi - ������) ] / ΢ [ (xi - ������)2] 11
  • 12. BÀI GIẢNG THỐNG KÊ SINH HỌC Nếu có 2 đường thẳng y = a1 + b1x và y = a2 + b2y, ta có một vài nhận xét sau: a. Hai đường thẳng là song song khi và chỉ khi độ dốc của chúng bằng nhau, tức là b1 =b2. b. Mặt khác, nếu b1 ≠ b2 thì hai đường thẳng không song song. Trong thống kê ta gọi hiện tượng này là “sự tương tác” (interaction) (Hình 1C). Hính 1 (A) hàm tuyến tính dạng y = a + bx (B) 2 đthẳng song song (C) “tương tác” Hệ thức [1] có thể mở rộng hơn nữa bao gồm nhiều hơn một biến số như sau: y= b0 + b1x1 +b2x2 + … + bnxn [1’] Phương trình tuyến tính [1’] xác định một siêu phẳng (n chiều) trong không gian n+1 chiều. Ví dụ mật độ khoáng trong xương(BMD) phụ thuộc rất nặng vào tuổi và trọng lượng cơ thể, chúng ta có thể viết mệnh đề về mối quan hệ này như sau: BMD = a + b.Age + c.Weight trong đó a, b, c là 3 hằng số đã được ước tính. Từ đó, với mỗi giá trị của Age và Weight, ta có thể ước lượng BMD từ công thức trên. Chúng ta sẽ khảo sát hàm số này trong bối cảnh phân tích hồi quy sau này trong loạt bài giảng này. 6.3. HÀM BẬC HAI Chúng ta thường gặp những trường hợp mà mối quan hệ hàm số giữa biến phụ thuộc (y) và các biến độc lập (x) không tuyến tính mà có tính cong. Một trong những hàm phổ biến là hàm bậc hai, có dạng: y = f (x) = ax² + bx + c [2] trong đó a, b và c là hằng số và a ≠ 0. −������± ������ 2 −4������������ Khi y = 0 và ������2 − 4������������ ≥ 0 ta được: ������ = 2������ ������ Khi ������ =− thì hàm bậc hai đạt giá trị cực đại / cực tiểu 2������ ������ 4������������ − ������2 ������������������/������������������ = f − = 2������ 2������ Ví dụ: quan hệ giữa BMD và tuổi (của các đối tượng già) là theo quan hệ bậc hai: BMD = a (Age)² + b (Age) + c 12
  • 13. BÀI GIẢNG THỐNG KÊ SINH HỌC 6.4. BẤT ĐẲNG THỨC Ta đã quen thuộc với các kí hiệu bất đẳng thức sau đây: > và < "lớn hơn" và "bé hơn", tương ứng. ≥ và ≤ "lớn hơn hoặc bằng" và "bé hơn hoặc bằng", tương ứng. Mốt số tính chất của bất đẳng thức cần lưu ý: Cho x, y là các số thực: (i) Nếu y > x thì y ± a > x ± a ∀ a ∈ R (ii) Nếu y > x thì -y < -x (iii) Nếu y > x thì y/a > x/a và ay > ax ∀a > 0 và y/a < x/a và ay < ax ∀a < 0 (iv) Nếu y > x > 0 thì x > y ∀ n. ∈ N n n Các tính chất (i) – (iv) vẫn còn đúng nếu thay > và < tương ứng bằng ≥ và ≤. 6.5. TUYẾN TÍNH HOÁ Có lẽ là không cần thiết để nói rằng một hàm tuyến tính rất dễ giải thích hơn là một hàm không tuyến tính (phi tuyến). Do đó, nhiều nỗ lực đã được thực hiện để biến đổi các hàm không tuyến tính thành một hàm tuyến tính. Ví dụ: nếu ������ = ������ ������ ������ , chúng ta có thể sử dụng logarit để tuyến tính hoá nó như sau: ������������������������ = log⁡ ������ ������ = ������������������������ + ������ ������������������������. Biểu thức cuối cùng cho thấy logy rõ ràng là một hàm tuyến tính đối (������ với x. Ở đây cần lưu ý rằng, chính thức có sự khác biệt giữa hàm tuyến tính và mô hình tuyến tính. Ví dụ y = a + bx, y = a + bx + cx² v.v... đều là các mô hình tuyến tính nhưng hàm sau là hàm không tuyến tính trong khi hàm đầu là một hàm tuyến tính. Chúng ta nói "tuyến tính" do các tham số a, b, và c là tuyến tính. Tuy nhiên, y = a²x + b hoặc y = a bx đều là mô hình "phi tuyến" và hàm phi tuyến bởi vì cả các tham số lẫn các đường cong đều không tuyến tính. VII. HỆ PHƯƠNG TRÌNH TUYẾN TÍNH VÀ MA TRẬN 7.1. Ma trận: 7.1.1. Định nghĩa: Ma trận m hàng n cột (thường được gọi là ma trận m×n) là bảng số có dạng: ������11 ������12 ⋯ ������1������ ⋮ ⋱ ⋮ ������������ 1 ������������ 2 ⋯ ������������ ������ trong đó aij ∈ R, i =1,2, … , m và j = 1, 2, … , n được gọi là các số hạng của ma trận. Ma trận không là ma trận mà tất cả cácsố hạng đều bằng 0. Khi m = n ta có ma trận vuông. 13
  • 14. BÀI GIẢNG THỐNG KÊ SINH HỌC Một ma trận vuông có các số hạng không nằm trên đường chéo chính (đi từ a11, a22… đến ann) đều bằng 0 gọi là ma trận chéo: Một ma trận chéo có các số hạng trên đường chéo chính đều bằng 1 gọi là ma trận đơn vị và kí hiệu là I, ví dụ ma trận đơn vị 3×3: 1 0 0 ������3 = 0 1 0 0 0 1 7.1.2. Phép toán trên ma trận: - Phép cộng: cho 2 ma trận A = (aij) và B = (bij) có cùng kích thước (cùng số hàng và số cột) ta định nghĩa: A + B = (aij+bji). - Phép nhân với một số : tích của số thực α và ma trận A = (aij) đưọc định nghĩa là: α A = ( α×aij) - Phép nhân: Cho ma trận A=(aij) có kích thước m×n và ma trận B=(bjk) có kích thước n×p thí tích của A và B là ma trận C=(crq) có kích thước m×p trong đó ������ ������������������ = ������������������ ������������������ ������=1 Tức là số hạng ở hàng r cột q của C là tổng của tích các số hạng ở hàng r của A tương ứng với số hạng ở cột q của B Ta chỉ nhân được A cho B khi số cột của A bằng số hàng của B, vì vậy nói chung B×A có thể không tồn tại. - Phép chuyển vị: ma trận chuyển vị của ma trận A=(aij) có kích thước m×n là ma trận A’=(a’ji) có kích thước n×m với a’ji = aij. 7.1.3. Định thức của ma trận vuông: Định thức của ma trận vuông A, kí hiệu là det(A) hay ||jA||, được định nghĩa như sau: ������ ������ - Ma trận 2×2: = ������������ − ������������ ������ ������ ������ ������ ������ ������ ������ ������ ������ - Ma trận 3×3: ������ ������ ������ = ������ ������ ������ − ������ + ������ ������ ������ ������ ������ ������ ������ ������ ������ ������ = aei + bfg + cdh – afh – bdi – ceg ������11 ������12 ⋯ ������1������ - Ma trận n×n: ⋮ ⋱ ⋮ = ������ ������=1 −1 ������+������ ������������������ ������������������ ������������ 1 ������������ 2 ⋯ ������������������ với Aki là ma trận (n-1)×(n-1) có được bằng cách bỏ đi hàng k và cột i trong ma trận gốc. Ví dụ: Tìm định thức của ma trận: −2 2 −3 ������ = −1 1 3 2 0 −1 Ta có thể dùng công thức cuối cùng, chẳng hạn với i = 2: 14
  • 15. BÀI GIẢNG THỐNG KÊ SINH HỌC 2+1 2 −3 −2 −3 −2 2 det ������ = −1 × −1 × + (−1)2+2 × 1 × + (−1)2+3 × 3 × 0 −1 2 −1 2 0 = (-1)×(-1)×(-2) + 1×1×8 + (-1)×3×(-4) =-2 + 8 +12 = 18. (Bạn đọc có thể kiểm tra lại kết quả bằng cách khai triển với giá trị i khác hoặc dùng công thức cho ma trận 3×3). 7.2. Hệ phương trình tuyến tính: 7.2.1. Hệ phương trình tuyến tính theo 2 ẩn x và y là cặp phương trình có dạng: ������������ + ������������ = ������ ������������ + ������������ = ������ trong đó a, b, c, d, e, f là những số đã biết và x, y là hai số chưa biết thoả cà 2 phương trình trên mà ta cần tìm. Khi ad – bc ≠ 0 thì hệ có nghiệm duy nhất cho bởi công thức Cramer như sau:6 x= (de – bf)/(ad – bc) và y=(af – ce)/(ad – bc) Hệ trên cũng có thể viết lại dưới dạng ma trận là: ������ ������������ ������ ������ ������ ������������ = ������ ������������������ ������ ������ = ������ ������ ������ ������ với ������ = và ������ = ������ ������ ������ Khi det(A) ≠ 0,(hay ad – bc ≠ 0), nghiệm của hệ cho bởi công thức Cramer như sau: ������������������(������1 ) ������ = với A1 là ma trận có đưọc bằng cách thay cột 1 trong A bằng B det⁡ (������) ������������������(������2 ) ������ = với A2 là ma trận có đưọc bằng cách thay cột 2 trong A bằng B det⁡ (������) (Bạn đọc tự kiểm tra lại công thức Cramer dạng định thức và dạng thông thường là như nhau.) 7.2.2. Hệ phương trình tuyến tính n ẩn là n phương trình đồng thời: a11x1 + a12x2 + … + a1nxn = b1 a21x1 + a22x2 + … + a2nxn = b2 ..................... ..................... ..................... an1x1 + an2x2 + … + annxn = bn với aij (i, j = 1 , 2, … , n) là những số đã biết và xi (I = 1, 2, …, n) là các số chưa biết thoả cả n phương trình trên mà ta cần tìm. Tương tự như trường hợp 2 ẩn cũng có thể viết phương trình này dưới dạng ma trận như sau: 6 Dĩ nhiên cũng có thể giải bằng các phương pháp thông thường như thế, khử, so sánh như đã biết. 15
  • 16. BÀI GIẢNG THỐNG KÊ SINH HỌC ������1 ������1 ������11 ⋯ ������1������ ������2 ������2 ������ ������ = ������ ������ớ������ ������ = ⋮ ⋱ ⋮ , ������ = ⋮ ������à ������ = ������������1 ⋯ ������������������ ⋮ ������������ ������������ Khi det(A) ≠ 0, hệ có nghiệm duy nhất cho bởi công thức Cramer như sau: ������������������(������������ ) ������������ = ������ = 1,2 … , ������, với Ai là ma trận có được bằng cách thay cột i trong A bằng B 7 det⁡ (������) Ví dụ: Giải hệ phương trình sau: −2������ + 2������ − 3������ = 1 −������ + ������ + 3������ = −2 2������ − ������ = 1 Hệ này có thể viết dưới dạng ma trận như sau: −2 2 −3 ������ 1 −1 1 3 ������ = −2 2 0 −1 ������ 1 Ta có det(A) = 18, det(A1) = 4, det(A2) =-2 và det(A3) = -10 nên x = 4/18 = 2/9, y = -2/18 = -1/9 và z = 10/18 = -5/9.8 VIII. ĐẠO HÀM VÀ TÍCH PHÂN 8.1. Đạo hàm: 8.1.1. Định nghĩa: ������(������ +������)− ������(������ 0 ) Cho hàm số y = f(x) liên tục trên một khoảng (a, b), x0 ∊ (a, b), nếu tỉ 0 ������ có giới hạn là l khi h→ ������������ (������ 0 ) 0 thì l được gọi là đạo hàm của hàm số y = f(x) tại x0 và được kí hiệu là f’(x0) hay ������������ ∶ ������������(������0 ) ������ ������0 + ������ − ������(������0 ) ������ ′ ������0 = = ������ = lim ������������ ������→0 ������ * Ý nghĩa hình học: Gọi M0 và M lần lượt là 2 điểm có hoành độ là x0 và x0+h trên đồ thị của hàm y = f(x). ������(������ +������ )− ������(������ 0 ) Lưu ý rằng tỉ 0 ������ là hệ số góc của cát tuyến M0M (xem hình 2). Khi h→ 0 thì ������(������ 0 +������ )− ������(������ 0 ) M → M0 và cát tuyến M0M trở thành tiếp tuyến M0t của đồ thị. Do đó, tỉ ������ tiến đến hệ số góc của cát tuyến M0t., tức là: f’(x0) = hệ số số góc của tiếp tuyến M0t 7 Cũng có thể giải trực tiếp bằng cách nhân cả 2 vế với ma trận nghịch đảo A-1 của A như cách giải phương trình bậc nhất thông thường và được X= ������−1 ������, tuy nhiên việc tìm ma trận nghịch đảo hơi phức tạp nên không trình bày ở đây. 8 Hiện nay có nhiều phần mềm có thể giúp ta tính toán định thức tự động sau khi nhập các số hạng của ma trận. 16
  • 17. BÀI GIẢNG THỐNG KÊ SINH HỌC Hình 2 : Đạo hàm bằng hệ số góc của tiếp tuyến * y’ = f’(x) cũng là một hàm số và nếu f’(x)có đạo hàm thì đạo hàm này đuợc gọi là đạo hàm bậc hai của ������ 2 ������(������) y= f(x) và được kí hiệu là y” = f”(x) hay ������" = ������������ 2 .. Tương tự ta cũng có thể định nghĩa đạo hàm bậc n của y = f(x) và kí hiệu đạo hàm bậc n là (������) ������ (������) ������������ ������(������) ������ = ������ ������ ������������������ ������ = ������������ ������ 8.1.2. Tính chất:  Cho f, g, h là các hàm số có đạo hàm, khi đó: (i) (f ± g)’ = f’ ± g’ (ii) (fg)’ = f’g + fg’ (iii) 1/f = - f’/f2 (iv) (fn)’ = n f’ fn-1  Nếu hàm số y = f(x) có đạo hàm trên khoảng (a, b) và x0 ∊ (a, b), khi đó: - f(x) đạt giá trị cực đại tại x0 khi và chỉ khi f’(x0) = 0 và f’(x) > 0 với x < x0 , f’(x) < 0 với x > x0. - (x) đạt giá trị cực tiểu tại x0 khi và chỉ khi f’(x0) = 0 và f’(x) < 0 với x < x0 , f’(x) > 0 với x > x0. 8.1.3. Đạo hàm một số hàm thông dụng: (C)’ = 0 (C là hằng số) (xn)’ = nxn-1 ∀n ∊ Z (ex)’ =ex (lnx )’= 1/x (sinx)’ = cosx (cosx)’ = -sinx (tgx)’ = 1/(1+tg2x) (cotgx)’ = -1/(1+cotg2x) 1 −1 ������������������������������������������ ’ = ������������������������������������������ ′ = 1 − ������ 2 1 − ������ 2 1 −1 ������������������������������������ ’ = ������������������������������������������������ ’ = 1 + ������������2 ������ 1 + ������������������������2 ������ 8.1. 4. Đạo hàm hàm nhiều biến: Định nghĩa: 17
  • 18. BÀI GIẢNG THỐNG KÊ SINH HỌC Cho hàm y = f(x1, x2, … , xn) liên tục trên ������ (������������ , ������������ ), và k là số nguyên sao cho ������=1 1 ≤ k ≤ n. Khi giữ các biến xi cố định với i ≠ k, lúc đó có thể xem y = f(x1, x2, … , xn) như một hàm chỉ theo biến xk và nếu hàm này có đạo hàm theo xk thì đạo hàm này được gọi là đạo hàm riêng của f theo xk và được kí hiệu là ′ ������������(������1 , ������2 , … , ������������ , … , ������������ ) ������������ ������ = ������������������ Hàm y = f(x1, x2, … , xn) được gọi là vi phân được (khả vi) khi nó có đạo hàm riêng theo tất cả các biến xi. Ví dụ: Cho y = f(u, v) = 2u – 3uv2 +5, ta có: ������������(������, ������) ������������(������, ������) ′ ������������ = = 2 − 3������ 2 ������à ������������ = ′ = −6������������ ������������ ������������ Tính chất: Cho y = f(x1, x2, … , xn) khả vi, khi đó: y = f(x1, x2, … , xn) đạt cực tiểu (cực đại) tại (x10, x20, … , xn0) nếu và chỉ nếu các đạo hàm riêng đều bằng 0 và đổi dấu từ âm sang dương (từ dương sang âm) khi đi qua xko với k =1, 2, … , n. 8.2. Nguyên hàm và Tích phân: 8.2.1. Nguyên hàm: Định nghĩa: Cho hàm y = F(x) và y = f(x) cùng xác định trên khoảng (a,b), nếu F có đạo hàm và F’(x) = f(x) thì hàm được gọi là nguyên hàm của hàm f Tính chất: Hàm F và hàm G là đều là nguyên hàm của hàm f khi và chỉ khi tồn tại hằng số C sao cho G(x) = F(x) + C.  Một nguyên hàm tổng quát (còn gọi là tích phân bất định) của hàm y = f(x) được kí hiệu là ������ ������ ������������. Nguyên hàm của một số hàm thông dụng: ������ ������ +1 ������������ ������ ������ ������������ = + ������ ������ ≠ −1 = ������������������ + ������ ������ + 1 ������ ������ ������ ������������ = ������ ������ + ������ ������������������ = ������ ������������������ − 1 + ������ ������������������������ ������������ = −������������������������ + ������ ������������������������ ������������ = ������������������������ + ������ ������������������ ������������ = −ln ������������������������ + ������ ������������������������������ ������������ = ln ������������������������ + ������ ������������������������������������������ ������������ = ������������������������ ������������������������ + 1 − ������ 2 + ������ ������������������������������������������ ������������ = ������������������������������������������������ − 1 − ������ 2 + ������ 1 ������������������������������������ ������������ = ������������������������������������������ − ln 1 + ������ 2 + ������ 2 18
  • 19. BÀI GIẢNG THỐNG KÊ SINH HỌC 8.2.2. Tích phân xác định: Định nghĩa: Cho y=f(x) xác định trên khoảng [a, b] và các số thực thoả điều kiện a = x0 ≤ t1 ≤ x1 ≤ … < xi-1 ≤ ti ≤ xi ≤ …≤ xn-1 ≤tn ≤xn=b. Đặt Sn là tổng sau đây (gọi là tổng tích phân) ������ ������������ = ������ ������������ ∆������ ������ớ������ ∆������ = ������������ − ������������−1 ������=1 Nếu Sn có giới hạn hữu hạn bằng L khi d = max1≤������≤������ ∆������ → 0 và giới hạn này không phụ thuộc vào cách lựa chọn các điểm xi, ti (I = 1, 2,…, n) thì L đuợc gọi là tích phân xác định của hàm f trên khoảng [a, b] và được kí hiệu là: ������ ������ ������ ������ ������������ = ������ = lim ������������ = lim ������ ������������ ∆������ ������ ������ →0 ������→0 ������=1 Khi đó ta nói f là tích phân đuợc (khả tích) trên [a, b]. Hình 3: Diện tích hình chữ nhật có tô màu bằng số hạng f(tk)Γk trong Sn ������ ������ ������  Quy ước: ������ ������(������)������������ = − ������ ������ ������ ������������ ������ ������ ������ ������������ = 0  Ý nghĩa hình học: Khi f(x) ≥ 0 với mọi x trên [a, b] thì Sn chính là tổng diện tích các hình chữ nhật có kích thước là Δk× f(tk) (k=1, 2, ,n). Để ý rằng các hình chữ nhật này có diện tích xấp xỉ diện tích hình thang cong bên dưới đồ thị giới hạn bởi trục Ox và 2 đường thẳng x =xk-1, x = xk nên Sn xấp xỉ diện tích thang cong bên dưới đồ thị giới hạn bởi Ox và 2 đường thẳng x=a, x = b. Vì thế khi d = max0<������<������ (������������ − ������������−1 ) → 0 thì Sn tiến về diện tích của hình thang cong vừa nêu, tức là ������ ������ ������ ������������ = ������������ệ������ ������í������������ ������ ì������������ ������������ ������������������ ������������������������ ������ướ������ đồ ������������ ị ������ Tính chất:  Cho f là hàm khả tích trên [a, b], và c là điểm bất kì trên [a, b] thì 19
  • 20. BÀI GIẢNG THỐNG KÊ SINH HỌC ������ ������ ������ ������(������) ������������ = ������(������) ������������ + ������(������) ������������. ������ ������ ������  Cho f, g là hai hàm khả tích trên [a,b] và α, β là 2 số thực thì ������ ������ ������ ������������ ������ + ������������(������) ������������ = ������ ������ ������ ������������ + ������ ������ ������ ������������ . ������ ������ ������ Định lí: Nếu f là hàm số liên tục trên khoảng [a, b] thì f khả tích trên [a, b]. Nhờ định lí trên, khi hàm f liên tục trên [a, b], ta có thể làm việc tính toán tổng tích phân Sn đơn giản hơn bằng cách chọn xk là các điểm chia [a,b] thành n khoảng bằng nhau và tk là một trong 2 đầu mút hoặc ������−������ trung điểm của các khoảng nhỏ đó, tức là chọn ������������ = ������ + ������ (������ = 0, 1, 2, … , ������) và ������ ������ ������−1 +������ ������ ������������ = ������������−1 ������ ������������ ������������ ������ ������ặ������ (������ = 1,2, … , ������). 2 Định lí cơ bản của toán vi tích phân: Cho y = F(x) là một nguyên hàm của hàm y = f(x) liên tục trên khoảng [a, b], khi đó ������ ������(������) ������������ = ������ ������ − ������ ������ . ������ 8.2.3. Mở rộng tích phân xác định: ������ ������ - Nếu y = f(x) chỉ xác định và liên tục trên [a,b) ta định nghĩa ������ ������ ������ ������������ = lim������ →������ −������ ������ ������ ������������ khi giới hạn này tồn tại và hữu hạn. Có thể mở rộng một cách tương tự tích phân xác định cho hàm chỉ xác định và liên tục trên (a, b], (a, b), [a, ∞), (a, ∞), ( -∞, b], hay ( -∞, b), đặc biệt cũng có thể mở rộng lên toàn tập số thực R như sau: +∞ +������ - Cho hàm y = f(x) liên tục trên R, ta định nghĩa −∞ ������ ������ ������������ = lim������ →∞ −������ ������ ������ ������������ nếu giới hạn này tồn tại và hữu hạn. * Lưu ý rằng với các mở rộng trên, nếu hàm y = f(x) xác định và liên tục trên [a, b] thì tích phân xác định của f trên [a, b], [a, b). (a, b] và (a, b) là như nhau, tức là: ������ [������,������] ������ ������ ������������ = ������,������ ������ ������ ������������ = (������,������] ������ ������ ������������ = (������,������) ������ ������ ������������ = ������ ������ ������������ . ������ ������ Điều này biện minh cho việc dùng cùng một kí hiệu ������ cho tất cả các tích phân trên. __________________ BÀI TẬP 1. Bộ gen VDR (Vitamin D receptors) có hai alen (gen đẳng vị), gọi là T và t, chúng tạo ra ba kiểu gen TT, Tt và tt. Chú ý rằng số alen T trong kiểu gen TT, Tt và tt lần lượt là 2, 1 và 0. Trong một nghiên cứu trên 130 phụ nữ ở Mĩ, các phân bố tần số của kiểu gen VDR như sau: TT: 53 20
  • 21. BÀI GIẢNG THỐNG KÊ SINH HỌC Tt: 57 tt: 20 Sử dụng phân bố này để tìm các tần số tương đối của alen T. Tần số tương đối của alen t là bao nhiêu? 2. Theo luật cân bằng Hardy-Weinberg, nếu tần số tương đối của alen T và t tương ứng là p và q (p + q = 1), thì các tần số của TT, Tt và tt được cho bởi p², 2pq và q², tương ứng. Sử dụng các kết quả của Câu hỏi 1 (p và q) để tìm phân bố tần số mong đợi của các kiểu gen VDR cho 130 phụ nữ. Những dữ liệu quan sát trong Câu hỏi 1 có phù hợp với luật cân bằng Hardy-Weinberg (không cần phải sử dụng công cụ thống kê)? 3. Theo lý thuyết về di truyền học, giá trị các trung bình kiểu hình theo lí thuyết của TT, Tt và tt lần lượt là (μ + a), (μ + d) và (μ - a), trong đó μ dùng để chỉ trung bình tổng thể của dân số, a dùng để chỉ ảnh hưởng di truyền phụ gia và d dùng để chỉ ảnh hưởng gen trội. Trong một mẫu phụ nữ, trung bình BMD cho ba kiểu gen tương ứng là1,23; 1,15 và 0,98. Tìm các giá trị của a và d. 4. Xét báo cáo sau đây: "DNA được chiết xuất từ 80 phụ nữ bệnh loãng xương và 85 phụ nữ cùng tuổi đối chứng. PCR được dùng để khuếch đại chuỗi ADN và enzyme hạn chế BSM-I được dùng để phát hiện alen VDR. Kết quả cho thấy không có khác biệt đáng kể giữa nhóm loãng xương và nhóm đối chứng về tần số của alen B (0,44 và 0,39) cũng như về tần số của kiểu gen BB (0,20 và 0,21). ” (Gallagher JBMR et al 1994). Giả sử rằng sự phân bố của kiểu gen ở các đối tượng loãng xương và đối chứng theo luật cân bằng Hardy-Weinberg, hãy ước lượng (tìm lại) số đối tượng trong mỗi kiểu gen cho từng nhóm. 5. Với mỗi hàm số sau đây tìm những giá trị của x không thuộc miền xác định của nó: ������+2 ������ (a) f(x) = (b) f(x) = 2 (c) f(x) = logx ������−1 ������ −4 (d) g(x) = ������ 2 −4 (e) h(x) = ������ 2 − ������. 6. Tốc độ thay đổi về BMD đôi khi được mô hình hóa dưới dạng một hàm bậc hai sau: δy = at² + bt + c Trong đó δy là tốc độ thay đổi về BMD, t là thời gian (tính theo năm), a, b và c là hằng số. Sử dụng kiến thức về bất đẳng thức để tìm ra khi nào (t =?) thì δy dương và khi nào δy âm. 7. Cho f(x) = ln[(x+1)/x], chứng tỏ rằng f(1) + f(2) + f(3) = ln4. ������ ! 8. Cho ������ ������, ������ = , tìm (không phải tính) một biểu thức cho: ������! ������−������ ! (i) C(5,3) (ii) C(n+1,k). 9. Hàm phân bố Bình thường (Gauss) được xác định bởi 2 tham số: trung bình (µ) và độ lệch chuẩn (ζ) và được cho bởi: 2 1 1 ������ − ������ 2 ������ ������; ������, ������ = ������������������ − ������ 2������ 2 ������ Tìm biểu thức cho f(10;15,5). 10. Nếu x = ln2 và y = ln3, biểu diễn các biểu thức sau theo x và y. (a) ln9 (b) ln 2 (c) ln(3/2) (d) ln3 3 (e) ln0.25 21
  • 22. BÀI GIẢNG THỐNG KÊ SINH HỌC (f) ln(8/9) (g) ln 6 (h) ln12 (i) ln4.5 (j) ln72. 11. Nếu ������ ������ − ������ −������ + 1 = 0, chứng tỏ rằng x = ln ( 5 −1) − ln 2. ������ −������ +������ ������ (ii) Nếu = 2chứng tỏ rằng x = −½ ln3 ������ −������ −������ ������ ������ ������ −������ −������ (iii) Nếu ������ = chứng tỏ rằng ������ = ln⁡ + ������ 2 + 1) (������ 2 12. Chứng tỏ rằng các kết quả sau đây là đúng: (a) logae= 1 / logea (b) logpq + logqr + logrp = 1 (c) lognax = logax /(1+logan). 13. Con cái của một loài côn trùng nào đó sinh ra 20 con cái còn sống sót thuộc thế hệ sau. Có 4 thế hệ / năm. Trong một năm sẽ có bao nhiêu con cái thuộc các thế hệ sau? 14. Giả sử rằng chỉ có sẵn đậu lăng khô và đậu nành khô để đáp ứng nhu cầu protein hàng ngày của một người vào khoảng 75 g. Một gam đậu lăng có chứa 0,26 g protein và 1 g đậu nành có chứa 0,35 g protein. Gọi mức tiêu thụ của người đó là x g đậu lăng và y g đậu nành. Hãy biểu thị mối quan hệ giữa x và y dưới dạng của một hàm tuyến tính tức là y= a + bx. 15. Phương trình liên kết xác suất gãy xương (P) và mật độ khoáng của xương (BMD) thường có dạng một phương trình logistic như sau: ������ = ������ ������ (������������������) 1 − ������ trong đó b là một hằng số. Ước lượng b trong phương trình này hơi khó một chút, tuy nhiên, việc ước lượng sẽ dễ dàng hơn nếu chúng ta biểu diễn mối quan hệ này duới dạng một hàm tuyến tính bằng cách sử dụng logarit. Hãy tìm phương trình tuyến tính này. 16. Trong một thí nghiệm, trọng lượng W của gạc nai được đo với một số nai ở các độ tuổi khác nhau. Các kết quả được cho trong bảng sau: A: 20 22 30 34 42 43 46 54 56 68 70 W: 0,08 0,10 0,15 0,20 0.27 026 0,31 0,36 0,40 0,49 0,49 (W tính theo kg và A tính theo tháng) Chứng tỏ bằng phương trình và bằng đồ thị rằng các dữ liệu trên phù hợp khít khao quan hệ tuyến tính: W = mA + b, trong đó m và b tương ứng là độ dốc và tung độ gốc. Tìm phương trình này. 17. Ngay sau khi tiêu thụ rượu, độ cồn trong máu của một người tăng lên đến một giá trị đỉnh là 0,22 mg / ml, và sau đó từ từ giảm. Nếu t là thời gian tính bằng giờ sau khi giá trị tối đa đạt được và y là mức độ rượu trong máu, bảng sau đây cho các giá trị đo thực nghiệm cho chủ thể này: t: 0 0,5 0,75 1,0 1,5 2,0 2,5 3,0 ________________________________________________________ y: 0,22 0,18 0,15 0,13 0,10 0,08 0,06 0,05 Các dữ liệu được cho là theo quan hệ ������ = ������������������ trong đó b và a là hằng số. Bằng cách sử dụng lôgarit và phần mềm thống kê phổ biến, ước tính a và b. 18. Cho: 22
  • 23. BÀI GIẢNG THỐNG KÊ SINH HỌC w1 = 8, w2 = 11, w3 = 3, w4 = 2, w5 = 17, w6 = 9, w7 = 6, w8 = 11 x1 = 4.7, x2 = 3,9, x3 = 7.2, x4 = 0,5, x5 = 2.8, x6 = 5.1, x7 = 7,9, x8 = 4,6 y1 = 6, y2 = 1, y3 = 5, y4 = 4, y5 = 4, y6 = 8, y7 = 1, y8 = 7. z1 = 31, z2 = 62, z3 = 7, z4 = 15, z5 = 53, z6 = 16, z7 = 94, z8 = 59. Hãy tính 6 8 4 (a) ������=1 ������������ (b) ������=1 ������������ (c) ������=1 ������2������ 7 7 (d) ������=3 ������2������−7 (e) ������ =3(������������ − ������������ −2 ) Các câu hỏi 19 -24 có cùng giả thiết với câu hỏi 18. 19. Gọi vij = wi yj (ví dụ v23 = w2.y3 = 11 × 5 = 55). Tính: (i) 3 7 ������=1 ������ =1 ������������������ (ìi) 5 4 ������=2 ������ =3 ������������������ . 20. Chứng minh rằng 5 3������������ = 3 5 ������������ . ������=1 ������=1 21. Chứng minh rằng 4 (3������������ − 2������������ ) = 3 5 ������������ − 2 4 ������������ . ������=1 ������=1 ������=1 22. Chứng minh rằng 4=1(������������ − 6) = 4 ������������ − 24. ������ ������=1 23. Chứng minh rằng 5 (������������ − 3)2 = 5 ������������2 − 6 5 ������������ + 5 × 9. ������=1 ������=1 ������=1 24. Chứng minh rằng 6 ������������ 6 ������������ ≠ 6 ������������ ������������ ������=1 ������=1 ������=1 25. Chứng minh rằng (i) ������ =0 ������������ = ������ =0 ������������−������ ������ ������ (ii) ������ ������������ = ������ ������������+1−������ ������=1 ������=1 26. Tìm phần trăm sai số trong công thức của Stirling khi n = 10 và n = 20. 23