Bài giảng Toán 5 Xác suất & Thống kê - Tuần 7 - Nguyễn Văn Đắc

4.1 Giới thiệu

Trong thực tế, có nhiều biến ngẫu nhiên với dạng phân phối xác suất giống nhau. Chương này ta

sẽ đưa ra một số dạng phân phối xác suất thường gặp trong ứng dụng của xác suất và được sử

dụng rộng rãi trong thống kê. Với mỗi dạng, ta nêu hàm xác suất hoặc hàm mật độ và một vài

tính chất cơ bản của dạng phân phối đó.

4.2 Một số dạng phân phối rời rạc thường gặp

4.2.1 Phân phối đều rời rạc

Ví dụ mở đầu: Tung một con xúc xắc cân đối và đồng chất. Đặt X là số chấm xuất hiện. Ta có

tập giá trị của X là {1, 2, 3, 4, 5, 6}, xác suất để X nhận mỗi phần tử trong tập giá trị là bằng

nhau. Người ta gọi X là biến ngẫu nhiên có phân phối đều rời rạc. Tổng quát, ta có

Định nghĩa 4.1

pdf18 trang | Chuyên mục: Xác Suất Thống Kê | Chia sẻ: tuando | Lượt xem: 461 | Lượt tải: 0download
Tóm tắt nội dung Bài giảng Toán 5 Xác suất & Thống kê - Tuần 7 - Nguyễn Văn Đắc, để xem tài liệu hoàn chỉnh bạn click vào nút "TẢI VỀ" ở trên
 không thể lập bảng tra cho các bộ sm và khác nhau. May thay, ta có thể biểu diễn kết 
quả cần tính thông qua một tích phân dạng như trên với 10 == sm bằng phép đặt sau 
.
s
m-
=
XZ
 Biến ngẫu nhiên Z là một biến ngẫu nhiên chuẩn với trung bình bằng 0 và phương sai bằng 1, 
đây là trường hợp đặc biệt quan trọng của dạng phân phối chuẩn. Ta gọi một biến ngẫu nhiên 
chuẩn với trung bình bằng 0 và phương sai bằng 1 là biến ngẫu nhiên tiêu chuẩn và phân phối 
của nó là phân phối tiêu chuẩn. 
 Bảng A.3 chỉ ra diện tích phần bên dưới đường cong tiêu chuẩn ứng với )( zZP < , với 
giá trị của z chạy từ -3.49 đến 3.49. Để minh họa cách dùng của bảng này, chúng ta sẽ tìm xác 
suất để Z nhỏ hơn 1.74. Đầu tiên, chúng ta xác định giá trị của z bằng 1.7 trong cột bên trái, rồi di 
chuyển theo hàng ngang tới cột bên dưới số 0.04, ở đó chúng ta sẽ gặp giá trị 0.9591. Do đó, 
.9591.0)74.1( =<ZP Để tìm giá trị của z ứng với xác suất cho trước, chúng ta làm ngược lại quá 
trình trên. Ví dụ, giá trị z ứng với phần diện tích 0.2148 nằm bên dưới đường cong và ở bên trái 
số z được tìm thấy là - 0.79. 
Ví dụ 4.13 Cho phân phối tiêu chuẩn, tìm diện tích phần nằm bên dưới đường cong chuẩn 
 (a) ở bên phải số z = 1.84 và diện tích phần nằm bên dưới đường cong 
 (b) giữa hai số z = - 1.97 và z = 0.86. 
Giải (a) Diện tích phần nằm trong Hình (a) ở bên phải số z = 1.84 bằng 1 trừ đi diện tích phần 
nằm bên trái số z = 1.84. 
 Bằng cách tra Bảng A.3 ta có diện tích phần cần tìm là 1 – 0.9671 = 0.0329. 
(b) Diện tích phần nằm trong Hình (b) ở giữa hai số z = - 1.97 và z = 0.86 bằng diện tích của 
phần nằm bên trái số z = 0.86 trừ đi diện tích phần nằm bên trái số z = -1.97. Từ Bảng A3 chúng 
ta tìm ra diện tích của phần hình cần tìm là 0.8051 – 0.0244 = 0.7807. 
Ví dụ 4.14 Cho phân phối tiêu chuẩn, tìm giá trị của k sao cho 
(a) 3015.0)( => kZP (b) .4197.0)18.0( =-<< ZkP 
Giải 
(a) Diện tích phần nằm bên trái số k bằng 1 – 0.3015 = 0.6985. Tra Bảng A3 ta tìm được k=0.52. 
(b) Từ Bảng A.3, có diện tích của phần bên trái của – 0.18 bằng 0.4286. Ta thấy rằng diện tích 
của phần ở giữa k và – 0.18 là 0.4197, vì thế diện tích của phần bên trái của k phải là 0.4286 – 
0.4197 = 0.0089. Do đó, từ Bảng A.3, chúng ta có k = - 2.37. 
Ví dụ 4.15 Cho một phân phối chuẩn có .10 và50 == sm Tìm xác suất để X nhận giá trị trong 
khoảng 45 và 62. 
Giải 
Các giá trị z tương ứng với 62 và45 21 == xx là 
.2.1
10
5062 và5.0
10
5045
21 =
-
=-=
-
= zz 
Do đó, 
).2.15.0()6245( <<-=<< ZPXP 
Xác suất )2.15.0( <<- ZP chính là diện tích của phần được tô đậm trong Hình trên. Diện tích 
của phần này có thể được tìm bằng cách trừ diện tích của phần bên trái z = 1.2 cho diện tích của 
phần bên trái z = - 0.5. Dùng Bảng A.3 chúng ta có, 
.5764.03085.08849.0)5.0()2.1()2.15.0( =-=--<=<<- PZPZP 
Nhiều khi chúng ta được yêu cầu tìm giá trị của z tương ứng với xác suất cho trước mà 
giá trị này lại rơi vào giữa các giá trị trong Bảng A.3 (xem Ví dụ 4.16). Để cho tiện, chúng ta sẽ 
lựa chọn giá trị z tương ứng với xác suất có sẵn trong bảng sao cho giá trị này gần nhất với giá trị 
đầu bài cho. Tuy nhiên, nếu giá trị xác suất được cho rơi vào chính giữa hai giá trị xác suất ở 
trong bảng, khi đó chúng ta sẽ chọn giá trị của z chính là giá trị nằm ở chính giữa hai giá trị 
tương ứng của z ở hai đầu mút. Chẳng hạn, để tìm giá trị của z tương ứng với xác suất 0.7975, 
giá trị này nằm ở giữa hai giá trị 0.7967 và 0.7995 trong Bảng A.3, chúng ta chọn z = 0.83, vì 
0.7975 gần hơn với 0.7967. Còn với xác suất 0.7981, giá trị này nằm chính giữa 0.7967 và 
0.7995 nên chúng ta lấy z = 0.835. 
Ví dụ vừa qua đã cho biết trước giá trị của x và do đó biết trước giá trị của z rồi sau đó 
yêu cầu tính diện tích của phần hình được chỉ ra. Trong Ví dụ 4.16 chúng ta sẽ làm ngược lại, 
chúng ta sẽ bắt đầu với một diện tích hoặc xác suất cho trước, sau đó tìm giá trị của z và xác định 
giá trị của x bởi công thức 
.hay zxxz sm
s
m
+=
-
= 
Ví dụ 4.16 Cho một phân phối chuẩn với ,6 và40 == sm tìm giá trị của x tương ứng với 
(a) phần hình nằm ở bên trái có diện tích 45%; 
(b) phần hình nằm ở bên phải có diện tích 14%. 
Giải 
(a) Phần có diện tích 0.45, nằm ở bên trái giá trị x được tô đậm trong Hình (a). Điều này đòi hỏi 
chúng ta tìm giá trị của z sao cho diện tích phần bên trái z bằng 0.45. Từ Bảng A.3 chúng ta thấy 
45.0)13.0( =-<ZP vì thế z = - 0. 13. Do đó, 
x = (6).(-0.13) + 40 = 39.22 
(b) Trong Hình (b) chúng ta bôi đen phần ở bên phải giá trị x có diện tích bằng 0.14. Điều này 
đòi hỏi chúng ta tìm giá trị của z sao cho diện tích phần bên phải z bằng 0.14 và do đó diện tích 
phần ở bên trái z bằng 0.86. Lại một lần nữa, từ bảng A.3 chúng ta thấy ,86.0)08.1( =<ZP vì 
thế z = 1.08 và .48.4640)08.1)(6( =+=x 
Xấp xỉ chuẩn của phân phối nhị thức 
Trong phần phân phối Poisson ta đã trình bày về việc dùng phân phối Poisson để xấp xỉ phân 
phối nhị thức với p rất gần 0 hoặc rất gần 1 và n đủ lớn. Phần này trình bày về việc dùng phân 
phối chuẩn để làm xấp xỉ cho phân phối nhị thức khi p gần 0.5. 
Định lý 4.16 
Nếu X là một biến ngẫu nhiên nhị thức với trung bình np=m và phương sai npq=2s , 
thì phân phối giới hạn của ,
npq
npXZ -= khi n→+∞, là phân tiêu chuẩn N(z; 0.1). 
Người ta còn thấy rằng phân phối chuẩn với np=m và )1(2 pnp -=s không chỉ là một xấp xỉ 
rất chính xác của phân phối nhị thức khi n lớn và p không quá gần với 0 và 1 mà nó còn là một 
xấp xỉ khá tốt ngay cả khi n nhỏ và p gần bằng 1/2. 
Ví dụ 4.17 Xác suất bình phục của một bệnh nhân mắc bệnh máu hiếm là 0.4. Nếu 100 người 
mắc bệnh này thì khả năng có ít hơn 30 người được cứu sống là bao nhiêu? 
Giải Đặt X là số bệnh nhân được cứu sống. Do n = 100, chúng ta có thể có được kết quả khá 
chính xác khi dùng đường cong chuẩn để xấp xỉ với 
40)4.0(100 === npm 
và 
.899.4)6.0)(4.0(100 === npqs 
Để có được xác suất mong muốn, chúng ta tìm diện tích của hình nằm bên trái x = 29.5. Giá trị 
tương ứng z là 
,14.2
899.4
405.29
-=
-
=z 
và xác suất để có ít hơn 30 người được cứu sống trong 100 bệnh nhân được cho bởi diện tích của 
phần bôi đen trong Hình dưới đây. Do đó, 
.0162.0)14.2()30( =-<@< ZPXP 
Ví dụ 4.18 Một kì thi trắc nghiệm có 200 câu hỏi với 4 phương án trả lời cho mỗi câu trong đó 
chỉ có một phương án đúng. Với xác suất bằng bao nhiêu thì một sinh viên không có kiến thức về 
phần đó có thể trả lời đúng từ 25 đến 30 câu hỏi trong 80 câu hỏi lấy từ 200 câu hỏi trên. 
Giải Xác suất để sinh viên trả lời đúng 1 câu trong 80 câu hỏi là 1/4. Nếu X là số câu trả lời 
đúng của sinh viên thì .)4/1,80;()3025(
30
25
å
=
=££
x
xbXP 
 Dùng đường cong chuẩn xấp xỉ với 
20)4/1(80 === npm 
và 
,873.3)4/3)(4/1(80 === npqs 
Chúng ta cần tính diện tích của hình nằm giữa 5.30 và5.24 21 == xx . Các giá trị z tương ứng là 
.71.2
873.3
205.30 và16.1
873.3
205.24
21 =
-
==
-
= zz 
Xác suất trả lời đúng từ 25 đến 30 câu hỏi được cho bởi 
.1196.08770.09966.0
)16.1()71.2()71.216.1(
30
25
)4/1,80;()3025(
=-=
<-<=<<@å
=
=££ ZPZPZP
x
xbXP 
4.3.3 Phân phối mũ và phân phối Gamma 
Mặc dù phân phối chuẩn có thể được sử dụng để giải quyết nhiều bài toán trong khoa học 
kỹ thuật, nhưng vẫn có một số tình huống đòi hỏi các dạng khác của hàm mật độ. Hai hàm mật 
độ như vậy là phân phối gamma và phân phối mũ sẽ được thảo luận trong mục này. 
Tên của phân phối gamma có nguồn gốc từ một hàm nổi tiếng có tên là hàm gamma, 
được nghiên cứu trong nhiều lĩnh vực của toán học. Trước khi đưa ra phân phối gamma, chúng ta 
sẽ đưa ra định nghĩa hàm này. 
Hàm gamma được định nghĩa bởi 
0. đó trong)(
0
1 >=G ò
¥
-- aa a dxex x 
Bây giờ chúng ta sẽ đưa hàm gamma vào trong định nghĩa về phân phối gamma. 
Định nghĩa 4.17 
Biến ngẫu nhiên liên tục X có phân phối gamma, với các tham số ba và , nếu hàm mật độ của 
nó được cho bởi 
.
 0 xkhi, 0
0 xkhi ,
)(
1
)(
/1
ïî
ï
í
ì
£
>
G=
-- ba
a ab
xexxf 
trong đó 0, >ba . 
Đồ thị của một số phân phối gamma được minh họa trong Hình 6.28, trong đó ba và nhận các 
giá trị xác định. Phân phối gamma đặc biệt ứng với 1=a được gọi là phân phối mũ. 
Phân phối mũ 
Biến ngẫu nhiên liên tục X có phân phối mũ, với tham số b , nếu hàm mật độ của nó được cho 
bởi 
0. đó trong
 0 khi , 0
0 xkhi ,1)(
/
>
ïî
ï
í
ì
£
>
=
-
b
b
b
x
exf
x
Định lý sau và hệ quả của nó đưa ra trung bình và phương sai của phân phối gamma và phân 
phối mũ. 
Định lý 4.18 
 Trung bình và phương sai của phân phối gamma là 
22 và absabm == . 
Hệ quả 
 Trung bình và phương sai của phân phối mũ là 
. và 22 bsbm == 
4.3.4 Phân phối Khi bình phương 
Một trường hợp đặc biệt khác của phân phối gamma cũng rất quan trọng, đó là khi ta cho 
vv đó trong2, và2/ == ba là một số nguyên dương. Kết quả được gọi là phân phối Khi bình 
phương. Phân phối này có một tham số, v, gọi là bậc tự do. 
Định nghĩa 4.19 
Biến ngẫu nhiên X có phân phối Khi bình phương với v bậc tự do nếu hàm mật độ của nó được 
cho bởi 
ïî
ï
í
ì
£
>
G=
--
0 0
0 ,
)2/(2
1
)(
2/12/
2/
 x
xdxex
vxf
xv
v 
ở đó v là một số nguyên dương. 
Phân phối Khi bình phương đóng một vai trò thiết yếu trong lý thuyết thống kê. Nó có 
những ứng dụng đáng kể trong cả lý thuyết lẫn phương pháp luận. Phân phối Khi bình phương là 
một thành phần quan trọng trong kiểm định giả thiết thống kê và ước lượng. 
Các chủ đề liên quan đến phân phối mẫu, phân tích phương sai và thống kê phi tham số 
cũng có liên quan nhiều đến việc dùng phân phối Khi bình phương. 
Trung bình và phương sai của phân phối Khi bình phương là 
.2 và 2 vv == sm 
Các ý chính của Bài giảng Tuần 7 
+ Một số dạng phân phối xác suất rời rạc thường gặp: phân phối(pp) Đều, pp nhị thức- đa 
thức, pp siêu bội, pp nhị thức âm-hình học và pp Poisson. 
+ Một số dạng phân phối xác suất liên tục thường gặp: pp Đều, pp chuẩn, pp Gammma, pp 
mũ, pp Khi bình phương. 

File đính kèm:

  • pdfbai_giang_toan_5_xac_suat_thong_ke_tuan_7_nguyen_van_dac.pdf