Bài giảng Toán 5 Xác suất & Thống kê - Tuần 7 - Nguyễn Văn Đắc
4.1 Giới thiệu
Trong thực tế, có nhiều biến ngẫu nhiên với dạng phân phối xác suất giống nhau. Chương này ta
sẽ đưa ra một số dạng phân phối xác suất thường gặp trong ứng dụng của xác suất và được sử
dụng rộng rãi trong thống kê. Với mỗi dạng, ta nêu hàm xác suất hoặc hàm mật độ và một vài
tính chất cơ bản của dạng phân phối đó.
4.2 Một số dạng phân phối rời rạc thường gặp
4.2.1 Phân phối đều rời rạc
Ví dụ mở đầu: Tung một con xúc xắc cân đối và đồng chất. Đặt X là số chấm xuất hiện. Ta có
tập giá trị của X là {1, 2, 3, 4, 5, 6}, xác suất để X nhận mỗi phần tử trong tập giá trị là bằng
nhau. Người ta gọi X là biến ngẫu nhiên có phân phối đều rời rạc. Tổng quát, ta có
Định nghĩa 4.1
không thể lập bảng tra cho các bộ sm và khác nhau. May thay, ta có thể biểu diễn kết quả cần tính thông qua một tích phân dạng như trên với 10 == sm bằng phép đặt sau . s m- = XZ Biến ngẫu nhiên Z là một biến ngẫu nhiên chuẩn với trung bình bằng 0 và phương sai bằng 1, đây là trường hợp đặc biệt quan trọng của dạng phân phối chuẩn. Ta gọi một biến ngẫu nhiên chuẩn với trung bình bằng 0 và phương sai bằng 1 là biến ngẫu nhiên tiêu chuẩn và phân phối của nó là phân phối tiêu chuẩn. Bảng A.3 chỉ ra diện tích phần bên dưới đường cong tiêu chuẩn ứng với )( zZP < , với giá trị của z chạy từ -3.49 đến 3.49. Để minh họa cách dùng của bảng này, chúng ta sẽ tìm xác suất để Z nhỏ hơn 1.74. Đầu tiên, chúng ta xác định giá trị của z bằng 1.7 trong cột bên trái, rồi di chuyển theo hàng ngang tới cột bên dưới số 0.04, ở đó chúng ta sẽ gặp giá trị 0.9591. Do đó, .9591.0)74.1( =<ZP Để tìm giá trị của z ứng với xác suất cho trước, chúng ta làm ngược lại quá trình trên. Ví dụ, giá trị z ứng với phần diện tích 0.2148 nằm bên dưới đường cong và ở bên trái số z được tìm thấy là - 0.79. Ví dụ 4.13 Cho phân phối tiêu chuẩn, tìm diện tích phần nằm bên dưới đường cong chuẩn (a) ở bên phải số z = 1.84 và diện tích phần nằm bên dưới đường cong (b) giữa hai số z = - 1.97 và z = 0.86. Giải (a) Diện tích phần nằm trong Hình (a) ở bên phải số z = 1.84 bằng 1 trừ đi diện tích phần nằm bên trái số z = 1.84. Bằng cách tra Bảng A.3 ta có diện tích phần cần tìm là 1 – 0.9671 = 0.0329. (b) Diện tích phần nằm trong Hình (b) ở giữa hai số z = - 1.97 và z = 0.86 bằng diện tích của phần nằm bên trái số z = 0.86 trừ đi diện tích phần nằm bên trái số z = -1.97. Từ Bảng A3 chúng ta tìm ra diện tích của phần hình cần tìm là 0.8051 – 0.0244 = 0.7807. Ví dụ 4.14 Cho phân phối tiêu chuẩn, tìm giá trị của k sao cho (a) 3015.0)( => kZP (b) .4197.0)18.0( =-<< ZkP Giải (a) Diện tích phần nằm bên trái số k bằng 1 – 0.3015 = 0.6985. Tra Bảng A3 ta tìm được k=0.52. (b) Từ Bảng A.3, có diện tích của phần bên trái của – 0.18 bằng 0.4286. Ta thấy rằng diện tích của phần ở giữa k và – 0.18 là 0.4197, vì thế diện tích của phần bên trái của k phải là 0.4286 – 0.4197 = 0.0089. Do đó, từ Bảng A.3, chúng ta có k = - 2.37. Ví dụ 4.15 Cho một phân phối chuẩn có .10 và50 == sm Tìm xác suất để X nhận giá trị trong khoảng 45 và 62. Giải Các giá trị z tương ứng với 62 và45 21 == xx là .2.1 10 5062 và5.0 10 5045 21 = - =-= - = zz Do đó, ).2.15.0()6245( <<-=<< ZPXP Xác suất )2.15.0( <<- ZP chính là diện tích của phần được tô đậm trong Hình trên. Diện tích của phần này có thể được tìm bằng cách trừ diện tích của phần bên trái z = 1.2 cho diện tích của phần bên trái z = - 0.5. Dùng Bảng A.3 chúng ta có, .5764.03085.08849.0)5.0()2.1()2.15.0( =-=--<=<<- PZPZP Nhiều khi chúng ta được yêu cầu tìm giá trị của z tương ứng với xác suất cho trước mà giá trị này lại rơi vào giữa các giá trị trong Bảng A.3 (xem Ví dụ 4.16). Để cho tiện, chúng ta sẽ lựa chọn giá trị z tương ứng với xác suất có sẵn trong bảng sao cho giá trị này gần nhất với giá trị đầu bài cho. Tuy nhiên, nếu giá trị xác suất được cho rơi vào chính giữa hai giá trị xác suất ở trong bảng, khi đó chúng ta sẽ chọn giá trị của z chính là giá trị nằm ở chính giữa hai giá trị tương ứng của z ở hai đầu mút. Chẳng hạn, để tìm giá trị của z tương ứng với xác suất 0.7975, giá trị này nằm ở giữa hai giá trị 0.7967 và 0.7995 trong Bảng A.3, chúng ta chọn z = 0.83, vì 0.7975 gần hơn với 0.7967. Còn với xác suất 0.7981, giá trị này nằm chính giữa 0.7967 và 0.7995 nên chúng ta lấy z = 0.835. Ví dụ vừa qua đã cho biết trước giá trị của x và do đó biết trước giá trị của z rồi sau đó yêu cầu tính diện tích của phần hình được chỉ ra. Trong Ví dụ 4.16 chúng ta sẽ làm ngược lại, chúng ta sẽ bắt đầu với một diện tích hoặc xác suất cho trước, sau đó tìm giá trị của z và xác định giá trị của x bởi công thức .hay zxxz sm s m += - = Ví dụ 4.16 Cho một phân phối chuẩn với ,6 và40 == sm tìm giá trị của x tương ứng với (a) phần hình nằm ở bên trái có diện tích 45%; (b) phần hình nằm ở bên phải có diện tích 14%. Giải (a) Phần có diện tích 0.45, nằm ở bên trái giá trị x được tô đậm trong Hình (a). Điều này đòi hỏi chúng ta tìm giá trị của z sao cho diện tích phần bên trái z bằng 0.45. Từ Bảng A.3 chúng ta thấy 45.0)13.0( =-<ZP vì thế z = - 0. 13. Do đó, x = (6).(-0.13) + 40 = 39.22 (b) Trong Hình (b) chúng ta bôi đen phần ở bên phải giá trị x có diện tích bằng 0.14. Điều này đòi hỏi chúng ta tìm giá trị của z sao cho diện tích phần bên phải z bằng 0.14 và do đó diện tích phần ở bên trái z bằng 0.86. Lại một lần nữa, từ bảng A.3 chúng ta thấy ,86.0)08.1( =<ZP vì thế z = 1.08 và .48.4640)08.1)(6( =+=x Xấp xỉ chuẩn của phân phối nhị thức Trong phần phân phối Poisson ta đã trình bày về việc dùng phân phối Poisson để xấp xỉ phân phối nhị thức với p rất gần 0 hoặc rất gần 1 và n đủ lớn. Phần này trình bày về việc dùng phân phối chuẩn để làm xấp xỉ cho phân phối nhị thức khi p gần 0.5. Định lý 4.16 Nếu X là một biến ngẫu nhiên nhị thức với trung bình np=m và phương sai npq=2s , thì phân phối giới hạn của , npq npXZ -= khi n→+∞, là phân tiêu chuẩn N(z; 0.1). Người ta còn thấy rằng phân phối chuẩn với np=m và )1(2 pnp -=s không chỉ là một xấp xỉ rất chính xác của phân phối nhị thức khi n lớn và p không quá gần với 0 và 1 mà nó còn là một xấp xỉ khá tốt ngay cả khi n nhỏ và p gần bằng 1/2. Ví dụ 4.17 Xác suất bình phục của một bệnh nhân mắc bệnh máu hiếm là 0.4. Nếu 100 người mắc bệnh này thì khả năng có ít hơn 30 người được cứu sống là bao nhiêu? Giải Đặt X là số bệnh nhân được cứu sống. Do n = 100, chúng ta có thể có được kết quả khá chính xác khi dùng đường cong chuẩn để xấp xỉ với 40)4.0(100 === npm và .899.4)6.0)(4.0(100 === npqs Để có được xác suất mong muốn, chúng ta tìm diện tích của hình nằm bên trái x = 29.5. Giá trị tương ứng z là ,14.2 899.4 405.29 -= - =z và xác suất để có ít hơn 30 người được cứu sống trong 100 bệnh nhân được cho bởi diện tích của phần bôi đen trong Hình dưới đây. Do đó, .0162.0)14.2()30( =-<@< ZPXP Ví dụ 4.18 Một kì thi trắc nghiệm có 200 câu hỏi với 4 phương án trả lời cho mỗi câu trong đó chỉ có một phương án đúng. Với xác suất bằng bao nhiêu thì một sinh viên không có kiến thức về phần đó có thể trả lời đúng từ 25 đến 30 câu hỏi trong 80 câu hỏi lấy từ 200 câu hỏi trên. Giải Xác suất để sinh viên trả lời đúng 1 câu trong 80 câu hỏi là 1/4. Nếu X là số câu trả lời đúng của sinh viên thì .)4/1,80;()3025( 30 25 å = =££ x xbXP Dùng đường cong chuẩn xấp xỉ với 20)4/1(80 === npm và ,873.3)4/3)(4/1(80 === npqs Chúng ta cần tính diện tích của hình nằm giữa 5.30 và5.24 21 == xx . Các giá trị z tương ứng là .71.2 873.3 205.30 và16.1 873.3 205.24 21 = - == - = zz Xác suất trả lời đúng từ 25 đến 30 câu hỏi được cho bởi .1196.08770.09966.0 )16.1()71.2()71.216.1( 30 25 )4/1,80;()3025( =-= <-<=<<@å = =££ ZPZPZP x xbXP 4.3.3 Phân phối mũ và phân phối Gamma Mặc dù phân phối chuẩn có thể được sử dụng để giải quyết nhiều bài toán trong khoa học kỹ thuật, nhưng vẫn có một số tình huống đòi hỏi các dạng khác của hàm mật độ. Hai hàm mật độ như vậy là phân phối gamma và phân phối mũ sẽ được thảo luận trong mục này. Tên của phân phối gamma có nguồn gốc từ một hàm nổi tiếng có tên là hàm gamma, được nghiên cứu trong nhiều lĩnh vực của toán học. Trước khi đưa ra phân phối gamma, chúng ta sẽ đưa ra định nghĩa hàm này. Hàm gamma được định nghĩa bởi 0. đó trong)( 0 1 >=G ò ¥ -- aa a dxex x Bây giờ chúng ta sẽ đưa hàm gamma vào trong định nghĩa về phân phối gamma. Định nghĩa 4.17 Biến ngẫu nhiên liên tục X có phân phối gamma, với các tham số ba và , nếu hàm mật độ của nó được cho bởi . 0 xkhi, 0 0 xkhi , )( 1 )( /1 ïî ï í ì £ > G= -- ba a ab xexxf trong đó 0, >ba . Đồ thị của một số phân phối gamma được minh họa trong Hình 6.28, trong đó ba và nhận các giá trị xác định. Phân phối gamma đặc biệt ứng với 1=a được gọi là phân phối mũ. Phân phối mũ Biến ngẫu nhiên liên tục X có phân phối mũ, với tham số b , nếu hàm mật độ của nó được cho bởi 0. đó trong 0 khi , 0 0 xkhi ,1)( / > ïî ï í ì £ > = - b b b x exf x Định lý sau và hệ quả của nó đưa ra trung bình và phương sai của phân phối gamma và phân phối mũ. Định lý 4.18 Trung bình và phương sai của phân phối gamma là 22 và absabm == . Hệ quả Trung bình và phương sai của phân phối mũ là . và 22 bsbm == 4.3.4 Phân phối Khi bình phương Một trường hợp đặc biệt khác của phân phối gamma cũng rất quan trọng, đó là khi ta cho vv đó trong2, và2/ == ba là một số nguyên dương. Kết quả được gọi là phân phối Khi bình phương. Phân phối này có một tham số, v, gọi là bậc tự do. Định nghĩa 4.19 Biến ngẫu nhiên X có phân phối Khi bình phương với v bậc tự do nếu hàm mật độ của nó được cho bởi ïî ï í ì £ > G= -- 0 0 0 , )2/(2 1 )( 2/12/ 2/ x xdxex vxf xv v ở đó v là một số nguyên dương. Phân phối Khi bình phương đóng một vai trò thiết yếu trong lý thuyết thống kê. Nó có những ứng dụng đáng kể trong cả lý thuyết lẫn phương pháp luận. Phân phối Khi bình phương là một thành phần quan trọng trong kiểm định giả thiết thống kê và ước lượng. Các chủ đề liên quan đến phân phối mẫu, phân tích phương sai và thống kê phi tham số cũng có liên quan nhiều đến việc dùng phân phối Khi bình phương. Trung bình và phương sai của phân phối Khi bình phương là .2 và 2 vv == sm Các ý chính của Bài giảng Tuần 7 + Một số dạng phân phối xác suất rời rạc thường gặp: phân phối(pp) Đều, pp nhị thức- đa thức, pp siêu bội, pp nhị thức âm-hình học và pp Poisson. + Một số dạng phân phối xác suất liên tục thường gặp: pp Đều, pp chuẩn, pp Gammma, pp mũ, pp Khi bình phương.
File đính kèm:
- bai_giang_toan_5_xac_suat_thong_ke_tuan_7_nguyen_van_dac.pdf