Bài giảng Xác suất thống kê - Chương 7: Kiểm định giả thuyết thống kê - Phạm Trí Cao
Thí dụ 1: Một tổ chức cho rằng chiều cao trung bình
hiện nay của thanh niên VN là 1.65m. Hãy lập giả
thiết để kiểm chứng kết quả này
HD:
H
0:=1.65
H
1:≠1.65
: chiều cao TB thực tế của thanh niên hiện nay
0= 1.65: chiều cao TB của thanh niên hiện nay theo
lời tổ chức này
H
0 gọi là giả thiết thống kê (giả thiết không)
H
1 gọi là giả thiết đối
au: xi ni pi npi inp inpin 2 3 2 1 0 14 36 24 6 1/8 3/8 3/8 1/8 10 30 30 10 1,6 1,2 1,2 1,6 Tổng n = 80 1 5,6 82 Nếu H0 đúng thì: p1 = P(B0) = 8 33 2 11 3)1(2,8 13 2 10 3 CBPpC 8 13 2 13 3)3(4,8 33 2 12 3)2(3 CBppCBPp Vậy 2 = 5,6 =0,05 , k=4 , r=0 8147,7)3(2 95,0)1( 2 1 rk )3(2 95,0 2 : chấp nhận H0 Số liệu đã cho chưa cho phép ta khẳng định loại thức ăn A có ảnh hưởng đến giới tính. 83 Bài 3: Sản phẩm được sản xuất ra trên một dây chuyền tự động được đóng gói một cách ngẫu nhiên theo quy cách: 3 sản phẩm/hộp. Tiến hành kiểm tra 200 hộp ta được kết quả: Số sp loại I có trong hộp 0 1 2 3 Số hộp 6 14 110 70 Với = 2% , có thể xem số sp loại I có trong hộp là đại lượng ngẫu nhiên có quy luật phân phối nhị thức không? 84 Giải: Gọi X là số sp loại I có trong một hộp. XB(3, p) Ta xấp xỉ p bằng: 74,0200*3 70*3110*214*1 f H0: X B(3 ; 0,74) ThS. Phạm Trí Cao * Chương 7 22 85 Ta lập bảng sau: xi ni pi npi inp inpin 2 0 1 2 3 6 14 110 70 0,017576 0,150072 0,427128 0,405224 3,5152 30,0144 85,4256 81,0448 1,75644 8,5446 7,06932 1,50519 Tổng n = 200 1 18,8755 2= 18,8755 > )114(298,0 = 7,8241 : bác bỏ H0 86 Bài 4: Một nhà máy sản xuất máy in nói rằng số lỗi in trong 1 cuốn sách dày 300 trang của máy in là 1 ĐLNN có quy luật phân phối Poisson với tham số =4,7 . Kiểm tra 300 trang sách in của 50 máy in cùng loại, ta thu được: Số lỗi 0 1 2 3 4 5 6 7 8 9 Số máy 1 1 8 6 13 10 5 5 1 0 Với mức ý nghĩa 1%, hỏi lời tuyên bố của nhà sản xuất có đúng không? 87 Giải: Gọi X= số lỗi trong 300 trang in H0: X ~ P(4,7) P1 = P(X 2) = e-4,7 1523,0)!2 2)7,4( !1 1)7,4( !0 0)7,4(( P2 = P(X=3) = e-4,7 !3 3)7,4( = 0,1574 P3= P(X=4)= e-4,7 !4 4)7,4( = 0,1849 P4 = P(X=5) = e-4,7 !5 5)7,4( = 0,1738 P5 = P(X=6) = e-4,7 !6 6)7,4( = 0,1362 P6 = P(X 7) = 1– 1954,0)( 6 0 kXp k 88 xi ni pi npi inp inpin 2 2 3 4 5 6 7 10 6 13 10 5 6 0,1523 0,1574 0,1849 0,1738 0,1362 0,1954 7,6150 7,8692 9,2463 8,6915 6,8083 9,7697 0,7470 0,4440 1,5239 0,1970 0,4803 1,4546 Tổng n =50 1 4,8468 = 0,01, k = 6, r = 0 0863,15)5(2 99,0 2 = 4,8468 < )5(2 99,0 : chấp nhận H0. tin lời tuyên bố trên. ThS. Phạm Trí Cao * Chương 7 23 89 Lưu ý: Nếu đề không cho biết = 4,7 thì ta làm như sau: 24,4)6*75*610*513*46*310*2(50 1 6 1 1 ixi i nnx Thay bằng x = 4,24 . Xem X~P(4,24) Tra bảng )4(299,0)116( 2 99,0 90 Bài 6: Quan sát chiều cao của 120 cây khuynh diệp ở 1 năm tuổi ta được bảng số liệu: Chiều cao (cm) 50-80 80-100 100-110 110-120 120-130 Số cây 10 9 13 14 21 Chiều cao 130-140 140-150 150-160 160-170 Số cây 15 12 13 13 Với mức ý nghĩa 5%, hãy kiểm định giả thiết: chiều cao cây khuynh diệp có phân phối chuẩn? 91 Gọi X = chiều cao của cây khuynh diệp (cm) H0 : X có phân phối chuẩn N(, 2) ixinnx 1 120 1 [65*10+90*9+105*13+115*14 +125*21+135*15+145*12+155*13 + 165*13] = 124,875 6649,776)2)875,124(1201963675(1120 1 )2)(2(1 12 xnixinns 8687,276649,776 s Xem X ~ N (124,875 ; (27,8687)2 ) 92 ixix , ni pi npi (ni-npi)2 inp inpin 2 (–, 80) (80, 100) (100, 10) (110, 120) (120, 130) (130, 140) (140, 150) (150, 160) (160, +) 10 9 13 14 21 15 12 13 13 0,0537 0,1330 0,1114 0,1344 0,1389 0,1340 0,1105 0,0803 0,1038 6,444 15,96 13,368 16,128 16,668 16,08 13,26 9,636 12,456 12,6451 48,4416 0,1354 4,5284 18,7662 1,1664 1,5876 11,3165 0,2959 1,9623 3,0352 0,0101 0,2808 1,1259 0,0725 0,1197 1,1744 0,0238 Tổng n =120 1 7,8047 ThS. Phạm Trí Cao * Chương 7 24 93 p1= P(X< 80)= 0,5+ 8687,27 875,12480 = 0,5 (1,61) = 0,5-0,4463 = 0,0537 p2= P(80<X<100) = 8687,27 875,124100 – 8687,27 875,12480 =(0,89)+(1,61)= – 0,3133+0,4463 = 0,1330 p3 = P (100<X<110)= –(0,53)+(0,89) = – 0,2019+0,3133 = 0,1114 p4= P (110 < X < 120)= –(0,17) + (0,53) = –0,0675 + 0,2019 = 0,1344 p5 = P (120 < X < 130) = (0,18) + (0,17) = 0,0714 + 0,0675 = 0,1389 p6 = P (130 < X < 140) = (0,54) - (0,18) = 0,2054 – 0,0714 = 0,1340 94 p7 = P (140 < X < 150 ) = (0,90) - (0,54) = 0,3159 – 0,2054 = 0,1105 p8 = P (150 < X < 160 ) = (1,26) - (0,90) = 0,3962 – 0,3159 = 0,0803 p9 = P (X>160 ) = 0,5 - (1,26) = 0,5 – 0,3962 = 0,1038 Hay p9 = 1–(p1 + . . . + p8) = 0,1038 = 0,05, k = 9, r = 2 5916,12)6(2 95,01)129( 2 05,01 2 = 7,8047 < 2 95,0 (6) : chấp nhận H0 Vậy có thể xem X~N(124,875 ; (27,8687)2) 95 Lưu ý: * Nếu đề cho trước = 25 thì r = 1 P(xi< X < xi+1) = )25 875,1241( i x )25 875,124 ( ix * Nếu đề cho trước = 120, = 25 thì r= 0 P( xi < X < xi+1) = )25 1201( i x )25 120 ( ix 96 PHẦN II.2 : KIỂM ĐỊNH TÍNH ĐỘC LẬP Một phần tử của đám đông có thể có các dấu hiệu định lượng. Ví dụ con người có: chiều cao, trọng lượng. Một phần tử của đám đông còn có dấu hiệu định tính. Ví dụ con người có: màu tóc, màu mắt. Ta khảo sát 3 trường hợp: *Tính độc lập của 2 dấu hiệu định tính. *Tính độc lập của 1 dấu hiệu định tính và 1 dấu hiệu định lượng. *Tính độc lập của 2 dấu hiệu định lượng. ThS. Phạm Trí Cao * Chương 7 25 97 I. KIỂM ĐỊNH TÍNH ĐỘC LẬP CỦA 2 DẤU HIỆU ĐỊNH TÍNH Ta có bảng liên hợp các dấu hiệu sau: B A B1 B2 . Bk Tổng A1 n11 n12 n1k n10 A2 n21 n22 n2k n20 .. Ar nr1 nr2 nrk nr0 Tổng n01 n02 .. n0k n k j ij nin 10 , k i ij njn 10 , r i k j oj ninn 1 10 : cỡ mẫu 98 Giả thiết H0: Hai dấu hiệu A và B độc lập H1: Hai dấu hiệu A và B không độc lập nij : tần số quan sát i j jnin ijnn )1 0.0 2 (2 )1)(1(21 rk Quy tắc quyết định: 2 > )1)(1(21 rk : bác bỏ H0 99 Ví dụ: Để nghiên cứu xem quy mô của một công ty có ảnh hưởng đến hiệu quả quảng cáo đối với khách hàng hay không, người ta tiến hành phỏng vấn 356 khách hàng và thu được kết quả sau: Hiệu quả quảng cáo Quy mô công ty Mạnh Vừa phải Yếu Tổng Nhỏ 20 52 32 104 Vừa 53 47 28 128 Lớn 67 32 25 124 Tổng 140 131 85 356 Với mức ý nghĩa 5%, có thể cho rằng quy mô của công ty có ảnh hưởng đến hiệu quả của quảng cáo đối với khách hàng hay không? 100 Giải H0: Quy mô không ảnh hưởng hiệu quả quảng cáo 1124*85 225 124*131 232 124*140 267 128*85 228 128*131 247 128*140 253 104*85 232 104*131 252 104*140 220 3562 = 29,638 > 4877,9)4(295,0)13)(13( 2 05,01 : bác bỏ H0 Tức quy mô công ty có ảnh hưởng đến hiệu quả của quảng cáo ThS. Phạm Trí Cao * Chương 7 26 101 II. KIỂM ĐỊNH TÍNH ĐỘC LẬP CỦA 1 DẤU HIỆU ĐỊNH TÍNH VÀ 1 DẤU HIỆU ĐỊNH LƯỢNG Tiêu chuẩn phù hợp 2 nói trên còn có thể áp dụng để kiểm định tính độc lập của 1 dấu hiệu định tính A và 1 dấu hiệu định lượng X. Khi đó ta cần chia miền giá trị của X thành k khoảng B1, B2, Bk , và nếu cá thể có số đo xj rơi vào khoảng Bj thì ta xem cá thể đó có dấu hiệu Bj 102 Ví dụ: Một con cua biển có thể có màu vỏ là xanh, hoặc hồng. Số vạch trên vỏ của nó có thể là 0, 1, 2, 3, 4, 5. Ở đây dấu hiệu A (màu vỏ) là dấu hiệu định tính, còn số vạch trên vỏ X là dấu hiệu định lượng (hay X là ĐLNN rời rạc). Xét ngẫu nhiên 169 con cua biển, ta thu được: Số vạch Màu vỏ 0 1 hoặc 2 3 hoặc 4 5 Tổng Xanh 35 19 36 25 115 Hồng 14 14 16 10 54 Tổng 49 33 52 35 169 Với = 5%, xét xem: A và X có độc lập? 103 Giải H0: hai dấu hiệu A và X độc lập 13,2)1 54*35 210..... 115*33 219 115*49 235(1692 = 0,05 , r=2 , k=4 8147,7)3(295,0)14)(12( 2 05,01 )3(295,0 2 : chấp nhận H0 104 III. KIỂM ĐỊNH TÍNH ĐỘC LẬP CỦA 2 DẤU HIỆU ĐỊNH LƯỢNG Tương tự như vậy, ta có thể dùng tiêu chuẩn 2 nói trên để kiểm tra tính độc lập của 2 ĐLNN X và Y (lưu ý rằng nếu X và Y không tương quan: RXY = 0 thì chưa chắc X,Y độc lập. Ta phải kiểm tra mới khẳng định được). Muốn vậy, ta chia miền giá trị của X thành k khoảng B1 , B2, Bk còn miền giá trị của Y thành r khoảng A1, A2, Ar . Nếu cá thể có số đo (y,x) Ai x Bj thì ta coi cá thể đó có dấu hiệu Ai và Bj ThS. Phạm Trí Cao * Chương 7 27 105 Ví dụ: Giả sử X và Y (pound) tương ứng là số đo huyết áp và trọng lượng của trẻ em 14 tuổi. Lấy 1 mẫu ngẫu nhiên gồm 200 trẻ, ta có: H. áp T. lượng X 99 99 120 Tổng Y 102 10 20 11 5 46 Y >102 6 48 50 50 154 Tổng 16 68 61 55 200 Với : 1 pound = 0,454 kg Với =1%, xét xem: X,Y có độc lập. 106 Giải H0: hai dấu hiệu X và Y độc lập = 0,01 , r= 2 , k= 4 345,11)3(299,0)14)(12( 2 01,01 53,22)1 154*55 250.... 46*68 220 46*16 210(2002 )3(295,0 2 : bác bỏ H0 Vậy giữa huyết áp và trọng lượng (trẻ 14 tuổi) có sự phụ thuộc lẫn nhau. 107 Mời ghé thăm trang web: www37.websamba.com/phamtricao www.phamtricao.web1000.com
File đính kèm:
- bai_giang_xac_suat_thong_ke_chuong_7_kiem_dinh_gia_thuyet_th.pdf