Bài giảng Toán 5 Xác suất & Thống kê - Tuần 11 - Nguyễn Văn Đắc
Như ta đã biết, nói đến một tổng thể nghĩa là ta quan tâm đến một biến ngẫu nhiên đo đặc tính
chung của các cá thể trong tổng thể. Ở đây, một khẳng định hoặc phỏng đoán về tổng thể chính là
khẳng định hay phỏng đoán về biến ngẫu nhiên mà ta quan tâm.
Ví dụ 7.1 Giả sử X là chiều cao của người trưởng thành ở Việt Nam, Y là chiều cao của người
trưởng thành ở Thái Lan. Mỗi khẳng định sau đây đều là một giả thuyết thống kê:
+ E(X) = 1.65;
+ E(X) = E(Y);
+ X có phân phối chuẩn.
Ta thường đối mặt với tình huống là: Tính đúng sai của giả thuyết thống kê là chưa biết. Không
thể khảo sát được toàn bộ cá thể trong tổng thể. Phải đưa ra quyết định chấp nhận hay bác bỏ giả
thuyết.
Khi giải quyết tình huống trên, nếu bác bỏ giả thuyết thì đồng nghĩa với việc ta chấp nhận một
khẳng định khác với giả thuyết – được gọi là đối thuyết. Để tiện trong việc tiến hành giải quyết
vấn đề người ta ký hiệu giả thuyết là H0 và đó thường là một khẳng định về giá trị xác định của
tham số, đối thuyết được ký hiệu là H1.
đưa ra khi 0H bị bác bỏ. Vị trí của miền bác bỏ được xác định chỉ khi 1H được phát biểu. Ví dụ, trong kiểm định một loại thuốc mới, ta đặt giả thuyết là nó không tốt hơn loại thuốc đang có trên thị trường và kiểm định nó với đối thuyết là loại thuốc đó tốt hơn. Đây là kiểm định một phía với miền tiêu chuẩn là đuôi bên phải. Tuy nhiên, nếu ta muốn so sánh một công nghệ dạy học mới với cách dạy theo lớp thông thường, thì đối thuyết chấp nhận phương pháp mới hoặc kém hơn, hoặc tốt hơn phương pháp thông thường. Do đó, kiểm định là hai phía với miền tiêu chuẩn được chia thành hai phần bằng nhau nằm ở các đuôi bên trái và phải của phân phối của chỉ tiêu kiểm định. Tất nhiên, điều đáng mong muốn là xác định rõ xem giả thuyết nào nên được trình bày ở 0H và giả thuyết nào nên được trình bày ở 1H . Đầu tiên, đọc kỹ bài toán và xác định yêu cầu cần kiểm định. Nếu yêu cầu đề cập tới hướng đơn như là lớn hơn, nhỏ hơn, tốt hơn, kém hơn, thì 1H sẽ được phát biểu qua dấu bất đẳng thức ( > hoặc < ). Ví dụ, trong kiểm định một loại thuốc mới, ta muốn đưa ra một chứng cớ rằng hơn 30% bệnh nhân được chữa khỏi, ta viết 1 : 0,3H p > và do đó giả thuyết được viết 0 : 0,3H p = . Nếu yêu cầu đề cập tới hướng kép như là ít nhất, bằng hoặc lớn hơn, nhiều nhất, không nhiều hơn,.. thì dấu kép ( £ hoặc ³ ) được biểu diễn cho 0H , nhưng chỉ sử dụng dấu bằng, và 1H được cho theo dấu ngược lại. Cuối cùng, nếu không hướng nào được nói tới trong yêu cầu, thì 1H được phát biểu qua dấu không bằng ( ≠). Ví dụ 7.2 Một hãng sản xuất loại ngũ cốc nào đó khẳng định lượng chất béo trung bình trong ngũ cốc không vượt quá 1,5 miligam. Phát biểu giả thuyết và đối thuyết được dùng trong kiểm định yêu cầu này và xác định vị trí miền bác bỏ giả thuyết. Giải Khẳng định của nhà sản xuất bị bác bỏ chỉ khi m lớn hơn 1,5 miligam và được chấp nhận nếu m nhỏ hơn hoặc bằng 1,5 miligam. Từ việc giả thuyết luôn chỉ rõ một giá trị cụ thể của tham số, ta sẽ kiểm định: 0 : 1,5H m = 1 : 1,5H m > . Mặc dù ta phát biểu giả thuyết với dấu bằng, nhưng cần hiểu nó bao gồm cả các giá trị không được nhắc tới trong đối thuyết. Do vậy, việc chấp nhận 0H không có nghĩa là chính xác 1,5m = ; nhưng phần nào có nghĩa là ta không đủ bằng chứng để chấp nhận 1H . Ta có bài toán kiểm định một phía, dấu lớn hơn cho thấy miền bác bỏ giả thuyết nằm hoàn toàn ở đuôi bên phải của phân phối của chỉ tiêu kiểm định. Ví dụ 7.3 Một đại lý nhà đất khẳng định rằng 60% số nhà riêng đang được xây dựng ngày nay là có 3 phòng ngủ. Để kiểm tra khẳng định này, một lượng lớn căn nhà mới xây dựng được kiểm tra, tỉ lệ nhà có 3 phòng ngủ được ghi lại và sử dụng trong chỉ tiêu kiểm định của ta. Phát biểu giả thuyết và đối thuyết của kiểm định, xác định vị trí của miền bác bỏ giả thuyết. Giải Nếu chỉ tiêu kiểm định thực chất là cao hơn hoặc thấp hơn p = 0,6 thì ta bác bỏ khẳng định của đại lý. Do đó ta có thể đặt giả thuyết: 0 : 0,6H p = 1 : 0,6H p ¹ . Đối thuyết cho thấy đây là bài toán kiểm định hai phía, với miền bác bỏ giả thuyết nằm đều ở cả hai đuôi của phân phối của - thống kê là chỉ tiêu kiểm định mà ta sẽ chọn. Trong khuôn khổ có hạn của chương trình, ta chỉ tập trung vào kiểm định hai phía. Phần kiểm định một phía coi như là đọc thêm. Thủ tục tổng quát để kiểm định một giả thuyết 1. Xác định tham số cần quan tâm, từ đó phát biểu giả thuyết và đối thuyết. 2. Chọn mức ý nghĩa α(Xác suất mắc sai lầm loại I). 3. Chọn chỉ tiêu kiểm định. 4. Xác định miền bác bỏ giả thuyết. 5. Tính giá trị của chỉ tiêu kiểm định dựa vào mẫu quan sát được. 6. Quyết định: Bác bỏ hoặc chấp nhận giả thuyết tùy thuộc vào việc giá trị của chỉ tiêu kiểm định nằm trong miền bác bỏ hay chấp nhận giả thuyết. 7.2 Kiểm định giả thuyết về một giá trị trung bình Xét một tổng thể với X là biến ngẫu nhiên có kỳ vọng và phương sai được ký hiệu lần lượt là , . Ta muốn kiểm định giả thuyết H0: = . H1: ≠ . Trường hợp đã biết + Chọn mức ý nghĩa α. + Chỉ tiêu kiểm định là n XZ / 0 s m- = . + Từ đối thuyết H1, ta chọn miền bác bỏ hai phía. Ta có a s m aa -=÷÷ ø ö çç è æ < - <- 1 / 2/ 0 2/ zn XzP với giả thuyết H0 là đúng thì Z có phân phối tiệm cận tiêu chuẩn nên từ mức ý nghĩa α, tra bảng A.3 ta được các giá trị tới hạn 2/az- , 2/az . Từ đó, miền bác bỏ giả thuyết là ),[],( 2/2/ +¥È--¥ aa zz . + Từ mẫu quan sát được, tính giá trị của Z và đưa ra quyết định. Chú ý: Ở trên ta đã sử dụng định lý giới hạn trung tâm nên nếu tổng thể có phân phối chuẩn thì cỡ mẫu là bao nhiêu thì không quan trọng, nhưng tổng thể không có phân phối chuẩn thì cỡ mẫu phải đủ lớn. Ví dụ 7.4 Một nhà sản xuất dụng cụ thể thao đưa ra một loại dây câu mới, họ khẳng định khối lượng trung bình dây có thể chịu là 8 kg, với độ lệch chuẩn là 0,5 kg. Để kiểm định giả thuyết m = 8 kg với đối thuyết m ≠ 8 kg, 50 dây ngẫu nhiên được kiểm tra và khối lượng trung bình dây có thể chịu là 7,8 kg. Hãy kiểm định khẳng định của nhà sản xuất với mức ý nghĩa 0,01. Giải 1. 8:0 =mH kg. 8:1 ¹mH kg. 2. 01,0=a . 3. Chỉ tiêu kiểm định n XZ / 0 s m- = 4. Miền bác bỏ: 575,2-z với n xz / 0 s m-= . 5. Tính toán: 8,7=x kg, 5,0=s kg, 83,2 50.5,0 88,7 -= - =z . 6. Kết luận: Bác bỏ 0H và kết luận trọng lượng trung bình dây có thể chịu là khác 8kg, và thực tế là nhỏ hơn 8 kg. Trường hợp chưa biết , ta phải có phân phối của tổng thể là phân phối chuẩn. + Chọn mức ý nghĩa α. + Chỉ tiêu kiểm định là nS XT / 0m-= . + Với giả thuyết đúng, thì T có phân phối Student với n-1 bậc tự do nên từ a m aa -=÷÷ ø ö çç è æ < - <- -- 1/ 1,2/ 0 1,2/ nn tnS XtP Ta xác định được miền bác bỏ. +Từ mẫu quan sát được ta tính giá trị của T. + Đưa ra quyết định. Ví dụ 7.5 Một báo cáo khẳng định mỗi máy hút bụi tiêu thụ khoảng 46 kWh / 1 năm. Từ một mẫu gồm 12 gia đình được nghiên cứu, cho thấy máy hút bụi tiêu thụ trung bình 42 kWh mỗi năm với độ lệch chuẩn 11,9 kWh. Liệu có thể nói, với mức ý nghĩa 0,05, trung bình máy hút bụi tiêu thụ không bằng 46 kWh mỗi năm hay không? Giả sử tổng thể đang xét có phân phối chuẩn. Giải 1. 46:0 =mH kWh. 46:1 ¹mH kWh. 2. 05,0=a . 3. Chỉ tiêu kiểm định nS XT / 0m-= . 4. Miền bác bỏ: 796,1- 1.796 với ns xt / 0m-= , v = 11 bậc tự do. 5. Tính toán: 42=x kWh, 9,11=s kWh, n = 12. Do đó: 16,1 12.9,11 4642 -= - =t . 6. Kết luận: Không bác bỏ 0H và kết luận trung bình lượng điện mà mỗi máy hút bụi tiêu thụ trong năm là 46kWH. 7.3 Kiểm định giả thuyết về hiệu hai giá trị trung bình Bài toán Cho hai tổng thể Ω1, Ω2. Gọi X1, X2 lần lượt là hai biến ngẫu nhiên đo đặc tính chung của các cá thể trong hai tổng thể, với kỳ vọng và phương sai tương ứng được ký hiệu là 11 , sm và 22 , sm . Dựa vào hai mẫu ngẫu nhiên được rút từ Ω1, Ω2 với cỡ lần lượt là n1, n2 , để kiểm định giả thuyết H0: 021 d=- mm H1: 021 d¹- mm trong đó d0 là số đã biết. Đây là bài toán kiểm định giả thuyết hai phía. + Chọn mức ý nghĩa α. + Chỉ tiêu kiểm định và miền bác bỏ: · Đã biết 22 2 1 ,ss và cỡ mẫu đủ lớn sao cho định lý giới hạn trung tâm có hiệu lực: - Chỉ tiêu kiểm định được chọn là 2 2 2 1 2 1 021 nn dXXZ ss + -- = với giả thuyết H0 đúng, thì Z có phân phối tiệm cận chuẩn. Từ đó và mức ý nghĩa α ta được - Miền bác bỏ ),[],( 2/2/ +¥È--¥ aa zz · Cả hai biến ngẫu nhiên có phân phối chuẩn(hoặc xấp xỉ chuẩn) với phương sai bằng nhau chưa biết: - Chỉ tiêu kiểm định được chọn là 21 021 /1/1 )( nnS dXXT p + -- = với 2 )1()1( 21 2 2 21 2 12 -+ -+- = nn nSnSS p . Khi giả thuyết đúng thì T có phân phối student với n1 + n2 -2 bậc tự do nên với mức ý nghĩa α ta được - Miền bác bỏ giả thuyết là ),[],( 2,2/2,2/ 2121 +¥È--¥ -+-+ nnnn tt aa · Cả hai biến ngẫu nhiên có phân phối chuẩn(hoặc xấp xỉ chuẩn) với phương sai khác nhau chưa biết: - Chỉ tiêu kiểm định được chọn là 2 2 2 1 2 1 021 )(' n S n S dXXT + -- = Khi giả thuyết đúng thì T’ có phân phối xấp xỉ phân phối student với bậc tự do được xác định bởi )]1/()/[()]1/()/[( )//( 2 2 2 2 21 2 1 2 1 2 2 2 21 2 1 -+- + = nnsnns nsnsv - Miền bác bỏ là ),[],( ,2/,2/ +¥È--¥ nana tt Ví dụ 7.6 Cho hai tổng thể Ω1, Ω2 với X1, X2 lần lượt là hai biến ngẫu nhiên đo đặc tính chung của các cá thể trong hai tổng thể. Từ Ω1, Ω2 lấy hai mẫu độc lập với kích thước n = 40, m = 50. Trung bình mẫu tính được lần lượt là 130 và 140. Biết rằng X1 có trung bình là 1m chưa biết và 8021 =s ; X2 có trung bình là 2m chưa biết và 2 2s = 100. Với mức ý nghĩa = 0.01, hãy kiểm định giả thuyết H0: 021 =- mm H1: 021 ¹- mm Giải + Mức ý nghĩa 01.0=a . + Chỉ tiêu kiểm định 2 2 2 1 2 1 021 nn dXXZ ss + -- = . + Miền bác bỏ (-∞, -2.58] ∪[2.58, +∞) +Tính toán: T = -5 + Bác bỏ H0. Ví dụ 7.7 Một thí nghiệm được thực hiện nhằm so sánh mức độ mài mòn của hai loại kim loại khác nhau. 12 miếng kim loại I được kiểm tra bằng cách đưa vào máy đo độ mài mòn. 10 miếng kim loại II được kiểm tra tương tự. Trong mỗi trường hợp, độ sâu của sự mài mòn được ghi lại. Mẫu ứng với kim loại I có trung bình mài mòn là 85 đơn vị, với độ lệch mẫu bằng 4; trong khi mẫu ứng với kim loại II có trung bình là 81 và độ lệch mẫu là 5. Có thể kết luận, với mức ý nghĩa 0.05, rằng mức độ mài mòn của kim loại I hơn kim loại II là 2 đơn vị được không? Giả sử các mật độ đều xấp xỉ chuẩn với phương sai bằng nhau. Giải Đặt 21,mm là kỳ vọng cho độ mài mòn của hai kim loại 1 và 2 + 2: 210 =- mmH . 2: 211 ¹- mmH . + 05,0=a . + Chỉ tiêu kiểm định 21 021 /1/1 )( nnS dXXT p + -- = , bậc tự do là v = 20. + Miền bác bỏ: 725,1>t hoặc t < - 1.725. + Tính toán: 851 =x , 41 =s , 121 =n . 812 =x , 52 =s , 102 =n . Do đó: 478,4 21012 25.916.11 = -+ + =ps , 04,110/112/1.478,4 2)8185( = + --=t + Kết luận: Không bác bỏ 0H . Hết tuần 11
File đính kèm:
- bai_giang_toan_5_xac_suat_thong_ke_tuan_11_nguyen_van_dac.pdf