Bài giảng Toán 5 Xác suất & Thống kê - Tuần 9 - Nguyễn Văn Đắc
6.1 Giới thiệu
Chương trước ta đã tìm hiểu về thống kê và một số thống kê quan trọng. Mục đích là xây dựng
nền tảng cho phép những người làm thống kê rút ra những kết luận về các tham số của tổng thể
từ số liệu thực nghiệm. Chẳng hạn, định lý giới hạn trung tâm cho ta biết về dạng phân phối của
trung bình mẫu X . Phân phối đó liên quan mật thiết đến trung bình của tổng thể m . Do vậy bất
kỳ một kết luận gì về m dựa trên mẫu, đều phải dựa vào dạng thống kê của trung bình mẫu.
Tương tự cho phương sai mẫu của tổng thể có phân phối chuẩn.
Chương này ta bắt đầu bằng việc chỉ rõ mục đích của suy luận thống kê. Sau đó, ta sẽ tìm hiểu về
bài toán ước lượng tham số của tổng thể.
6.2 Suy luận thống kê
Lý thuyết suy luận thống kê chứa đựng các phương pháp mà dựa vào đó ta có thể đưa ra những
suy luận hoặc những kết luận khái quát về tổng thể.
Suy luận thống kê được chia thành hai mảng chính: Ước lượng và kiểm định giả thuyết, lần lượt
được trình bày trong Chương 6 và Chương 7. Ta có thể phân biệt được hai mảng trên dựa vào ví
dụ sau đây: Một ứng cử viên tổng thống muốn ước lượng tỉ lệ cử tri ủng hộ ông ta trên toàn quốc
bằng cách lấy ý kiến của 500 000 cử tri được chọn ngẫu nhiên và độc lập từ các vùng miền khác
nhau. Tỉ lệ cử tri trong mẫu ủng hộ ông ta làm cơ sở để đưa ra ước lượng về tỉ lệ ủng hộ ông ta
trên toàn quốc. Các kiến thức về phân phối của tỉ lệ sẽ giúp ta xác định được độ chính xác của
ước lượng. Bài toán này thuộc mảng ước lượng tham số. Khi ông ta tuyên bố tỉ lệ cử tri ủng hộ
ông ta trên toàn quốc là 70%, thì vấn đề đặt ra đối với ứng cử viên đối lập là cần tìm hiểu xem lời
phát biểu trên có cơ sở hay không. Lúc này, ta không ước lượng tham số mà phải đưa ra quyết
định chấp nhận hay không chấp nhận lời tuyên bố trên. Lại phải dựa vào lý thuyết về mẫu và các
số liệu thực nghiệm để đưa ra quyết định với độ chính xác có thể xác định được. Bài toán này
thuộc về mảng kiểm định giả thuyết
o cho xác suất để biến ngẫu nhiên tiêu chuẩn Z nhận giá trị lớn hơn 2/az , bằng 2/a Ta có P(- zα/2< Z < zα/2) = 1 - a , trong đó n XZ /s m- = . Như vậy, .12/2/ a s m s aa -=÷÷ ø ö çç è æ +<<- n zX n zXP Tức là với một mẫu ngẫu nhiên cỡ n được chọn từ một tổng thể mà 2s đã biết và ta tính được x , thì ta được một khoảng tin cậy (1 – )100% như trong phát biểu dưới đây. · Khoảng ước lượng cho m với s đã biết Nếu x là trung bình của một mẫu ngẫu nhiên cỡ n được lấy từ tổng thể với 2s đã biết, thì khoảng tin cậy (1 – )100% cho trung bình m của tổng thể là n zx n zx sms aa 2/2/ +<<- trong đó 2/az được xác định bởi P(Z > 2/az ) = 2/a . Do ta đã sử dụng định lý giới hạn trung tâm để xây dựng khoảng tin cậy cho trung bình tổng thể nên với mẫu cỡ nhỏ được chọn từ tổng thể có phân phối khác phân phối chuẩn thì độ chính xác không cao. Với cỡ mẫu lớn hơn hoặc bằng 30 thì lý thuyết mẫu bảo đảm rằng kết quả là tốt. Dưới đây là hình ảnh của khoảng tin cậy với các mẫu khác nhau. Ví dụ 6.2 Hàm lượng kẽm trung bình thu được khi đo ở 36 địa điểm khác nhau trên một dòng sông là 2.6 gam/mi-li-lít. Biết rằng độ lệch chuẩn của tổng thể là 0.3. Hãy tìm các khoảng tin cậy 95% và 99% cho hàm lượng kẽm trung bình trong dòng sông đó. Giải Ước lượng điểm cho m là x = 2.6; + = 0.05 thì 2/a = 0.025, ta có P(Z > 2/az ) = 2/a tương đương P(Z < 2/az ) = 1 - 2/a = 0.975 Nên 2/az = 1.96(tra Bảng A.3). n =36. Khoảng tin cậy 95% cho m là 36 3.0)96.1(6.2 36 3.0)96.1(6.2 +<<- m viết gọn là 2.5 < m < 2.7. + = 0.01 thì 2/a = 0.005, ta có 2/az = 2.575 và n = 36 nên khoảng tin cậy 99% cho m là 36 3.0)575.2(6.2 36 3.0)575.2(6.2 +<<- m giản ước ta được 2.47 < μ < 2.73. Để ý một chút, ta sẽ thấy khoảng tin cậy (1 – )100% còn cho ta ước tính cho độ chính xác của một ước lượng điểm. Thực vậy, x được dùng để ước lượng điểm cho m thì sai số mắc phải là | x - m | Theo kết quả trên thì | x - m | < n z sa 2/ . Từ đó ta có Định lý 6.1 Nếu x được sử dụng để ước lượng điểm cho m , thì với độ tin cậy (1 – )100% ta cho rằng sai số của ước lượng không vượt quá n z sa 2/ . Trong Ví dụ 6.2, với độ tin cậy 95% ta cho rằng giá trị trung bình mẫu x = 2.6 sai khác với m một khoảng không quá 0.98. Trong thực tế đôi khi ta phải trả lời câu hỏi: Với cỡ mẫu phải bằng bao nhiêu thì sai số ước lượng nói trên không vượt quá một số e cho trước? Từ Định lý 6.1 suy ra rằng để sai số của ước lượng điểm không vượt quá e ta chỉ việc chọn n sao cho n z sa 2/ = e . Nên ta có Định lý 6.2 Nếu x được sử dụng để ước lượng điểm cho m , với độ tin cậy (1 – )100% ta cho rằng sai số của ước lượng không vượt quá e khi cỡ mẫu được xác định bởi 2 2/ ÷ ø ö ç è æ= e sazn theo nguyên tắc làm tròn đến số tiếp theo. Một cách chính xác thì công thức trong Định lý 6.2 chỉ được sử dụng khi biết s . Tuy nhiên nếu chưa biết s ta có thể chọn một mẫu ban đầu với cỡ mẫu lớn hơn hoặc bằng 30, tính độ lệch chuẩn mẫu s để làm ước lượng cho s rồi từ đó tìm giá trị gần đúng cho n. Ví dụ 6.3 Nếu ta muốn với độ tin cậy 95% sai số của ước lượng x cho m không vượt quá 0.05, thì cỡ mẫu phải là bao nhiêu? Giải Theo Định lý 6.2 thì 2(1.96)(0.3)n 138.3 0.05 é ù= =ê úë û Do vậy, với độ tin cậy 95% ta cho rằng một mẫu cỡ 139 sẽ cho ta một ước lượng điểm là trung bình mẫu với sự sai lệch so với trung bình tổng thể không vượt quá 0.05. Tiếp theo ta sẽ xây dựng khoảng tin cậy (1 – α)100% cho trung bình tổng thể với phương sai chưa biết. Nhắc lại rằng nếu tổng thể có phân phối chuẩn, thì biến ngẫu nhiên nS XT / m- = có phân phối student với n -1 bậc tự do, trong đó S là độ lệch tiêu chuẩn mẫu. Ta dùng T để xây dựng khoảng tin cậy cho μ với phương sai của tổng thể ta chưa biết. Trước tiên ta ấn định aaa -=<<- 1)( 2/2/ tTtP với nS XT / m- = thì T có phân phối student với n - 1 bậc tự do nên khi a cho trước ta xác định được 2/at . Từ đó ta được a m aa -=÷÷ ø ö çç è æ < - <- 1 / 2/2/ t nS XtP Hay tương đương là am aa -=÷ ø ö ç è æ +<<- 12/2/ n StX n StXP từ đó · Khoảng tin cậy cho m với s chưa biết Nếu x và s lần lượt là trung bình và độ lệch chuẩn mẫu của một mẫu ngẫu nhiên được chọn từ tổng thể có phân phối chuẩn với s chưa biết, khoảng tin cậy %100)1( a- cho m là n stx n stx 2/2/ aa m +<<- trong đó 2/at được xác định bởi 2 )( 2/ a a => tTP . Lưu ý: + Tìm 2/at bằng cách tra Bảng A.4. + Kết quả trên có giả thiết là tổng thể có phân phối chuẩn, tuy nhiên nếu tổng thể có phân phối xấp xỉ chuẩn thì sử dụng kết quả trên cũng khá tốt, còn khi không biết dạng phân phối của tổng thể thì đòi hỏi cỡ mẫu phải lớn hơn hoặc bằng 30, khi đó ta nói kết quả trên là khoảng tin cậy với cỡ mẫu lớn. Ví dụ 6.4 Một mẫu được lấy từ tổng thể có phân phối xấp xỉ chuẩn với số liệu như sau 9.8 10.2 10.4 9.8 10.0 và 9.6 Hãy tìm khoảng tin cậy 95% cho giá trị trung bình của tổng thể. Giải Đặt X là biến ngẫu nhiên với số liệu thực nghiệm như trên. Trung bình mẫu và phương sai mẫu lần lượt là 283.00.10 == sx Sử dụng Bảng A.4, ta tìm được 447.2025.0 =t với số bậc tự do là 6. Do đó khoảng tin cậy 95% cho m là ÷ ø ö ç è æ +<<÷ ø ö ç è æ - 7 283.0)477.2(0.10 7 283.0)477.2(0.10 m viết gọn lại là 9.74 < m < 10.26. 6.4.2 Ước lượng hiệu hai giá trị trung bình Ta có hai tổng thể với trung bình lần lượt là 21, mm và phương sai tương ứng lần lượt là 2 2 2 1 , ss . Ước lượng điểm cho hiệu 21 mm - là thống kê 21 XX - , trong đó 1X , 2X lần lượt là trung bình mẫu lấy từ tổng thể thứ nhất và tổng thể thứ hai. Vấn đề đặt ra là: Xây dựng khoảng tin cậy (1 – α)100% cho 21 mm - . Người ta đã thu được các kết quả sau: · Khoảng tin cậy cho 21 mm - ; đã biết 2 2 2 1 , ss . Nếu 1x và 2x là trung bình mẫu của các mẫu ngẫu nhiên độc lập cỡ lần lượt là n1 và n2 được lấy từ những tổng thể với phương sai đã biết là 22 2 1 , ss , thì khoảng tin cậy (1 – α)100% cho 21 mm - là 2 2 2 1 2 1 2/2121 2 2 2 1 2 1 2/21 )()( nn zxx nn zxx ssmmss aa ++-<-<+-- trong đó 2/az được xác định bởi 2 )( 2/ a a => zZP . Ví dụ 6.5 Cho hai tổng thể A và B với độ lệch chuẩn lần lượt là 6 và 8. Một mẫu từ A có cỡ là 50, cho ta giá trị trung bình mẫu là 36. Một mẫu từ B có cỡ là 75, cho ta giá trị trung bình là 42. Tìm khoảng tin cậy 96% cho hiệu AB mm - . Giải + Ước lượng điểm cho AB mm - là 42 – 36 = 6. + α = 0.04, dùng Bảng A.3 ta tìm được z0.02 = 2.05. + Khoảng tin cậy 96% cho AB mm - là 50 6 75 805.26 50 6 75 805.26 2222 ++<-<+- AB mm Thu gọn ta được 57.843.3 <-< AB mm . · Khoảng tin cậy cho 21 mm - ; chưa biết 2 2 2 1 , ss nhưng biết rằng 2 2 2 1 ss = . Nếu 1x và 2x là trung bình mẫu của các mẫu ngẫu nhiên độc lập cỡ lần lượt là n1 và n2 được lấy từ những tổng thể có phân phối xấp xỉ chuẩn với phương sai bằng nhau nhưng chưa biết, thì khoảng tin cậy (1 – α)100% cho 21 mm - là 21 2/2121 21 2/21 11)(11)( nn stxx nn stxx pp ++-<-<+-- aa mm trong đó 2/at được xác định bởi 2 )( 2/ a a => tTP với n1 + n2 - 2 bậc tự do và sp được tính theo công thức 2 )1()1( 21 2 22 2 11 -+ -+- = nn snsns p . Ví dụ 6.6 Cho hai tổng thể A và B. Một mẫu từ A có cỡ là 12, cho ta giá trị trung bình mẫu là 3.11 và độ lệch tiêu chuẩn mẫu là s1 = 0.771. Một mẫu từ B có cỡ là 10, cho ta giá trị trung bình là 2.04 và độ lệch tiêu chuẩn là s2 = 0.448. Tìm khoảng tin cậy 90% cho hiệu BA mm - , giả sử rằng hai tổng thể có phân phối xấp xỉ chuẩn và có phương sai bằng nhau nhưng chưa biết. Giải + Ước lượng điểm cho BA mm - là 3.11 – 2.04 = 1.07. + .646.0 2911 )448.0)(9()771.0)(11( 2 )1()1( 22 21 2 22 2 11 = -+ + = -+ -+- = nn snsns p + α = 0.1 và số bậc tự do n1 + n2 – 2 = 20, dùng Bảng A.4 ta tìm được t0.05 = 1.725. Ta được khoảng tin cậy 90% cho BA mm - là 10 1 12 1)646.0)(752.1(07.1 10 1 12 1)646.0)(752.1(07.1 ++<-<+- BA mm Thu gọn ta được 0.593 < BA mm - < 1.547. · Khoảng tin cậy cho 21 mm - ; đã biết 2 2 2 1 , ss nhưng biết rằng 2 2 2 1 ss ¹ . Nếu 1x , 2 1s và 2x , 2 2s là trung bình mẫu, phương sai mẫu của các mẫu ngẫu nhiên độc lập cỡ lần lượt là n1 và n2 được lấy từ những tổng thể có phân phối xấp xỉ chuẩn với phương sai khác nhau nhưng chưa biết, thì khoảng tin cậy (1 – α)100% xấp xỉ cho 21 mm - là 2 2 2 1 2 1 2/2121 2 2 2 1 2 1 2/21 )()( n s n stxx n s n stxx ++-<-<+-- aa mm trong đó 2/at được xác định bởi 2 )( 2/ a a => tTP với số bậc tự do là ( ) ( ) ( ) )]1/(/[)]1/(/[ // 2 2 2 2 21 2 1 2 1 2 2 2 21 2 1 -+- + = nnsnns nsns u (được làm tròn đến số nguyên kế tiếp nếu chưa nguyên). Ví dụ 6.7 Cho hai tổng thể A và B. Một mẫu từ A có cỡ là 15, cho ta giá trị trung bình mẫu là 3.84 và độ lệch tiêu chuẩn mẫu là s1 = 3.07. Một mẫu từ B có cỡ là 12, cho ta giá trị trung bình là 1.49 và độ lệch tiêu chuẩn là s2 = 0.8. Tìm khoảng tin cậy 95% cho hiệu BA mm - , giả sử rằng hai tổng thể có phân phối chuẩn và có phương sai khác nhau nhưng chưa biết. Giải + Ước lượng điểm cho BA mm - là 3.84 – 1.49 = 2.35. + ( ) ( ) ( ) ( ) 3.16 ]11/)12/8.0[(]14/)15/07.3[( 12/8.015/07.3 )]1/(/[)]1/(/[ // 2222 222 2 2 2 2 21 2 1 2 1 2 2 2 21 2 1 » + + = -+- + = nnsnns nsns u làm tròn thành 17. + Với α = 0.05 và bậc tự do là 17, tra bảng A.4 ta được t0.025 = 2.110. Ta được khoảng tin cậy 95% cho BA mm - là 12 8.0 15 07.3110.235.2 12 8.0 15 07.3110.235.2 2222 ++<-<+- BA mm Thu gọn ta được 135.4565.0 <-< BA mm Như vậy, với độ tin cậy 95% ta cho rằng hiệu BA mm - nằm trong khoảng (0.565 , 4.135 ). Các ý chính của Bài giảng tuần 9 + Ước lượng điểm + Ước lượng khoảng: Ước lượng một trung bình, ước lượng hiệu hai trung bình.
File đính kèm:
- bai_giang_toan_5_xac_suat_thong_ke_tuan_9_nguyen_van_dac.pdf