Bài giảng Toán 5 Xác suất & Thống kê - Tuần 8 - Nguyễn Văn Đắc
5.1 Mẫu ngẫu nhiên
Trước hết ta xét tình huống sau: Để có một chiến lược cho chương trình dinh dưỡng quốc gia
nhằm tăng chiều cao của người dân, người ta đi tìm hiểu về chiều cao của người trưởng thành ở
Việt Nam.
Trong tình huống trên:
a) Tập hợp gồm các người trưởng thành ở Việt Nam, ta gọi là tổng thể hoặc dân số.
b) Mỗi người trong tổng thể, được gọi là một cá thể.
c) Chiều cao của người trong tổng thể chính là một biến ngẫu nhiên.
d) Do số người trưởng thành ở Việt Nam là rất lớn, nên ta không thể tiến hành đo tất cả được,
mà ta chỉ chọn ra một số người (chẳng hạn 200 người) để đo. Tập gồm 200 người này được gọi
là một mẫu, số 200 được gọi là kích thước mẫu.
u. Ví dụ 5.9 Vào ngày 19 tháng 7 năm 1966, tại hồ Muskoka người ta chọn ngẫu nhiên 6 ngư dân và số cá hồi họ đánh bắt được lần lượt là 3, 4, 5, 6, 6 và 7. Tính phương sai của mẫu số liệu trên. Giải Chúng ta nhận thấy å å = = === 6 1 6 1 2 6,31,171 i i ii nxx . Do đó 6 13 )5)(6( )31()171)(6( 22 =-=s 5.3 Phân phối của các thống kê cơ bản 5.3.1 Phân phối của trung bình mẫu Giả sử một mẫu ngẫu nhiên cỡ n được lấy từ tổng thể chuẩn với kỳ vọng là m và phương sai là 2s . Ta có các biến ngẫu nhiên thành phần Xi (i = 1, 2, .., n) trong mẫu ngẫu nhiên đều có phân phối chuẩn với kỳ vọng và phương sai lần lượt là m , 2s nên n XXX X n L++ = 21 có phân phối chuẩn với kỳ vọng là ... X n m m m m m + + + = = và phương sai là 2 2 2 2 2 2 ... x n n s s s s s + + + = = Điều rất đặc biệt là khi chúng ta lấy mẫu từ một tổng thể mà không biết gì về phân phối của tổng thể thì ta vẫn có phân phối của X là xấp xỉ chuẩn miễn sao cỡ mẫu đủ lớn. Đó là nội dung chính của định lý quan trọng sau đây Định lý 5.11 (Định lý giới hạn trung tâm) Nếu X là trung bình của một mẫu ngẫu nhiên có kích thước n được lấy từ một tổng thể có giá trị trung bình là μ và phương sai hữu hạn σ2, thì giới hạn của / XZ n m s - = khi n ® ¥ , là biến ngẫu nhiên tiêu chuẩn n(z; 0,1). Việc lấy xấp xỉ chuẩn cho biến ngẫu nhiên X chỉ tốt khi n ≥ 30. Nếu n < 30 thì việc lấy xấp xỉ chỉ tốt khi phân phối của tổng thể khá gần với phân phối chuẩn. Đặc biệt, nếu tổng thể có phân phối chuẩn thì ta không cần quan tâm đến cỡ của tổng thể và chắc chắn rằng X có phân phối chuẩn. Ví dụ 5.10 Một công ty điện sản xuất các loại bóng điện với tuổi thọ có phân phối xấp xỉ chuẩn, giá trị trung bình bằng 800 giờ và độ lệch tiêu chuẩn 40 giờ. Tìm xác suất để một mẫu ngẫu nhiên 16 bóng có tuổi thọ trung bình chưa đến 775 giờ. Giải Phân phối của X sẽ xấp xỉ chuẩn với 800Xm = và 40 / 16 10Xs = = . Xác suất cần tìm được cho trong miền gạch chéo trong hình sau Tương ứng với 775x = , chúng ta nhận thấy rằng 775 800 2.5 10 z -= = - và vì thế ( 775) ( 2.5) 0.0062P X P Z< = < - = Suy diễn về giá trị trung bình của tổng thể Ví dụ 5.11 Một dây chuyền sản xuất ra các xy lanh cho ngành công nghiệp ô tô. Theo thiết kế dây chuyền này sản xuất ra các xy lanh có đường kính trung bình bằng 5 mi-li-mét. Sau một thời gian hoạt động, một kỹ sư có liên quan phát biểu rằng giá trị trung bình của tổng thể là 5 mi-li- mét. Người ta cho sản xuất thử 100 linh kiện và thu được đường kính trung bình mẫu 5,027=x mi-li-mét. Liệu thông tin mẫu này hỗ trợ hay bác bỏ lại phỏng đoán của kỹ sư nói trên? Biết rằng độ lệch tiêu chuẩn tổng thể σ = 0.1. Giải Thông tin từ mẫu hỗ trợ hay bác bỏ lại phỏng đoán của người kỹ sư là tùy thuộc vào việc xác suất để một mẫu tương tự như trong thử nghiệm trên ( 5.027x = ) có lớn hay không, với giả thiết là μ= 5.0. Tức là, một mẫu cụ thể có giá trị trung bình mẫu thỏa mãn 5.027x ³ với n = 100 và giá trị trung bình tổng thể là μ=5.0, có thường xuyên xảy ra hay không? Nếu xác suất này cho ta thấy rằng 5.027x = là không vô lý, thì dự đoán không bị bác bỏ. Nếu xác suất này rất thấp, thì dữ liệu này không cho thấy dự đoán rằng μ=5.0 là đúng. Xác suất mà chúng ta chọn để tính toán là Pr[| X -5| ≥ 0.027]. Nói cách khác, nếu giá trị trung bình μ là 5 thì xác suất để X sẽ lệch so với trung bình nhiều nhất là 0.027 mi-li-mét bằng bao nhiêu? [ ] ú û ù ê ë é ³ - =-£-+³-=³- 7.2 100/1.0 52]027.05[]027.05[027.0|5| XPXPXPXP Nếu phát biểu của người kỹ sư mà đúng, thì ta đang có trung bình của tổng thể là 5 và do đó theo định lý giới hạn trung tâm ta được 5 0.1/ 100 X - có phân phối xấp xỉ tiêu chuẩn . Vì thế Pr[| X -5| ≥ 0.027] = [ ]52 2.7 2 2.7 2(0.0035) 0.007 0.1/ 100 XP P Z é ùæ ö- ³ = ³ = =ê úç ÷ ê úè øë û Như vậy biến cố x lệch khỏi vị trí trung bình là 0.027 chỉ xảy ra khoảng 7 lần trong 1000 lần lấy mẫu. Vậy mà trong thử nghiệm cho thấy điều đó đã xảy ra nên 5.027x = là một thông tin bác bỏ khẳng định rằng μ=5.0. Phân phối của hiệu hai trung bình Một nhà khoa học hoặc một kỹ sư quan tâm đến việc so sánh hai phương thức sản xuất dựa vào giá trị trung bình của sản phẩm. Trong tình huống này, ta so sánh trung bình của hai tổng thể. Cơ sở để so sánh chính là hiệu hai trung bình tổng thể μ1 - μ2 . Giả sử ta có hai tổng thể, tổng thể thứ nhất có trung bình là μ1 và phương sai 21s còn tổng thể thứ hai có trung bình là μ2 và phương sai là 22s . Đặt 1X và 2X lần lượt là trung bình mẫu được lấy từ tổng thể thứ nhất và thứ hai, hai mẫu được lấy một cách ngẫu nhiên và độc lập với cỡ mẫu lần lượt là n1, n2. Hiệu 21 XX - có phân phối dạng gì? Định lý 5.11 cho ta biết 1X và 2X là các biến ngẫu nhiên có phân phối tiệm cận tiêu chuẩn với trung bình 21 ; mm phương sai là 2 2 21 2 1 /;/ nn ss . Do đó Định lý 5.12 Nếu các mẫu độc lập có kích thước n1 và n2 được lấy ngẫu nhiên từ hai tổng thể, rời rạc hoặc liên tục, có các giá trị trung bình μ1 ; μ2, các phương sai 21s ; 22s tương ứng, thì phân phối của 1 2X X- là xấp xỉ chuẩn có giá trị trung bình và phương sai là 2121 mmm -=- XX và 1 2 2 2 2 1 2 1 2 - = +X X n n s s s Do đó 1 2 1 2 2 2 1 1 2 2 ( ) ( ) ( / ) ( / ) X XZ n n m m s s - - - = + có phân phối xấp xỉ phân phối tiêu chuẩn khi n đủ lớn. Nếu n1 và n2 cùng lớn hơn 30 thì xấp xỉ phân phối chuẩn cho 1 2X X- là tốt. Nếu n1 hoặc n2 nhỏ hơn 30 thì việc xấp xỉ chuẩn nói trên vẫn còn tốt trừ khi cả hai tổng thể đều khác phân phối chuẩn một cách rõ rệt. Đặc biệt, cả hai tổng thể đều có phân phối chuẩn thì ta không cần phải quan tâm đến cỡ mẫu. Ví dụ 5.12 Đàn ông của dân tộc A có chiều cao trung bình là 179cm với độ lệch chuẩn là 12cm. Đàn ông dân tộc B có chiều cao trung bình là 177cm với độ lệch chuẩn là 8cm. Chọn ngẫu nhiên 32 người từ dân tộc A với trung bình mẫu là X và một mẫu ngẫu nhiên 75 người từ dân tộc B với trung bình mẫu là Y . Tính xác suất để Y > X . Giải X có μ1 = 179 và 21s = 12 2; Y có μ2 = 177 và 22s = 8 2 Nên X - Y có trung bình là 17717921 -=- mm = 2 và độ lệch chuẩn là 314.2 75 64 32 144 =+ P[Y > X ] = P[ X - Y < 0] = P[ Z < 314.2 2- ] » 0.19355. 5.3.2 Phân phối của phương sai mẫu Trước tiên, ta định nghĩa phân phối Khi-bình phương. Định nghĩa 5.13 Biến ngẫu nhiên liên tục X được gọi là biến ngẫu nhiên có phân phối Khi-bình phương với u bậc tự do nếu hàm mật độ của nó có dạng: ïî ï í ì £ > G= - - 0 khi 0 0khi )2/(2 1 )( 2 1 2 2/ x xexxf xu u u trong đó u là một số nguyên dương. Định lý 5.14 Nếu S2 là phương sai của mẫu ngẫu nhiên cỡ n được chọn từ một tổng thể có phân phối chuẩn với phương sai σ2, thì thống kê 22 n 2 i 2 2 i 1 (X X)(n 1)S = -- c = = s så có phân phối Khi-bình phương với u = n -1 bậc tự do. Giá trị của biến ngẫu nhiên 2c được tính với mỗi mẫu cụ thể là theo công thức 2 2 2 (n 1)s- c = s + Bảng A.5 cho ta một số giá trị 2ac sao cho P[ 2c > 2ac ] = a , với một số giá trị a và u . 5.3.3 Phân phối t Định lý 5.15 Cho Z là biến ngẫu nhiên tiêu chuẩn và V là một biến ngẫu nhiên Khi-bình phương với u bậc tự Do. Nếu Z và V độc lập thì phân phối của biến ngẫu nhiên T với u/V ZT = có hàm mật độ +¥<<¥-÷÷ ø ö çç è æ + G +G = +- ttth ,1 )2/( ]2/)1[()( 2/)1(2 u upuu u và được gọi là biến ngẫu nhiên có phân phối t. Hệ quả Giả sử X1 , X2 , , Xn là các biến ngẫu nhiên độc lập, cùng phân phối chuẩn với giá trị trung bình μ và độ lệch chuẩn σ. Đặt å = = n i i n XX 1 và å = - - = n i i n XXS 1 2 2 1 )( Khi đó biến ngẫu nhiên XT S/ n - m = có một phân phối t với v = n-1 bậc tự do + Nếu T là biến ngẫu nhiên có phân phối t, thì Bảng A.4 ghi các kết quả tính sẵn một số giá trị at sao cho P[T > at ] = a . Do tính đối xứng của phân phối qua trục tung, ta có aa tt -=-1 . 5.3.4 Phân phối F Định lý 5.16 Giả sử U và V là hai biến ngẫu nhiên độc lập có các phân bố Khi-bình phương với 1u và 2u các bậc tự do tương ứng. Khi đó phân bố của biến ngẫu nhiên 2 1 / / u u V UF = được cho bởi ïî ï í ì £ +¥<< +GG +G = + - 0khi0 0khi )/1()2/()2/( )/](2/)[( )( 2/)( 21 12/ 21 2/ 2121 21 11 f f f f fh uu uu uuuu uuuu Phân bố này được gọi là phân bố F với 1u và 2u bậc tự do. Nếu F là biến ngẫu nhiên có phân phối F với 1u và 2u bậc tự do, thì Bảng A.6 cho ta một số giá trị af thỏa mãn P[F > af ] =a với a = 0.05, a = 0.01 cùng với một số cặp 1u , 2u . Chẳng hạn 1u = 6 và 2u = 10 ta có 22.305.0 =f . Định lý sau cho phép ta tìm được 99.095.0 , ff . Định lý 5.17 af được ký hiệu là ),( 21 uuaf . Ta có ),( 1),( 12 211 uu uu a a f f =- Định lý 5.18 Nếu 21S và 2 2S là các phương sai của các mẫu ngẫu nhiên độc lập có kích thước n1 và n2 được lấy từ các tổng thể chuẩn có các phương sai 21s và 2 2s tương ứng, khi đó 2 2 2 2 1 1 2 1 2 2 2 2 2 2 1 2 S / SF S / S s s = = s s có phân bố F với v1=n1-1 và v2= n2-1 bậc tự do. Các ý chính trong Bài giảng tuần 8 + Mẫu ngẫu nhiên + Thống kê mẫu + Phân phối xác suất của một số thống kê thường gặp. Đọc thêm: Cách dùng máy CASIO fx 500MS9 (các máy khác thì đọc trong hướng dẫn của loại máy đó), để tính trung bình, phương sai và độ lệch chuẩn. + Cho mẫu cụ thể x1, x2,.., xn. Giả sử trong đó có m1 số bằng x1, ta nói m1 là tần số của x1, tương tự cho các số khác. Ta lập được bảng X x1 . xk Tần số m1 mk Chú ý m1 + m2++ mk = n. + Dùng máy để tính: 1) Để vào chế độ tính toán thống kê, ta ấn Mode 2 2) Nếu mẫu chưa được lập thành bảng tần số x1, x2,.., xn, thì ta nhập số liệu như sau: x1 DT x2 DT ,, xn DT Nếu mẫu đã được lập thành bảng: x1 SHIFT ; n1 DT x2 SHIFT ; n2 DT. xk SHIFT ; nk DT 3) Nhập dữ liệu xong, để tính số trung bình x , ta ấn SHIFT S-Var 1 = 4) Tính độ lệch chuẩn s: SHIFT S-Var 1 = 5) Tính phương sai s2: x2 =
File đính kèm:
- bai_giang_toan_5_xac_suat_thong_ke_tuan_8_nguyen_van_dac.pdf