Bài giảng Toán 5 Xác suất & Thống kê - Tuần 8 - Nguyễn Văn Đắc

5.1 Mẫu ngẫu nhiên

Trước hết ta xét tình huống sau: Để có một chiến lược cho chương trình dinh dưỡng quốc gia

nhằm tăng chiều cao của người dân, người ta đi tìm hiểu về chiều cao của người trưởng thành ở

Việt Nam.

Trong tình huống trên:

a) Tập hợp gồm các người trưởng thành ở Việt Nam, ta gọi là tổng thể hoặc dân số.

b) Mỗi người trong tổng thể, được gọi là một cá thể.

c) Chiều cao của người trong tổng thể chính là một biến ngẫu nhiên.

d) Do số người trưởng thành ở Việt Nam là rất lớn, nên ta không thể tiến hành đo tất cả được,

mà ta chỉ chọn ra một số người (chẳng hạn 200 người) để đo. Tập gồm 200 người này được gọi

là một mẫu, số 200 được gọi là kích thước mẫu.

13 trang | Chuyên mục: Xác Suất Thống Kê | Chia sẻ: tuando | Lượt xem: 916 | Lượt tải: 0

Tóm tắt nội dung Bài giảng Toán 5 Xác suất & Thống kê - Tuần 8 - Nguyễn Văn Đắc, để xem tài liệu hoàn chỉnh bạn click vào nút "TẢI VỀ" ở trên

u. 
Ví dụ 5.9 Vào ngày 19 tháng 7 năm 1966, tại hồ Muskoka người ta chọn ngẫu nhiên 6 ngư dân 
và số cá hồi họ đánh bắt được lần lượt là 
3, 4, 5, 6, 6 và 7. 
Tính phương sai của mẫu số liệu trên. 
Giải Chúng ta nhận thấy å å
= =
===
6
1
6
1
2 6,31,171
i i
ii nxx . Do đó 
6
13
)5)(6(
)31()171)(6( 22 =-=s 
5.3 Phân phối của các thống kê cơ bản 
 5.3.1 Phân phối của trung bình mẫu 
Giả sử một mẫu ngẫu nhiên cỡ n được lấy từ tổng thể chuẩn với kỳ vọng là m và phương sai là
2s . Ta có các biến ngẫu nhiên thành phần Xi (i = 1, 2, .., n) trong mẫu ngẫu nhiên đều có phân 
phối chuẩn với kỳ vọng và phương sai lần lượt là m , 2s nên 
n
XXX
X n
L++
= 21 
có phân phối chuẩn với kỳ vọng là 
...
X n
m m m
m m
+ + +
= = 
và phương sai là 
2 2 2 2
2
2
...
x n n
s s s s
s
+ + +
= =
 Điều rất đặc biệt là khi chúng ta lấy mẫu từ một tổng thể mà không biết gì về phân phối của tổng 
thể thì ta vẫn có phân phối của X là xấp xỉ chuẩn miễn sao cỡ mẫu đủ lớn. Đó là nội dung chính 
của định lý quan trọng sau đây 
Định lý 5.11 (Định lý giới hạn trung tâm) 
 Nếu X là trung bình của một mẫu ngẫu nhiên có kích thước n được lấy từ một tổng thể 
có giá trị trung bình là μ và phương sai hữu hạn σ2, thì giới hạn của 
/
XZ
n
m
s
-
=
 khi n ® ¥ , là biến ngẫu nhiên tiêu chuẩn n(z; 0,1).
Việc lấy xấp xỉ chuẩn cho biến ngẫu nhiên X chỉ tốt khi n ≥ 30. Nếu n < 30 thì việc lấy xấp xỉ 
chỉ tốt khi phân phối của tổng thể khá gần với phân phối chuẩn. Đặc biệt, nếu tổng thể có phân 
phối chuẩn thì ta không cần quan tâm đến cỡ của tổng thể và chắc chắn rằng X có phân phối 
chuẩn. 
Ví dụ 5.10 Một công ty điện sản xuất các loại bóng điện với tuổi thọ có phân phối xấp xỉ chuẩn, 
giá trị trung bình bằng 800 giờ và độ lệch tiêu chuẩn 40 giờ. Tìm xác suất để một mẫu ngẫu 
nhiên 16 bóng có tuổi thọ trung bình chưa đến 775 giờ. 
Giải Phân phối của X sẽ xấp xỉ chuẩn với 800Xm = và 40 / 16 10Xs = = . Xác suất cần tìm 
được cho trong miền gạch chéo trong hình sau 
Tương ứng với 775x = , chúng ta nhận thấy rằng 
775 800 2.5
10
z -= = - 
và vì thế 
( 775) ( 2.5) 0.0062P X P Z< = < - = 
Suy diễn về giá trị trung bình của tổng thể 
Ví dụ 5.11 Một dây chuyền sản xuất ra các xy lanh cho ngành công nghiệp ô tô. Theo thiết kế 
dây chuyền này sản xuất ra các xy lanh có đường kính trung bình bằng 5 mi-li-mét. Sau một thời 
gian hoạt động, một kỹ sư có liên quan phát biểu rằng giá trị trung bình của tổng thể là 5 mi-li-
mét. Người ta cho sản xuất thử 100 linh kiện và thu được đường kính trung bình mẫu 5,027=x
mi-li-mét. Liệu thông tin mẫu này hỗ trợ hay bác bỏ lại phỏng đoán của kỹ sư nói trên? Biết rằng 
độ lệch tiêu chuẩn tổng thể σ = 0.1. 
Giải Thông tin từ mẫu hỗ trợ hay bác bỏ lại phỏng đoán của người kỹ sư là tùy thuộc vào việc 
xác suất để một mẫu tương tự như trong thử nghiệm trên ( 5.027x = ) có lớn hay không, với giả 
thiết là μ= 5.0. 
Tức là, một mẫu cụ thể có giá trị trung bình mẫu thỏa mãn 5.027x ³ với n = 100 và giá trị 
trung bình tổng thể là μ=5.0, có thường xuyên xảy ra hay không? Nếu xác suất này cho ta thấy 
rằng 5.027x = là không vô lý, thì dự đoán không bị bác bỏ. Nếu xác suất này rất thấp, thì dữ liệu 
này không cho thấy dự đoán rằng μ=5.0 là đúng. 
Xác suất mà chúng ta chọn để tính toán là 
Pr[| X -5| ≥ 0.027]. 
Nói cách khác, nếu giá trị trung bình μ là 5 thì xác suất để X sẽ lệch so với trung bình nhiều nhất 
là 0.027 mi-li-mét bằng bao nhiêu? 
[ ] ú
û
ù
ê
ë
é
³
-
=-£-+³-=³- 7.2
100/1.0
52]027.05[]027.05[027.0|5| XPXPXPXP 
Nếu phát biểu của người kỹ sư mà đúng, thì ta đang có trung bình của tổng thể là 5 và do đó theo 
định lý giới hạn trung tâm ta được 5
0.1/ 100
X - có phân phối xấp xỉ tiêu chuẩn . Vì thế 
Pr[| X -5| ≥ 0.027] = [ ]52 2.7 2 2.7 2(0.0035) 0.007
0.1/ 100
XP P Z
é ùæ ö-
³ = ³ = =ê úç ÷
ê úè øë û 
Như vậy biến cố x lệch khỏi vị trí trung bình là 0.027 chỉ xảy ra khoảng 7 lần trong 1000 lần lấy 
mẫu. Vậy mà trong thử nghiệm cho thấy điều đó đã xảy ra nên 5.027x = là một thông tin bác bỏ 
khẳng định rằng μ=5.0. 
Phân phối của hiệu hai trung bình 
Một nhà khoa học hoặc một kỹ sư quan tâm đến việc so sánh hai phương thức sản xuất dựa vào 
giá trị trung bình của sản phẩm. Trong tình huống này, ta so sánh trung bình của hai tổng thể. Cơ 
sở để so sánh chính là hiệu hai trung bình tổng thể μ1 - μ2 . 
Giả sử ta có hai tổng thể, tổng thể thứ nhất có trung bình là μ1 và phương sai 21s còn tổng thể thứ 
hai có trung bình là μ2 và phương sai là 22s . Đặt 1X và 2X lần lượt là trung bình mẫu được lấy 
từ tổng thể thứ nhất và thứ hai, hai mẫu được lấy một cách ngẫu nhiên và độc lập với cỡ mẫu lần 
lượt là n1, n2. Hiệu 21 XX - có phân phối dạng gì? Định lý 5.11 cho ta biết 1X và 2X là các 
biến ngẫu nhiên có phân phối tiệm cận tiêu chuẩn với trung bình 21 ; mm phương sai là 
2
2
21
2
1 /;/ nn ss . Do đó 
Định lý 5.12 
Nếu các mẫu độc lập có kích thước n1 và n2 được lấy ngẫu nhiên từ hai tổng thể, rời rạc hoặc liên 
tục, có các giá trị trung bình μ1 ; μ2, các phương sai 21s ; 22s tương ứng, thì phân phối của 
1 2X X- là xấp xỉ chuẩn có giá trị trung bình và phương sai là 
 2121 mmm -=- XX và 1 2
2 2
2 1 2
1 2
-
= +X X n n
s s
s 
Do đó 
1 2 1 2
2 2
1 1 2 2
( ) ( )
( / ) ( / )
X XZ
n n
m m
s s
- - -
=
+
có phân phối xấp xỉ phân phối tiêu chuẩn khi n đủ lớn. 
Nếu n1 và n2 cùng lớn hơn 30 thì xấp xỉ phân phối chuẩn cho 1 2X X- là tốt. Nếu n1 hoặc n2 
nhỏ hơn 30 thì việc xấp xỉ chuẩn nói trên vẫn còn tốt trừ khi cả hai tổng thể đều khác phân phối 
chuẩn một cách rõ rệt. Đặc biệt, cả hai tổng thể đều có phân phối chuẩn thì ta không cần phải 
quan tâm đến cỡ mẫu. 
Ví dụ 5.12 Đàn ông của dân tộc A có chiều cao trung bình là 179cm với độ lệch chuẩn là 12cm. 
Đàn ông dân tộc B có chiều cao trung bình là 177cm với độ lệch chuẩn là 8cm. 
Chọn ngẫu nhiên 32 người từ dân tộc A với trung bình mẫu là X và một mẫu ngẫu nhiên 75 
người từ dân tộc B với trung bình mẫu là Y . Tính xác suất để Y > X . 
Giải X có μ1 = 179 và 21s = 12
2; Y có μ2 = 177 và 22s = 8
2 
Nên X - Y có trung bình là 17717921 -=- mm = 2 và độ lệch chuẩn là 
314.2
75
64
32
144
=+ 
P[Y > X ] = P[ X - Y < 0] = P[ Z < 
314.2
2- ] » 0.19355. 
 5.3.2 Phân phối của phương sai mẫu 
Trước tiên, ta định nghĩa phân phối Khi-bình phương. 
Định nghĩa 5.13 
Biến ngẫu nhiên liên tục X được gọi là biến ngẫu nhiên có phân phối Khi-bình phương với u bậc 
tự do nếu hàm mật độ của nó có dạng: 
ïî
ï
í
ì
£
>
G=
-
-
0 khi 0
0khi
)2/(2
1
)(
2
1
2
2/
x
xexxf
xu
u u 
trong đó u là một số nguyên dương. 
Định lý 5.14 
Nếu S2 là phương sai của mẫu ngẫu nhiên cỡ n được chọn từ một tổng thể có phân phối chuẩn 
với phương sai σ2, thì thống kê 
22 n
2 i
2 2
i 1
(X X)(n 1)S
=
--
c = =
s så 
có phân phối Khi-bình phương với u = n -1 bậc tự do. 
 Giá trị của biến ngẫu nhiên 2c được tính với mỗi mẫu cụ thể là theo công thức 
2
2
2
(n 1)s-
c =
s 
+ Bảng A.5 cho ta một số giá trị 2ac sao cho P[ 
2c > 2ac ] = a , với một số giá trị a và u .
 5.3.3 Phân phối t 
Định lý 5.15 
Cho Z là biến ngẫu nhiên tiêu chuẩn và V là một biến ngẫu nhiên Khi-bình phương với u bậc tự 
Do. Nếu Z và V độc lập thì phân phối của biến ngẫu nhiên T với 
u/V
ZT = 
có hàm mật độ +¥<<¥-÷÷
ø
ö
çç
è
æ
+
G
+G
=
+-
ttth ,1
)2/(
]2/)1[()(
2/)1(2 u
upuu
u và được gọi là biến ngẫu nhiên 
có phân phối t. 
Hệ quả 
Giả sử X1 , X2 , , Xn là các biến ngẫu nhiên độc lập, cùng phân phối chuẩn với giá trị trung bình 
μ và độ lệch chuẩn σ. Đặt 
å
=
=
n
i
i
n
XX
1
 và å
= -
-
=
n
i
i
n
XXS
1
2
2
1
)( 
Khi đó biến ngẫu nhiên XT
S/ n
- m
= có một phân phối t với v = n-1 bậc tự do 
+ Nếu T là biến ngẫu nhiên có phân phối t, thì Bảng A.4 ghi các kết quả tính sẵn một số giá trị at 
sao cho P[T > at ] = a . Do tính đối xứng của phân phối qua trục tung, ta có aa tt -=-1 . 
 5.3.4 Phân phối F 
Định lý 5.16 
Giả sử U và V là hai biến ngẫu nhiên độc lập có các phân bố Khi-bình phương với 1u và 2u các 
bậc tự do tương ứng. Khi đó phân bố của biến ngẫu nhiên 
2
1
/
/
u
u
V
UF = được cho bởi 
ïî
ï
í
ì
£
+¥<<
+GG
+G
= +
-
0khi0
0khi
)/1()2/()2/(
 )/](2/)[(
)( 2/)(
21
12/
21
2/
2121
21
11
f
f
f
f
fh uu
uu
uuuu
uuuu
 Phân bố này được gọi là phân bố F với 1u và 2u bậc tự do. 
 Nếu F là biến ngẫu nhiên có phân phối F với 1u và 2u bậc tự do, thì Bảng A.6 cho ta một số giá 
trị af thỏa mãn P[F > af ] =a với a = 0.05, a = 0.01 cùng với một số cặp 1u , 2u . Chẳng hạn 
1u = 6 và 2u = 10 ta có 22.305.0 =f . Định lý sau cho phép ta tìm được 99.095.0 , ff . 
Định lý 5.17 
af được ký hiệu là ),( 21 uuaf . Ta có 
),(
1),(
12
211 uu
uu
a
a f
f =- 
Định lý 5.18 
Nếu 21S và 
2
2S là các phương sai của các mẫu ngẫu nhiên độc lập có kích thước n1 và n2 được lấy 
từ các tổng thể chuẩn có các phương sai 21s và 
2
2s tương ứng, khi đó 
2 2 2 2
1 1 2 1
2 2 2 2
2 2 1 2
S / SF
S / S
s s
= =
s s
có phân bố F với v1=n1-1 và v2= n2-1 bậc tự do. 
Các ý chính trong Bài giảng tuần 8 
+ Mẫu ngẫu nhiên 
+ Thống kê mẫu 
+ Phân phối xác suất của một số thống kê thường gặp. 
Đọc thêm: Cách dùng máy CASIO fx 500MS9 (các máy khác thì đọc trong hướng dẫn của loại máy đó), 
để tính trung bình, phương sai và độ lệch chuẩn. 
+ Cho mẫu cụ thể x1, x2,.., xn. Giả sử trong đó có m1 số bằng x1, ta nói m1 là tần số của x1, tương tự cho 
các số khác. Ta lập được bảng 
X x1 . xk 
Tần số m1  mk 
Chú ý m1 + m2++ mk = n. 
+ Dùng máy để tính: 
1) Để vào chế độ tính toán thống kê, ta ấn 
Mode 2 
2) Nếu mẫu chưa được lập thành bảng tần số x1, x2,.., xn, thì ta nhập số liệu như sau: 
x1 DT x2 DT ,, xn DT 
 Nếu mẫu đã được lập thành bảng: 
x1 SHIFT ; n1 DT x2 SHIFT ; n2 DT. xk SHIFT ; nk DT 
3) Nhập dữ liệu xong, để tính số trung bình x , ta ấn 
SHIFT S-Var 1 = 
4) Tính độ lệch chuẩn s: 
 SHIFT S-Var 1 = 
5) Tính phương sai s2: 
 x2 =

File đính kèm:

bai_giang_toan_5_xac_suat_thong_ke_tuan_8_nguyen_van_dac.pdf