Bài giảng Xác suất và thống kê - Đoàn Vương Nguyên

− Mẫu không lặp: các phần tửcủa mẫu chỉcó mặt một

lần (các phần tửkhác nhau từng ñôi một).

− Mẫu có lặp: các phần tửcủa mẫu có thểlặp lại nhiều

lần trong mẫu.

− Mẫu không thứtự: khi thay ñổi vịtrí các phần tửkhác

nhau của mẫu ta không nhận ñược mẫu mới.

− Mẫu có thứ tự: khi thay ñổi vị trí các phần tử khác

nhau của mẫu ta nhận ñược mẫu mới.

pdf22 trang | Chuyên mục: Xác Suất Thống Kê | Chia sẻ: dkS00TYs | Lượt xem: 2580 | Lượt tải: 5download
Tóm tắt nội dung Bài giảng Xác suất và thống kê - Đoàn Vương Nguyên, để xem tài liệu hoàn chỉnh bạn click vào nút "TẢI VỀ" ở trên
 nghĩa 5%, có thể ñem cây ra 
trồng ñược chưa ? 
1.4. Kiểm ñịnh giả thiết phương sai tổng thể có phân 
phối chuẩn 2σ (tham khảo) 
Với 20σ cho trước, ta thực hiện các bước sau: 
• ðặt giả thiết H: 2 20σ = σ (nghĩa là phương sai tổng thể 
như phương sai cho trước). 
• Từ mẫu ta tính giá trị kiểm ñịnh 
2
2
2
0
(n 1)s−
χ =
σ
. 
• Từ D 2 2n 1 n 11 , 12 2 2− −
   α α α  − α ⇒ →χ χ −        
. 
• Nếu 2 2 2n 1 n 1 12 2− −
   α α  χ < χ < χ −        
 ta chấp nhận 
giả thiết, ngược lại thì bác bỏ giả thiết. 
• Trong trường hợp bác bỏ, nếu 2 20s > σ thì kết luận 
2 2
0σ > σ và 
2 2
0s < σ thì 
2 2
0σ < σ . 
VD 10. Tiến hành 25 quan sát về chỉ tiêu X của 1 loại 
sản phẩm, ta tính ñược s2 = 416,667. Có tài liệu nói rằng 
phương sai của chỉ tiêu X là 400. Với mức ý nghĩa 3%, 
cho nhận xét về tài liệu này? 
§2. KIỂM ðỊNH SO SÁNH HAI ðẶC TRƯNG 
2.1. So sánh hai tỉ lệ px và py của hai tổng thể X, Y 
• ðặt giả thiết H: px = py. 
• Từ 2 mẫu ta tính xx
x
m
f
n
= , yy
y
m
f
n
= , 
x y
0
x y
m m
p
n n
+
=
+
 (tỉ lệ thực nghiệm chung của hai mẫu). 
• Tính 0 0q 1 p= − 
x y
0 0
x y
f f
t
1 1
p q
n n
−
⇒ =
   +   
 (giá trị kiểm ñịnh). 
 • Nếu t tα≤ thì chấp nhận H x yp p⇒ = ; 
 nếu x y
x y
t t
p p
f f
α
 > ⇒ < <
; nếu x y
x y
t t
p p
f f
α
 > ⇒ > >
. 
VD 1. Từ hai tổng thể X1, X2 tiến hành 2 mẫu có kích 
thước n1 = 100, n2 = 120 ta tính ñược f1 = 0,2 và f2 = 0,3. 
Với mức ý nghĩa 1% hãy so sánh hai tỉ lệ của hai tổng 
thể ñó. 
VD 2. Kiểm tra 120 sinh viên trường A thấy có 80 sinh 
viên giỏi, 150 sinh viên trường B có 90 sinh viên giỏi. 
Hỏi tỉ lệ sinh viên giỏi của 2 trường như nhau không với 
mức ý nghĩa là 5%? 
VD 3. Kiểm tra 120 sản phẩm ở kho I thấy có 6 phế 
phẩm. Kiểm tra 200 sản phẩm ở kho II thấy có 24 phế 
phẩm. Chất lượng hàng ở hai kho có khác nhau không 
với: 1) Mức ý nghĩa 5% ? 2) Mức ý nghĩa 1% ? 
2.2. So sánh hai trung bình µx và µy của hai tổng thể 
Tóm tắt 4 trường hợp (chấp nhận hay bác bỏ giả thiết 
như bài kiểm ñịnh trung bình): 
• ðặt giả thiết H: µx = µy. 
Trường hợp 1. x yn , n 30≥ và 
2 2
x y, σ σ ñã biết. 
• Từ 2 mẫu cụ thể ta tính kiểm ñịnh 
22
yx
x y
x y
t
n n
−
=
σσ
+
 và 
so sánh với tα . 
Trường hợp 2. x yn , n 30≥ và 
2 2
x y, σ σ chưa biết. 
Ta thay 2 2x y, σ σ bởi 
2 2
x ys , s trong trường hợp 1. 
Trường hợp 3. x yn , n 30< và 
2 2
x y, σ σ ñã biết ñồng 
thời X, Y có phân phối chuẩn (như trường hợp 1). 
Trường hợp 4. x yn , n 30< và 
2 2
x y, σ σ chưa biết; X, Y 
có phân phối chuẩn. 
• Tính phương sai mẫu chung chưa hiệu chỉnh của 2 mẫu 
2 2
x x y y2
x y
(n 1)s (n 1)s
s
n n 2
− + −
=
+ −
. 
• Tính giá trị kiểm ñịnh 
x y
x y
t
1 1
s.
n n
−
=
+
. 
• Từ x yn n 2C t + −αα → và so sánh với t. 
VD 4. Cân thử 100 trái cây ở nông trường I ta tính ñược 
2
xx 101,2gr; s 571,7= = và 361 trái cây ở nông 
trường II tính ñược 2yy 66,39gr; s 29,72= = . 
Hãy so sánh trọng lượng trung bình của trái cây ở 2 nông 
trường với mức ý nghĩa 1%. 
VD 5. ðo ñường kính 20 trục máy do máy I sản xuất và 
22 trục máy do máy II sản xuất ta tính ñược 
x 251,7mm= ; 2xs 52,853= và y 249,8mm= ; 
2
ys 56,2= . Có thể xem ñường kính trung bình của các 
trục máy ở 2 máy như nhau với mức ý nghĩa 1% không? 
w
w
w
.
v
i
e
t
m
a
t
h
s
.
c
o
m
w
w
w
.
v
i
e
t
m
a
t
h
s
.
c
o
m
ThS. Ñoaøn Vöông Nguyeân Slide baøi giaûng XSTK 
 Trang 21
VD 6. Khối lượng trung bình của 50 trái dưa hấu do xã 
A trồng là 6,72kg với sx = 0,72kg. Khối lượng trung bình 
của 80 trái dưa hấu do xã B trồng là 6,46kg với 
sy = 0,91kg. Với mức ý nghĩa 1% có kết luận khối lượng 
trung bình trái dưa hấu do xã A trồng nặng hơn không ? 
VD 7. Khối lượng trung bình của 23 trái dưa hấu do xã 
A trồng là 6,72kg với sx = 0,72kg. Khối lượng trung bình 
của 19 trái dưa hấu do xã B trồng là 6,46kg với 
sy = 0,91kg. Với mức ý nghĩa 1% có kết luận khối lượng 
trung bình trái dưa hấu do xã A trồng nặng hơn không ? 
 2.3. So sánh hai phương sai 2xσ và 2yσ của hai tổng 
thể (so sánh tỉ lệ phương sai) (tham khảo) 
• ðặt giả thiết H: 2 2x yσ = σ . 
• Tính giá trị kiểm ñịnh 
2
x
2
y
s
g
s
= . 
• Từ mức ý nghĩa α 
2
α
⇒ . 
 Tra bảng E ta tìm ñược x y
2
f f (n 1, n 1)α= − − . 
• Nếu g f ta bác bỏ giả 
thiết. 
• Trong trường hợp bác bỏ giả thiết: 
– Nếu 2 2x ys s> thì kết luận 
2 2
x yσ > σ và ngược lại. 
VD 8. Giá cổ phiếu là biến ngẫu nhiên có phân phối 
chuẩn. ðiều tra ngẫu nhiên giá cổ phiếu của công ty X 
trong 25 ngày tính ñược ñộ lệch tiêu chuẩn mẫu hiệu 
chỉnh là 7,5 ngàn ñồng; của công ty Y trong 22 ngày là 
6,2 ngàn ñồng. Với mức ý nghĩa 5%, hãy so sánh về ñộ 
rủi ro cổ phiểu của hai công ty trên. 
VD 9. Doanh số bán hàng (ñơn vị: triệu ñồng) của 1 
công ty A là biến ngẫu nhiên có phân phối chuẩn. Công 
ty A cho người theo dõi doanh số bán hàng trong 7 ngày 
ở vùng X thì tính ñược phương sai mẫu chưa hiệu chỉnh 
là 82,1; ở vùng Y trong 6 ngày thì tính ñược 25,3. 
Với mức ý nghĩa 3%, hãy so sánh ñộ rủi ro ñầu tư của 
công ty A ở hai vùng trên. 
Chương VII. LÝ THUYẾT TƯƠNG QUAN VÀ HÀM HỒI QUY 
1. Hệ số tương quan giữa X và Y 
• ðể minh họa cho vấn ñề, chúng ta thử xem xét nghiên 
cứu sau ñây mà trong ñó nhà nghiên cứu ño lường ñộ 
cholesterol (Y) trong máu của 10 ñối tượng nam ở ñộ 
tuổi (X). 
Kết quả ño lường như sau: 
X 20 52 30 57 28 
Y 1,9 4,0 2,6 4,5 2,9 
X 43 57 63 40 49 
Y 3,8 4,1 4,6 3,2 4,0 
Biểu ñồ liên hệ giữa ñộ tuổi và ñộ cholesterol: 
Biểu ñồ trên ñây gợi ý cho thấy mối liên hệ giữa ñộ tuổi 
(X) và cholesterol (Y) là một ñường thẳng (tuyến tính). 
• ðể “ño lường” mối liên hệ này, chúng ta có thể sử 
dụng hệ số tương quan: 
n
i i
i 1
xy n n 2 2
x y2 2
i i
i 1 i 1
(x x)(y y)
xy x.y
r
s .s
(x x) (y y)
=
= =
− −
−
= =
− −
∑
∑ ∑
⌢ ⌢
. 
Trong ñó ij i i
i 1
j 1
1
xy n x
n
y
=
=
= ∑ , ijn n= ∑ . 
Chú ý. 2 2x ys .s⌢ ⌢ có sai số bé hơn x ys .s⌢ ⌢ . 
Ý nghĩa 
• Hệ số tương quan ño mối quan hệ tuyến tính giữa x, y. 
1) xy1 1r− ≤ ≤ . 
2) Nếu xyr 0= thì hai biến số không có quan hệ tuyến 
tính; nếu xyr 1= ± thì hai biến số có quan hệ tuyến tính 
tuyệt ñối. 
3) Nếu xyr 0< thì quan hệ giữa x, y là giảm biến 
 (có nghĩa là khi x tăng thì y giảm). 
4) Nếu xyr 0> thì quan hệ giữa x, y là ñồng biến 
 (có nghĩa là khi x tăng thì y cũng tăng). 
w
w
w
.
v
i
e
t
m
a
t
h
s
.
c
o
m
w
w
w
.
v
i
e
t
m
a
t
h
s
.
c
o
m
ThS. Ñoaøn Vöông Nguyeân Slide baøi giaûng XSTK 
 Trang 22
VD 1. Tính hệ số tương quan giữa ñộ tuổi và cholesterol 
cho ở bảng trên. Ta có: 
n
i 1
ix
1
x 43
n
,9
=
= =∑ ; 
n
i 1
iy
1
y 3,
n
56
=
= =∑ ; 
ij i i
i 1
j 1
xy y 167,2
1
6n x
n =
=
= =∑ ; 
2
xs 183,29=
⌢ ; 2ys 0,6944=
⌢
. 
Vậy xy 2 2
x y
xy x.y
r 0,9729
s .s
−
= =
⌢ ⌢
. 
2. ðường thẳng hồi qui 
• ðể tiện việc theo dõi và mô tả mô hình, gọi ñộ tuổi cho 
cá nhân i là xi và cholesterol là yi, i 1,10= . 
– Các ñiểm có tọa ñộ (xi; yi) tạo thành ñường gấp khúc 
và gần với ñường thẳng có dạng y = ax + b. Người ta 
dùng ñường thẳng y = ax + b ñể tính xấp xỉ các giá trị yi 
theo xi: i i iy ax b= + ε+ với một sai số iε , ñường 
thẳng này ñược gọi là ñường thẳng hồi quy. 
– Các thông số a, b phải ñược ước tính từ dữ liệu. 
Phương pháp ñể ước tính các thông số này là phương 
pháp bình phương bé nhất. Phương pháp bình phương bé 
nhất là tìm giá trị a, b sao cho tổng bình phương sai số 
n n
i 1 i 1
22
i i i(axy b)
= =
 ε  = − +∑ ∑ là nhỏ nhất. 
– Ước lượng cho a, b ñáp ứng ñiều kiện trên là: 
2
x
xy x.y
a , b y ax
s
−
= = −⌢ . 
Chú ý 
x
xy
y x
y y x x
r
s s
− −
=⌢ ⌢ . 
VD 2. ðo chiều cao X(m) và khối lượng Y(kg) của 5 học 
sinh, ta có kết quả: 
X(m) 1,45 1,6 1,5 1,65 1,55 
Y(kg) 50 55 45 60 55 
a) Tìm hệ số tương quan rxy. 
b) Lập phương trình hồi quy tuyến tính của Y theo X. 
c) Dự ñoán nếu một học sinh cao 1,62m thì nặng khoảng 
bao nhiêu kg? 
VD 3. Số vốn ñầu tư X(triệu ñồng) và lợi nhuận Y(triệu 
ñồng) trong một ñơn vị thời gian của 100 quan sát là: 
 Y 
 X 
0,3 
0,7 
1,0 
1 20 10 
2 30 10 
3 10 20 
a) Lập phương trình hồi tuyến tính của X theo Y. 
b) Dự ñoán nếu muốn lợi nhuận thu ñược là 0,5 triệu 
ñồng thì cần ñầu tư bao nhiêu? 
VD 4. Số thùng bia Y(thùng) ñược bán ra phụ thuộc vào 
giá bán X (triệu ñồng/ thùng). ðiều tra 100 ñại lý về 1 
loại bia trong một ñơn vị thời gian có bảng số liệu: 
 Y 
 X 
100 
110 
120 
0,150 5 15 30 
0,160 10 25 
0,165 15 
a) Tính hệ số tương quan rxy. 
b) Lập phương trình hồi tuyến tính của X theo Y. 
c) Dự ñoán nếu muốn bán ñược 115 thùng bia thì giá bán 
mỗi thùng cỡ bao nhiêu? 
3. Sử dụng máy tính tìm ñường hồi qui 
VD 5. (fx 500ES) Bài toán cho dạng cặp i i(x , y )như sau 
X 20 52 30 57 28 43 57 63 40 49 
Y 1,9 4 2,6 4,5 2,9 3,8 4,1 4,6 3,2 4 
Tìm hệ số xyr , ñường hồi qui mẫu xy ax b= + . 
Nhập liệu: 
SHIFT -> MODE -> dịch chuyển mũi tên tìm chọn mục 
Stat-> 2 (chế ñộ không tần số) 
MODE->2 (stat) ->2 (A+Bx) -> (nhập các giá trị của X, 
Y vào 2 cột) 
 X Y 
 20 1,9 
 … … 
 49 4 
Xuất kết quả: 
SHIFT - > 1 -> 7 ->1(A chính là b trong phương trình) 
 - >2 (B chính là a trong phương trình) 
 -> 3 (r chính là xyr ). 
VD 6. (fx 500ES) Bài toán cho dạng bảng như sau 
 X 
Y 
21 23 25 
3 2 
4 5 3 
5 11 8 
Nhập liệu: 
SHIFT -> MODE -> dịch chuyển mũi tên tìm chọn muc 
Stat-> 1 (chế ñộ có tần số) 
MODE->2 (stat) ->2 (A+Bx) -> (nhập các giá trị của X, 
Y, tần số vào 2 cột) 
 X Y FREQ 
 21 3 2 
 21 4 5 
 23 4 3 
 23 5 11 
 25 5 8 
Xuất kết quả giống ví dụ trên. 
------------------------------------Hết-------------------------------------- 
w
w
w
.
v
i
e
t
m
a
t
h
s
.
c
o
m
w
w
w
.
v
i
e
t
m
a
t
h
s
.
c
o
m

File đính kèm:

  • pdfBài giảng Xác suất và thống kê - Đoàn Vương Nguyên.pdf