Bài giảng Xác suất và thống kê - Đoàn Vương Nguyên
− Mẫu không lặp: các phần tửcủa mẫu chỉcó mặt một
lần (các phần tửkhác nhau từng ñôi một).
− Mẫu có lặp: các phần tửcủa mẫu có thểlặp lại nhiều
lần trong mẫu.
− Mẫu không thứtự: khi thay ñổi vịtrí các phần tửkhác
nhau của mẫu ta không nhận ñược mẫu mới.
− Mẫu có thứ tự: khi thay ñổi vị trí các phần tử khác
nhau của mẫu ta nhận ñược mẫu mới.
nghĩa 5%, có thể ñem cây ra trồng ñược chưa ? 1.4. Kiểm ñịnh giả thiết phương sai tổng thể có phân phối chuẩn 2σ (tham khảo) Với 20σ cho trước, ta thực hiện các bước sau: • ðặt giả thiết H: 2 20σ = σ (nghĩa là phương sai tổng thể như phương sai cho trước). • Từ mẫu ta tính giá trị kiểm ñịnh 2 2 2 0 (n 1)s− χ = σ . • Từ D 2 2n 1 n 11 , 12 2 2− − α α α − α ⇒ →χ χ − . • Nếu 2 2 2n 1 n 1 12 2− − α α χ < χ < χ − ta chấp nhận giả thiết, ngược lại thì bác bỏ giả thiết. • Trong trường hợp bác bỏ, nếu 2 20s > σ thì kết luận 2 2 0σ > σ và 2 2 0s < σ thì 2 2 0σ < σ . VD 10. Tiến hành 25 quan sát về chỉ tiêu X của 1 loại sản phẩm, ta tính ñược s2 = 416,667. Có tài liệu nói rằng phương sai của chỉ tiêu X là 400. Với mức ý nghĩa 3%, cho nhận xét về tài liệu này? §2. KIỂM ðỊNH SO SÁNH HAI ðẶC TRƯNG 2.1. So sánh hai tỉ lệ px và py của hai tổng thể X, Y • ðặt giả thiết H: px = py. • Từ 2 mẫu ta tính xx x m f n = , yy y m f n = , x y 0 x y m m p n n + = + (tỉ lệ thực nghiệm chung của hai mẫu). • Tính 0 0q 1 p= − x y 0 0 x y f f t 1 1 p q n n − ⇒ = + (giá trị kiểm ñịnh). • Nếu t tα≤ thì chấp nhận H x yp p⇒ = ; nếu x y x y t t p p f f α > ⇒ < < ; nếu x y x y t t p p f f α > ⇒ > > . VD 1. Từ hai tổng thể X1, X2 tiến hành 2 mẫu có kích thước n1 = 100, n2 = 120 ta tính ñược f1 = 0,2 và f2 = 0,3. Với mức ý nghĩa 1% hãy so sánh hai tỉ lệ của hai tổng thể ñó. VD 2. Kiểm tra 120 sinh viên trường A thấy có 80 sinh viên giỏi, 150 sinh viên trường B có 90 sinh viên giỏi. Hỏi tỉ lệ sinh viên giỏi của 2 trường như nhau không với mức ý nghĩa là 5%? VD 3. Kiểm tra 120 sản phẩm ở kho I thấy có 6 phế phẩm. Kiểm tra 200 sản phẩm ở kho II thấy có 24 phế phẩm. Chất lượng hàng ở hai kho có khác nhau không với: 1) Mức ý nghĩa 5% ? 2) Mức ý nghĩa 1% ? 2.2. So sánh hai trung bình µx và µy của hai tổng thể Tóm tắt 4 trường hợp (chấp nhận hay bác bỏ giả thiết như bài kiểm ñịnh trung bình): • ðặt giả thiết H: µx = µy. Trường hợp 1. x yn , n 30≥ và 2 2 x y, σ σ ñã biết. • Từ 2 mẫu cụ thể ta tính kiểm ñịnh 22 yx x y x y t n n − = σσ + và so sánh với tα . Trường hợp 2. x yn , n 30≥ và 2 2 x y, σ σ chưa biết. Ta thay 2 2x y, σ σ bởi 2 2 x ys , s trong trường hợp 1. Trường hợp 3. x yn , n 30< và 2 2 x y, σ σ ñã biết ñồng thời X, Y có phân phối chuẩn (như trường hợp 1). Trường hợp 4. x yn , n 30< và 2 2 x y, σ σ chưa biết; X, Y có phân phối chuẩn. • Tính phương sai mẫu chung chưa hiệu chỉnh của 2 mẫu 2 2 x x y y2 x y (n 1)s (n 1)s s n n 2 − + − = + − . • Tính giá trị kiểm ñịnh x y x y t 1 1 s. n n − = + . • Từ x yn n 2C t + −αα → và so sánh với t. VD 4. Cân thử 100 trái cây ở nông trường I ta tính ñược 2 xx 101,2gr; s 571,7= = và 361 trái cây ở nông trường II tính ñược 2yy 66,39gr; s 29,72= = . Hãy so sánh trọng lượng trung bình của trái cây ở 2 nông trường với mức ý nghĩa 1%. VD 5. ðo ñường kính 20 trục máy do máy I sản xuất và 22 trục máy do máy II sản xuất ta tính ñược x 251,7mm= ; 2xs 52,853= và y 249,8mm= ; 2 ys 56,2= . Có thể xem ñường kính trung bình của các trục máy ở 2 máy như nhau với mức ý nghĩa 1% không? w w w . v i e t m a t h s . c o m w w w . v i e t m a t h s . c o m ThS. Ñoaøn Vöông Nguyeân Slide baøi giaûng XSTK Trang 21 VD 6. Khối lượng trung bình của 50 trái dưa hấu do xã A trồng là 6,72kg với sx = 0,72kg. Khối lượng trung bình của 80 trái dưa hấu do xã B trồng là 6,46kg với sy = 0,91kg. Với mức ý nghĩa 1% có kết luận khối lượng trung bình trái dưa hấu do xã A trồng nặng hơn không ? VD 7. Khối lượng trung bình của 23 trái dưa hấu do xã A trồng là 6,72kg với sx = 0,72kg. Khối lượng trung bình của 19 trái dưa hấu do xã B trồng là 6,46kg với sy = 0,91kg. Với mức ý nghĩa 1% có kết luận khối lượng trung bình trái dưa hấu do xã A trồng nặng hơn không ? 2.3. So sánh hai phương sai 2xσ và 2yσ của hai tổng thể (so sánh tỉ lệ phương sai) (tham khảo) • ðặt giả thiết H: 2 2x yσ = σ . • Tính giá trị kiểm ñịnh 2 x 2 y s g s = . • Từ mức ý nghĩa α 2 α ⇒ . Tra bảng E ta tìm ñược x y 2 f f (n 1, n 1)α= − − . • Nếu g f ta bác bỏ giả thiết. • Trong trường hợp bác bỏ giả thiết: – Nếu 2 2x ys s> thì kết luận 2 2 x yσ > σ và ngược lại. VD 8. Giá cổ phiếu là biến ngẫu nhiên có phân phối chuẩn. ðiều tra ngẫu nhiên giá cổ phiếu của công ty X trong 25 ngày tính ñược ñộ lệch tiêu chuẩn mẫu hiệu chỉnh là 7,5 ngàn ñồng; của công ty Y trong 22 ngày là 6,2 ngàn ñồng. Với mức ý nghĩa 5%, hãy so sánh về ñộ rủi ro cổ phiểu của hai công ty trên. VD 9. Doanh số bán hàng (ñơn vị: triệu ñồng) của 1 công ty A là biến ngẫu nhiên có phân phối chuẩn. Công ty A cho người theo dõi doanh số bán hàng trong 7 ngày ở vùng X thì tính ñược phương sai mẫu chưa hiệu chỉnh là 82,1; ở vùng Y trong 6 ngày thì tính ñược 25,3. Với mức ý nghĩa 3%, hãy so sánh ñộ rủi ro ñầu tư của công ty A ở hai vùng trên. Chương VII. LÝ THUYẾT TƯƠNG QUAN VÀ HÀM HỒI QUY 1. Hệ số tương quan giữa X và Y • ðể minh họa cho vấn ñề, chúng ta thử xem xét nghiên cứu sau ñây mà trong ñó nhà nghiên cứu ño lường ñộ cholesterol (Y) trong máu của 10 ñối tượng nam ở ñộ tuổi (X). Kết quả ño lường như sau: X 20 52 30 57 28 Y 1,9 4,0 2,6 4,5 2,9 X 43 57 63 40 49 Y 3,8 4,1 4,6 3,2 4,0 Biểu ñồ liên hệ giữa ñộ tuổi và ñộ cholesterol: Biểu ñồ trên ñây gợi ý cho thấy mối liên hệ giữa ñộ tuổi (X) và cholesterol (Y) là một ñường thẳng (tuyến tính). • ðể “ño lường” mối liên hệ này, chúng ta có thể sử dụng hệ số tương quan: n i i i 1 xy n n 2 2 x y2 2 i i i 1 i 1 (x x)(y y) xy x.y r s .s (x x) (y y) = = = − − − = = − − ∑ ∑ ∑ ⌢ ⌢ . Trong ñó ij i i i 1 j 1 1 xy n x n y = = = ∑ , ijn n= ∑ . Chú ý. 2 2x ys .s⌢ ⌢ có sai số bé hơn x ys .s⌢ ⌢ . Ý nghĩa • Hệ số tương quan ño mối quan hệ tuyến tính giữa x, y. 1) xy1 1r− ≤ ≤ . 2) Nếu xyr 0= thì hai biến số không có quan hệ tuyến tính; nếu xyr 1= ± thì hai biến số có quan hệ tuyến tính tuyệt ñối. 3) Nếu xyr 0< thì quan hệ giữa x, y là giảm biến (có nghĩa là khi x tăng thì y giảm). 4) Nếu xyr 0> thì quan hệ giữa x, y là ñồng biến (có nghĩa là khi x tăng thì y cũng tăng). w w w . v i e t m a t h s . c o m w w w . v i e t m a t h s . c o m ThS. Ñoaøn Vöông Nguyeân Slide baøi giaûng XSTK Trang 22 VD 1. Tính hệ số tương quan giữa ñộ tuổi và cholesterol cho ở bảng trên. Ta có: n i 1 ix 1 x 43 n ,9 = = =∑ ; n i 1 iy 1 y 3, n 56 = = =∑ ; ij i i i 1 j 1 xy y 167,2 1 6n x n = = = =∑ ; 2 xs 183,29= ⌢ ; 2ys 0,6944= ⌢ . Vậy xy 2 2 x y xy x.y r 0,9729 s .s − = = ⌢ ⌢ . 2. ðường thẳng hồi qui • ðể tiện việc theo dõi và mô tả mô hình, gọi ñộ tuổi cho cá nhân i là xi và cholesterol là yi, i 1,10= . – Các ñiểm có tọa ñộ (xi; yi) tạo thành ñường gấp khúc và gần với ñường thẳng có dạng y = ax + b. Người ta dùng ñường thẳng y = ax + b ñể tính xấp xỉ các giá trị yi theo xi: i i iy ax b= + ε+ với một sai số iε , ñường thẳng này ñược gọi là ñường thẳng hồi quy. – Các thông số a, b phải ñược ước tính từ dữ liệu. Phương pháp ñể ước tính các thông số này là phương pháp bình phương bé nhất. Phương pháp bình phương bé nhất là tìm giá trị a, b sao cho tổng bình phương sai số n n i 1 i 1 22 i i i(axy b) = = ε = − +∑ ∑ là nhỏ nhất. – Ước lượng cho a, b ñáp ứng ñiều kiện trên là: 2 x xy x.y a , b y ax s − = = −⌢ . Chú ý x xy y x y y x x r s s − − =⌢ ⌢ . VD 2. ðo chiều cao X(m) và khối lượng Y(kg) của 5 học sinh, ta có kết quả: X(m) 1,45 1,6 1,5 1,65 1,55 Y(kg) 50 55 45 60 55 a) Tìm hệ số tương quan rxy. b) Lập phương trình hồi quy tuyến tính của Y theo X. c) Dự ñoán nếu một học sinh cao 1,62m thì nặng khoảng bao nhiêu kg? VD 3. Số vốn ñầu tư X(triệu ñồng) và lợi nhuận Y(triệu ñồng) trong một ñơn vị thời gian của 100 quan sát là: Y X 0,3 0,7 1,0 1 20 10 2 30 10 3 10 20 a) Lập phương trình hồi tuyến tính của X theo Y. b) Dự ñoán nếu muốn lợi nhuận thu ñược là 0,5 triệu ñồng thì cần ñầu tư bao nhiêu? VD 4. Số thùng bia Y(thùng) ñược bán ra phụ thuộc vào giá bán X (triệu ñồng/ thùng). ðiều tra 100 ñại lý về 1 loại bia trong một ñơn vị thời gian có bảng số liệu: Y X 100 110 120 0,150 5 15 30 0,160 10 25 0,165 15 a) Tính hệ số tương quan rxy. b) Lập phương trình hồi tuyến tính của X theo Y. c) Dự ñoán nếu muốn bán ñược 115 thùng bia thì giá bán mỗi thùng cỡ bao nhiêu? 3. Sử dụng máy tính tìm ñường hồi qui VD 5. (fx 500ES) Bài toán cho dạng cặp i i(x , y )như sau X 20 52 30 57 28 43 57 63 40 49 Y 1,9 4 2,6 4,5 2,9 3,8 4,1 4,6 3,2 4 Tìm hệ số xyr , ñường hồi qui mẫu xy ax b= + . Nhập liệu: SHIFT -> MODE -> dịch chuyển mũi tên tìm chọn mục Stat-> 2 (chế ñộ không tần số) MODE->2 (stat) ->2 (A+Bx) -> (nhập các giá trị của X, Y vào 2 cột) X Y 20 1,9 … … 49 4 Xuất kết quả: SHIFT - > 1 -> 7 ->1(A chính là b trong phương trình) - >2 (B chính là a trong phương trình) -> 3 (r chính là xyr ). VD 6. (fx 500ES) Bài toán cho dạng bảng như sau X Y 21 23 25 3 2 4 5 3 5 11 8 Nhập liệu: SHIFT -> MODE -> dịch chuyển mũi tên tìm chọn muc Stat-> 1 (chế ñộ có tần số) MODE->2 (stat) ->2 (A+Bx) -> (nhập các giá trị của X, Y, tần số vào 2 cột) X Y FREQ 21 3 2 21 4 5 23 4 3 23 5 11 25 5 8 Xuất kết quả giống ví dụ trên. ------------------------------------Hết-------------------------------------- w w w . v i e t m a t h s . c o m w w w . v i e t m a t h s . c o m
File đính kèm:
- Bài giảng Xác suất và thống kê - Đoàn Vương Nguyên.pdf