Bài giảng Lý thuyết thống kê (Phần I)
NỘI DUNG
1 GIỚI THIỆU CHUNG VỀ THỐNG KÊ HỌC
2 ĐIỀU TRA THỐNG KÊ
3 TỔNG HỢP THỐNG KÊ
4 NGHIÊN CỨU THỐNG KÊ CÁC MỨC ĐỘ CỦA HIỆN TƯỢNG KTXH
5 ĐIỀU TRA CHỌN MẪU
6 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
dụng phương pháp chọn không hoàn lại 3. Một số phương pháp tổ chức chọn mẫu ngẫu nhiên a. Chọn mẫu ngẫu nhiên đơn giản b. Chọn mẫu hệ thống (máy móc) c. Chọn mẫu phân loại (phân tổ) d. Chọn mẫu cả khối (mẫu chùm) e. Chọn mẫu phân tầng (nhiều cấp) 94 III. Điều tra chọn mẫu phi ngẫu nhiên Một số phương pháp chọn mẫu phi ngẫu nhiên: - Chọn mẫu tiện lợi (thuận tiện) - Chọn mẫu phán đoán - Chọn mẫu hạn ngạch - Chọn mẫu tích lũy “Điểm yếu của tất cả các phương pháp phi ngẫu nhiên là không có sự phát triển về lý thuyết, chọn mẫu phi ngẫu nhiên chỉ có thể được đánh giá bằng chủ quan” Graham Kalton I NHỮNG VẤN ĐỀ CHUNG VỀ KIỂM ĐỊNH II KIỂM ĐINH TRUNG BÌNH IV KIỂM ĐỊNH TỶ LỆ CHƯƠNG VI: KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ 95 I. Những vấn đề chung về kiểm định Giả thuyết thống kê1 Sai lầm và mức ý nghĩa trong kiểm định2 Tiêu chuẩn kiểm định3 Các bước tiến hành một kiểm định giả thuyết thống kê4 1. Giả thuyết thống kê Là giả thuyết về một vấn đề nào đó của tổng thể chung (về các tham số như trung bình, tỷ lệ, phương sai, dạng phân phối,) 96 1. Giả thuyết thống kê Giả thuyết mà ta muốn kiểm định (H0) Giả thuyết đối lập (Ha, H1, H) 2. Sai lầm và mức ý nghĩa trong kiểm định - Sai lầm loại I là bác bỏ H0 khi H0 đúng - Sai lầm loại II là chấp nhận H0 khi H0 sai 97 2. Sai lầm và mức ý nghĩa trong kiểm định Kết luận Thực tế Chấp nhận H0 Bác bỏ H0 H0 đúng Kết luận đúng Sai lầm loại I H0 sai Sai lầm loại II Kết luận đúng 2. Sai lầm và mức ý nghĩa trong kiểm định Mức ý nghĩa của kiểm định () là xác suất mắc sai lầm loại I = P(Bác bỏ H0/H0 đúng) 98 3. Tiêu chuẩn kiểm định Tiêu chuẩn kiểm định là quy luật phân phối xác suất nào đó dùng để kiểm định. Trong tập hợp các kiểm định thống kê có cùng mức ý nghĩa , kiểm định nào có xác suất mắc sai lầm loại 2 nhỏ nhất được xem là “tốt nhất”. 4. Các bước tiến hành kiểm định - Xây dựng giả thuyết H0 và giả thuyết đối H1 - Xác định mức ý nghĩa - Chọn tiêu chuẩn kiểm định - Tính giá trị của tiêu chuẩn kiểm định từ mẫu quan sát - Kết luận 99 Kết luận Quy tắc kiểm định giả thuyết thống kê - Nếu giá trị tiêu chuẩn kiểm định thuộc miền bác bỏ (W), kết luận H0 sai, có cơ sở để bác bỏ H0 - Nếu giá trị của tiêu chuẩn kiểm định thuộc miền không bác bỏ, chưa khẳng định H0 đúng mà kết luận chưa đủ cơ sở để bác bỏ H0 II. Kiểm định trung bình Kiểm định giả thuyết về giá trị trung bình của một tổng thể chung1 Kiểm định hai giá trị trung bình của hai tổng thể2 Kiểm định trung bình thuộc nhiều tổng thể chung3 100 1. Kiểm định giả thuyết về giá trị trung bình của một tổng thể chung - Giả sử nghiên cứu X N(, 2) - Chưa biết song có cơ sở để giả định nó bằng 0 (H0: = 0) - Để kiểm định giả thuyết trên, lấy mẫu n đơn vị từ đó tính trung bình mẫu - Tiêu chuẩn kiểm định x a. Trường hợp đã biết 2 Tiêu chuẩn kiểm định )1,0(~ / )( 0 N n xZ 101 a. Trường hợp đã biết 2 Miền bác bỏ W - Hai phía: Zqs > z/2 - Vế phải: Zqs > z - Vế trái: Zqs < -z b. Trường hợp chưa biết 2 Tiêu chuẩn kiểm định Trong đó )1( 0 ~ / )( ntnS xT 2222 )( 11 )( xx f f f fxxS i i i ii 102 b. Trường hợp chưa biết 2 Miền bác bỏ W - Hai phía: Tqs > t/2(n-1) - Vế phải: Tqs > t(n-1) - Vế trái: Tqs < -t(n-1) b. Trường hợp chưa biết 2 Trong trường hợp số quan sát (n) lớn, thống kê t có phân phối xấp xỉ chuẩn, nên có thể viết tiêu chuẩn kiểm định là: )1,0(~ / )( 0 N nS xZ 103 b. Trường hợp chưa biết 2 Miền bác bỏ W - Hai phía: Zqs > z/2 - Vế phải: Zqs > z - Vế trái: Zqs < -z 2. Kiểm định hai giá trị trung bình của hai tổng thể a. Hai mẫu độc lập b. Hai mẫu phụ thuộc 104 a. Hai mẫu độc lập -Giả sử nghiên cứu 2 tổng thể X1 N(1, 12) và X2 N(2, 22) - Chưa biết 1 và 2 song có cơ sở để giả định nó bằng nhau (H0: 1 = 2) - Để kiểm định giả thuyết trên, lấy 2 mẫu ngẫu nhiên độc lập, với kích thước n1 và n2 từ đó tính được và - Tiêu chuẩn kiểm định 1x 2x Trường hợp đã biết 12 và 22 Tiêu chuẩn kiểm định )1,0(~)( 2 2 2 1 2 1 21 N nn xxZ 105 Trường hợp đã biết 12 và 22 Miền bác bỏ W - Hai phía: Zqs > z/2 - Vế phải: Zqs > z - Vế trái: Zqs < -z Trường hợp chưa biết 12 và 22 Phương sai bằng nhau Phương sai không bằng nhau 106 Kiểm định phương sai -Tiêu chuẩn kiểm định )12;11(2 2 2 1 ~ nnfS SF Miền bác bỏ giả thuyết H0: Fqs < f1-/2, (n1-1)(n2-1) hoặc Fqs > f/2, (n1-1)(n2-1) Trường hợp chưa biết 12 và 22 và phương sai bằng nhau Tiêu chuẩn kiểm định )2(, 2 2 1 2 21 21 ~)( nnt n S n S xxT )1()1( )1()1( 21 2 22 2 112 nn SnSnSTrong đó 107 Trường hợp chưa biết 12 và 22 và phương sai bằng nhau Miền bác bỏ W - Hai phía: Tqs > t/2 ,(n1+n2-2) - Vế phải: Tqs > t (n1+n2-2) - Vế trái: Tqs < -t(n1+n2-2) Trường hợp chưa biết 12 và 22 và phương sai không bằng nhau Tiêu chuẩn kiểm định vt n S n S xxT , 2 2 2 1 2 1 21 ~)( 2 2 2 2 2 2 1 2 1 1 2 2 2 2 1 2 1 1 1 1 1 n S nn S n n S n S v Nếu v lẻ thì làm tròn xuống 108 Trường hợp chưa biết 12 và 22 và phương sai không bằng nhau Miền bác bỏ W - Hai phía: Tqs > t/2(v) - Vế phải: Tqs > t(v) - Vế trái: Tqs < -t(v) b. Hai mẫu phụ thuộc -Giả sử nghiên cứu 2 tổng thể phụ thuộc X1 N(1, 12) và X2 N(2, 22) Muốn so sánh 1 và 2 ta xét độ lệch trung bình d (chưa biết) có cơ sở để giả định độ lệch trung bình bằng 0 (H0: d = 0) - Để kiểm định giả thuyết trên, lấy mẫu ngẫu nhiên phụ thuộc được hình thành bởi n cặp quan sát của 2 mẫu, tính độ lệch giữa 2 mẫu (di), từ đó tính trung bình của các độ lệch giữa các cặp của 2 mẫu ( ) - Tiêu chuẩn kiểm định d 109 b. Hai mẫu phụ thuộc Tiêu chuẩn kiểm định )1( 0 ~ / )( n d t nS dT b. Hai mẫu phụ thuộc Miền bác bỏ W - Hai phía: Tqs > t/2(n-1) - Vế phải: Tqs > t(n-1) - Vế trái: Tqs < -t(n-1) 110 b. Hai mẫu phụ thuộc Ưu điểm: Thường cho kết quả chính xác hơn vì đã bỏ được các nhân tố ngoại lai Hạn chế: Tiến hành thực hiện thu thập thông tin phức tạp hơn 3. Kiểm định trung bình thuộc nhiều tổng thể chung (one-way ANOVA) - Giả sử có k tổng thể đều có có phân phối Xj N(j,j2) - Chưa biết i song có cơ sở để giả định nó bằng nhau (H0: 1 = 2 = . = k) - Để kiểm định giả thuyết trên, lấy k mẫu với cỡ mẫu tương ứng n1, n2, nk - Tiêu chuẩn kiểm định 111 3. Kiểm định trung bình thuộc nhiều tổng thể chung (one-way ANOVA) - Tiêu chuẩn kiểm định ),1(~ knkfMSE MSFF 1 k SSFMSF kn SSEMSE 3. Kiểm định trung bình thuộc nhiều tổng thể chung (one-way ANOVA) k j n i ij j xxSST 1 1 2 j k j j nxxSSF . 1 2 k j n i jij j xxSSE 1 1 2 SSESSFSST Total Sum of Squares) (Sum of Squares for Factor) (Sum of Squares for Error) 112 3. Kiểm định trung bình thuộc nhiều tổng thể chung (one-way ANOVA) Miền bác bỏ W: Fqs > f(k-1; n-k) 3. Kiểm định trung bình thuộc nhiều tổng thể chung (one-way ANOVA) ANOVA Source of Variation SS df MS F Between Groups SSF k-1 MSF *** Within Groups SSE n-k MSE Total SST n-1 Kết quả (chạy bằng phần mềm) được thể hiện trong bảng sau (ANOVA – Analysis of Variance): 113 III. Kiểm định tỷ lệ Kiểm định giả thuyết về tỷ lệ của tổng thể chung1 Kiểm định tỷ lệ của hai tổng thể chung2 Kiểm định tỷ lệ của nhiều tổng thể chung3 1. Kiểm định giả thuyết về tỷ lệ của tổng thể chung - Giả sử nghiên cứu tiêu thức A nào đó của một tổng thể chung - Chưa biết p song có cơ sở để giả định nó bằng p0 (H0: p = p0) - Để kiểm định giả thuyết trên, lấy mẫu n đơn vị từ đó tính tỷ lệ mẫu f - Tiêu chuẩn kiểm định 114 1. Kiểm định giả thuyết về tỷ lệ của tổng thể chung Khi n đủ lớn (n.f 5 hoặc n(1-f) 5) Tiêu chuẩn kiểm định )1,0(~ /)1( )( 00 0 N npp pfZ Miền bác bỏ W - Hai phía: Zqs > z/2 - Vế phải: Zqs > z - Vế trái: Zqs < -z 1. Kiểm định giả thuyết về tỷ lệ của tổng thể chung 115 2. Kiểm định tỷ lệ của hai tổng thể chung -Giả sử nghiên cứu 2 tổng thể , tỷ lệ chung theo tiêu thức A lần lượt là p1 và p2 - Chưa biết p1 và p1 song có cơ sở để giả định nó bằng nhau (H0: p1 = p2) - Để kiểm định giả thuyết trên, lấy 2 mẫu ngẫu nhiên với kích thước n1 và n2 từ đó tính được f1 và f2 - Tiêu chuẩn kiểm định 2. Kiểm định tỷ lệ của hai tổng thể chung Khi n1 và n2 đủ lớn, tức là n1.f1 5 hoặc n1(1-f1)5 Và n2.f2 5 hoặc n2(1-f2) 5 Tiêu chuẩn kiểm định )1,0(~ 11)1( 21 21 N nn ff ffZ 21 2211 nn fnfnf Trong đó 116 2. Kiểm định tỷ lệ của hai tổng thể chung Miền bác bỏ W - Hai phía: Zqs > z/2 - Vế phải: Zqs > z - Vế trái: Zqs < -z 3. Kiểm định tỷ lệ của nhiều tổng thể chung Có ý kiến cho rằng tỷ lệ nghèo ở 3 địa phương (A, B và C) là khác nhau? Từ mỗi địa phương chọn ngẫu nhiên 1 số hộ gia đình và có kết quả như sau: 117 3. Kiểm định tỷ lệ của nhiều tổng thể chung ĐP Loại hộ A B C Hộ nghèo 20 50 25 Hộ không nghèo 180 350 95 -Hãy đưa ra kết luận với mức ý nghĩa 5% -Bảng trên được gọi là bảng ngẫu nhiên 2 dòng (i=1,2) và 3 cột (j=1,3) 3. Kiểm định tỷ lệ của nhiều tổng thể chung Gọi tỷ lệ hộ nghèo của địa phương A, B và C lần lượt là p1, p2 và p3 Cặp giả thuyết cần kiểm định là H0: p1 = p2 = p3 H1: pi pj (i j) 118 3. Kiểm định tỷ lệ của nhiều tổng thể chung Gọi nij là tần số thực nghiệm (số quan sát ở dòng thứ i và cột thứ j) Tính tần số lý thuyết ( )ijn n nij jcét tængi dßng tæng i j ijnn Tổng số đơn vị điều tra 3. Kiểm định tỷ lệ của nhiều tổng thể chung Tiêu chuẩn kiểm định 2 , 2 2 ~ df i j ij ijij n nn 1)cét 1).(sèdßng (sè df
File đính kèm:
- bai_giang_ly_thuyet_thong_ke_phan_i.pdf