Bài giảng Thống kê kinh doanh và SPSS - Bài 4: Kiểm định thống kê - Trương Minh Chiến
Bài 4
KIỂM ĐỊNH THỐNG KÊ
1. Kiểm định trung bình
2. Kiểm định phi tham số
3. Kiểm định Khi bình phương
44 trang | Chuyên mục: Thống Kê Kinh Doanh và Kinh Tế | Chia sẻ: yen2110 | Lượt xem: 349 | Lượt tải: 0
Tóm tắt nội dung Bài giảng Thống kê kinh doanh và SPSS - Bài 4: Kiểm định thống kê - Trương Minh Chiến, để xem tài liệu hoàn chỉnh bạn click vào nút "TẢI VỀ" ở trên
ể kiểm soát giá trị khuyết. Exclude cases analysis by analysis : Những trường hợp có giá trị khuyết ở trong biến phụ thuộc và cả biến kiểm soát sẽ không được đưa vào trong kiểm định. Ngoài ra những trường hợp có giá trị quan sát nằm bên ngoài chuổi đã xác định cho biến kiểm soát cũng không được sử dụng Exclude cases listwise . Những trường hợp có giá trị khuyết Cases trong biến điều khiển hoặc bất kỳ biến phụ thuộc nào được đưa ra hoặc không đưa ra kiểm định đều bị loại trừ ra khỏi quá trình kiểm định phân tích . 2. Kiểm định phi tham số Các tiêu chuẩn thống kê để kiểm định sự khác nhau giữa hai trung bình của hai tổng thể chung được trình bày ở trên gọi là kiểm định có tham số. Khi tiến hành các kiểm định này thường phải dựa trên giả thiết quan trọng là tổng thể chung đang xét có phân phối chuẩn và hoặc kích thước mẫu khá lớn. Nếu một trong các điều kiện trên bị vi phạm thì các tiêu chuẩn đó không thể thực hiện được. Trong tình huống như vậy ta phải sử dụng các tiêu chuẩn phi tham số. Tiêu chuẩn này không đòi hỏi phải có các giả thiết về các dạng phân phối của tổng thể chung và dùng trong các phương pháp kiểm định tự do (đối với dạng phân phối), đó là các phương pháp kiểm định phi tham số . Kiểm định 2 mẫu độc lập (Mann-Whitney U) Kiểm định Mann - Whitney được sử dụng khi chỉ có hai tổng thể nghiên cứu. Kiểm định này cho phép ta xác định xem có phải các mẫu độc lập được lấy ra từ cùng một tổng thể chung hoặc từ các tổng thể khác nhau nhưng có chung một phân phối hay không. Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại Bài toán tổng quát Giả sử có hai tổng thể chung X và Y. Phân phối của hai tổng thể này chưa biết và không nhất thiết là phân phối chuẩn. Ta muốn biết liệu hai tổng thể chung này có khác nhau không, giả thiết cần kiểm định là: H0: 1 = 2 (không có sự khác nhau giữa hai tổng thể chung và do đó có cùng số trung bình) H1: 1 2 (có sự khác nhau giữa hai tổng thể chung và chúng có số trung bình khác nhau) Để kiểm định giả thiết này, từ tổng thể chung lấy ra 2 mẫu: Mẫu thứ nhất, gồm n1 đơn vị có các lượng biến (x1, x2 ...xn1) lấy ra từ tổng thể chung X. Mẫu thứ hai, gồm n2 đơn vị có các lượng biến (y1, y2 ...yn2) lấy ra từ tổng thể chung Y. Tiêu chuẩn kiểm định Mann - Whitney Gộp 2 mẫu trên thành 1 mẫu với cỡ mẫu là (n1 + n2) Sắp xếp (n1 + n2) lượng biến của 2 mẫu theo thứ tự tăng dần và xác định hạng của mỗi lượng biến đó. Tính tổng hạng của các lượng biến thuộc mẫu thứ nhất là R1 và của mẫu thứ hai là R2. Như vậy tổng hạng chung R = R1 + R2 = 1 +2 + ... + (n1 + n2). Người ta đã chứng minh được rằng: nếu H0 đúng và n1, n2 10 thì R1 có phân phối xấp xỉ chuẩn với trung bình là: và phương sai là Tiêu chuẩn kiểm định Mann - Whitney ( Tương tự, ta có R2 có phân phối xấp xỉ chuẩn với giá trị trung bình là: và phương sai là Thông thường chúng ta chọn số nhỏ nhất giữa R1 và R2 để tính tiêu chuẩn kiểm định. Giả sử R1 < R2 , khi đó tiêu chuẩn kiểm định được chọn là : nếu ta bác bỏ giả thiết H0 . (Nếu thay R1 bằng R2 cũng sẽ cho ta cùng một kết luận) Analyze - Nonparametric Test - 2 Independent Samples Nhấn Grouping Define để định nghĩa các biến chọn các biến vào phân tích Kiểm định 2 mẫu phụ thuộc (Wilcoxon, kiểm định dấu, kiểm định Nemar) Đây là phương pháp kiểm định phi tham số dùng trong trường hợp 2 mẫu phụ thuộc. Ở phần trên, chúng ta dùng phương pháp so sánh từng cặp, nhưng phương pháp này đòi hỏi một giả thiết quan trọng là các chênh lệch của từng cặp quan sát (di) phải có phân phối chuẩn hay xấp xỉ chuẩn. Nếu giả thiết này không được thoả mãn cần sử dụng đến các kiểm định phi tham số. Trong phần này chúng ta sẽ đề cập đến 2 phương pháp kiểm định thông dụng nhất là kiểm định dấu và kiểm định hạng có dấu của Wilcoxon. Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại Kiểm định dấu Phương pháp này kiểm định dựa trên cơ sở các dấu âm hoặc dương của các chênh lệch trong từng cặp quan sát chứ không dựa vào giá trị của chúng. Giả sử có hai tổng thể: chẳng hạn X là hiệu quả của phương pháp thứ nhất và Y là hiệu quả của phương pháp thứ hai tác động lên cùng một đối tượng (hay X và Y phụ thuộc). Ta muốn kiểm định giả thiết H0 : “Hiệu quả của phương pháp thứ nhất và của phương pháp thứ hai là như nhau”. Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại Để kiểm định giả thiết trên, người ta quan sát n cặp giá trị (x1, y1); (x2, y2) ... (xn, yn). Đặt di = xi - yi . Ta loại bỏ các di có giá trị bằng 0 vì chúng không mang lại thông tin gì. Gọi n’ là số các di có giá trị khác 0 và n+ là số các di mang dấu + . Nếu giả thiết H0 đúng thì n+ sẽ có phân phối nhị thức với tham số p = 0,5 và n’. Ta biết rằng nếu (n’. 0,5) >5 tức n’ > 10 thì tần suất f = n+/n’ sẽ có phân phối xấp xỉ chuẩn với kỳ vọng 0,5 và độ lệch tiêu chuẩn là: Như vậy tiêu chuẩn kiểm định được chọn là: Đại lượng Z trên sẽ có phân phối chuẩn. Với mức ý nghĩa cho trước, tuỳ thuộc giả thiết đối mà ta có các trường hợp: Kiểm định 2 phía: H1- “Có sự khác nhau”, ta bác bỏ H0 khi - Kiểm định 1 phía: H1 - “phương pháp thứ nhất hiệu quả hơn phương pháp thứ hai”, ta sẽ bác bỏ H0 khi Z > Z0,5 - . Kiểm định hạng có dấu của Wilcoxon Trong khi kiểm định dấu chỉ quan tâm tới dấu của các hiệu số di thì kiểm định hạng có dấu của Wilcoxon còn tính đến độ lớn của . Như vậy kiểm định này sẽ có hiệu quả hơn kiểm định dấu. Các bước thực hiện như sau: Xuất phát từ 2 mẫu ta tính các di Bỏ qua các giá trị di = 0 Tính hạng của (di 0) Gọi: n’ là số các giá trị di = 0 R+ là tổng các hạng của ứng với di > 0 R- là tổng các hạng của ứng với di < 0 Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại Người ta đã chứng minh được rằng nếu H0 đúng thì R+ và R- đều có cùng phân phối với kỳ vọng là và phương sai là Nếu n’ 8 thì R+ và R- có phân phối xấp xỉ chuẩn. Như vậy tiêu chuẩn kiểm định được chọn là: Đại lượng Z sẽ có phân phối N(0, 1). Trong đó R là R+ hoặc R- (thường lấy số nhỏ nhất trong 2 số đó). Giả thiết H0 sẽ bị bác bỏ ở mức ý nghĩa nếu > Z0,5 - /2 . Analyze - Nonparametric Tests - 2 Related Samples chọn các biến vào phân tích Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại Kiểm định nhiều hơn 2 mẫu độc lập (Kruskal-Wallis H) Analyze - Nonparametric Test - K Independent Samples Vào Grouping Variable để định nghĩa biến chọn các biến vào phân tích Kiểm định nhiều hơn 2 mẫu phụ thuộc (Friedman, Kendall’s W, Cochran’s Q) Analyze - Nonparametric Test - K Related Samples chọn các biến vào phân tích Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại Nhận xét về phương pháp phi tham số Ưu điểm : - Chúng không đòi hỏi phải có giả thiết là tổng thể chung có phân phối chuẩn hoặc tuân theo một dạng phânphối cụ thể nào đó. - Nói chung các phương pháp này dễ hiểu và dễ thực hiện. Kiểm định phi tham số có thể được dùng thay thế cho kiểm định tham số bằng cách thay thế các giá trị số bằng các thứ hạng của chúng như đã làm ở trên. - Đôi khi ngay cả việc sắp xếp theo thứ tự hạng cũng không cần thiết. Thông thường cái cần làm chỉ là mô tả 1 kết quả là “tốt hơn” so với một kết quả khác. Gặp trường hợp đó hoặc khi việc đo lường không được chính xác, không đáp ứng được yêu cầu của kiểm định tham số thì ta có thể sử dụng các phương pháp phi tham số. Nhược điểm: - Kiểm định phi tham số bỏ qua một lượng thông tin nhất định chẳng hạn như việc thay giá trị số bằng thứ hạng. - Kiểm định phi tham số không hiệu quả hay “sắc bén” (nói cách khác là không mạnh) bằng kiểm định tham số. Cần nhớ rằng: Nếu điều kiện cho phép dùng kiểm định tham số được thoả mãn thì ta nên dùng kiểm định có tham số Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại 3. Kiểm định Khi bình phương - Kiểm định tính độc lập hay phụ thuộc giữa các tiêu thức Để kiểm định hai (hay nhiều hơn) tỷ lệ người ta sử dụng tiêu chuẩn kiểm định là phân phối Khi bình phương. Chúng ta xuất phát từ thí dụ sau: Để nghiên cứu tỷ lệ phụ nữ có từ 3 con trở lên ở 3 địa phương A, B, C xem có khác nhau không, từ mỗi địa phương người ta chọn ngẫu nhiên một số phụ nữ, kết quả như sau: Địa phương (j) Số con (i) A B C Tổng dòng i Từ 2 con trở xuống Hơn 2 con 140 60 240 160 60 60 440 280 Tổng cột j 200 400 120 720 Bảng trên gọi là bảng ngẫu nhiên 2 dòng (i = 1, 2) và 3 cột (j = 1, 2, 3). Gọi tỷ lệ phụ nữ có hơn 2 con của A, B, C lần lượt là p1, p2, p3. Ta cần kiểm định giả thiết H0 : p1 = p2 = p3 (tỷ lệ ở 3 địa phương là như nhau) H1 : p1 p2 p3 (tỷ lệ ở 3 địa phương khác nhau) Các bước được tiến hành như sau: + Gọi là số phụ nữ có số con i ở địa phương j (ví dụ: số phụ nữ có từ 2 con trở xuống của địa phương A là n11 = 140 ...). là tần số thực nghiệm (do điều tra) + Từ bảng ngẫu nhiên, tính tần số lý thuyết như sau: với n = + Tính tiêu chuẩn 2 : 2 là một đại lượng ngẫu nhiên (vì giá trị của nó thay đổi từ mẫu này qua mẫu khác) và có số bậc tự do (df) = (số dòng - 1).(số cột - 1 ). Ta có nhận xét rằng nếu giả thiết H0 đúng thì càng gần với và do đó giá trị 2 nhỏ và ngược lại. Với mức ý nghĩa cho trước, tra bảng tìm , nếu 2 > ta bác bỏ giả thiết H0 . Những điểm cần chú ý khi sử dụng tiêu chuẩn 2 + Sử dụng cỡ mẫu lớn : Nếu cỡ mẫu nhỏ thì giá trị 2 quá lớn dẫn đến loại bỏ quá nhiều giả thiết cần kiểm định. Cần tuân theo một nguyên tắc chung là không nên sử dụng tần số lý thuyết nhỏ hơn 5 đơn vị trong 1 ô của bảng phân phối ngẫu nhiên. + Sử dụng cẩn thận số liệu thu thập : Số liệu thu thập được phải đúng, nếu có nghi ngờ phải kiểm tra lại cách thu thập hoặc phương pháp tính toán, đo lường hoặc cả hai. Khi giá trị 2 = 0, phải thận trọng đặt câu hỏi không có sự chênh lệch tuyệt đói giữa tần số thực nghiệm và tần số lý thuyết? Và kiểm tra lại số liệu. Descriptives statistics - Crosstab Bấm Statistics để thiết lập các thống kê Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại
File đính kèm:
- bai_giang_thong_ke_kinh_doanh_va_spss_bai_4_kiem_dinh_thong.ppt