Bài giảng Tin học quản lý SPSS - Chương 4: Phân tích dữ liệu định tính
MỤC TIÊU CỦA CHƯƠNG
Cung cấp tóm tắt lý thuyết kiểm định mối quan hệ giữa
hai biến định tính.
Sử dụng spss để kiểm định mối quan hệ giữa hai biến
định tính ( kiểm định chi – square).
Sử dụng SPSS để kiểm định mối quan hệ giữa hai biến
định tính với dữ liệu thang đo thứ bậc bằng kiểm định
Tau của Kendall, D của Somer; Gamma của
Goodman và Kruskal.
Viết được báo cáo gắn gọn về mối quan hệ giữa hai
biến trong mẫu. Dựa theo kết quả kiểm định giả thuyết,
bảng thống kê, đồ thị và các trị số thống kê được.
e Thí dụ 2 cho cách tính chi square • Giả thuyết H0: trình độ học vấn không ảnh hưởng tới nhận định về tình trạng nền kinh tế. • Bác bỏ giả thuyết H0 nếu 𝜒ଶ>𝜒ଶ(r-1)(c-1), 𝜶 • Chấp nhận giả thuyết H0 Nếu 𝜒ଶ ≤ 𝜒ଶ(r-1)(c-1), 𝜶 • Nếu không có liên hệ giữa trình độ học vấn và nhận định về tình trạng kinh tế chúng ta tính giá trị kỳ vọng của hai biến N= 800 340/800 160/800 210/800 Trình độ học vấn Tệ hơn Khôngkhác trước Tốt hơn Xác xuất học vấn Trung học (n = 340) 91 104 235 0,425 Cao đẳng (n= 160) 39 73 48 0,200 Đại học (n=210) 18 31 161 0,263 Tổng số 148 208 444 Xác xuất tình trạng kt 0,185 0,260 0,555 1,000 N= 800 148/800 208/800 444/800 TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH Kiểm Định Chi - Square Thí dụ 2 cho cách tính chi square P (A&B)= P(A)xP(B) P 𝑨&𝑩 = 𝑷 𝑨 𝒙𝑷 𝑩 𝒙 𝑵 ⇒ 0,425*0,185* 800 Tính giá trị kỳ vọng khi xác xuất cả hai biến A & B xảy ra Trình độ học vấn Tệ hơn Không khác trước Tốt hơn Xác xuất học vấn Trung học (n = 340) 0,425*0,185 0,425*0,260 0,425*0,555 0,425 Cao đẳng (n= 160) 0,200*0,185 0,200*0,260 0,200*0,555 0,200 Đại học (n=210) 0,263*0,185 0,263*0,260 0,263*0,555 0,263 Tổng số 148 208 444 Xác xuất tình trạng kt 0,185 0,260 0,555 1,000 X 800 28/01/2018 7 TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH Kiểm Định Chi - Square Thí dụ 2 cho cách tính chi square P (A&B)= P(A)xP(B) P 𝑨&𝑩 = 𝑷 𝑨 𝒙𝑷 𝑩 𝒙 𝑵 ⇒ 0,425*0,185* 800 Tính giá trị kỳ vọng khi xác xuất cả hai biến A & B xảy ra Trình độ học vấn Tệ hơn Không khác trước Tốt hơn Xác xuất học vấn Trung học (n = 340) 79 112 238 0,537 Cao đẳng (n= 160) 30 42 89 0,200 Đại học (n=210) 39 55 117 0,263 Tổng số 148 208 444 Xác xuất tình trạng kt 0,185 0,260 0,555 1,000 X 800 TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH Kiểm Định Chi - Square Thí dụ 2 cho cách tính chi square Giá trị kỳ vọng khi hai biến độc lập và giá trị quan sát được Trình độ học vấn Tệ hơn Không khác trước Tốt hơn O E O E O E Trung học (n = 340) 91 63 104 88 235 189 Cao đẳng (n= 160) 39 30 73 42 48 89 Đại học (n=210) 18 39 31 55 161 117 Với O là giá trị quan sát thực tế và E là giá trị kỳ vọng khi hai biến độc lập 𝝌𝟐 = (𝑶 − 𝑬)𝟐 𝑬 𝝌𝟐 = (𝟗𝟏 − 𝟔𝟑)2/91 + (𝟏𝟎𝟒 − 𝟖𝟖)2/112...+ = (𝟏𝟔𝟏 − 𝟏𝟏𝟕)2/117 = ???????? 125,44 Tra bảng phân phối để xác định chấp nhận hay bác bỏ giả thuyết với df = 4 và 1- 𝜶 = 0.05 df = 𝒄 − 𝟏 𝒙 𝒓 − 𝟏 , 𝜶 Với c số cột; r là số hàng của bảng; 1- 𝜶 mức độ tin cậy trong kiểm định (0,1;0,05; 0,001) 90%; 95%; 99% Bảng tra 𝝌𝟐 TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH Kiểm Định Chi - Square Thí dụ 3 cho cách tính chi square Tử vong trong tai nạn tàu Titanic Bài tập Câu hỏi có mối liên hệ nào giữa hạng vé và khả năng sống sót ? Biết rằng n tổng thể bằng 1309, yêu cầu xác định chi-Square với 𝜶 = 0,1. Bảng tra 𝝌𝟐 Hạng Tử vong Sống sót Tổng số Vip 123 200 (62%) 323 Business 158 119 (43%) 227 Economy 528 181 (26%) 709 Total 809 500 (38%) 1309 28/01/2018 8 TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH Kiểm Định Chi - Square Thí dụ 4 cho cách tính chi square Bài tập Câu hỏi có mối liên hệ nào giữa cách đọc báo chung và trình độ học vấn Biết rằng n tổng thể bằng 500, yêu cầu xác định chi-Square với 𝜶 = 0,1. Bảng tra 𝝌𝟐 Kiểm định mối quan hệ giữa cách đọc báo nói chung và học vấn Trình độ học vấn Tổng cộngCấp 1 -2 Cấp 3-THCH CĐ - SVĐH TN ĐH Đọc báo theo thứ tự từ trang đầu đến trang cuối 18 77 18 35 148 Xem lướt qua các đề mục, đọc các mục ưa thích trước 23 95 57 77 252 Chỉ đọc các mục ưa thích không đọc các trang khác 9 20 9 8 46 Xem tin đáng chú ý trên một trang 1 và tìm đọc trước 10 23 7 14 54 Total 60 215 91 134 500 TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH Kiểm Định Chi - Square Thí dụ 4 cho cách tính chi square Bài tập Câu hỏi có mối liên hệ nào giữa cách đọc báo chung và trình độ học vấn Biết rằng n tổng thể bằng 500, yêu cầu xác định chi-Square với 𝜶 = 0,1. Bảng tra 𝝌𝟐 Kiểm định mối quan hệ giữa cách đọc báo nói chung và học vấn Trình độ học vấn Tổng cộng Cấp 1 -2 Cấp 3-THCH CĐ - SVĐH TN ĐH Đọc báo theo thứ tự từ trang đầu đến trang cuối 18 77 18 35 148 Xem lướt qua các đề mục, đọc các mục ưa thích trước 23 95 57 77 252 Chỉ đọc các mục ưa thích không đọc các trang khác 9 20 9 8 46 Xem tin đáng chú ý trên một trang 1 và tìm đọc trước 10 23 7 14 54 Total 60 215 91 134 500 TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH Kiểm Định Chi - Square cách thức thực hiện kiểm định hai biến định tính trong spss 1. Xác định biến cần xác định mối liên hệ trong tổng thể mẫu. 2. Tạo bảng chéo 3. Từ của sổ dataset Anlyze ...Crosstabs Bảng tra 𝝌𝟐 28/01/2018 9 TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH Kiểm Định Chi - Square Bảng tra 𝝌𝟐 TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH Kiểm Định Chi - Square Thí dụ 4 cho cách tính chi square Bảng tra 𝝌𝟐 TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH Kiểm Định Chi - Square Thí dụ 4 cho cách tính chi square Bảng tra 𝝌𝟐 28/01/2018 10 TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH Kiểm Định Chi - Square Thí dụ 4 cho cách tính chi square Bảng tra 𝝌𝟐 TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH Kiểm Định Chi - Square Thí dụ 4 cho cách tính chi square Bảng tra 𝝌𝟐 TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH Kiểm Định Chi - Square Thí dụ 4 cho cách tính chi square Bảng tra 𝝌𝟐 28/01/2018 11 TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH Kiểm Định Chi - Square Thí dụ 4 cho cách tính chi square Bảng tra 𝝌𝟐 TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH Kiểm Định Chi - Square Thí dụ 4 cho cách tính chi square Bảng tra 𝝌𝟐 TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH Kiểm Định Chi - Square Thí dụ 4 cho cách tính chi square Bảng tra 𝝌𝟐 28/01/2018 12 TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH Nguyên tắc dùng giá trị P-Value. P- Value (Sig – Observed Significance Level) là mức ý nghĩa quan sát. Nguyên tắc của P-Value là: Chấp nhận giả thuyết H0 nếu Sig. > 𝜶 Bác bỏ giả thuyết H0 nếu sig.< 𝜶 Bảng tra 𝝌𝟐 TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH GIẢI THÍCH MỘT SỐ ĐẠI LƯỢNG THỐNG KÊ Kiểm định Chi - Square chỉ có ý nghĩa khi số quan sát đủ lớn. Nếu có quá 20% các ô trong bảng chéo có tần số lý thuyết nhỏ hơn 5 thì giá trị 𝜒2 Không đáng tin cậy. Giải pháp là recode lại biến để tăng số quan sát của biến lên trong mỗi nhóm hoặc sử dụng các kiểm định khác TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH GIẢI THÍCH MỘT SỐ ĐẠI LƯỢNG THỐNG KÊ • Continuity Corection là 1 dạng biến thể của Pearson Chi-Square để sử dụng cho những bảng dạng 2 x 2 tức là các bảng kết hợp của hai biến mà mỗi biến chỉ có 2 biển hiện. • Likelihood Ratio là một thống kê tương tự Pearson chi square với những cỡ mẫu lớn, kết quả của hai kiểm định này tương rất gần nhau. • Linear – by Linear Asociation đo lường mối liên hệ tuyến tính giữa hai biến, thống kê này chỉ hữu dụng khi binees hàng và cột được sắp xếp trật tự từ nhỏ đến lớn. • Fisher’s Exact test phù hợp cho các bảng dạng 2 x 2 với các trường hợp tấn số mong đợi tại các ô nhỏ hơn 5. 28/01/2018 13 TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH KIỂM ĐỊNH MỐI LIÊN HỆ GIỮA HAI BIẾN THỨ BẬC • Thí dụ: chúng ta cần nghiên cứu mối liên hệ giữa tuổi tác và mức độ quan tâm đối với chủ thể gia đình trên báo tiếp thị. Cả hai yếu tố này đều là dữ liệu thứ tự vì nó được phân hạng như sau: • Độ tuổi (18->25); (26-> 35); (36->45); (46->60) tuổi. • Mức độ quan tâm đến chủ thể gia đình: quân tâm nhất, nhì và ba. • Lập giả thuyết: H0 Tuổi tác không có liên hệ với mức độ quan tâm đến chủ thể gia đình trên báo SGTT (hay mức độ quan tâm đếm chủ thể gia đình không khác nhau giữa các nhóm tuổi) • Lập bảng Crosstabs giữa hai biến. • TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH KIỂM ĐỊNH MỐI LIÊN HỆ GIỮA HAI BIẾN THỨ BẬC Gamma của Goodman và KrusKal Gamma là một thước đo phổ biến và dễ cảm nhận. Trị số đo thể hệ từ -1 (liên hệ nghịch hoàn toàn) đến +1 (liên hệ thuận hoàn toàn), giá trị 0 ở trung tâm đại diện cho sự độc lập giữa hai biến). Lưu ý: Kết quả Gamma tính được dựa trên thông tin mẫu chỉ thể hiện được độ mạnh của mối liên hệ trong mẫu do đó đối với tổng thể phải kiểm định ý nghĩa của Gamma. Đặt giả thuyết H0: Gamma của tổng thể = 0 ( nghĩa là không có mối liên hệ giữa các biến thứ bậc trong tổng thể chúng ta đang nghiên cứu. nếu kết quả kiểm định Gamma cho phép chúng ta bác bỏ giả thuyết H0 hai biến thứ bậc trong kiểm định Gamma có mối liên hệ và giá trị Gamma của mẫu tính được chắc chắn xấp xỉ giá trị Gamma của tổng thể chung ( Ký hiệu 𝜸 𝒍à 𝑮𝒂𝒎𝒎𝒂 𝒄ủ𝒂 𝒕ổ𝒏𝒈 𝒕𝒉ể 𝒄𝒉𝒖𝒏𝒈) Nhược điểm: có xu hướng thổi phồng mối liên hệ giữa các biến. Bảng tra 𝝌𝟐 28/01/2018 14 TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH KIỂM ĐỊNH MỐI LIÊN HỆ GIỮA HAI BIẾN THỨ BẬC Tau – b của Kendall Sử dụng hầu hết dữ liệu nên kết quả đáng tin cậy hơn trong đo lường mối quan hệ giữa các biến. Nhược điểm khó kiểm tra mức ý nghĩa của tau – b ; không có bảng tra. Tau – b thích hợp cho các bảng chéo cân đối. Tau – c thích hợp cho các bảng khi số hàng và cột không bằng nhau TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH KIỂM ĐỊNH MỐI LIÊN HỆ GIỮA HAI BIẾN THỨ BẬC TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH KIỂM ĐỊNH MỐI LIÊN HỆ GIỮA HAI BIẾN THỨ BẬC 28/01/2018 15 TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH Kết thúc chương 4
File đính kèm:
- bai_giang_tin_hoc_quan_ly_spss_chuong_4_phan_tich_du_lieu_di.pdf