Bài giảng Thống kê kinh doanh và SPSS - Bài 3: Thống kê mô tả - Trương Minh Chiến

1. Kiểm tra dữ liệu (Explore)

Để nhận dạng và phát hiện sai sót trong dữ liệu, ta có ba cách hiển thị dữ liệu như sau:

 Biểu đồ Histogram

 Sơ đồ cành và lá (Stem-and-leaf plot)

 Sơ đồ Boxplot (hộp ria mèo)

 

ppt33 trang | Chuyên mục: Thống Kê Kinh Doanh và Kinh Tế | Chia sẻ: yen2110 | Lượt xem: 332 | Lượt tải: 0download
Tóm tắt nội dung Bài giảng Thống kê kinh doanh và SPSS - Bài 3: Thống kê mô tả - Trương Minh Chiến, để xem tài liệu hoàn chỉnh bạn click vào nút "TẢI VỀ" ở trên
s together đưa ra một hiển thị riêng biệt cho mỗi biến phụ thuộc. Trong phạm vi một hiển thị, Boxplots được hiển thị cho mỗi một nhóm được phân ra theo giá trị của biến điều khiển (factor variable). 
Dependents together đưa ra một hiển 
thị riêng biệt theo mỗi nhóm được phân 
theo các giá trị trong biến điều khiển. 
Trong phạm vi của hiễn thị, boxplots được 
đưa ra lần lượt cho mỗi biến phụ thuộc 
Descriptive: Cho phép lựa chọn hiển thị 
dạng đồ thị Histogram hay dạng cành lá 
(stem-and-leaf plots) 
Sử dụng công cụ Plots 
Normality plots with tests . Đưa ra các dạng đồ thị về phân phối chuẩn. Đồng thời cung cấp một kiểm nghiệm thống kê Kolmogorov-Smirnov statistic, với mức tin cậy Lilliefors dùng để kiểm nghiện tính chuẩn của phân phối mẫu đang quan sát. 
Spread vs. Level with Levene Test . Cho phép chúng ta kiểm tra tính đồng đều của phương sai giữa các mẫu trong dữ liệu gốc hay dữ liệu đã được biến đổi. 
Kiểm định Kolmogorov-Smirnov (Lilliefors) 
Kiểm định Lilliefors là một dạng kiểm định Kolmogorov-Smirnov, dùng để kiểm định tính chuẩn của một mẫu hay hai mẫu. Với giá trị sig. nhỏ hơn mức ý nghĩa (0.05) là kết quả bác bỏ giả thuyết phân phối mẫu là phân phối chuẩn.. 
Kiểm định Levene 
Kiểm định Levene là phép kiểm định tính đồng nhất của phương sai. ở đây ta kiểm định giả thuyết cho rằng phương sai của giữa các mẫu quan sát là bằng nhau. Kiểm định cho ta kết quả Sig. nhỏ hơn mức tin cậy (5%) ta kết luận không chấp nhận giả thuyết cho rằng phương sai mẫu thì bằng nhau. 
Áp dụng vào bài tập tình huống. 
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại  
Áp dụng vào bài tập tình huống. 
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại  
Áp dụng vào bài tập tình huống. 
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại  
Áp dụng vào bài tập tình huống. 
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại  
Áp dụng vào bài tập tình huống. 
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại  
Áp dụng vào bài tập tình huống. 
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại  
2. Bảng phân bố tần suất 
Bảng phân phối tần suất được thể hiện với tất cả các biến định tính (rời rạc) với các thang đo định danh, thứ bậc và các biến định lượng (liên tục) với thang đo khoảng cách hoặc tỉ lệ. 
Từ thanh menu chọn: Analyze / Descriptive Statistics / Frequencies 
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại  
Frequencies 
Chọn một hoặc một số biến định lượng hoặc định tính 
Nhắp Statistics để có các thống kê mô tả đối với biến định lượng 
Nhắp Charts để có đồ thị thanh, đồ thị tròn, và biểu đồ tần suất. 
Nhắp Format để có trật tự mà các kết quả được thể hiện. 
Frequencies Statistics 
Percentile Values . Các trị số của một biến định lượng chia dữ liệu có thứ bậc vào thành các nhóm sao cho một tỷ lệ % cụ thể là nằm trên nó và một tỷ lệ % khác nằm dưới nó. Các số tứ phân vị chia các quan sát ra thành 4 nhóm có cùng số lượng quan sát. Nếu muốn một số lượng các nhóm lớn hơn 4, hãy chọn Cut points for n equal groups. Cũng có thể xác định các số phân vị riêng biệt (ví dụ, phân vị thứ 95, là trị số mà nằm dưới nó là 95% số lượng quan sát). 
Central Tendency . Các thống kê mô tả trung tâm của một phân bố bao gồm trung bình, trung vị, mode, và tổng mọi trị số. 
Dispersion . Các thống kê đo đạc độ lớn của sự biến thiên bao gồm độ lệch chuẩn, phương sai, phạm vi, trị số lớn nhất, nhỏ nhất, và sai số chuẩn của trung bình. 
Distribution . Skewness {Độ lệch} và Kurtosis {độ nhọn} là các thống kê mô tả hình dạng và độ cân xứng của một phân bố. 
Value are group midpoints . Nếu các trị số trong dữ liệu là điểm giữa của các nhóm, hãy chọn tuỳ chọn này để ước lượng trung vị và các phân vị cho dữ liệu thô, không nhóm gộp. 
Frequencies Charts 
các nhóm dưới dạng hình ảnh. Một biểu đồ tần số {Histogram} cũng có các thanh, nhưng chúng được vẽ dọc theo một thang đo khoảng bằng nhau. Chiều cao của từng thanh là số lượng của các trị số của một biến định lượng rơi vào trong khoảng. Một biểu đồ tần suất thể hiện hình dạng, trung tâm, và độ trải rộng của phân bố. Một đường cong chuẩn đặt chồng thêm vào một biểu đồ tần suất giúp bạn xét đoán liệu chừng dữ liệu có phân bố chuẩn. 
Chart Values . Đối với đồ thị thanh, trục thang đo có thể được đặt nhãn bởi số lượng hoặc tỷ lệ %. 
Chart Type : Một đồ thị tròn {pie chart} thể hiện phân bố của các bộ phận trong toàn bộ. Từng miếng của đồ thị tròn tương ứng với một nhóm được xác định bởi một biến lập nhóm. Một đồ thị thanh {bar chart} thể hiện số lượng/tần số của từng trị số riêng biệt hoặc từng nhóm như là một thanh riêng, cho phép bạn so sánh 
Áp dụng vào bài tập tình huống. 
Áp dụng vào bài tập tình huống. 
Sau đó chúng ta có thể áp dụng Excel để làm lại bảng và trình bày cho đẹp như bên dưới 
Độ tuổi 
Tần số 
Tần suất (%) 
Tần số tích lũy 
Tần suất tích lũy(%) 
30-35 
2 
6.67 
2 
6.67 
35-40 
2 
6.67 
4 
13.33 
40-45 
0 
0 
4 
13.33 
45-50 
6 
20 
10 
33.33 
50-55 
4 
13.33 
14 
46.67 
55-60 
1 
3.33 
15 
50 
60-65 
6 
20 
21 
70 
65-70 
4 
6.67 
23 
76.67 
70-75 
2 
13.33 
27 
90 
75-80 
3 
10 
30 
100 
Tổng 
30 
100 
/ 
/ 
Áp dụng vào bài tập tình huống. 
3. Mô tả dữ liệu (Descriptive) 
Sử dụng Statisticts\Summaries\Descriptives để mở hộp thoại mô tả thống kê 
Đây là một dạng công cụ khác có thể được dùng để tóm tắc dữ liệu và chỉ cho phép thao tác trên dạng dữ liệu định lượng (thang đo khoảng và tỷ lệ). Được dùng để thể hiện xu hướng tập trung của dữ liệu (central tendency) thông qua giá trị trung bình của các giá trị trong biến (mean), và mô tả sự phân tán của dữ liệu thông qua phương sai và độ lệch chuẩn. Chuyển các biến cần tóm tắt vào hộp thoại variables và nhấp thanh options để lựa chọn các thông số thống kê cần mô tả, như giá trị trung bình–mean, giá trị tối thiểu, giá trị tối đa, phương sai và độ lệch chuẩn 
4. Lập bảng nhiều chiều cho các biến một trả lời 
Bảng nhiều chiều là dạng bảng chéo thể hiện tần suất xuất hiện của một biến này trong mối quan hệ với một hay nhiều biến khác. Bảng chéo còn cung cấp nhiều loại kiểm định thống kê và đo lường mối quan hệ và tương quan giữa các biến trong bảng 
Chọn trên menu Statistics/Summaries/Crosstabs 
Các biến trong tập dữ liệu được hiển thị bên hộp bên trái. Chọn các biến hàng đưa vào hộp Row(s) và các biến cột đưa vào hộp Column(s). Thông thường biến phụ thuộc hay biến cần quan sát thường được đưa và hàng (rows) và biến độc lập hay biến kiểm soát được đưa và cột (columns). 
Crosstabs 
 Ngoài ra, chúng ta có thể đưa thêm vào bảng chéo các biến điều khiển (layer) để tạo ra các bảng biến chéo nhiều chiều. Mỗi bảng chéo riêng biệt sẽ được tạo ra ứng với mỗi giá trị của mỗi biến điều khiển. Mỗi biến điều khiển sẽ chia bảng chéo thành nhiều nhóm nhỏ hơn. Có thể thêm tối đa 8 biến điều khiển. Việc đưa vào các biến điều khiển này cho phép ta xem xét các mối quan hệ mà lúc ban đầu không thể thấy ngay. 
 Công cụ Cells trong hộp thoại cho phép ta tính toán các hệ số đo lường mối quan hệ giữa các biến đó như % hàng, % cột, % Total tuỳ thuộc vào yêu cầu nghiên cứu. 
5. Lập bảng cho biến nhiều trả lời 
5.1 Định nghĩa nhóm biến nhiều trả lời (define multi response sets) 
Trong câu hỏi nhiều trả lời sẽ bao gồm nhiều biến chứa đựng các trả lời có thể có, những biến này gọi là biến sơ cấp. Do đó để xữ lý, chúng ta phải gộp các biến sơ cấp này thành một biến gộp chứa các biến sơ cấp. 
chọn menu Statistics/Multiple Response/Define sets  
Chọn tất cả những biến sơ cấp liên quan đến một câu hỏi nhiều trả lời ở hộp thoại Set Definition bên trái chuyển sang hộp thoại Variables in Set bên phải 
Sau đó chỉ định cách mã hóa các biến đó (dichotomy hay category); dãy giá trị mã hóa (Range Through) xác định khoảng biến thiên cho các giá trị trong biến gộp; xác định tên và gán nhãn cho biến gộp. Sau đó ấn thanh Add để đưa tên nhóm vừa xác định vào hộp Multi Response Sets. 
Lập bảng cho biến nhiều trả lời 
5.2 Lập bảng cho các biến nhiều trả lời: 
 Sử dụng các tên nhóm đa biến đã được định nghĩa bằng công cụ Define Multi Response Sets đã được đề cập ở phần trên sau đó vào Statistics\Multiple response và chọn Frequencies hoặc Crosstabs tùy theo nhu cầu lập bảng một chiều hay đa chiều. 
 Chú ý : Trong các công cụ Frequencies và Crosstabs sử dụng cho biến nhiều trả lời chỉ mô tả tần suất xuất hiện của các giá trị trong biến gộp và các tỷ lệ % nhưng không có các phương pháp kiểm định thống kê kèm theo. 
Lập bảng 
Khi tiến hành lập bảng mô tả thống kê cho kết quả cuối cùng của vấn đề nghiên cứu có thể dùng các công cụ trong statistics\custom table để tạo ra các bảng biểu (có thể là bảng một chiều, bảng nhiều chiều): 
Bảng biểu thể hiện tần số xuất hiện ( Tables of frequencies ): Cho phép chúng ta tạo ra những bảng biểu thể hiện tần số xuất hiện của một hay nhiều biến đơn 
Dạng bảng biểu cơ bản ( Basic tables ): Thể hiện các dữ liệu nghiên cứu theo dạng bảng chéo ( cross-tabulation ) giữa hai biến hoặc giữa một biến và một nhóm các biến. 
Dạng bảng đa biến ( Multiple response tables ): Giống như basic tables thể hiện tần suất xuất hiện và bảng chéo, tuy nhiên dạng bảng biểu này cho phép ta xây dựng bảng biểu cho các câu trả lời đa biến 
Dạng bảng biểu tổng hợp ( General tables ): Giống như bảng biểu cơ bản và đa trả lời. Các dữ liệu được thể hiện dưới dạng bảng chéo, tuy nhiên ở dạng bảng biểu này cho phép người phân tích thể hiện mối liên hệ giữa một biến với nhiều biến khác trên cùng một bảng. 
6. Trụ và xoay bảng trên Output Viewer (Pivot table) 
Nhấp đúp chuột vào bảng cần tương tác hoặc chấp chuột một lần vào bảng trên vùng Viewer rồi chọn tính năng Pivot trên Menu-bar 
Pivot table (tt) 
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại  
Pivot table (tt) 
Áp dụng tính năng Kéo-thả (drag-drop) 
để kéo biểu tượng “statistics” vào thả 
lên vùng trình chiếu trên nhằm đổi chiều 
của bảng từ dọc sang trình chiếu ngang. 
Pivot table (tt) 
Pivot table (tt) 

File đính kèm:

  • pptbai_giang_thong_ke_kinh_doanh_va_spss_bai_3_thong_ke_mo_ta_t.ppt