Báo cáo Bài tập lớn môn Xác suất thống kê - Nguyễn Minh Cường
MỤC LỤC
Bài 1.2
Bài 2.4
Bài 3.7
Bài 4. 16
So sánh tỉ số .
- Đối với một thí nghiệm có nhiều kết quả (ở bài này là thí nghiệm nghiên cứu
nhằm xác định xem sự khác nhau giữa tỉ lệ đàn ông và đàn bà trong việc chọn
mua các loại ô tô) cần so sánh nhiều tỉ số.
- Trắc nghiệm X2 cho phép ta so sánh không những hai mà còn nhiều tỉ số (hay
tỉ lệ, xác suất) một cách tiện lợi.
0 BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012 – 2013 Giảng viên bộ môn: Nguyễn Bá Thi Sinh viên thực hiện: Nguyễn Minh Cường MSSV: 41200437 Nhóm: 01 Đại học Quốc gia Thành phố Hồ Chí Minh Trường Đại học Bách Khoa BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ NHÓM 1 1 MỤC LỤC Bài 1 ............................................................................................................................ 2 Bài 2 ............................................................................................................................ 4 Bài 3 ............................................................................................................................ 7 Bài 4 .......................................................................................................................... 16 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ NHÓM 1 2 1. Một hãng sản xuất ôtô tiến hành một nghiên cứu nhằm xác định xem có sự khác nhau giữa tỷ lệ đàn ông và đàn bà trong việc chọn mua các loại ôtô của hãng hay không. Kết quả thu được như sau: Loại ôtô A B C Phụ nữ 70 80 150 Nam giới 40 60 100 Với mức ý nghĩa = 5%, ta cần phải đưa ra kết luận gì? Bài làm: 1.Dạng bài: So sánh tỉ số . - Đối với một thí nghiệm có nhiều kết quả (ở bài này là thí nghiệm nghiên cứu nhằm xác định xem sự khác nhau giữa tỉ lệ đàn ông và đàn bà trong việc chọn mua các loại ô tô) cần so sánh nhiều tỉ số. - Trắc nghiệm X2 cho phép ta so sánh không những hai mà còn nhiều tỉ số (hay tỉ lệ, xác suất) một cách tiện lợi. 2.Dàn bài: Giả thuyết H0: Phân bố chọn mua các loại ô tô của nam và nữ là giống nhau. + Tìm P(X > ϰ2) bằng hàm CHITEST trong MS-Excel . + Nếu P(X > ϰ2) > ∝ => chấp nhận giả thuyết H0 và ngược lại. 3.Thực hiện bài toán bằng Excel BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ NHÓM 1 3 A .Nhập dữ liệu vào bảng tính: B .Tính các tổng số + Tổng hàng: chọn ô E2 và nhập biểu thức =SUM(B2:D2), Dùng con trỏ kéo nút tự điền từ ô E2->E3 + Tổng cột: chọn ô B4 và nhập biểu thức =SUM(B2:B3), Dùng con trỏ kéo nút tự điền từ ô B4->D4 + Tổng cộng: chọn ô E5 và nhập biểu thức =SUM(E2:E3) C .Tính các tần số lý thuyết: + Phụ nữ chọn mua ô tô A: chọn ô B8 và nhập biểu thức =B4*$E$2/$E$5 + Tương tự cho ô tô B và C. Dùng con trỏ kéo nút tự điền từ ô B8=>D8 + Nam giới chọn mua ô tô A: chọn ô B9 và nhập biểu thức =B4*$E$3/$E$5 + Tương tự cho ô tô B và C. Dùng con trỏ kéo nút tự điền từ ô B9=>D9 Áp dụng hàm số CHITEST để tính xác suất P(X> ϰ2) Chọn ô B11 và nhập vào =CHITEST(B2:D3,B8:D9) BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ NHÓM 1 4 Ta có kết quả của P(X>ϰ2) Biện luận: P(X>ϰ2)= 0.582093 > α =0.05 => chấp nhận giả thuyết H0. 4.Kết luận: Phân bố chọn mua các loại ô tô của nam và nữ là giống nhau. 2. Một nhà nông học tiến hành việc kiểm định hiệu quả của ba loại phân nêu trên các cây cà chua và theo dõi số quả cà chua mọc trên mỗi cây. Kết quả thu được như sau : Loại phân A B C 24 18 27 28 21 26 32 25 16 22 19 17 Với mức ý nghĩa = 5%, hãy so sánh số quả cà chua mọc trung bình khi bón ba loại phân A, B, C nói trên. BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ NHÓM 1 5 Bài làm: 1.Dạng bài: Phân tích phương sai 1 yếu tố. - Phép phân tích phương sai được dùng trong các trắc nghiệm để so sánh các giá trị trung bình của hai hay nhiều mẫu từ các phân số. - Mục đích của sự phân tích phương sai một yếu tố là đánh giá sự ảnh hưởng của một yếu tố (nhân tạo hay tự nhiên) nào đó trên các giá trị quan sát, Yi, (I = 1,2, , k). 2.Dàn bài: - Giả thuyết: H0: “Các giá trị trung bình bằng nhau” - Giá trị thống kê: F = ெௌி ெௌா (dùng bảng ANOVA) - Nếu F Chấp nhận giả thuyết H0 3.Thực hiện bằng Excel: A. Nhập dữ liệu vào bảng tính BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ NHÓM 1 6 Áp dụng " Anova Single Factor" 1. Vào Data chọn Data Analysis rồi chọn “Anova: Single Factor” 2. Trong hộp thoại Anova: Single Factor lần lượt ấn định các chi tiết: - Phạm vi đầu vào (Input Range): $A$2:$C$6 - Cách sắp xếp theo hàng hay cột (Group By): ở đây chọn Columns - Nhãn dữ liệu (Labels in First Row/column) - Alpha (độ tin cậy): chọn 0.05 - Output Range (vị trí xuất bảng ANOVA) Hộp thoại Anova: Single Factor Kết quả ta có bảng Anova : BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ NHÓM 1 7 Biện luận: F=3,855652 < F0.05=4,256495 Chấp nhận giả thuyết H0 4.Kết luận: Vậy số quả cà chua mọc trung bình khi bón 3 loại phân trên là như nhau. 3. Tính tỷ số tương quan của Y đối với X ,hệ số tương quan và hệ số xác định của tập số liệu sau đây. Với mức ý nghĩa = 5%, có kết luận gì về mối tương quan giữa X và Y. (Có phi tuyến không ? Có tuyến tính không ?).Tìm đường hồi quy của Y đối với X. BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ NHÓM 1 8 X 210 90 240 50 240 270 130 270 90 240 130 170 50 170 210 Y 255 115 255 35 275 315 135 355 135 295 175 235 75 195 235 Bài làm: 1.Dạng bài : đây là bài toán phân tích tương quan và hồi quy. 2.Thực hiện bài toán bằng Excel I/Phân tích tương quan tuyến tính 1.Nhập giá trị vào bảng tính 2.Thiết lập bảng Correlation. - Vào Data Data analysis , chọn Correlation - Trong hộp thoại Correlation lần lượt ấn định: BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ NHÓM 1 9 Phạm vi đầu vào: Input Range (quét vùng): $A$1:$B$16 Cách nhóm theo hàng hay cột: Group By, chọn Columns (nhóm theo cột). Chọn Labels in first row (nhãn dữ liệu ở hàng đầu). Phạm vi đầu ra: Output Range, chọn ô D3 Nhấn OK, ta sẽ có bảng kết quả sau: BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ NHÓM 1 10 Ta tìm được hệ số tương quan: r = 0.97436 * Giả thiết Ho : X và Y không có tương quan tuyến tính (n = 15, r2 = 0.9493696) - c là phân vị mức α/2=0.025 của phân bố Student với n-2=13 bậc tự do Dùng Excel tính toán ta có : T =(E5*SQRT(13))/SQRT(1-E5*E5) E5 : chứa giá trị r c =TINV(0.05,13) 2 2 1 r nT r BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ NHÓM 1 11 Vì T> c nên bác bỏ giả thuyết H0.Vậy X và Y có tương quan tuyến tính. II/Phân tích tương quan phi tuyến Sắp xếp lại các giá trị của X và Y theo bảng sau 1.Thiết lập bảng Anova: Single Factor. - Vào Tools /Data analysis , chọn Anova: Single Factor - Trong hộp thoại Anova: Single Factor lần lượt ấn định: Input Range, quét vùng (B1:H4). Group By, chọn Columns (nhóm theo cột). Chọn Labels in first row (nhãn dữ liệu nằm ở hàng đầu). Mức ý nghĩa : Alpha (ấn định α=0,05). Phạm vi đầu ra: Output Range, chọn ô A5 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ NHÓM 1 12 Nhấn OK, ta sẽ có bảng kết quả sau Rút ra được từ bảng Anova: SSF = 114693.3 SST = 119093.3 Tính: ɳ 2Y/X = SSF/SST = 0.96305 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ NHÓM 1 13 => Tỉ số tương quan : ɳ2Y/X =0.96305 * Giả thiết Ho : X và Y không có tương quan phi tuyến. Ta có: F= 0,59241 (n = 15, k = 7) c là phân vị mức α=0,05 của phân bố Fisher bậc tự do (k-2,n-k)=(5,8). c ~ 3.69 (=FINV(0.05,5,8)) Vì: F < c nên chấp nhận giả thiết Ho. Vậy: X và Y không có tương quan phi tuyến Kết luận : - X và Y có tương quan tuyến tính. - X và Y không có tương quan phi tuyến với mức ý nghĩa 5%. III. Phân tích hồi quy: Sử dụng Regression - Nhập dữ liệu vào bảng tính như sau: 2 2 / 2 / 2 Y X Y X r n k F k BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ NHÓM 1 14 - Vào Data/Data analysis, chọn Regression - Trong hộp thoại Regression lần lượt ấn định: Phạm vi đầu vào: Input Y Range, quét vùng ($B$2:$B$16). Input X Range, quét vùng ($A$2:$A$16). Chọn Labels (thêm nhãn dữ liệu). Confidence Level (ngưỡng tin cậy): 95 Phạm vi đầu ra: Output Range, chọn ô $D$11. Chọn Line Fit Plots trong Residuals để vẽ đường hồi quy BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ NHÓM 1 15 - Sau đó nhấn OK ta có kết quả : Kết luận : Đường hồi quy của Y đối với X là : BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ NHÓM 1 16 Y= 6.159101 + 1.167563X 4. Hãy phân tích vai trò ngành nghề (chính, phụ) trong hoạt động kinh tế của các hộ gia đình ở một vùng nông thôn trên cơ sở bảng số liệu về thu nhập của một số hộ tương ứng với các ngành nghề nói trên như sau (mức ý nghĩa 5 %): Nghề chính Nghề phụ (1) (2) (3) (4) Trồng lúa (1) Trồng cây ăn quả (2) Chăn nuôi (3) Dịch vụ (4) 3.5:3.4:4.0 5.6:5.2:5.8 4.1:4.4:3.8 7.2:7.0:7.7 7.4:7.6:7.1 4.1:4.4:3.9 2.5:2.5:2.7 3.2:3.5:3.1 8.3:8.1:8.0 6.1:6.4:5.8 1.8:1.6:1.4 2.2:2.6:2.3 3.5:3.4:3.7 9.6:9.7:9.2 2.1:2.3:2.0 1.5:1.7:1.4 1.Dạng bài: đây là bài phân tích phương sai hai yếu tố 2.Cách làm Giả thuyết : HA là năng suất không phụ thuộc vào nghề chính : HB là năng suất không phụ thuộc vào nghề phụ : HAB là năng suất giữa nghề chính và nghề phụ không có liên quan đến nhau. Thực hiện bài toán bằng Excel - Nhập dữ liệu vào bảng tính: BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ NHÓM 1 17 - Chọn Data Analysis\Anova: Two Factor With Replication - Trong hộp thoại Anova : Two-factor With Replication lần ấn định: Phạm vi đầu vào: Input Y Range, quét vùng ($A$2:$E$14) Rows per sample : 3 Alpha: 0.05 Output Range : ($G$17) Sau đó nhấn OK ta có kết quả: BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ NHÓM 1 18 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ NHÓM 1 19 3.Kết luận: a. 617.7936 = FA > Fn-1;nm(r-1);1-α = 2,90112 bác bỏ yếu tố HA, năng phụ thuộc vào nghề chính. b. 36.73547 = FB > Fm-1;nm(r-1);1-α = 2.90112 bác bỏ yếu tố HB , năng suất phụ thuộc vào nghề phụ. c. 308,223 = FAB > F(n-1)(m-1);nm(r-1);1-α = 2.188766 bác bỏ yếu tố HAB, có sự tương tác năng suất giữa nghề chính và nghề phụ
File đính kèm:
- bao_cao_bai_tap_lon_mon_xac_suat_thong_ke_nguyen_minh_cuong.pdf