Báo cáo Bài tập lớn môn Xác suất thống kê - Nguyễn Minh Cường

MỤC LỤC

Bài 1.2

Bài 2.4

Bài 3.7

Bài 4. 16

 So sánh tỉ số .

- Đối với một thí nghiệm có nhiều kết quả (ở bài này là thí nghiệm nghiên cứu

nhằm xác định xem sự khác nhau giữa tỉ lệ đàn ông và đàn bà trong việc chọn

mua các loại ô tô) cần so sánh nhiều tỉ số.

- Trắc nghiệm X2 cho phép ta so sánh không những hai mà còn nhiều tỉ số (hay

tỉ lệ, xác suất) một cách tiện lợi.

 

pdf20 trang | Chuyên mục: Xác Suất Thống Kê | Chia sẻ: tuando | Lượt xem: 540 | Lượt tải: 0download
Tóm tắt nội dung Báo cáo Bài tập lớn môn Xác suất thống kê - Nguyễn Minh Cường, để xem tài liệu hoàn chỉnh bạn click vào nút "TẢI VỀ" ở trên
0 
BÁO CÁO 
BÀI TẬP LỚN 
XÁC SUẤT THỐNG KÊ 
2012 – 2013 
Giảng viên bộ môn: Nguyễn Bá Thi 
Sinh viên thực hiện: Nguyễn Minh Cường 
MSSV: 41200437 
Nhóm: 01 
Đại học Quốc gia Thành phố Hồ Chí Minh 
Trường Đại học Bách Khoa 
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ NHÓM 1 
1 
MỤC LỤC 
Bài 1 ............................................................................................................................ 2 
Bài 2 ............................................................................................................................ 4 
Bài 3 ............................................................................................................................ 7 
Bài 4 .......................................................................................................................... 16 
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ NHÓM 1 
2 
1. Một hãng sản xuất ôtô tiến hành một nghiên cứu nhằm xác định xem có sự 
khác nhau giữa tỷ lệ đàn ông và đàn bà trong việc chọn mua các loại ôtô của hãng 
hay không. Kết quả thu được như sau: 
Loại ôtô A B C 
Phụ nữ 70 80 150 
Nam giới 40 60 100 
 Với mức ý nghĩa  = 5%, ta cần phải đưa ra kết luận gì? 
Bài làm: 
1.Dạng bài: 
So sánh tỉ số . 
- Đối với một thí nghiệm có nhiều kết quả (ở bài này là thí nghiệm nghiên cứu 
nhằm xác định xem sự khác nhau giữa tỉ lệ đàn ông và đàn bà trong việc chọn 
mua các loại ô tô) cần so sánh nhiều tỉ số. 
- Trắc nghiệm X2 cho phép ta so sánh không những hai mà còn nhiều tỉ số (hay 
tỉ lệ, xác suất) một cách tiện lợi. 
 2.Dàn bài: 
Giả thuyết H0: Phân bố chọn mua các loại ô tô của nam và nữ là giống nhau. 
+ Tìm P(X > ϰ2) bằng hàm CHITEST trong MS-Excel . 
+ Nếu P(X > ϰ2) > ∝ => chấp nhận giả thuyết H0 và ngược lại. 
3.Thực hiện bài toán bằng Excel 
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ NHÓM 1 
3 
A .Nhập dữ liệu vào bảng tính: 
B .Tính các tổng số 
+ Tổng hàng: chọn ô E2 và nhập biểu thức =SUM(B2:D2), 
Dùng con trỏ kéo nút tự điền từ ô E2->E3 
+ Tổng cột: chọn ô B4 và nhập biểu thức =SUM(B2:B3), 
Dùng con trỏ kéo nút tự điền từ ô B4->D4 
+ Tổng cộng: chọn ô E5 và nhập biểu thức =SUM(E2:E3) 
C .Tính các tần số lý thuyết: 
+ Phụ nữ chọn mua ô tô A: chọn ô B8 và nhập biểu thức =B4*$E$2/$E$5 
+ Tương tự cho ô tô B và C. Dùng con trỏ kéo nút tự điền từ ô B8=>D8 
+ Nam giới chọn mua ô tô A: chọn ô B9 và nhập biểu thức =B4*$E$3/$E$5 
+ Tương tự cho ô tô B và C. Dùng con trỏ kéo nút tự điền từ ô B9=>D9 
Áp dụng hàm số CHITEST để tính xác suất P(X> ϰ2) 
Chọn ô B11 và nhập vào =CHITEST(B2:D3,B8:D9) 
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ NHÓM 1 
4 
Ta có kết quả của P(X>ϰ2) 
Biện luận: P(X>ϰ2)= 0.582093 > α =0.05 => chấp nhận giả thuyết H0. 
4.Kết luận: Phân bố chọn mua các loại ô tô của nam và nữ là giống nhau. 
2. Một nhà nông học tiến hành việc kiểm định hiệu quả của ba loại phân nêu 
trên các cây cà chua và theo dõi số quả cà chua mọc trên mỗi cây. Kết quả thu 
được như sau : 
Loại phân 
A B C 
24 
18 
27 
28 
21 
26 
32 
25 
16 
22 
19 
17 
 Với mức ý nghĩa  = 5%, hãy so sánh số quả cà chua mọc trung bình khi bón 
ba loại phân A, B, C nói trên. 
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ NHÓM 1 
5 
Bài làm: 
 1.Dạng bài: 
Phân tích phương sai 1 yếu tố. 
- Phép phân tích phương sai được dùng trong các trắc nghiệm để so sánh các 
giá trị trung bình của hai hay nhiều mẫu từ các phân số. 
- Mục đích của sự phân tích phương sai một yếu tố là đánh giá sự ảnh hưởng 
của một yếu tố (nhân tạo hay tự nhiên) nào đó trên các giá trị quan sát, Yi, (I = 
1,2, , k). 
 2.Dàn bài: 
 - Giả thuyết: H0: “Các giá trị trung bình bằng nhau” 
 - Giá trị thống kê: F = ெௌி
ெௌா
 (dùng bảng ANOVA) 
 - Nếu F Chấp nhận giả thuyết H0 
 3.Thực hiện bằng Excel: 
A. Nhập dữ liệu vào bảng tính 
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ NHÓM 1 
6 
Áp dụng " Anova Single Factor" 
1. Vào Data chọn Data Analysis rồi chọn “Anova: Single Factor” 
 2. Trong hộp thoại Anova: Single Factor lần lượt ấn định các chi tiết: 
- Phạm vi đầu vào (Input Range): $A$2:$C$6 
- Cách sắp xếp theo hàng hay cột (Group By): ở đây chọn Columns 
- Nhãn dữ liệu (Labels in First Row/column) 
- Alpha (độ tin cậy): chọn 0.05 
 - Output Range (vị trí xuất bảng ANOVA) 
Hộp thoại Anova: Single Factor 
 Kết quả ta có bảng Anova : 
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ NHÓM 1 
7 
 Biện luận: 
F=3,855652 < F0.05=4,256495 
 Chấp nhận giả thuyết H0 
 4.Kết luận: 
Vậy số quả cà chua mọc trung bình khi bón 3 loại phân trên là như nhau. 
3. Tính tỷ số tương quan của Y đối với X ,hệ số tương quan và hệ số xác định của 
tập số liệu sau đây. Với mức ý nghĩa  = 5%, có kết luận gì về mối tương quan giữa 
X và Y. (Có phi tuyến không ? Có tuyến tính không ?).Tìm đường hồi quy của Y 
đối với X. 
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ NHÓM 1 
8 
X 210 90 240 50 240 270 130 270 90 240 130 170 50 170 210
 Y 255 115 255 35 275 315 135 355 135 295 175 235 75 195 235
Bài làm: 
1.Dạng bài : đây là bài toán phân tích tương quan và hồi quy. 
2.Thực hiện bài toán bằng Excel 
I/Phân tích tương quan tuyến tính 
1.Nhập giá trị vào bảng tính 
2.Thiết lập bảng Correlation. 
 - Vào Data Data analysis , chọn Correlation 
- Trong hộp thoại Correlation lần lượt ấn định: 
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ NHÓM 1 
9 
 Phạm vi đầu vào: Input Range (quét vùng): $A$1:$B$16 
 Cách nhóm theo hàng hay cột: Group By, chọn Columns (nhóm theo 
cột). 
 Chọn Labels in first row (nhãn dữ liệu ở hàng đầu). 
 Phạm vi đầu ra: Output Range, chọn ô D3 
Nhấn OK, ta sẽ có bảng kết quả sau: 
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ NHÓM 1 
10 
Ta tìm được hệ số tương quan: r = 0.97436 
* Giả thiết Ho : X và Y không có tương quan tuyến tính 
(n = 15, r2 = 0.9493696) 
- c là phân vị mức α/2=0.025 của phân bố Student với n-2=13 bậc tự do 
Dùng Excel tính toán ta có : 
 T =(E5*SQRT(13))/SQRT(1-E5*E5) E5 : chứa giá trị r 
 c =TINV(0.05,13) 
2
2
1
r nT
r



BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ NHÓM 1 
11 
Vì T> c nên bác bỏ giả thuyết H0.Vậy X và Y có tương quan tuyến tính. 
II/Phân tích tương quan phi tuyến 
Sắp xếp lại các giá trị của X và Y theo bảng sau 
1.Thiết lập bảng Anova: Single Factor. 
- Vào Tools /Data analysis , chọn Anova: Single Factor 
- Trong hộp thoại Anova: Single Factor lần lượt ấn định: 
 Input Range, quét vùng (B1:H4). 
 Group By, chọn Columns (nhóm theo cột). 
 Chọn Labels in first row (nhãn dữ liệu nằm ở hàng đầu). 
 Mức ý nghĩa : Alpha (ấn định α=0,05). 
 Phạm vi đầu ra: Output Range, chọn ô A5 
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ NHÓM 1 
12 
Nhấn OK, ta sẽ có bảng kết quả sau Rút ra được từ bảng Anova: 
SSF = 114693.3 
SST = 119093.3 
 Tính: ɳ 2Y/X = SSF/SST = 0.96305 
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ NHÓM 1 
13 
=> Tỉ số tương quan : ɳ2Y/X =0.96305 
* Giả thiết Ho : X và Y không có tương quan phi tuyến. 
Ta có: F= 0,59241 (n = 15, k = 7) 
 c là phân vị mức α=0,05 của phân bố Fisher bậc tự do (k-2,n-k)=(5,8). 
c ~ 3.69 (=FINV(0.05,5,8)) 
Vì: F < c nên chấp nhận giả thiết Ho. 
Vậy: X và Y không có tương quan phi tuyến 
Kết luận : 
- X và Y có tương quan tuyến tính. 
- X và Y không có tương quan phi tuyến với mức ý nghĩa 5%. 
III. Phân tích hồi quy: 
Sử dụng Regression 
- Nhập dữ liệu vào bảng tính như sau: 
  
  
2 2
/
2
/ 2
Y X
Y X
r n k
F
k
  

 
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ NHÓM 1 
14 
- Vào Data/Data analysis, chọn Regression 
- Trong hộp thoại Regression lần lượt ấn định: 
 Phạm vi đầu vào: 
 Input Y Range, quét vùng ($B$2:$B$16). 
 Input X Range, quét vùng ($A$2:$A$16). 
 Chọn Labels (thêm nhãn dữ liệu). 
 Confidence Level (ngưỡng tin cậy): 95 
 Phạm vi đầu ra: Output Range, chọn ô $D$11. 
 Chọn Line Fit Plots trong Residuals để vẽ đường hồi quy 
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ NHÓM 1 
15 
- Sau đó nhấn OK ta có kết quả : 
 Kết luận : 
Đường hồi quy của Y đối với X là : 
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ NHÓM 1 
16 
Y= 6.159101 + 1.167563X 
4. Hãy phân tích vai trò ngành nghề (chính, phụ) trong hoạt động kinh tế của các 
hộ gia đình ở một vùng nông thôn trên cơ sở bảng số liệu về thu nhập của một số 
hộ tương ứng với các ngành nghề nói trên như sau (mức ý nghĩa 5 %): 
Nghề chính 
Nghề phụ 
(1) (2) (3) (4) 
Trồng lúa (1) 
Trồng cây ăn quả (2) 
Chăn nuôi (3) 
Dịch vụ (4) 
3.5:3.4:4.0 
5.6:5.2:5.8 
4.1:4.4:3.8 
7.2:7.0:7.7 
7.4:7.6:7.1 
4.1:4.4:3.9 
2.5:2.5:2.7 
3.2:3.5:3.1 
8.3:8.1:8.0 
6.1:6.4:5.8 
1.8:1.6:1.4 
2.2:2.6:2.3 
3.5:3.4:3.7 
9.6:9.7:9.2 
2.1:2.3:2.0 
1.5:1.7:1.4 
1.Dạng bài: đây là bài phân tích phương sai hai yếu tố 
2.Cách làm 
Giả thuyết : HA là năng suất không phụ thuộc vào nghề chính 
 : HB là năng suất không phụ thuộc vào nghề phụ 
 : HAB là năng suất giữa nghề chính và nghề phụ không có liên quan đến 
nhau. 
Thực hiện bài toán bằng Excel 
- Nhập dữ liệu vào bảng tính: 
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ NHÓM 1 
17 
- Chọn Data Analysis\Anova: Two Factor With Replication 
- Trong hộp thoại Anova : Two-factor With Replication lần ấn định: 
 Phạm vi đầu vào: 
Input Y Range, quét vùng ($A$2:$E$14) 
Rows per sample : 3 
Alpha: 0.05 
Output Range : ($G$17) 
 Sau đó nhấn OK ta có kết quả: 
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ NHÓM 1 
18 
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ NHÓM 1 
19 
3.Kết luận: 
a. 617.7936 = FA > Fn-1;nm(r-1);1-α = 2,90112 bác bỏ yếu tố HA, năng phụ 
thuộc vào nghề chính. 
b. 36.73547 = FB > Fm-1;nm(r-1);1-α = 2.90112 bác bỏ yếu tố HB , năng suất 
phụ thuộc vào nghề phụ. 
c. 308,223 = FAB > F(n-1)(m-1);nm(r-1);1-α = 2.188766 bác bỏ yếu tố HAB, có sự 
tương tác năng suất giữa nghề chính và nghề phụ 

File đính kèm:

  • pdfbao_cao_bai_tap_lon_mon_xac_suat_thong_ke_nguyen_minh_cuong.pdf