Báo cáo Bài tập lớn môn Xác suất thống kê

Chọn ô C7 nhập biểu thức =SUM(B3:E3)

Chọn ô D7 nhập biểu thức =SUM(B4:E4)

Chọn ô E7 nhập biểu thức =SUM(B5:E5)

 Các giá trị T.j.

Chọn ô B8 nhập biểu thức =SUM(B2:B5)

Dùng con trỏ kéo kí hiệu tự điền từ ô B8 đến ô E8.

 Các giá trị T.k

Chọn ô B9 nhập biểu thức =SUM(B2,C5,D4,E3)

Chọn ô C9 nhập biểu thức =SUM(B3,C2,D5,E4)

Chọn ô D9 nhập biểu thức =SUM(B4,C3,D2,E5)

Chọn ô E9 nhập biểu thức =SUM(B5,C4,D3,E2)

 Giá trị T

Chọn B10 và nhập biểu thức =SUM(B2:E5)

 

doc17 trang | Chuyên mục: Xác Suất Thống Kê | Chia sẻ: tuando | Lượt xem: 489 | Lượt tải: 0download
Tóm tắt nội dung Báo cáo Bài tập lớn môn Xác suất thống kê, để xem tài liệu hoàn chỉnh bạn click vào nút "TẢI VỀ" ở trên
Chọn ô K10 và nhập biểu thức =I10/((4-1)*(4-2))
Tính các giá trị và K
Chọn ô M7 và nhập biểu thức =K7/0.3958
Dùng con trỏ kéo kí hiệu tự điền từ ô M7 đến ô M9
Bước 3: Kết quả và biện luận
FR = 3,1052632 Chấp nhận H0 (pH)
FC = 11,947368 > F0,05(3,6) = 4,76 => Bác bỏ H0 (nhiệt độ)
F = 30,052632 > F0,05(3,6) = 4,76 => Bác bỏ H0 (chất xúc tác)
Kết luận: Vaäy chæ coù nhieät ñoä vaø chaát xuùc taùc gaây aûnh höôûng ñeán hieäu suaát.
 ² Ví dụ 4.2:
 Người ta đã dùng ba mức nhiệt độ gồm 105, 120 và 1350C kết hợp với ba khoảng thời gian là 15, 30 và 60 phút để thực hiện một phản ứng tổng hợp. Các hiệu suất của phản ứng (%) được trình bày trong bảng sau đây:
Thời gian (phút)
X1
Nhiệt độ (°C)
X2
Hiệu suất (%)
Y
15
30
60
15
30
60
15
30
60
105
105
105
120
120
120
135
135
135
1.87
2.02
3.28
3.05
4.07
5.54
5.03
6.45
7.26
Hãy cho biết yếu tố nhiệt độ và thời gian hoặc yếu tố thời gian có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp? Nếu có thì điều kiện nhiệt độ 115 0C trong vòng 50 phút thì hiệu suất phản ứng là bao nhiêu ?
Giải:
Dạng toán: Hồi quy tuyến tính đa tham số
Áp dụng MS-EXCEL:
-Trong trắc nghiệm t:
H0 : Βi = 0 ó Các hệ số hồi quy không có ý nghĩa
H1 : Βi ≠ 0 ó Các hệ số hồi quy có ý nghĩa
-Trong trắc nghiệm F:
H0 : Βi = 0 ó Phương trình hồi quy không thích hợp
H1 : Βi ≠ 0 ó Phương trình hồi quy thích hợp với ít nhất vài Bi
Bước 1: Nhập dữ liệu theo cột
Bước 2: Sử dụng “Regression”
Nhấn lần lượt đơn lệnh Tools và lệnh Data Analysis
Chọn chương trình Regression trong hộp thoại Data Analysis và nhấn OK
Trong hộp thoại Regression lần lượt ấn định:
-Phạm vi của biến X (Input X Range)
-Phạm vi của biến Y (Input Y Range)
-Nhãn dữ liệu (Labels)
-Mức tin cậy (Confidence Level)
 -Tọa độ đầu ra (Output Range)
Ä Phương trình hồi quy = f(X1)
= 2.73 + 0.04X1
(R2 = 0,21;S = 1,81) 
t0 = 2,129 α = 0,05)
 ⇒ Chấp nhận giả thuyết H0.
t1 = 1,38 α = 0,05)
 ⇒Chấp nhận giả thuyết H0.
F = 1,905 α = 0,05)
 ⇒Chấp nhận giả thuyết H0.
Vậy cả hai hệ số 2,37(B0) và 0,04(B1) của phương trình hồi quy = 2,73 + 0,04X1 đều không có ý nghĩa thống kê. Nói cách khác, phương trình hồi quy này không thích hợp.
Kết luận: 
Yếu tố thời gian không liên quan tuyến tính với hiệu suất của phản ứng tổng hợp.
Ä Phương trình hồi quy = f(X2)
= -11,14 + 0,13X2
(R2 = 0,76; S = 0,99)
t0 = 3,418 > t0,05 = 2,365 (Hay = 0,011 < α = 0,05)
 ⇒ Bác bỏ giả thuyết H0.
t2 = 4,757 > t0,05 = 2,365 (Hay = 0,00206 < α = 0,05)
 ⇒Bác bỏ giả thuyết H0.
F = 22,631 > = 5,590 (Hay FS = 0,00206 < α = 0,05)
 ⇒Bác bỏ giả thuyết H0.
Vậy cả hai hệ số -11,14(B0) và 0,13(B2) của phương trình hồi quy -11,14 + 0,13X2 đều có ý nghĩa thống kê. Nói cách khác, phương trình hồi quy này thích hợp.
Kết luận: 
Yếu tố nhiệt độ có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp.
Ä Phương trình hồi quy = f(X1,X2)
 = -12,70 + 0,04X1 + 0,13X2
(R2 = 0,97; S = 0,33)
t0 = 11,528 > t0,05 = 2,365 (Hay Pv = 2,260.10-5 <α = 0,05)
 ⇒ Bác bỏ giả thuyết H0.
t1 = 7,583 > t0,05 = 2,365 (Hay Pv = 0,00027 < α = 0,05)
 ⇒ Bác bỏ giả thuyết H0.
t2 = 14,328 > t0,05 = 2,365 (Hay Pv = 7,233.10-6 < α = 0,05)
 ⇒ Bác bỏ giả thuyết H0.
F = 131,392 > F0,05 = 5,140 (Hay Fs = 1,112.10-5 < α = 0,05)
 ⇒ Bác bỏ giả thuyết H0.
Vậy cả ba hệ số -12,70(B0), 0,04(B1) và 0,13(B2) của phương trình hồi quy = -12,70 + 0,04X1 + 0,13X2 đều có ý nghĩa thống kê. Nói cách khác, phương trình hồi quy này thích hợp.
 Kết luận:
Hiệu suất của phản ứng tổng hợp có liên quan tuyến tính với cả hai yếu tố là thời gian và nhiệt độ.
Hiệu suất dự đoán = B0 + B1*50 + B2*115 
Điều kiện nhiệt độ ở 115°C, thời gian 50 phút thì hiệu suất phản ứng là:
= -12,7 + 0,04.50 + 0,13.115 = 4,3108 
Bài 2:
Một nông trường nuôi bò nuôi ba giống bò sữa A, B, C. Lượng sữa của các con bò này được thống kê trong bảng sau đây: 
Loại bò
Lượng sữa
Ít
Trung bình
Nhiều
A
B
C
92
53
75
37
15
19
46
19
12
Với mức ý nghĩa a = 0,05, hãy nhận định xem có phải ba giống bò này thuần như nhau về phương diện sản lượng sữa hay không? 
BÀI LÀM:
Giả thiết H0: 3 giống bò thuần như nhau. 
 -Nhập dữ liệu vào bảng tính
Tính các tổng số: Tổng cột và tổng hàng
Giá trị tổng cột
Chọn ô B7 và nhập biểu thức=SUM(B3:B5)
Tương tự với hai ô C7 và D7
Giá trị tổng hàng
Chọn ô F3 và nhập biểu thức =SUM(B3:D3)
Tương tự với hai ô F4 và F5
Giá trị tổng cộng
Chọn ô F7 và nhập biểu thức=SUM(B3:D5)
Tính các tần số lý thuyết
- Tần số lý thuyết =(tổng hàng x tổng cột)/tổng cộng
- Số bò A ít sữa: Chọn ô B9 và nhập= B7* F3/F7
- số bò A sữa trung bình: Chọn ô C9 và nhập = C7*F3/F7
- Số bò A nhiều sữa: Chọn ô D9 và nhập =D7*F3/F7
- Làm tương tự với loại bò B và C
 Tính giá trị P(X>)
- Tính xác xuất P(X>) bằng cách chọn ô B13 và nhập = CHITEST(B3:D5, B9:D11)
Kết quả và biện luận: 
Vì P(X>)= 0,0225 bác bỏ H0
Vậy ba giống bò không thuần như nhau với mức ý nghĩa α=0,05
Bài 3:
Tính tỷ số tương quan của Y đối với X và hệ số xác định của tập số liệu sau đây:
(X, Y) = (15, 13), (25, 22), (10, 6), (15, 17), (20, 21), (10, 10), (20, 25), (25, 18), (30, 14), (30, 10).
Với mức ý nghĩa 1% .Có nhận xét gì về mối quan hệ giữa X và Y?
Giải:
 - Tính hệ số xác định:
 Nhập bảng số liệu:
 Sử dụng “Correlation”
 Nhấp lần lượt đơn lệnh Tools và lệnh Data Analysis.
 Chọn chương trình Correlation trong hộp thoại Data Analysis rồi chọn OK.
 Trong hộp thoại Correlation, lần lượt ấn định :
 + Phạm vi đầu vào ( Input Range)
 + Cách sắp xếp hàng hay cột (Group by)
 + Nhãn dữ liệu (Labals First Row/ Column)
 + Phạm vi đầu ra (Output Range)
 Hệ số xác định bằng r2 nên ta chọn ô G7 và nhập =F5*F5. Ta được kết quả như trên hình.
- Tính tỷ lệ tương quan 
 Ta có = SSF/SST. Trong đó 
 ( tổng bình phương do nhân tố)
 ( tổng bình phương chung)
 Nhập bảng số liệu như hình: 
+ Trong bài số giá trị Y trong cột x(k) là n(i) = 2.
 + Tính y2: chọn ô C2 và nhập =B2*B2. Dùng con trỏ kéo nút tự đền từ C2 đến C11
 + Tính n: Chọn ô H17 và nhập = sum(C17:G17)
 + Tính Ti: chọn ô C18 và nhập =sum(C15:C16). Tính tương tự cho các ô D18, E18, F18, G18.
 + Tính T: chọn ô I17 và nhập = sum(C18:G24)
 + Tính T2i/ni: Chọn ô C19 và nhập = C18*C18/C17. Tính tương tự cho các ô D19 đến G19
 + Tính SST: chọn ô B21 và nhập =sum(C2:C11)-I17*I17/H17
 + Tính SSF: chọn ô B22 và nhập =sum(C19:G19)-I17*I17/H17
 + Tính tỷ số tương quan: chọn ô D23 và nhập =C22/C21
 - Xét mối quan hệ giữa X và Y:
 Giả thiết H0: X và Y không có tương quan phi tuyến.
 Ta dùng test thống kê: 
 Trong bài k=5 (k là số cột chứa giá trị X)
 Tính F: chọn ô F22 và nhập =(D23-G7)*(H17-5)/(1-D23)/(5-2)
 Ta được kết quả:
 Vì F< c= 12.06 (c là phân vị mức của phân phối Fisher với bậc tự do (k-2,n-k)) do đó chấp nhận H0. Vậy ta khẳng định X và Y không có tương quan phi tuyến. 
 Bài 4: Một nhóm gồm 105 nhà doanh nghiệp Mỹ được phân loại căn cứ theo thu nhập hàng năm và tuổi thọ của họ. Kết quả thu được như sau:
Tuổi
Thu nhập
Dưới 
100 000 $
Từ 100 000 $ - 399 599 $
Trên 
400 000 $
Dưới 40
6
9
5
Tử 30 đến 54
18
19
8
Trên 54
11
12
17
	Với mức ý nghĩa 1%, kiểm định giả thiết cho rằng tuổi và mức thu nhập có quan hệ với nhau hay không ?
Giải:
Giả thiết H0: Tuổi và mức thu nhập là độc lập với nhau.
Nhập dữ liệu vào bảng tính:
Tính các tổng số: Tổng cột và tổng hàng
Giá trị tổng cột
Chọn ô B6 và nhập biểu thức =SUM(B3:B5)
Dùng con trỏ kéo nút tự điền từ B6 tới D6
Giá trị tổng hàng:
Chọn ô E3 và nhập biểu thức =SUM(B3:D3)
Dùng con trỏ kéo nút tự điền từ E3 đến E5
Giá trị tổng cộng: Chọn ô B7 và nhập biểu thức =SUM(E3:E5)
Tính các giá trị tần số lý thuyết:
Giá trị V11: chọn ô B10 và nhập =E3*B6/B7
Giá trị V12: chọn ô C10 và nhập =E3*C6/B7
Giá trị V13 chọn ô D10 và nhập =E3*D6/B7
Tương tự với các giá trị V21, V22, V23, V31, V32, V33.
Tính các giá trị P (X>2)
Tính xác suất P (X>2) bằng cách chọn ô B14 và nhập
=CHITEST(B3:D5,B10:D12)
Kết quả và biện luận:
Vì P(X>2) = 0.14375984 > α = 0.01 => chấp nhận H0
Vậy tuổi và mức thu nhập không có quan hệ với nhau.
Bài 5: Sau đây là số liệu về số lượng một loài báo được bán ở 5 quận nội thành: m
Ngaøy khaûo saùt
Quaän noäi thaønh
Q1
Q2
Q3
Q4
Q5
Thöù hai
Thöù ba
Thöù tö
Thöù naêm
Thöù saùu
Thöù baûy
22
21
25
24
28
30
18
18
25
24
19
22
22
22
25
18
15
28
18
18
19
20
22
25
18
19
20
22
25
25
	Lượng báo bán được ở 5 quận có khác nhau thực sự không? Chọn α = 1%. Lượng báo bán ra có chịu tác động của các yếu tố ngày trong tuần không? 
Giải:
Nhập dữ liệu vào bảng tính:
Giả thuyết H0:Số lượng báo bán ở mỗi quận là như nhau.
Áp dụng “Anova:Single Factor”
-Nhấp lần lượt đơn lệnh tools và lệnh data Analysis.
-Chọn chương trình “Anova:Single Factor” trong hộp thoại Data Analysís rồi nhấp nút OK.
-Trong hộp thoại “Anova:Single Factor” lần lượt ấn định:
Phạm vi đầu vào (Input range)
Cách sắp xếp theo hàng hay cột (Group by)
Nhãn dữ liệu (Labels in Fisrt Row/Column)
Mức ý nghĩa (Alpha)
Tọa độ đầu ra (Output Range,New Worksheet Ply và New Workbook)
Kết quả và biện luận:
Vì F=1.635203chấp nhận H0.Vậy số lượng báo bán ở mỗi quận là như nhau.
Giả thiết H01:lượng báo bán không chịu tác động của các ngày trong tuần.
	 H02: lượng báo bán ra không chịu tác động của quận nội thành.
Áp dụng “Anova:Two-Factor Without Replication” 
-Nhấn lần lượt đơn lệnh Tools và lệnh Data Analysis.
-Chọn chương trình “Anova:Two-Factor Without Replication” trong hộp thoại Data Analysis rồi nhấp OK.
-Trong hộp thoại “Anova:Two-Factor Without Replication”,lần lượt ấn định:
Phạm vi đầu vào (Input range)
Nhãn dữ liệu (Labels in Fisrt Row/Column)
Mức ý nghĩa (Alpha)
Tọa độ đầu ra (Output Range,New Worksheet Ply và New Workbook)
Kết quả và biện luận:
Vì FR=3.56726891Chấp nhận H01(Ngày khảo sát).
Vì FC=2.474789916 Chấp nhận H02(Quận nội thành).
Vậy số lượng báo bán không quan hệ với yếu tố quận nội thành và ngày trong tuần.

File đính kèm:

  • docbao_cao_bai_tap_lon_mon_xac_suat_thong_ke.doc