Bài tập Xác suất thống kê - Bùi Trung Hậu

1. Tính các giá trị G:

_Các giá trị G

Chọn ô G7 và nhập biểu thức =SUMSQ(B7:E7)

Dùng con trỏ kéo kí hiệu tự điền từ ô G7 đến ô G9

Chọn ô G10 và nhập biểu thức =POWER(B10,2)

Chọn ô G11 và nhập biểu thức =SUMSQ(B2:E5)

2. Tính các giá trị SSR,SSC,SSF,SST và SSE:

_Các giá trị SSR,SSC,SSF

Chọn ô I7 và nhập biểu thức =G7/4-39601/POWER(4,2)

Dùng con trỏ kéo kí hiệu tự điền từ ô I7 đến ô I9

_Giá trị SST

Chọn ô I11 và nhập biểu thức =G11-G10/POWER(4,2)

_Giá trị SSE

Chọn ô I10 và nhập biểu thức =I11-SUM(I7:I9)

 

doc19 trang | Chuyên mục: Xác Suất Thống Kê | Chia sẻ: tuando | Lượt xem: 344 | Lượt tải: 0download
Tóm tắt nội dung Bài tập Xác suất thống kê - Bùi Trung Hậu, để xem tài liệu hoàn chỉnh bạn click vào nút "TẢI VỀ" ở trên
ờng Đại Học Bách Khoa TPHCM
óc%dó
BÀI TẬP LỚN THỐNG KÊ
Nhóm VII
GV: PGS.TS Nguyễn Đình Huy
Sinh viên: Bùi Trung Hậu
MSSV: G0804211
	Câu 1: 
Phần A: Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo ba yếu tố:pH(A), nhiệt độ(B) và chất xúc tác(C) được trình bày trong bảng sau:
Yếu tố A
Yếu tố B
B1
B2
B3
B4
A1
C1
9
C2
14
C3
16
C4
12
A2
C2
12
C3
15
C4
12
C1
10
A3
C3
13
C4
14
C1
11
C2
14
A4
C4
10
C1
11
C2
13
C3
13
Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng?
Bài làm:
	Nhập dữ liệu vào bảng tính:
Thiết lập các biểu thức và tính các giá trị thống kê:
Tính các giá trị Ti.,T.j..,T..k và T
_ Các giá trị Ti
Chọn ô B7 và nhập biểu thức = SUM(B2:E2)
Chọn ô C7 và nhập biểu thức = SUM(B3:E3)
Chọn ô D7 và nhập biểu thức = SUM(B4:E4)
Chọn ô E7 và nhập biểu thức = SUM(B5:E5)
_Các giá trị T.j..
Chọn ô B8 và nhập biểu thức = SUM(B2:B5)
Dùng con trỏ kéo kí hiệu tự điền từ ô B8 đến ô E8
_Các giá trị T..k 
Chọn ô B9 và nhập biểu thức = SUM(B2,C5,D4,E3)
Chọn ô C9 và nhập biểu thức = SUM(B3,C2,D5,E4)
Chọn ô D9 và nhập biểu thức = SUM(B4,C3,D2,E5)
Chọn ô E9 và nhập biểu thức =SUM(B5,C4,D3,E2)
	_Giá trị T
	Chọn ô B10 và nhập biểu thức =SUM(B2:E5)
Tính các giá trị G:
_Các giá trị G
Chọn ô G7 và nhập biểu thức =SUMSQ(B7:E7)
Dùng con trỏ kéo kí hiệu tự điền từ ô G7 đến ô G9
Chọn ô G10 và nhập biểu thức =POWER(B10,2)
Chọn ô G11 và nhập biểu thức =SUMSQ(B2:E5)
Tính các giá trị SSR,SSC,SSF,SST và SSE:
_Các giá trị SSR,SSC,SSF
Chọn ô I7 và nhập biểu thức =G7/4-39601/POWER(4,2)
Dùng con trỏ kéo kí hiệu tự điền từ ô I7 đến ô I9
_Giá trị SST
Chọn ô I11 và nhập biểu thức =G11-G10/POWER(4,2)
_Giá trị SSE
Chọn ô I10 và nhập biểu thức =I11-SUM(I7:I9)
Tính các giá trị MSR,MSC,MSF và MSE:
_Giá trị MSR,MSC,MSF:
Chọn ô K7 và nhập biểu thức =I7/(4-1)
Dùng con trỏ kéo kí hiệu tự điền từ ô K7 đến ô K9
_Giá trị MSE:
Chọn ô K10 và nhập biểu thức =I10/((4-1)*(4-2))
Tính các giá trị Ġ và F:
Chọn ô M7 và nhập biểu thức =K7/0.3958
Dùng con trỏ kéo kí hiệu tự điền từ ô M7 đến ô M9
Kết quả và biện luận:
FR = 3.10 < F0.05(3.6) = 4.76 nên chấp nhận H0(pH)
FC =11.95 > F0.05(3.6) = 4.76 nên bác bỏ H0(nhiệt độ)
F = 30.05 > F0.05(3.6) = 4.76 nên bác bỏ H0(chất xúc tác)
Vậy chỉ có nhiệt độ và chất xúc tác gây ra ảnh hưởng đến hiệu suất. 
Phần B: Người ta dùng ba mức nhiệt độ gồm 105,120 và 1350C kết hợp với ba khoảng thời gian là 15,30 và 60 phút để thực hiện một phản ứng tổng hợp.Các hiệu suất của phản ứng (%) được trình bày trong bảng sau đây:
Thời gian (phút) X1
Nhiệt độ(0C) X2
Hiệu suất(%) Y
15
105
1,87
30
105
2,02
60
105
3,28
15
120
3,05
30
120
4,07
60
120
5,54
15
135
5,03
30
135
6,45
60
135
7,26
Hãy cho biết yếu tố nhiệt độ và thời gian/ hoặc yếu tố thời gian có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp?Nếu có thì điều kiện nhiệt độ 1150C trong vòng 50 phút thì hiệu suất phản ứng sẽ là bao nhiêu?
Bài làm:
Nhập dữ liệu vào bảng tính:
Dữ liệu nhất thiết phải được nhập theo cột
Áp dụng “Regresson”
Nhấn lần lượt lệnh Tool và lệnh Data Analysis.
Chọn chương trình Regresson trong hộp thoại Data Analysis rồi nhấp Ok.
Trong hộp thoại Regreson, lần lượt ấn định các chi tiết:
	_ Phạm vi của biến số Y(Input Y Range)
	_ Phạm vi của biến số X(Input X Range)
	_ Nhãn dữ liệu(Labels)
	_ Mức tin cậy(Confidence Level)
	_ Tọa độ đầu ra(Output Range)
	_ Đường hồi quy(Line Fit Plots)
	_ Biểu thức sai số(Residuals Plots),
Các giá trị đầu ra cho bởi bảng sau:
Phương trình hồi quy ŶX1 = f(X1)
ŶX1 = 2,73 + 0,04X1 (R2 = 0,21; S=1,81)
t0 = 2,129 α=0,05)
nên chấp nhận giả thiết H0.
t1 = 1,38 α=0,05)
nên chấp nhận giả thiết H0.
F = 1,905 α=0,05)
nên chấp nhận giả thiết H0.
Vậy cả hai hệ số 2,37(B0) và 0,04(B1) của phương trình hồi quy ŶX1 = 2,73 + 0,04X1 đều không có ý nghĩa thống kê.Nói cách khác, phương trình hồi quy này không thích hợp.
	Kết luận: Yếu tố thời gian không có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp.
Phương trình hồi quy ŶX2 = f(X2)
Nhập các giá trị vào bảng sau:
Các giá trị đầu ra cho bởi bảng sau:
ŶX2 = -11,14 + 0,13X2 (R2 = 0,76; S=0,99)
t0 = 3,418 > t0,05 = 2,365 (hay P2V = 0,011 < α=0,05)
nên bác bỏ giả thiết H0.
t1 = 4,757 > t0,05 = 2,365 (hay PV = 0,00206 < α=0,05)
nên bác bỏ giả thiết H0.
F = 22,631 > F0,05 = 5,590 (hay FS = 0,00206 < α=0,05)
nên bác bỏ giả thiết H0.
Vậy cả hai hệ số -11,14(B0) và 0,13(B1) của phương trình hồi quy ŶX2 = -11,14 + 0,13X2 đều có ý nghĩa thống kê.Nói cách khác, phương trình hồi quy này thích hợp.
	Kết luận: Yếu tố nhiệt độ có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp.
Phương trình hồi quy ŶX1,X2 = f(X1,X2)
Nhập các giá trị vào bảng sau:
Các giá trị đầu ra cho bởi bảng sau:
ŶX1,X2 = -12,70 + 0,04X1 + 0,13X2 (R2 = 0,97; S=0,33)
t0 = 11,528 > t0.05 = 2,365 (hay P2V = 2,260.10-5 < α=0,05)
nên bác bỏ giả thiết H0.
t1 = 7,583 > t0.05 = 2,365 (hay PV = 0,00027 < α=0,05)
nên bác bỏ giả thiết H0.
t2 = 14,328 > t0,05 = 2,365 (hay PV = 7,23.10-6 < α=0,05)
nên bác bỏ giả thiết H0.
F = 131,392 > F0,05 = 5,140 (hay FS = 1,112.10-5 < α=0,05)
nên bác bỏ giả thiết H0.
Vậy cả hai hệ số -12,70(B0);0,04(B1) và 0.13(B2) của phương trình hồi quy ŶX1,X2 = -12,70 + 0,04X1 + 0,13X2 đều có ý nghĩa thống kê.Nói cách khác, phương trình hồi quy này thích hợp.
	Kết luận: Hiệu suất của phản ứng tổng hợp có liên quan tuyến tính với cả hai yếu tố là thời gian và nhiệt độ.
Sự tuyến tính của phương trình ŶX1,X2 = -12,70 + 0,04X1 + 0,13X2 có thể được trình bày trên biểu đồ phân tán(scatterplots):
	Nếu muốn dự đoán hiệu suất của phản ứng bằng phương trình hồi quy ŶX1,X2 = -12,70 + 0,04X1 + 0,13X2,chỉ cần chọn một ô,ví dụ B21,sau đó nhập hàm và được kết quả như sau:
 4,310873016
	Ghi chú:B17 là tọa độ của B0, B18 là tọa độ của B1, B19 là tọa độ của B2,50 là giá trị của X1(thời gian) và 115 là giá trị của X2 (nhiệt độ). 
Câu 2:
	Một nhà nông học tiến hành việc kiểm định hiệu quả của ba loại phân này trên các cây cà chua và theo dõi số quả cà chua mọc trên mỗi cây. Kết quả thu được như bảng sau:
Loại phân
A
B
C
24
21
16
18
26
22
27
32
19
28
25
17
	Với mức ý nghĩa = 15, hãy so sánh số quả cà chua mọc trung bình khi bón ba loại phân A, B, C nói trên.
Bài làm:
I.Thuật toán:
a. Mở chương trình Ms-EXCEL.
b. Nhập bảng dữ liệu:
	_Áp dụng “Anova: Single Factor”
c. Kết quả:
 	Thu được bảng Anova. Trong đó cho kết quả của F, 
	_ Nếu F < thì chấp nhận giả thiết H0
	_ Nếu F > thì bác bỏ giả thiết H0
II.Quá trình giải thuật:
Mở chương trình Ms-EXCEL và nhập dữ liệu vào bảng:
Nhập dữ liệu vào bảng tính:
Gọi hộp thoại Data Analysis. Chọn chương trình Anova: Single Factor. Nhấn OK
Nhập dữ liệu vào hộp thoại Anova: Single Factor. Nhấn OK
	Thu được bảng kết quả:
Giá Trị 
Giá trị F
III.Kết quả và biện luận:
	F = 3.8556 > F0.15 = 2.3597 
Bác bỏ giả thiết H0
Vậy số quả cà chua mọc trung bình khi bón ba loại phân A, B, C là khác nhau
Dựa vào giá trị trung bình ta thấy số quả cà chua khi bón phân A và B tương đương nhau, và nhiều hơn khi so với bón phân C. Do đó đi đến kết luận là nên bón phân A hoặc B sẽ thu được kết quả tốt nhất.
Câu 3:
	Một cửa hàng lớn có bán ba loại giày A, B, C. Theo dõi số khách hàng mua các loại giày này trong 5 ngày, người quản lý thu được bảng số liệu sau:
Loại giày
A
B
C
28
35
33
21
42
38
20
32
31
18
25
42
23
27
29
	Với mức ý nghĩa = 1, hãy so sánh lượng tiêu thụ trung bình của ba loại giày nói trên.
Bài làm:
I.Thuật toán:
a. Mở chương trình Ms-EXCEL.
b. Nhập bảng dữ liệu:
	_Áp dụng “Anova: Single Factor”
c. Kết quả:
 	Thu được bảng Anova. Trong đó cho kết quả của F, 
	_ Nếu F < thì chấp nhận giả thiết H0
	_ Nếu F > thì bác bỏ giả thiết H0
II.Quá trình giải thuật:
Mở chương trình Ms-EXCEL và nhập dữ liệu vào bảng:
Nhập dữ liệu vào bảng tính:
Gọi hộp thoại Data Analysis. Chọn chương trình Anova: Single Factor. Nhấn OK
Nhập dữ liệu vào hộp thoại Anova: Single Factor. Nhấn OK
Thu được bảng kết quả:
Giá Trị F
Giá Trị F0.01
III.Kết quả và biện luận:
	F = 7.5864 > F0.01 = 6.9266 
Bác bỏ giả thiết H0
Vậy số lượng tiêu thụ trung bình của ba loại giày A, B, C là khác nhau
Dựa vào giá trị trung bình, lượng giày B và C bán ra tương đương nhau, và nhiều hơn loại giày A è Cần tập trung bán 2 loại giày B và C
Câu 4: 
Bảng sau đây cho ta số liệu về màu tóc của 422 người:
Màu tóc
Nam
Nữ
Đen
56
32
Hung
37
66
Nâu
84
90
Vàng
19
38
	Với mức ý nghĩa 1, nhận định xem số liệu có mối quan hệ giữa màu tóc và giới tính hay không.
Bài làm:
I. Thuật toán:
a. Mở chương trình Ms-EXCEL.
b. Nhập bảng dữ liệu.
	_ Tính tổng hàng, tổng cột.
	_ Tính tần số lý thuyết = (tổng hàng * tổng cột)/tổng cộng.
	_ Gọi hàm CHITEST, nhập dữ liệu vào chọn, đầu ra cho dữ liệu.
c. Kết quả:
 Thu được bảng Anova. Trong đó cho kết quả của P (X>χ2) 
	_ Nếu P(X>χ2) > α thì chấp nhận giả thiết H0
	_ Nếu ngược lai thì bác bỏ giả thiết H0
II.Quá trình giải thuật:
Mở chương trình Ms-EXCEL và nhập dữ liệu vào bảng:
Nhập dữ liệu vào bảng tính:
Nhập thêm “tổng hàng”, ”tổng cột”, ”P”, ”nam”, “nữ”.
Tính tổng hàng,tổng cột:
Chọn ô hay cột cần tính tổng sau đó dung cú pháp:
	=sum(trị bảng dò)
Rồi nhấn Enter.
Ví dụ:
Tại ô B6, B6=sum(B2:B5)
Tại ô D2, D2=sum(B2:C2)
Tiếp theo tính tần số lý thuyết:
 =(tổng hàng * tổng cột)/tổng cộng.
Ví dụ:
Tại ô B9, B9=D2*B6/D6
Nhấn vào Insert Function để gọi hàm CHITEST, nhấn OK
=D2*B6/D6
.
=sum(B2:C2)
=sum(B2:B5)
Insert Function
Xuất hiện hộp thoại Function Agruments.
Nhập các giá trị tần số quan sát Actual_range
Nhập các giá trị tần số lý thuyết vào mục Expected_range. Nhấp Ok.
III.Kết quả và biện luận:
	P = 0.000247
Thu được bảng Anova. Trong đó cho kết quả của P (X>χ2) 
P (X>χ2) < α=1% nên bác bỏ giả thiết H0
Vậy tỉ lệ Nam Nữ theo màu tóc là khác nhau, từ đó đi đến kết luận màu tóc có phụ thuộc vào giới tính.

File đính kèm:

  • docbai_tap_xac_suat_thong_ke_bui_trung_hau.doc