Bài tập Xác suất thống kê - Bùi Trung Hậu
1. Tính các giá trị G:
_Các giá trị G
Chọn ô G7 và nhập biểu thức =SUMSQ(B7:E7)
Dùng con trỏ kéo kí hiệu tự điền từ ô G7 đến ô G9
Chọn ô G10 và nhập biểu thức =POWER(B10,2)
Chọn ô G11 và nhập biểu thức =SUMSQ(B2:E5)
2. Tính các giá trị SSR,SSC,SSF,SST và SSE:
_Các giá trị SSR,SSC,SSF
Chọn ô I7 và nhập biểu thức =G7/4-39601/POWER(4,2)
Dùng con trỏ kéo kí hiệu tự điền từ ô I7 đến ô I9
_Giá trị SST
Chọn ô I11 và nhập biểu thức =G11-G10/POWER(4,2)
_Giá trị SSE
Chọn ô I10 và nhập biểu thức =I11-SUM(I7:I9)
ờng Đại Học Bách Khoa TPHCM óc%dó BÀI TẬP LỚN THỐNG KÊ Nhóm VII GV: PGS.TS Nguyễn Đình Huy Sinh viên: Bùi Trung Hậu MSSV: G0804211 Câu 1: Phần A: Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo ba yếu tố:pH(A), nhiệt độ(B) và chất xúc tác(C) được trình bày trong bảng sau: Yếu tố A Yếu tố B B1 B2 B3 B4 A1 C1 9 C2 14 C3 16 C4 12 A2 C2 12 C3 15 C4 12 C1 10 A3 C3 13 C4 14 C1 11 C2 14 A4 C4 10 C1 11 C2 13 C3 13 Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng? Bài làm: Nhập dữ liệu vào bảng tính: Thiết lập các biểu thức và tính các giá trị thống kê: Tính các giá trị Ti.,T.j..,T..k và T _ Các giá trị Ti Chọn ô B7 và nhập biểu thức = SUM(B2:E2) Chọn ô C7 và nhập biểu thức = SUM(B3:E3) Chọn ô D7 và nhập biểu thức = SUM(B4:E4) Chọn ô E7 và nhập biểu thức = SUM(B5:E5) _Các giá trị T.j.. Chọn ô B8 và nhập biểu thức = SUM(B2:B5) Dùng con trỏ kéo kí hiệu tự điền từ ô B8 đến ô E8 _Các giá trị T..k Chọn ô B9 và nhập biểu thức = SUM(B2,C5,D4,E3) Chọn ô C9 và nhập biểu thức = SUM(B3,C2,D5,E4) Chọn ô D9 và nhập biểu thức = SUM(B4,C3,D2,E5) Chọn ô E9 và nhập biểu thức =SUM(B5,C4,D3,E2) _Giá trị T Chọn ô B10 và nhập biểu thức =SUM(B2:E5) Tính các giá trị G: _Các giá trị G Chọn ô G7 và nhập biểu thức =SUMSQ(B7:E7) Dùng con trỏ kéo kí hiệu tự điền từ ô G7 đến ô G9 Chọn ô G10 và nhập biểu thức =POWER(B10,2) Chọn ô G11 và nhập biểu thức =SUMSQ(B2:E5) Tính các giá trị SSR,SSC,SSF,SST và SSE: _Các giá trị SSR,SSC,SSF Chọn ô I7 và nhập biểu thức =G7/4-39601/POWER(4,2) Dùng con trỏ kéo kí hiệu tự điền từ ô I7 đến ô I9 _Giá trị SST Chọn ô I11 và nhập biểu thức =G11-G10/POWER(4,2) _Giá trị SSE Chọn ô I10 và nhập biểu thức =I11-SUM(I7:I9) Tính các giá trị MSR,MSC,MSF và MSE: _Giá trị MSR,MSC,MSF: Chọn ô K7 và nhập biểu thức =I7/(4-1) Dùng con trỏ kéo kí hiệu tự điền từ ô K7 đến ô K9 _Giá trị MSE: Chọn ô K10 và nhập biểu thức =I10/((4-1)*(4-2)) Tính các giá trị Ġ và F: Chọn ô M7 và nhập biểu thức =K7/0.3958 Dùng con trỏ kéo kí hiệu tự điền từ ô M7 đến ô M9 Kết quả và biện luận: FR = 3.10 < F0.05(3.6) = 4.76 nên chấp nhận H0(pH) FC =11.95 > F0.05(3.6) = 4.76 nên bác bỏ H0(nhiệt độ) F = 30.05 > F0.05(3.6) = 4.76 nên bác bỏ H0(chất xúc tác) Vậy chỉ có nhiệt độ và chất xúc tác gây ra ảnh hưởng đến hiệu suất. Phần B: Người ta dùng ba mức nhiệt độ gồm 105,120 và 1350C kết hợp với ba khoảng thời gian là 15,30 và 60 phút để thực hiện một phản ứng tổng hợp.Các hiệu suất của phản ứng (%) được trình bày trong bảng sau đây: Thời gian (phút) X1 Nhiệt độ(0C) X2 Hiệu suất(%) Y 15 105 1,87 30 105 2,02 60 105 3,28 15 120 3,05 30 120 4,07 60 120 5,54 15 135 5,03 30 135 6,45 60 135 7,26 Hãy cho biết yếu tố nhiệt độ và thời gian/ hoặc yếu tố thời gian có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp?Nếu có thì điều kiện nhiệt độ 1150C trong vòng 50 phút thì hiệu suất phản ứng sẽ là bao nhiêu? Bài làm: Nhập dữ liệu vào bảng tính: Dữ liệu nhất thiết phải được nhập theo cột Áp dụng “Regresson” Nhấn lần lượt lệnh Tool và lệnh Data Analysis. Chọn chương trình Regresson trong hộp thoại Data Analysis rồi nhấp Ok. Trong hộp thoại Regreson, lần lượt ấn định các chi tiết: _ Phạm vi của biến số Y(Input Y Range) _ Phạm vi của biến số X(Input X Range) _ Nhãn dữ liệu(Labels) _ Mức tin cậy(Confidence Level) _ Tọa độ đầu ra(Output Range) _ Đường hồi quy(Line Fit Plots) _ Biểu thức sai số(Residuals Plots), Các giá trị đầu ra cho bởi bảng sau: Phương trình hồi quy ŶX1 = f(X1) ŶX1 = 2,73 + 0,04X1 (R2 = 0,21; S=1,81) t0 = 2,129 α=0,05) nên chấp nhận giả thiết H0. t1 = 1,38 α=0,05) nên chấp nhận giả thiết H0. F = 1,905 α=0,05) nên chấp nhận giả thiết H0. Vậy cả hai hệ số 2,37(B0) và 0,04(B1) của phương trình hồi quy ŶX1 = 2,73 + 0,04X1 đều không có ý nghĩa thống kê.Nói cách khác, phương trình hồi quy này không thích hợp. Kết luận: Yếu tố thời gian không có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp. Phương trình hồi quy ŶX2 = f(X2) Nhập các giá trị vào bảng sau: Các giá trị đầu ra cho bởi bảng sau: ŶX2 = -11,14 + 0,13X2 (R2 = 0,76; S=0,99) t0 = 3,418 > t0,05 = 2,365 (hay P2V = 0,011 < α=0,05) nên bác bỏ giả thiết H0. t1 = 4,757 > t0,05 = 2,365 (hay PV = 0,00206 < α=0,05) nên bác bỏ giả thiết H0. F = 22,631 > F0,05 = 5,590 (hay FS = 0,00206 < α=0,05) nên bác bỏ giả thiết H0. Vậy cả hai hệ số -11,14(B0) và 0,13(B1) của phương trình hồi quy ŶX2 = -11,14 + 0,13X2 đều có ý nghĩa thống kê.Nói cách khác, phương trình hồi quy này thích hợp. Kết luận: Yếu tố nhiệt độ có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp. Phương trình hồi quy ŶX1,X2 = f(X1,X2) Nhập các giá trị vào bảng sau: Các giá trị đầu ra cho bởi bảng sau: ŶX1,X2 = -12,70 + 0,04X1 + 0,13X2 (R2 = 0,97; S=0,33) t0 = 11,528 > t0.05 = 2,365 (hay P2V = 2,260.10-5 < α=0,05) nên bác bỏ giả thiết H0. t1 = 7,583 > t0.05 = 2,365 (hay PV = 0,00027 < α=0,05) nên bác bỏ giả thiết H0. t2 = 14,328 > t0,05 = 2,365 (hay PV = 7,23.10-6 < α=0,05) nên bác bỏ giả thiết H0. F = 131,392 > F0,05 = 5,140 (hay FS = 1,112.10-5 < α=0,05) nên bác bỏ giả thiết H0. Vậy cả hai hệ số -12,70(B0);0,04(B1) và 0.13(B2) của phương trình hồi quy ŶX1,X2 = -12,70 + 0,04X1 + 0,13X2 đều có ý nghĩa thống kê.Nói cách khác, phương trình hồi quy này thích hợp. Kết luận: Hiệu suất của phản ứng tổng hợp có liên quan tuyến tính với cả hai yếu tố là thời gian và nhiệt độ. Sự tuyến tính của phương trình ŶX1,X2 = -12,70 + 0,04X1 + 0,13X2 có thể được trình bày trên biểu đồ phân tán(scatterplots): Nếu muốn dự đoán hiệu suất của phản ứng bằng phương trình hồi quy ŶX1,X2 = -12,70 + 0,04X1 + 0,13X2,chỉ cần chọn một ô,ví dụ B21,sau đó nhập hàm và được kết quả như sau: 4,310873016 Ghi chú:B17 là tọa độ của B0, B18 là tọa độ của B1, B19 là tọa độ của B2,50 là giá trị của X1(thời gian) và 115 là giá trị của X2 (nhiệt độ). Câu 2: Một nhà nông học tiến hành việc kiểm định hiệu quả của ba loại phân này trên các cây cà chua và theo dõi số quả cà chua mọc trên mỗi cây. Kết quả thu được như bảng sau: Loại phân A B C 24 21 16 18 26 22 27 32 19 28 25 17 Với mức ý nghĩa = 15, hãy so sánh số quả cà chua mọc trung bình khi bón ba loại phân A, B, C nói trên. Bài làm: I.Thuật toán: a. Mở chương trình Ms-EXCEL. b. Nhập bảng dữ liệu: _Áp dụng “Anova: Single Factor” c. Kết quả: Thu được bảng Anova. Trong đó cho kết quả của F, _ Nếu F < thì chấp nhận giả thiết H0 _ Nếu F > thì bác bỏ giả thiết H0 II.Quá trình giải thuật: Mở chương trình Ms-EXCEL và nhập dữ liệu vào bảng: Nhập dữ liệu vào bảng tính: Gọi hộp thoại Data Analysis. Chọn chương trình Anova: Single Factor. Nhấn OK Nhập dữ liệu vào hộp thoại Anova: Single Factor. Nhấn OK Thu được bảng kết quả: Giá Trị Giá trị F III.Kết quả và biện luận: F = 3.8556 > F0.15 = 2.3597 Bác bỏ giả thiết H0 Vậy số quả cà chua mọc trung bình khi bón ba loại phân A, B, C là khác nhau Dựa vào giá trị trung bình ta thấy số quả cà chua khi bón phân A và B tương đương nhau, và nhiều hơn khi so với bón phân C. Do đó đi đến kết luận là nên bón phân A hoặc B sẽ thu được kết quả tốt nhất. Câu 3: Một cửa hàng lớn có bán ba loại giày A, B, C. Theo dõi số khách hàng mua các loại giày này trong 5 ngày, người quản lý thu được bảng số liệu sau: Loại giày A B C 28 35 33 21 42 38 20 32 31 18 25 42 23 27 29 Với mức ý nghĩa = 1, hãy so sánh lượng tiêu thụ trung bình của ba loại giày nói trên. Bài làm: I.Thuật toán: a. Mở chương trình Ms-EXCEL. b. Nhập bảng dữ liệu: _Áp dụng “Anova: Single Factor” c. Kết quả: Thu được bảng Anova. Trong đó cho kết quả của F, _ Nếu F < thì chấp nhận giả thiết H0 _ Nếu F > thì bác bỏ giả thiết H0 II.Quá trình giải thuật: Mở chương trình Ms-EXCEL và nhập dữ liệu vào bảng: Nhập dữ liệu vào bảng tính: Gọi hộp thoại Data Analysis. Chọn chương trình Anova: Single Factor. Nhấn OK Nhập dữ liệu vào hộp thoại Anova: Single Factor. Nhấn OK Thu được bảng kết quả: Giá Trị F Giá Trị F0.01 III.Kết quả và biện luận: F = 7.5864 > F0.01 = 6.9266 Bác bỏ giả thiết H0 Vậy số lượng tiêu thụ trung bình của ba loại giày A, B, C là khác nhau Dựa vào giá trị trung bình, lượng giày B và C bán ra tương đương nhau, và nhiều hơn loại giày A è Cần tập trung bán 2 loại giày B và C Câu 4: Bảng sau đây cho ta số liệu về màu tóc của 422 người: Màu tóc Nam Nữ Đen 56 32 Hung 37 66 Nâu 84 90 Vàng 19 38 Với mức ý nghĩa 1, nhận định xem số liệu có mối quan hệ giữa màu tóc và giới tính hay không. Bài làm: I. Thuật toán: a. Mở chương trình Ms-EXCEL. b. Nhập bảng dữ liệu. _ Tính tổng hàng, tổng cột. _ Tính tần số lý thuyết = (tổng hàng * tổng cột)/tổng cộng. _ Gọi hàm CHITEST, nhập dữ liệu vào chọn, đầu ra cho dữ liệu. c. Kết quả: Thu được bảng Anova. Trong đó cho kết quả của P (X>χ2) _ Nếu P(X>χ2) > α thì chấp nhận giả thiết H0 _ Nếu ngược lai thì bác bỏ giả thiết H0 II.Quá trình giải thuật: Mở chương trình Ms-EXCEL và nhập dữ liệu vào bảng: Nhập dữ liệu vào bảng tính: Nhập thêm “tổng hàng”, ”tổng cột”, ”P”, ”nam”, “nữ”. Tính tổng hàng,tổng cột: Chọn ô hay cột cần tính tổng sau đó dung cú pháp: =sum(trị bảng dò) Rồi nhấn Enter. Ví dụ: Tại ô B6, B6=sum(B2:B5) Tại ô D2, D2=sum(B2:C2) Tiếp theo tính tần số lý thuyết: =(tổng hàng * tổng cột)/tổng cộng. Ví dụ: Tại ô B9, B9=D2*B6/D6 Nhấn vào Insert Function để gọi hàm CHITEST, nhấn OK =D2*B6/D6 . =sum(B2:C2) =sum(B2:B5) Insert Function Xuất hiện hộp thoại Function Agruments. Nhập các giá trị tần số quan sát Actual_range Nhập các giá trị tần số lý thuyết vào mục Expected_range. Nhấp Ok. III.Kết quả và biện luận: P = 0.000247 Thu được bảng Anova. Trong đó cho kết quả của P (X>χ2) P (X>χ2) < α=1% nên bác bỏ giả thiết H0 Vậy tỉ lệ Nam Nữ theo màu tóc là khác nhau, từ đó đi đến kết luận màu tóc có phụ thuộc vào giới tính.
File đính kèm:
- bai_tap_xac_suat_thong_ke_bui_trung_hau.doc