Báo cáo môn Xác suất thống kê
1. Tính các giá trị Ti., T.j., T.k và T.
• Các giá trị Ti.
Chọn ô B7 và chọn biểu thức =SUM(B2:E2)
Chọn ô C7 và nhập biểu thức =SUM(B3:E3)
Chọn ô D7 và nhập biểu thức =SUM(B4:E4)
Chọn ô E7 và nhập biểu thức =SUM(B4:E4)
• Các giá trị T.j.
Chọn ô B8 và nhập biểu thức =SUM(B2:B5)
Dùng con trỏ kéo ký hiệu tự điền từ ô B8 đến ô E8
• Các giá trị T.k
Chọn ô B9 và nhập biểu thức =SUM(B2,C5,D4,E3)
Chọn ô C9 và nhập biểu thức =SUM(B3,C2,D5,E4)
Chọn ô D9 và nhập biểu thức =SUM(B4,C3,D2,E5)
Chọn ô E9 và nhập biểu thức =SUM(B5,C4,D3,E2)
• Giá trị T
Chọn ô B10 và nhập biểu thức=SUM(B2:B5)
2. Tính các giá trị G
Chọn ô G7 và nhập biểu thức =SUMSQ(B7:E7)
Dùng con trỏ kéo ký hiệu tự điền từ ô G7 đến ô G9
Chọn ô G10 và nhập biểu thức =POWER(B10,2)
Chọn ô G11 và nhập biểu thức =SUMSQ(B2:E5)
h hồi quy Ŷx1 = 2.73 + 0.04X1 đều không có ý nghĩa thống kê. Nói cách khác phương trình hồi quy này không thích hợp. Kết luận: yếu tố thời gian không có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp. Phương trình hồi quy Ŷx2 = f(X2) Ŷx2 = -11.14 + 0.13X2 (R2 = 0.76; S = 0.99) t0 = 3.418 > t0.05 = 2.365 (hay Pv2=0.011 > α=0.05) =>Bác bỏ giả thiết H0 t1= 4.757 > t0.05 = 2.365(hay Pv=0.00206 Bác bỏ giả thiết H0 F= 22.631 > F=5.590(hay Fs=0.00206 Bác bỏ giả thiết H0 Vậy cả hai hệ số -11.14 (B0) và 0.13 (B2) của phương trình hồi quy Ŷx2= -11.14 + 0.13X2 đều có ý nghĩa thống kê. Nói cách khác phương trình hồi quy này thích hợp. Kết luận: yếu tố nhiệt độ có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp. Phương trình hồi quy: Ŷx1,x2=f(X1,X2) Ŷx1,x2 = -12.70 + 0.04X1 + 0.13X2 (R2=0.97; S=0.33) t0=11.528 > t0.05=2.365 (hay Pv2=2.260.10-5Bác bỏ giả thiết H0 t1=7.583 > t0.05=2.365 (hay Pv=0.00027Bác bỏ giả thiết H0 F=131.392 > 5.14 (hay Fs=1.112.10-5Bác bỏ giả thiết H0 Vậy cả hai hệ số -12.70 (B0), 0.04 (B1) và 0.13 (B1) của phương trình hồi quy Ŷx1,x2 =-12.7 + 0.04X1 + 0.13X2 đều có ý nghĩa thống kê. Nói cách khác, phương trình hồi quy này thích hợp. Kết luận: Hiệu suất của phản ứng tổng hợp có liên quan tuyến tính với cả hai yếu tố là thời gian và nhiệt độ. Sự tuyến tính của phương trình Ŷx1,x2 = -12.70 + 0.04X1 + 0.13X2. Có thể được trình bày trong biểu đồ phân tán (scatter plots): Nếu muốn dự đoán hiệu suất bằng phương trình hồi quy Ŷx1,x2 = -12.70 + 0.04X1 + 0.13X2 chỉ cần chọn một ô, ví dụ như: B21, sau đó nhập hàm = B17 + B18*50 + B19*115 . Và được kết quả như sau: Ghi chú: B17 tọa độ của B0, B18 tọa độ của B1, B19 tọa độ của B2, 50 là giá trị xủa X1 ( thời gian ) và 115 là giá trị của X2 ( nhiệt độ ). Bài 2: Một nhà nông học tiến hành việc kiểm định hiệu quả của ba loại phân này trên các cây cà chua và theo dõi số quả cà chua mọc trên mỗi cây. Kết quả thu được như sau: Loại phân A B C 24 18 27 28 21 26 32 25 16 22 19 17 Với mức ý nghĩa a =5%, hay so sánh số quả cà chua mọc trung bình khi bón ba loại phân A, B, C nói trên. Cơ sở lý thuyết : PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ Phép phân tích phương sai được dùng trong các trắc nghiệm để so sánh các giá trị trung bình của hai hay nhiều mẫu được lấy từ các phân số.Đây có thể được xem như phần mở rộng các trắc nghiệm t hay z (so sánh hai giá trị trung bình). Mục đích của sự phân tích phương sai một yếu tố là đánh giá sự ảnh hưởng của một yếu tố (nhân tạo hay tự nhiên) nào đó trên các giá trị quan sát, Yi(i=0,1,2,,k). Mô hình: Yếu tố thí nghiệm 1 2 .. K Y11 Y21 .. Yk1 Y12 Y22 .. Yk2 .. .. .. .. Y1N Y2N .. YkN Tổng cộng trung bình T1 T2 .. .. Tk T Bảng ANOVA: Nguồn sai số Bậc sai số Tổng số bình phương Bình phương trung bình Giá trị thống kê Yếu tố Sai số k-1 N-k SSF= SSE=SST-SSF MSF= MSE= F= Tổng cộng N-1 SST= Trắc nghiệm: Giả thiết: H0: “Các giá trị trung bình bằng nhau” H1: “Ít nhất có hai giá trị trung bình khác nhau” Giá trị thống kê: F= Biện luận: Nếu F chấp nhận giả thiết H0 Bài làm: Đây là bài toán phân tích phương sai một yếu tố, số quả cà chua mọc trung bình chịu ảnh hưởng bởi loại phân bón. Giả thiết H0: µ1 = µ2 = µ3; tức số quả cà chua mọc trung bình là bằng nhau Nhập dữ liệu vào bảng: Áp dụng “ Anova: Single Factor” a.Nhấn lần lượt đơn lệnh Data và lệnh Data Analysis. b.Chọn trương trình Anova: Single Factor trong hộp thoại Data Analysis rồi nhấn nút OK c.Trong hộp thoại Anova: Single Factor lần lượt ấn định - Phạm vi đầu vào (Input range) - Cách xắp xếp theo hàng hay cột (Group by) - Nhãn dử liệu (Labels in fisrt row/column) - Phạm vi đầu ra (Output range) Bảng Anova: Kết luận: Từ giá trị trong bảng Anova: F= 3.855652 Chấp nhận H0 => Lượng quả cà chua mọc trung bình khi sử dụng các loại phân khác nhau là như nhau. Bài 3: Bảng sau đây cho ta số liệu về màu tóc của 422 người: Màu tóc Nam Nữ Đen Hung Nâu Vàng 56 37 84 19 32 66 90 38 Với mức ý nghĩa 3%, nhận định xem liệu có mối quan hệ giữa màu tóc và giới tính hay không. Cơ sở lý thuyết: KIỂM ĐỊNH TÍNH ĐỘC LẬP Khái niệm thống kê và giả thuyết bài toán: Mục đích: Xét một tổng thể gồm 2 dấu hiện X, Y. Các dấu hiệu này có thể là dấu hiệu định tính hoặc định lượng. Trong trường hợp bài toán nêu trên là cả 2 dấu hiệu đều là dấu hiệu định tính. Lấy mẫu kích thước n ta có bảng số liệu như sau: Y X y1 y2 yh ni x1 n11 n12 n1h n1 x2 n21 n22 n2h n2 xk nk1 nk2 nkh nk mj m1 m2 mh ni=n Trong đó: -xi ( i=1,k ) - các dấu hiệu mà X nhận -yj ( j=1,h ) – các dấu hiệu mà Y nhận - ni (i =1,k) – số lần X nhận xi - mj (j =1,h) – số lần Y nhận yj nij (i = 1,...,k ; j = 1,...,h) – số lần đồng thời X nhận xi và Y nhận yj Kiểm định giả thiết: H0: X và Y độc lập, với mức ý nghĩa α. Tìm từ bảng phân vị χ2 “khi bình phương” Cách 1: Tính thống kê dựa vào các công thức sau: Cách 2: Sử dụng hàm CHITEST trong Excel: CHITEST(nij,γij), với lưu ý số lượng các giá trị của nij và γij phải bằng nhau. Kết luận Nếu → Chấp nhận giả thiết H0. Hoặc kết quả hàm CHITEST > α =0.03 → Chấp nhận giả thiết H0. Bài làm: Giả thiết H0: Màu tóc độc lập với giới tính Nhập bảng số liệu như hình sau Tính các tổng số + Tổng hàng (ni): Chọn ô D2 nhập biểu thức “=SUM(B2:C2)”. Dùng con trỏ kéo nút tự điền từ ô G3 đến ô G5. + Tổng cột (mj): Chọn ô B6 nhập biểu thức “=SUM(B2:B5)”. Dùng con trỏ kéo nút tự điền đến ô C6. + Tổng cộng: Chọn ô D6 nhập biểu thức “=SUM(B2;C5)”. Tính tần số lý thuyết dựa vào công thức sau: Màu đen Nam : chọn ô G2 rồi nhập biểu thức: “=D2*B6/D6” Nữ : chọn ô H2 rồi nhập biểu thức: “=D2*C6 /D6” Màu hung Nam : chọn ô G3 rồi nhập biểu thức: “=D3*B6/D6” Nữ : chọn ô H3 rồi nhập biểu thức: “=D3*C6 /D6” Màu nâu Nam : chọn ô G4 rồi nhập biểu thức: “=D4*B6/D6” Nữ : chọn ô H4 rồi nhập biểu thức: “=D4*C6 /D6” Màu vàng Nam : chọn ô G5 rồi nhập biểu thức: “=D5*B6/D6” Nữ : chọn ô H5 rồi nhập biểu thức: “=D5*C6 /D6” Sau khi sử dụng với Excel ta có bảng số liệu gij như sau: Áp dụng hàm số “CHITEST” Tính xác suất P(X>) bằng cách chọn ô G7và nhập biểu thức “=CHITEST(B2:C5,G2:H5)”. Kết luận: Kết quả: P(X>) = 0,000247< = 0,03 ... Bác bỏ giả thuyết Ho. Vậy: Màu tóc và giới tính có mối liên hệ với nhau. Bài 4: Tiến hình thăm dò ba nhóm xã hội khác nhau: công nhân, nông dân, tri thức. Kết quả thăm dò như sau: Tầng lớp Ý kiến Công nhân Nông dân Tri thức Tổng số Tăng 100 300 20 420 Như cũ 200 400 30 630 Giảm 50 80 5 135 Không ý kiến 30 70 5 105 Tổng số 380 850 60 1290 Với mức ý nghĩa α=2% có sự khác nhau về ý kiến trong các tầng lớp trên hay không? Dạng bài:Đây là dạng toán kiểm định giả thuyết về tỷ lệ: Bài làm: Gọi H0: các ý kiến trong các tầng lớp xã hội trên là giống nhau Nhập bảng số liêu : Tính các tần số lý thuyết theo công thức: Tăng: Chọn H2 rồi nhập biểu thức “=($E2*B$6)/$E$6” Rồi dùng con trỏ kéo nút tự điều khiển từ ô B9 đến D9 Như cũ: Chọn H3 rồi nhập biểu thức “=($E3*B$6)/$E$6” Rồi dùng con trỏ kéo nút tự điều khiển từ ô B10 đến D10 Giảm Chọn H4 rồi nhập biểu thức “=($E4*B$6)/$E$6 Rồi dùng con trỏ kéo nút tự điều khiển từ ô B11 đến D11 Không có ý kiến: Chọn H5 rồi nhập biểu thức “=($E5*B$6)/$E$6 Rồi dùng con trỏ kéo nút tự điều khiển từ ô B12 đến D12 Ta có bảng số liệu sau: Áp dụng hàm số “CHITEST” Tính xác suất P(X>) bằng cách chọn ô B13 nhập biểu thức “=CHITEST(B2:D5,B9:D12) Ta được kết quả bảng sau: Kết luận: Kết quả : P(X>) =0.061178 > 0.02 : Chấp nhận giả thiết H0 Vậy: Không có sự khác nhau về ý kiến trong các tầng lớp xã hội Bài 5: Với mức ý nghĩa a = 2%,Hãy phân tích vai trò ngành nghề (chính, phụ) trong hoạt động kinh tế của các hộ gia đình ở một vùng nông thôn trên cơ sở bảng số liệu về thu nhập trung bình của một hộ tương ứng với các ngành nghề nói trên như sau: Nghề chính Nghề phụ (1) (2) (3) (4) Trồng lúa (1) Trồng cây ăn trái (2) Chăn nuôi(3) Dịch vụ (4) 3.5 5.6 4.1 7.2 7.4 4.1 2.5 3.2 8.0 6.1 1.8 2.2 3.5 9.6 2.1 1.5 Cơ sở lý thuyết : PHÂN TÍCH PHƯƠNG SAI HAI YẾU TỐ ( KHÔNG LẶP) Sự phân tích này nhằm đánh giá sự ảnh hưởng của hai yếu tố trên các giá trị quan sát Yij ( i=1,2r: yếu tố A; j=1,2c: yếu tố B). Mô hình: Yếu tố A Yếu tố B Tổng cộng Trung bình 1 2 - c Y11 Y21 .. Yr1 Y12 Y22 ... Yr2 Y1c Y2c Yr Y1. Y2. Yr `Y1 `Y2 `Yr Tổng cộng trung bình T.1 `Y.1 T.2 `Y.2 Tc `Y.c T.. `Y.. Bảng anova: Nguồn sai số Bậc tự do Tổng số bình phương Bình phương trung bình Giá trị tống kê Yếu tố A (hàng) (r – 1) SSB=i=1rTi2c-T2..rc MSB=SSB(r-1) FR=MSBMSE Yếu tố B (cột) Sai số (c – 1) (r – 1)(c – 2) SSB=j=1cTj2r-T2..rc SSE = SST - (SSF + SSB) MSF=SSF(c-1) MSB=SSBr-1 FC=MSFMSE Tổng cộng (rc – 1) SST=i=1rj=1cYij2-T2..r Trắc nghiêm: Giả thiết: H0: μ1=μ2==μk ó “các giá trị trung bình bằng nhau” H0: μi≠μj ó “có ít nhất hai giá trị trung bình khác nhau” Giá trị thống kê: FR=MSBMSE và FC=MSFMSE Biện luận: Nếu FR<Fa[b – 1,(k – 1)(b – 1)] ð chấp nhận H0 (yếu tố A) Nếu FC<Fa[k – 1,(k – 1)(b – 1)] ð chấp nhận H0 (yếu tố B) Bài làm: Giả thiết H0:các giá trị trung bình là bằng nhau Đối giả thiết H1:các giá trị trung bình là không bằng nhau. Nhập dữ liệu vào bảng tính: Áp dụng: “Anova: Two – Factor without Replication” a)Tại nhóm lệnh Data analysis, chọn Anova:Two – Factor without Replication”. b)Trong hộp thoại Anova:Two – Factor without Replication, lần lượt ấn định các giá trị: - Phạm vi đầu vào (input range): chọn bảng tính ta vừa tạo. -Nhãn dữ liệu (labels in first row/column) -Ngưỡng tin cậy: Alpha = 2% = 0.02 -Phạm vi đầu ra (output Range). Sau khi click OK thì ta được kết quả: Kết luận: FR = 1.9966 chấp nhận giả thiết H0 (nghề chính). FC = 0.1105 chấp nhận giả thiết H0 (nghề phụ). Vậy, thu nhập của gia đình giống nhau xét cho nghề chính hay nghề phụ.
File đính kèm:
- bao_cao_mon_xac_suat_thong_ke.docx