Bài tập Xác suất thống kê - Nguyễn Công Vũ
Với mức ý nghĩa α = 0.05 , hãy nhận định xem có phải ba giống bò này thuần như nhau về phương diện sản lượng sữa hay không?
Cơ sở lý thuyết :
Bài toán tổng quát :
“Cho X, Y là đại lượng ngẫu nhiên gốc của một tổng thể.
Từ tổng thể, lấy mẫu có kích thước n, có bảng phân phối đồng thời tương ứng,
Với mức ý nghĩa α, kiểm định H : X, Y độc lập.
Thuật giải :
• Tìm = [(k - 1)(h – 1)] từ bảng phân vị .
• Tính thống kê
= , =
• Kết luận :
o Nếu ≤ thì chấp nhận nhận H.
o Nếu > thì bác bỏ H.
Bài tập xác suất thống kê Nhóm 10 Nguyễn Công Vũ 50703022 Lê Nguyễn Duy Vũ 50703018 Nguyễn Thanh Tùng 40602902 Nguyễn Văn Viện K0702928 Đặng Văn Trọng 20602672 Nguyễn Phan Vĩnh Tùng 20802539 Nguyễn Hoàng Vương 30603099 Bài 1. Một nông trường nuôi bò nuôi ba giống bò sữa A, B, C. Lượng sữa của các con bò này được thống kê trong bảng sau đây: Loại bò Lượng sữa Ít Trung bình Nhiều A 92 37 46 B 53 15 19 C 75 19 12 Với mức ý nghĩa α = 0.05 , hãy nhận định xem có phải ba giống bò này thuần như nhau về phương diện sản lượng sữa hay không? Cơ sở lý thuyết : Bài toán tổng quát : “Cho X, Y là đại lượng ngẫu nhiên gốc của một tổng thể. Từ tổng thể, lấy mẫu có kích thước n, có bảng phân phối đồng thời tương ứng, Với mức ý nghĩa α, kiểm định H : X, Y độc lập. Thuật giải : Tìm = [(k - 1)(h – 1)] từ bảng phân vị . Tính thống kê = , = Kết luận : Nếu ≤ thì chấp nhận nhận H. Nếu > thì bác bỏ H. Áp dụng MS-EXCEL: Tính giá trị = [(k - 1)(h – 1)] = [4] = 9.49 ( tra bảng ) Nhập dữ liệu vào bảng tính THỰC NGHIỆM Ít Trung bình Nhiều Tổng hàng A 92 37 46 175 B 53 15 19 87 C 75 19 12 106 Tổng cột 220 71 77 368 LÝ THUYẾT 1 2 3 1 104.61956522 33.76358696 36.61684783 2 52.01086957 16.78532609 18.20380435 3 63.36956522 20.45108696 22.17934783 1 2 3 1 1.5222146 0.310227 2.404454505 2 0.018811 0.189891 0.034823903 3 2.1345738 0.10296 4.671874168 Giá trị 11.389831 Giả sử bảng được nhập từ ô A1 trong bảng tính. Tính các tổng số: Tổng hàng : chọn ô E2 rồi nhập biểu thức = SUM(B2:D2) Dùng con trỏ để kéo nút tự điền từ ô E2 đến E4 Tổng cột : chọn ô B5 rồi nhập biểu thức =SUM(B2:B4) Dùng con trỏ để kéo nút tự điền từ B5 đến E5 Tổng cộng : ô E5 Tính các tần số lý thuyết Tần số lý thuyết = (tổng hàng x tổng cột ) / tổng cộng Bò A cho ít sữa : chọn B8 và nhập =E2*B5/E5 Bò A cho trung b ình sữa : chọn C8 và nhập = E2*C5/E5 Bò A cho nhiều sữa : chọn D8 và nhập = E2*D5/E5 Bò B cho ít sữa : chọn B8 và nhập = E3*B5/E5 Bò B cho trung bình sữa : chọn C8 và nhập =E3*C5/E5 Bò B cho nhiều sữa : chọn D8 và nhập =E3*D5/E5 Bò C cho ít sữa : chọn B8 và nhập =E4*B5/E5 Bò C cho trung bình sữa : chọn C8 và nhập =E4*C5/E5 Bò C cho nhiều sữa : chọn D8 và nhập =E4*D5/E5 Nhập các giá tr ị Chọn ô B12, nhập =POWER(B2-B8;2)/B8 Dùng trỏ chuột kéo từ B12 đến D14 Tính giá trị : chọn ô B15, nhập =SUM(B12:D14) Biện luận : Vì > , ta bác bỏ H : ba giống bò này không thuần về sản lượng sữa. T ính giá trị “P” : d ùng hàm CHITEST bằng cách chọn ô B16 và nhập =CHITEST(B2:D4,B8:D10) K ết qu ả : P(X > ) = 0.02251515 < α = 0.05 Vậy ba giống bò này không thuần về sản lượng sữa. BÀI 2 Lập bảng ANOVA cho bảng số liệu sau đây. Giả thuyết Ho có bị bác bỏ ở mức 5% hay không? Nhóm 1 Nhóm 2 Nhóm 3 Nhóm 4 12 19 34 19 16 20 29 21 12 18 31 17 14 9 19 14 26 22 26 19 BÀI GIẢI Nhóm 1 Nhóm 2 Nhóm 3 Nhóm 4 Tổng cộng 12 19 34 19 16 20 29 21 12 18 31 17 14 9 19 14 26 22 26 19 ni 5 6 5 4 n=20 Ti 80 107 139 71 T=397 Bước 1: Tính tổng bình phương do nhân tố ký hiệu là SSF (Sumof Squares for Factor) =432.167 Bước 2: Tính tổng bình phương chung ký hiệu là SST (Total Sum of Squares) = =828.55 Bước 3: Tính tổng bình phương do sai số ký hiệu là SSE (Sumof Squares for the Error) = 828.55-432.167 =396.383 Bước 4: Tính trung bình bình phương của nhân tố ký hiệu là MSF (Mean Square for Factor) Bước 5: Tính trung bình bình phương của sai số ký hiệu là MSS (Mean Square for Error) Bước 6: Tính tỷ số F: Bước 7: Tra bảng phân phối Fisher để tìm c rùi so sánh c với F để rút ra kết luận Tra bảng ứng với α=5% ta được c=3.24 Do F>c nên không chấp nhận Ho Sử dụng chương trình Microsoft Excel: Áp dụng “Anova: Single Factor’ a. Nhấp lần lượt đơn lệnh Tools và lệnh Data Analysis. b. Chọn chương trình Anova: Single Factor trong hộp thoại Data Analysis rồi nhấp nút OK. c. Trong hộp thoại Anova: Single Factor, lần lượt ấn định: - Phạm vi đầu vào (Input Range) - Cách sắp xếp theo hàng hay cột (Group by) - Nhãn dữ liệu (Labels in First Row/Column) Bài 3. Đề: Tìm đường hồi quy của Y đối với X. Tính sai số tiêu chuẩn của đường hồi quy. Tính tỷ số F để kiểm định sự đúng đắn của giả thiết: Có hồi quy tuyến tính của Y theo X. X 2 5 7 10 11 Y 10 20 35 50 65 X 2 5 7 10 11 Y 13 21 32 56 60 Bài giải: 1/ Cơ sở lý thuyết: Cho một mẫu đồng thời của vector ngẫu nhiên (X,Y) có dạng bảng số liệu sau: a/ Các đặc trưng của mẫu: , , , , Với , đặt: Là trung bình mẫu của Y khi . Biểu diễn các điểm lên mặt phẳng tọa độ và nối các điểm và bằng một đoạn thẳng , ta được một đường gắp khúc, gọi là đường hồi quy mẫu của Y theo X. b/ Hồi quy tuyến tính đơn giản: Đường hồi quy: Đường hồi quy tuyến tính mẫu của Y theo X là đường thẳng có phương trình y=ax+b gần với đường hồi qui mẫu Y theo X nhất, đường thẳng y=ax+b có tổng bình phương các khoảng cách tới đường thẳng là nhỏ nhất. Có nghĩa là (a,b) là điểm cực tiểu hàm: (a,b) là nghiệm của hệ: Sai số tiêu chuẩn của đường hồi quy: Dạng khác của công thức trên: Được gọi là sai số tiêu chuẩn của đường hồi quy, là số đo sự phân tán của đám mây điểm xung quanh đường thẳng hồi quy. Kiểm định giả thiết Ho: “Có hồi quy tuyến tính giữa Y với X”: Tỷ số + Nếu : chấp nhận Ho + Ngược lại: bác bỏ Ho Với giá trị c tra từ bảng phân phối Fisher với bậc tự do (1,n-2) hay c=FINV(α,1,n-2) (EXCEL). là tổng bình phương do hồi quy. là tổng bình phương do sai số trung bình bình phương do sai số. 2/ Áp dụng Excel: Các bước thực hiện: Nhập số liệu cho bảng tính Chọn Data analysis sau khi đã load Add-ins Analysis Toolpak Chọn Regression Nhập phạm vi biến số X, Y, label, độ tin cậy (confidence level), và vùng xuất kết quả, chọn Line Fit Plots nếu muốn vẽ đường hồi qui Nhấn OK, được bảng kết quả Từ đó thu được kết quả sau a) Đuờng hồi quy của Y đối với X: a = 5,75 b = -4,05 Phuơng trình đuờng hồi quy: y = 5,75x – 4,05 b) Sai số tiêu chuẩn của đuờng hồi quy SY.X = 4,255 c) Tỷ số F: F = 197,211 c = f(α,1,n-2) = 5,32 Do F > c. vậy phương trình hồi quy không thích hợp, không có hồi quy tuyến tính giữa Y và X. Bài 4. Tính tỷ số tương quan của Y đối với X, hệ số tương quan và hệ số xác định của tập số liệu sau đây.Với mức ý nghĩa α=5%, có kết luận gì về mối tương quan của X và Y(phi tuyến hay tuyến tính)? Bài làm: LÝ THUYẾT: ♦ Hệ số tương quan: Để đo mức độ tuyến tính giữa hai đại lượng ngẫu nhiên X và Y, người ta đưa ra khái niệm hệ số tương quan. ♦ Tỷ số tương quan: Để đo mức độ phụ thuộc nói chung của ĐLNN Y vào ĐLNN X, người ta đưa ra khái niệm tỷ số tương quan. Tỷ số tương quan lý thuyết của Y theo X được ký hiệu bởi là một số không âm : Với E[Y/X] gọi là kỳ vọng của Y với điều kiện X. Ta có bảng số liệu: Vậy: = =2730.8607 Hệ số tương quan: Hệ số xác định: = 0.0819 Tính bằng Excel: Nhập số: Vào Data/Data Analysis/Regression/OK : r=0.286222 ♦ Tỷ số tương quan: SST =266342.8571 SSF =1332700 - 1080357.143 = 252342.8571 ♦ Ta có: F = (0.94744 - 0.0819)(28-7) / (1- 4.0157 Tra bảng phân bố Fisher với bậc tư do (5,21) ở mức 5%, ta đươc c=2.68 Vì F>c nên không chấp nhận Ho. Kết luận : X và Y có tương quan tuyến tính
File đính kèm:
- bai_tap_xac_suat_thong_ke_nguyen_cong_vu.doc