Bài tập Xác suất thống kê - Nguyễn Công Vũ

Với mức ý nghĩa α = 0.05 , hãy nhận định xem có phải ba giống bò này thuần như nhau về phương diện sản lượng sữa hay không?

Cơ sở lý thuyết :

Bài toán tổng quát :

“Cho X, Y là đại lượng ngẫu nhiên gốc của một tổng thể.

Từ tổng thể, lấy mẫu có kích thước n, có bảng phân phối đồng thời tương ứng,

Với mức ý nghĩa α, kiểm định H : X, Y độc lập.

Thuật giải :

• Tìm = [(k - 1)(h – 1)] từ bảng phân vị .

• Tính thống kê

= , =

• Kết luận :

o Nếu ≤ thì chấp nhận nhận H.

o Nếu > thì bác bỏ H.

 

doc18 trang | Chuyên mục: Xác Suất Thống Kê | Chia sẻ: tuando | Lượt xem: 608 | Lượt tải: 0download
Tóm tắt nội dung Bài tập Xác suất thống kê - Nguyễn Công Vũ, để xem tài liệu hoàn chỉnh bạn click vào nút "TẢI VỀ" ở trên
Bài tập xác suất thống kê
Nhóm 10
Nguyễn Công Vũ	50703022
Lê Nguyễn Duy Vũ	50703018
Nguyễn Thanh Tùng	40602902
Nguyễn Văn Viện	K0702928
Đặng Văn Trọng	20602672
Nguyễn Phan Vĩnh Tùng	20802539
Nguyễn Hoàng Vương	30603099
Bài 1.
Một nông trường nuôi bò nuôi ba giống bò sữa A, B, C. Lượng sữa của các con bò này được thống kê trong bảng sau đây:
Loại bò
Lượng sữa
Ít
Trung bình
Nhiều
A
92
37
46
B
53
15
19
C
75
19
12
Với mức ý nghĩa α = 0.05 , hãy nhận định xem có phải ba giống bò này thuần như nhau về phương diện sản lượng sữa hay không?
Cơ sở lý thuyết :
Bài toán tổng quát : 
“Cho X, Y là đại lượng ngẫu nhiên gốc của một tổng thể.
Từ tổng thể, lấy mẫu có kích thước n, có bảng phân phối đồng thời tương ứng,
Với mức ý nghĩa α, kiểm định H : X, Y độc lập.
Thuật giải :
Tìm = [(k - 1)(h – 1)] từ bảng phân vị .
Tính thống kê
= , = 
Kết luận : 
Nếu ≤ thì chấp nhận nhận H.
Nếu > thì bác bỏ H.
Áp dụng MS-EXCEL:
Tính giá trị = [(k - 1)(h – 1)] = [4] = 9.49 ( tra bảng )
Nhập dữ liệu vào bảng tính
THỰC NGHIỆM
Ít
Trung bình
Nhiều
Tổng hàng
A
92
37
46
175
B
53
15
19
87
C
75
19
12
106
Tổng cột
220
71
77
368
LÝ THUYẾT
1
2
3
1
104.61956522
33.76358696
36.61684783
2
52.01086957
16.78532609
18.20380435
3
63.36956522
20.45108696
22.17934783
1
2
3
1
1.5222146
0.310227
2.404454505
2
0.018811
0.189891
0.034823903
3
2.1345738
0.10296
4.671874168
Giá trị 
11.389831
Giả sử bảng được nhập từ ô A1 trong bảng tính.
Tính các tổng số:
Tổng hàng : chọn ô E2 rồi nhập biểu thức = SUM(B2:D2)
Dùng con trỏ để kéo nút tự điền từ ô E2 đến E4
Tổng cột : chọn ô B5 rồi nhập biểu thức =SUM(B2:B4)
Dùng con trỏ để kéo nút tự điền từ B5 đến E5
Tổng cộng : ô E5
Tính các tần số lý thuyết
Tần số lý thuyết = (tổng hàng x tổng cột ) / tổng cộng
Bò A cho ít sữa : chọn B8 và nhập =E2*B5/E5
Bò A cho trung b ình sữa : chọn C8 và nhập = E2*C5/E5
Bò A cho nhiều sữa : chọn D8 và nhập = E2*D5/E5
Bò B cho ít sữa : chọn B8 và nhập = E3*B5/E5
Bò B cho trung bình sữa : chọn C8 và nhập =E3*C5/E5
Bò B cho nhiều sữa : chọn D8 và nhập =E3*D5/E5
Bò C cho ít sữa : chọn B8 và nhập =E4*B5/E5
Bò C cho trung bình sữa : chọn C8 và nhập =E4*C5/E5
Bò C cho nhiều sữa : chọn D8 và nhập =E4*D5/E5
Nhập các giá tr ị 
Chọn ô B12, nhập =POWER(B2-B8;2)/B8
Dùng trỏ chuột kéo từ B12 đến D14
Tính giá trị : chọn ô B15, nhập =SUM(B12:D14)
Biện luận :
Vì > , ta bác bỏ H : ba giống bò này không thuần về sản lượng sữa.
T ính giá trị “P” : d ùng hàm CHITEST bằng cách chọn ô B16 và nhập =CHITEST(B2:D4,B8:D10)
K ết qu ả : P(X > ) = 0.02251515 < α = 0.05
Vậy ba giống bò này không thuần về sản lượng sữa.
BÀI 2
Lập bảng ANOVA cho bảng số liệu sau đây. Giả thuyết Ho có bị bác bỏ ở mức 5% hay không?
Nhóm 1
Nhóm 2
Nhóm 3
Nhóm 4
12
19
34
19
16
20
29
21
12
18
31
17
14
9
19
14
26
22
26
19
BÀI GIẢI
Nhóm 1
Nhóm 2
Nhóm 3
Nhóm 4
Tổng cộng
12
19
34
19
16
20
29
21
12
18
31
17
14
9
19
14
26
22
26
19
ni
5
6
5
4
n=20
Ti
80
107
139
71
T=397
Bước 1: Tính tổng bình phương do nhân tố ký hiệu là SSF (Sumof Squares for Factor)
 =432.167
Bước 2: Tính tổng bình phương chung ký hiệu là SST (Total Sum of Squares)
 =
 =828.55
Bước 3: Tính tổng bình phương do sai số ký hiệu là SSE (Sumof Squares for the Error)
 = 828.55-432.167
 =396.383
Bước 4: Tính trung bình bình phương của nhân tố ký hiệu là MSF (Mean Square for Factor)
Bước 5: Tính trung bình bình phương của sai số ký hiệu là MSS (Mean Square for Error)
Bước 6: Tính tỷ số F:
Bước 7: Tra bảng phân phối Fisher để tìm c rùi so sánh c với F để rút ra kết luận
Tra bảng ứng với α=5% ta được c=3.24
Do F>c nên không chấp nhận Ho
Sử dụng chương trình Microsoft Excel: Áp dụng “Anova: Single Factor’
a. Nhấp lần lượt đơn lệnh Tools và lệnh Data Analysis.
b. Chọn chương trình Anova: Single Factor trong hộp thoại Data Analysis rồi nhấp nút OK.
c. Trong hộp thoại Anova: Single Factor, lần lượt ấn định:
 - Phạm vi đầu vào (Input Range)
 - Cách sắp xếp theo hàng hay cột (Group by)
 - Nhãn dữ liệu (Labels in First Row/Column)
Bài 3.
Đề:
 Tìm đường hồi quy của Y đối với X. Tính sai số tiêu chuẩn của đường hồi quy. Tính tỷ số F để kiểm định sự đúng đắn của giả thiết: Có hồi quy tuyến tính của Y theo X.
X
2
5
7
10
11
Y
10
20
35
50
65
X
2
5
7
10
11
Y
13
21
32
56
60
Bài giải:
1/ Cơ sở lý thuyết:
 Cho một mẫu đồng thời của vector ngẫu nhiên (X,Y) có dạng bảng số liệu sau:
a/ Các đặc trưng của mẫu:
 , , 
 , , 
Với , đặt:
Là trung bình mẫu của Y khi .
 Biểu diễn các điểm lên mặt phẳng tọa độ và nối các điểm và bằng một đoạn thẳng , ta được một đường gắp khúc, gọi là đường hồi quy mẫu của Y theo X.
b/ Hồi quy tuyến tính đơn giản:
Đường hồi quy:
Đường hồi quy tuyến tính mẫu của Y theo X là đường thẳng có phương trình y=ax+b gần với đường hồi qui mẫu Y theo X nhất, đường thẳng y=ax+b có tổng bình phương các khoảng cách tới đường thẳng là nhỏ nhất. Có nghĩa là (a,b) là điểm cực tiểu hàm:
(a,b) là nghiệm của hệ:
Sai số tiêu chuẩn của đường hồi quy:
 Dạng khác của công thức trên:
 Được gọi là sai số tiêu chuẩn của đường hồi quy, là số đo sự phân tán của đám mây điểm xung quanh đường thẳng hồi quy.
Kiểm định giả thiết Ho: “Có hồi quy tuyến tính giữa Y với X”:
 Tỷ số 
 + Nếu : chấp nhận Ho
 + Ngược lại: bác bỏ Ho
 Với giá trị c tra từ bảng phân phối Fisher với bậc tự do (1,n-2) hay c=FINV(α,1,n-2) (EXCEL).
 là tổng bình phương do hồi quy.
 là tổng bình phương do sai số
 trung bình bình phương do sai số.
2/ Áp dụng Excel:
Các bước thực hiện: 
Nhập số liệu cho bảng tính 
Chọn Data analysis sau khi đã load Add-ins Analysis Toolpak
Chọn Regression 
Nhập phạm vi biến số X, Y, label, độ tin cậy (confidence level), và vùng xuất kết quả, chọn Line Fit Plots nếu muốn vẽ đường hồi qui
Nhấn OK, được bảng kết quả 
Từ đó thu được kết quả sau
a) Đuờng hồi quy của Y đối với X:
a = 5,75
b = -4,05
Phuơng trình đuờng hồi quy:
y = 5,75x – 4,05
b) Sai số tiêu chuẩn của đuờng hồi quy
SY.X = 4,255
c) Tỷ số F:
F = 197,211
c = f(α,1,n-2) = 5,32
Do F > c. vậy phương trình hồi quy không thích hợp, không có hồi quy tuyến tính giữa Y và X.
Bài 4.
 Tính tỷ số tương quan của Y đối với X, hệ số tương quan và hệ số xác định của tập số liệu sau đây.Với mức ý nghĩa α=5%, có kết luận gì về mối tương quan của X và Y(phi tuyến hay tuyến tính)?
Bài làm:
LÝ THUYẾT:
♦ Hệ số tương quan:
Để đo mức độ tuyến tính giữa hai đại lượng ngẫu nhiên X và Y, người ta đưa ra khái niệm hệ số tương quan.
♦ Tỷ số tương quan:
Để đo mức độ phụ thuộc nói chung của ĐLNN Y vào ĐLNN X, người ta đưa ra khái niệm tỷ số tương quan. Tỷ số tương quan lý thuyết của Y theo X được ký hiệu bởi là một số không âm :
Với E[Y/X] gọi là kỳ vọng của Y với điều kiện X.
Ta có bảng số liệu: 
Vậy:
 =
=2730.8607
Hệ số tương quan:
Hệ số xác định:
= 0.0819
Tính bằng Excel:
Nhập số: Vào Data/Data Analysis/Regression/OK : 
 r=0.286222
♦ Tỷ số tương quan:
 SST =266342.8571
 SSF =1332700 - 1080357.143 = 252342.8571
♦ Ta có:
F = (0.94744 - 0.0819)(28-7) / (1- 4.0157
Tra bảng phân bố Fisher với bậc tư do (5,21) ở mức 5%, ta đươc c=2.68
Vì F>c nên không chấp nhận Ho.
Kết luận : X và Y có tương quan tuyến tính

File đính kèm:

  • docbai_tap_xac_suat_thong_ke_nguyen_cong_vu.doc