Báo cáo môn Xác suất thống kê

1. Tính các giá trị Ti., T.j., T.k và T.

• Các giá trị Ti.

 Chọn ô B7 và chọn biểu thức =SUM(B2:E2)

 Chọn ô C7 và nhập biểu thức =SUM(B3:E3)

 Chọn ô D7 và nhập biểu thức =SUM(B4:E4)

 Chọn ô E7 và nhập biểu thức =SUM(B4:E4)

• Các giá trị T.j.

 Chọn ô B8 và nhập biểu thức =SUM(B2:B5)

 Dùng con trỏ kéo ký hiệu tự điền từ ô B8 đến ô E8

• Các giá trị T.k

 Chọn ô B9 và nhập biểu thức =SUM(B2,C5,D4,E3)

 Chọn ô C9 và nhập biểu thức =SUM(B3,C2,D5,E4)

 Chọn ô D9 và nhập biểu thức =SUM(B4,C3,D2,E5)

 Chọn ô E9 và nhập biểu thức =SUM(B5,C4,D3,E2)

• Giá trị T

 Chọn ô B10 và nhập biểu thức=SUM(B2:B5)

2. Tính các giá trị G

 Chọn ô G7 và nhập biểu thức =SUMSQ(B7:E7)

 Dùng con trỏ kéo ký hiệu tự điền từ ô G7 đến ô G9

 Chọn ô G10 và nhập biểu thức =POWER(B10,2)

 Chọn ô G11 và nhập biểu thức =SUMSQ(B2:E5)

 

docx26 trang | Chuyên mục: Xác Suất Thống Kê | Chia sẻ: tuando | Lượt xem: 480 | Lượt tải: 0download
Tóm tắt nội dung Báo cáo môn Xác suất thống kê, để xem tài liệu hoàn chỉnh bạn click vào nút "TẢI VỀ" ở trên
h hồi quy Ŷx1 = 2.73 + 0.04X1 đều không có ý nghĩa thống kê. Nói cách khác phương trình hồi quy này không thích hợp.
Kết luận: yếu tố thời gian không có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp.
Phương trình hồi quy Ŷx2 = f(X2)
Ŷx2 = -11.14 + 0.13X2	(R2 = 0.76; S = 0.99)
t0 = 3.418 > t0.05 = 2.365 (hay Pv2=0.011 > α=0.05)	=>Bác bỏ giả thiết H0
t1= 4.757 > t0.05 = 2.365(hay Pv=0.00206 Bác bỏ giả thiết H0
F= 22.631 > F=5.590(hay Fs=0.00206 Bác bỏ giả thiết H0
Vậy cả hai hệ số -11.14 (B0) và 0.13 (B2) của phương trình hồi quy Ŷx2= -11.14 + 0.13X2 đều có ý nghĩa thống kê. Nói cách khác phương trình hồi quy này thích hợp.
Kết luận: yếu tố nhiệt độ có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp.
Phương trình hồi quy: Ŷx1,x2=f(X1,X2)
Ŷx1,x2 = -12.70 + 0.04X1 + 0.13X2	 (R2=0.97; S=0.33)
t0=11.528 > t0.05=2.365 (hay Pv2=2.260.10-5Bác bỏ giả thiết H0
t1=7.583 > t0.05=2.365 (hay Pv=0.00027Bác bỏ giả thiết H0
F=131.392 > 5.14 (hay Fs=1.112.10-5Bác bỏ giả thiết H0
Vậy cả hai hệ số -12.70 (B0), 0.04 (B1) và 0.13 (B1) của phương trình hồi quy Ŷx1,x2 =-12.7 + 0.04X1 + 0.13X2 đều có ý nghĩa thống kê. Nói cách khác, phương trình hồi quy này thích hợp.
Kết luận: Hiệu suất của phản ứng tổng hợp có liên quan tuyến tính với cả hai yếu tố là thời gian và nhiệt độ.
Sự tuyến tính của phương trình Ŷx1,x2 = -12.70 + 0.04X1 + 0.13X2. Có thể được trình bày trong biểu đồ phân tán (scatter plots):
Nếu muốn dự đoán hiệu suất bằng phương trình hồi quy Ŷx1,x2 = -12.70 + 0.04X1 + 0.13X2
chỉ cần chọn một ô, ví dụ như:
B21, sau đó nhập hàm = B17 + B18*50 + B19*115 . Và được kết quả như sau:
Ghi chú: B17 tọa độ của B0, B18 tọa độ của B1, B19 tọa độ của B2, 50 là giá trị xủa X1 ( thời gian ) và 115 là giá trị của X2 ( nhiệt độ ).
Bài 2: Một nhà nông học tiến hành việc kiểm định hiệu quả của ba loại phân này trên các cây cà chua và theo dõi số quả cà chua mọc trên mỗi cây. Kết quả thu được như sau: 
Loại phân
A
B
C
24
18
27
28
21
26
32
25
16
22
19
17
Với mức ý nghĩa a =5%, hay so sánh số quả cà chua mọc trung bình khi bón ba loại phân A, B, C nói trên.
Cơ sở lý thuyết : 	PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ
Phép phân tích phương sai được dùng trong các trắc nghiệm để so sánh các giá trị trung bình của hai hay nhiều mẫu được lấy từ các phân số.Đây có thể được xem như phần mở rộng các trắc nghiệm t hay z (so sánh hai giá trị trung bình).
Mục đích của sự phân tích phương sai một yếu tố là đánh giá sự ảnh hưởng của một yếu tố (nhân tạo hay tự nhiên) nào đó trên các giá trị quan sát, Yi(i=0,1,2,,k).
Mô hình:
Yếu tố thí nghiệm
1
2
..
K
Y11
Y21
..
Yk1
Y12
Y22
..
Yk2
..
..
..
..
Y1N
Y2N
..
YkN
Tổng cộng trung bình
T1
T2
..
..
Tk
T
Bảng ANOVA:
Nguồn sai số
Bậc sai số
Tổng số bình phương
Bình phương trung bình
Giá trị thống kê
Yếu tố
Sai số
k-1
N-k
SSF=
SSE=SST-SSF
MSF=
MSE=
F=
Tổng cộng
N-1
SST=
Trắc nghiệm:
Giả thiết:
H0: “Các giá trị trung bình bằng nhau”
H1: “Ít nhất có hai giá trị trung bình khác nhau”
Giá trị thống kê: F=
Biện luận: Nếu F chấp nhận giả thiết H0
Bài làm:
Đây là bài toán phân tích phương sai một yếu tố, số quả cà chua mọc trung bình chịu ảnh hưởng bởi loại phân bón.
Giả thiết H0: µ1 = µ2 = µ3; tức số quả cà chua mọc trung bình là bằng nhau
Nhập dữ liệu vào bảng:
Áp dụng “ Anova: Single Factor”
a.Nhấn lần lượt đơn lệnh Data và lệnh Data Analysis.	
b.Chọn trương trình Anova: Single Factor trong hộp thoại Data Analysis rồi nhấn nút OK
c.Trong hộp thoại Anova: Single Factor lần lượt ấn định
- Phạm vi đầu vào (Input range)
- Cách xắp xếp theo hàng hay cột (Group by)
- Nhãn dử liệu (Labels in fisrt row/column)
- Phạm vi đầu ra (Output range)
Bảng Anova:
Kết luận:
Từ giá trị trong bảng Anova:
	F= 3.855652 Chấp nhận H0 
=> Lượng quả cà chua mọc trung bình khi sử dụng các loại phân khác nhau là như nhau.
Bài 3: Bảng sau đây cho ta số liệu về màu tóc của 422 người:
Màu tóc
Nam 
Nữ 
Đen 
Hung 
Nâu
Vàng 
56
37
84
19
32
66
90
38
Với mức ý nghĩa 3%, nhận định xem liệu có mối quan hệ giữa màu tóc và giới tính hay không.
Cơ sở lý thuyết: 
KIỂM ĐỊNH TÍNH ĐỘC LẬP
Khái niệm thống kê và giả thuyết bài toán:
Mục đích: Xét một tổng thể gồm 2 dấu hiện X, Y. Các dấu hiệu này có thể là dấu hiệu định tính hoặc định lượng. Trong trường hợp bài toán nêu trên là cả 2 dấu hiệu đều là dấu hiệu định tính.
Lấy mẫu kích thước n ta có bảng số liệu như sau: 
Y
X
y1
y2
yh
ni
x1
n11
n12
n1h
n1
x2
n21
n22
n2h
n2
xk
nk1
nk2
nkh
nk
mj
m1
m2
mh
ni=n
Trong đó:
-xi ( i=1,k ) - các dấu hiệu mà X nhận
-yj ( j=1,h ) – các dấu hiệu mà Y nhận
- ni (i =1,k) – số lần X nhận xi
- mj (j =1,h) – số lần Y nhận yj
nij (i = 1,...,k ; j = 1,...,h) – số lần đồng thời X nhận xi và Y nhận yj
Kiểm định giả thiết: H0: X và Y độc lập, với mức ý nghĩa α.
Tìm từ bảng phân vị χ2 “khi bình phương”
Cách 1: Tính thống kê dựa vào các công thức sau:
Cách 2: Sử dụng hàm CHITEST trong Excel: CHITEST(nij,γij), với lưu ý số lượng các giá trị của nij và γij phải bằng nhau.
Kết luận
Nếu → Chấp nhận giả thiết H0.
Hoặc kết quả hàm CHITEST > α =0.03 → Chấp nhận giả thiết H0.
Bài làm:
Giả thiết H0: Màu tóc độc lập với giới tính
Nhập bảng số liệu như hình sau
Tính các tổng số
 + Tổng hàng (ni):
Chọn ô D2 nhập biểu thức “=SUM(B2:C2)”.
Dùng con trỏ kéo nút tự điền từ ô G3 đến ô G5.
+ Tổng cột (mj):
Chọn ô B6 nhập biểu thức “=SUM(B2:B5)”.
Dùng con trỏ kéo nút tự điền đến ô C6.
+ Tổng cộng:
Chọn ô D6 nhập biểu thức “=SUM(B2;C5)”.
Tính tần số lý thuyết dựa vào công thức sau:
Màu đen
Nam	: chọn ô G2 rồi nhập biểu thức: “=D2*B6/D6”
Nữ	: chọn ô H2 rồi nhập biểu thức: “=D2*C6 /D6”
Màu hung
Nam	: chọn ô G3 rồi nhập biểu thức: “=D3*B6/D6”
Nữ	: chọn ô H3 rồi nhập biểu thức: “=D3*C6 /D6”
Màu nâu
Nam	: chọn ô G4 rồi nhập biểu thức: “=D4*B6/D6”
Nữ	: chọn ô H4 rồi nhập biểu thức: “=D4*C6 /D6”
Màu vàng
Nam	: chọn ô G5 rồi nhập biểu thức: “=D5*B6/D6”
Nữ	: chọn ô H5 rồi nhập biểu thức: “=D5*C6 /D6”
Sau khi sử dụng với Excel ta có bảng số liệu gij như sau:
Áp dụng hàm số “CHITEST”
Tính xác suất P(X>) bằng cách chọn ô G7và nhập biểu thức “=CHITEST(B2:C5,G2:H5)”.
Kết luận:
Kết quả: P(X>) = 0,000247< = 0,03 ... Bác bỏ giả thuyết Ho.
Vậy: Màu tóc và giới tính có mối liên hệ với nhau.
Bài 4: Tiến hình thăm dò ba nhóm xã hội khác nhau: công nhân, nông dân, tri thức. Kết quả thăm dò như sau:
Tầng lớp 
Ý kiến
Công nhân
Nông dân
Tri thức
Tổng số
Tăng
100
300
20
420
Như cũ
200
400
30
630
Giảm
50
80
5
135
Không ý kiến
30
70
5
105
Tổng số
380
850
60
1290
Với mức ý nghĩa α=2% có sự khác nhau về ý kiến trong các tầng lớp trên hay không?
Dạng bài:Đây là dạng toán kiểm định giả thuyết về tỷ lệ:
Bài làm:
Gọi H0: các ý kiến trong các tầng lớp xã hội trên là giống nhau
Nhập bảng số liêu :
Tính các tần số lý thuyết theo công thức:
Tăng:	 Chọn H2 rồi nhập biểu thức “=($E2*B$6)/$E$6”
Rồi dùng con trỏ kéo nút tự điều khiển từ ô B9 đến D9
Như cũ:	Chọn H3 rồi nhập biểu thức “=($E3*B$6)/$E$6”
Rồi dùng con trỏ kéo nút tự điều khiển từ ô B10 đến D10
Giảm 	Chọn H4 rồi nhập biểu thức “=($E4*B$6)/$E$6
Rồi dùng con trỏ kéo nút tự điều khiển từ ô B11 đến D11
Không có ý kiến: Chọn H5 rồi nhập biểu thức “=($E5*B$6)/$E$6
Rồi dùng con trỏ kéo nút tự điều khiển từ ô B12 đến D12
Ta có bảng số liệu sau:
Áp dụng hàm số “CHITEST”
Tính xác suất P(X>) bằng cách chọn ô B13 nhập biểu thức “=CHITEST(B2:D5,B9:D12)
Ta được kết quả bảng sau:
Kết luận:
Kết quả : P(X>) =0.061178 > 0.02 : Chấp nhận giả thiết H0
Vậy: Không có sự khác nhau về ý kiến trong các tầng lớp xã hội
 Bài 5: Với mức ý nghĩa a = 2%,Hãy phân tích vai trò ngành nghề (chính, phụ) trong hoạt động kinh tế của các hộ gia đình ở một vùng nông thôn trên cơ sở bảng số liệu về thu nhập trung bình của một hộ tương ứng với các ngành nghề nói trên như sau:
Nghề chính
Nghề phụ
(1)
(2)
(3)
(4)
Trồng lúa (1)
Trồng cây ăn trái (2)
Chăn nuôi(3)
Dịch vụ (4)
3.5
5.6
4.1
7.2
7.4
4.1
2.5
3.2
8.0
6.1
1.8
2.2
3.5
9.6
2.1
1.5
Cơ sở lý thuyết :	PHÂN TÍCH PHƯƠNG SAI HAI YẾU TỐ ( KHÔNG LẶP)
Sự phân tích này nhằm đánh giá sự ảnh hưởng của hai yếu tố trên các giá trị quan sát Yij ( i=1,2r: yếu tố A; j=1,2c: yếu tố B).
Mô hình:
Yếu tố A
Yếu tố B
Tổng cộng
Trung bình
1
2
-
c
Y11
Y21
..
Yr1
Y12
Y22
...
Yr2
Y1c
Y2c
Yr
Y1.
Y2.
Yr
`Y1
`Y2
`Yr
Tổng cộng trung bình
T.1
`Y.1
T.2
`Y.2
Tc
`Y.c
T..
`Y..
Bảng anova:
Nguồn sai số
Bậc tự do
Tổng số bình phương
Bình phương trung bình
Giá trị tống kê
Yếu tố A (hàng)
(r – 1)
SSB=i=1rTi2c-T2..rc
MSB=SSB(r-1)
FR=MSBMSE
Yếu tố B (cột)
Sai số
(c – 1)
(r – 1)(c – 2)
SSB=j=1cTj2r-T2..rc
SSE = SST - (SSF + SSB)
MSF=SSF(c-1)
MSB=SSBr-1
FC=MSFMSE
Tổng cộng
(rc – 1)
SST=i=1rj=1cYij2-T2..r
Trắc nghiêm:
Giả thiết:
H0: μ1=μ2==μk ó “các giá trị trung bình bằng nhau”
 H0: μi≠μj ó “có ít nhất hai giá trị trung bình khác nhau”
Giá trị thống kê:
FR=MSBMSE và FC=MSFMSE
Biện luận:
Nếu FR<Fa[b – 1,(k – 1)(b – 1)] ð chấp nhận H0 (yếu tố A)
Nếu FC<Fa[k – 1,(k – 1)(b – 1)] ð chấp nhận H0 (yếu tố B)
Bài làm:
Giả thiết H0:các giá trị trung bình là bằng nhau
Đối giả thiết H1:các giá trị trung bình là không bằng nhau.
Nhập dữ liệu vào bảng tính:
Áp dụng: “Anova: Two – Factor without Replication”
a)Tại nhóm lệnh Data analysis, chọn Anova:Two – Factor without Replication”.
b)Trong hộp thoại Anova:Two – Factor without Replication, lần lượt ấn định các giá trị: 
- Phạm vi đầu vào (input range): chọn bảng tính ta vừa tạo.
-Nhãn dữ liệu (labels in first row/column)
-Ngưỡng tin cậy: Alpha = 2% = 0.02
-Phạm vi đầu ra (output Range).
Sau khi click OK thì ta được kết quả:
Kết luận:
FR = 1.9966 chấp nhận giả thiết H0 (nghề chính).
FC = 0.1105 chấp nhận giả thiết H0 (nghề phụ).
Vậy, thu nhập của gia đình giống nhau xét cho nghề chính hay nghề phụ.

File đính kèm:

  • docxbao_cao_mon_xac_suat_thong_ke.docx