Bài giảng Xác suất thống kê - Chương 6: Ước lượng tham số thống kê - Hoàng Văn Hà

Ước lượng điểm 2

Giới thiệu. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

Ví dụ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

Các tiêu chuẩn Ước lượng 5

Ước lượng không chệch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

Ước lượng không chệch - Ví dụ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

Ước lượng hiệu quả (Efficiency estimator). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

Trung bình của bình phương sai số - MSE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

Sai số chuẩn - Standard Error . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

Ước lượng bền vững - Consistency estimator . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

Ước lượng khoảng 13

Giới thiệu. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

Khoảng tin cậy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

Khoảng tin cậy cho kỳ vọng 17

TH biết phương sai . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

TH không biết phương sai, mẫu nhỏ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

TH không biết phương sai, mẫu lớn. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

TH không biết phương sai, mẫu lớn. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

KTC cho kỳ vọng - Tóm tắt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

Khoảng tin cậy cho tỷ lệ 37

Giới thiệu. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

Khoảng tin cậy cho tỷ lệ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

Ví dụ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

pdf14 trang | Chuyên mục: Xác Suất Thống Kê | Chia sẻ: yen2110 | Lượt xem: 1382 | Lượt tải: 0download
Tóm tắt nội dung Bài giảng Xác suất thống kê - Chương 6: Ước lượng tham số thống kê - Hoàng Văn Hà, để xem tài liệu hoàn chỉnh bạn click vào nút "TẢI VỀ" ở trên
MSE(Θ˜) < MSE(Θˆ)
• hoặc Var(Θˆ)−Var(Θ˜) > (Bias(Θ˜))2 − (Bias(Θˆ))2.
• Nếu cả Θˆ và Θ˜ là ƯLKC, tiêu chuẩn MSE trở thành tiêu chuẩn so sánh dựa trên phương sai mẫu.
• Tiêu chuẩn MSE tương đương với việc so sánh tỷ số
Eff(Θˆ, Θ˜) =
MSE(Θ˜)
MSE(Θˆ)
(6)
và chọn Θ˜ nếu Eff(Θˆ, Θ˜) < 1.
10
Sai số chuẩn - Standard Error
Định nghĩa 5. Sai số chuẩn (SE) của một ước lượng Θˆ chính là độ lệch tiêu chuẩn của nó, cho bởi
SE(Θˆ) =
√
Var(Θˆ) (7)
Ký hiệu khác: σˆΘˆ.
• Ví dụ.
Tham số Ước lượng T Var(T ) SE(T )
µ X¯
σ2
n
S√
n
p pˆ
p(1− p)
n
√
pˆ(1− pˆ
n
σ2 S2
2σ4
n− 1 S
2
√
2
n− 1
11
Ước lượng bền vững - Consistency estimator
Định nghĩa 6. Gọi Θˆn = h(X1, . . . ,Xn) là một ước lượng điểm của tham số θ. Ước lượng Θˆn gọi là
bền vững (consistency) nếu Θˆn
P−→ θ, tức là
lim
n→∞
P
(
|Θˆn − θ| > 
)
= 0, ∀ > 0
• Ví dụ.
1. S2 là ước lượng vững của σ2.
2. Với X ∼ B(n, p), pˆ = X¯
n
là ước lượng vững cho p.
12
4
Ước lượng khoảng 13
Giới thiệu
4 Giả sử cần khảo sát một đặc tính X trên một tổng thể xác định.
4 Biến ngẫu nhiên X có phân phối F (x; θ), tham số θ chưa biết.
4 Chọn một mẫu ngẫu nhiên cỡ n: X = (X1, . . . ,Xn).
Định nghĩa 7. Một ước lượng khoảng (interval estimator) của một tham số θ là một cặp các thống
kê L(X1, . . . ,Xn) và U(X1, . . . ,Xn) của một mẫu ngẫu nhiên thỏa L(X) ≤ U(X), và
L(X) ≤ θ ≤ U(X). Nếu một mẫu thực nghiệm x = (x1, . . . , xn) được quan trắc, [l(x), u(x)] gọi là
một khoảng ước lượng (interval estimate) cho θ.
14
Khoảng tin cậy
Định nghĩa 8. Xét biến ngẫu nhiên X = (X1, . . . ,Xn) là biến ngẫu nghiên có hàm mật độ đồng thời
phụ thuộc vào tham số θ ∈ R và L(X) và U(X) là hai thống kê sao cho L(X) ≤ U(X). Khi đó,
khoảng ngẫu nhiên [L(X), U(X)] gọi là khoảng tin cậy cho tham số θ với độ tin cậy 100(1−α)% nếu
P {L(X) ≤ θ ≤ U(X)} = 1− α (8)
4 Với mẫu thực nghiệm x = (x1, . . . , xn), ta có khoảng tin cậy cụ thể cho tham số θ là
l(x) ≤ θ ≤ u(x)
15
Khoảng tin cậy
• Ý nghĩa: với 100% lần lấy mẫu cỡ n thì
4 có 100(1 − α)% lần giá trị tham số θ ∈ [l, u];
4 có 100α% lần giá trị tham số θ /∈ [l, u].
16
5
Khoảng tin cậy cho kỳ vọng 17
TH biết phương sai
• Các giả định:
4 Mẫu ngẫu nhiên được chọn từ tổng thể có phân phối chuẩn, tức là X1, . . . ,Xn
i.i.d∼ N (µ, σ2).
4 Phương sai σ2 của tổng thể đã biết.
18
TH biết phương sai
• Xây dựng khoảng tin cậy:
4 Chọn mẫu ngẫu nhiên cỡ n: X1, . . . ,Xn
i.i.d∼ N (µ, σ2),
4 Thống kê trung bình mẫu
X¯ =
1
n
n∑
i=1
Xi
4 Phân phối mẫu của X¯ : X¯ ∼ N (µ, σ2/n),
4 Đặt
Z =
X¯ − µ
σ/
√
n
(9)
thì Z ∼ N (0, 1).
19
TH biết phương sai
• Xây dựng khoảng tin cậy:
4 Với độ tin cậy 100(1 − α)%, ta có
P
{
−z1−α/2 ≤
X¯ − µ
σ/
√
n
≤ z1−α/2
}
= 1− α (10)
hay
P
{
X¯ − z1−α/2
σ√
n
≤ µ ≤ X¯ + z1−α/2
σ√
n
}
= 1− α (11)
20
6
TH biết phương sai
Định nghĩa 9. Nếu x¯ là trung bình mẫu của một mẫu ngẫu nhiên cỡ n được chọn từ một tổng thể có
phương sai σ2 đã biết, khoảng tin cậy 100(1 − α)% cho kỳ vọng µ được xác đinh như sau
x¯− z1−α/2
σ√
n
≤ µ ≤ x¯+ z1−α/2
σ√
n
(12)
với z1−α/2 là phân vị mức 1− α2 của Z ∼ N (0, 1).
21
TH biết phương sai
• Độ chính xác và cỡ mẫu:
4  = z1−α/2
σ√
n
gọi là độ chính xác (hay sai số) của ước lượng.
4 Chiều dài khoảng tin cậy: 2.
4 Cho trước sai số  và độ tin cậy 100(1 − α)%, công thức tính cỡ mẫu
n =
(z1−α/2σ

)2
(13)
22
Ví dụ
Đường kính của một ống piston trong động cơ xe máy có phân phối chuẩn với độ lệch chuẩn
σ = 0.001 mm. Một mẫu ngẫu nhiên gồm 15 ống piston có đường kính trung bình x¯ = 74.036 mm.
(a) Lập KTC 95% cho đường kính trung bình của piston.
(b) Lập KTC 99% cho đường kính trung bình của piston.
23
7
Ví dụ
Đo chỉ số IQ của các sinh viên trong 1 trường đại học, khảo sát 18 sinh viên thu được kết quả sau:
130 122 119 142 136 127 120 152 141
132 127 118 150 141 133 137 129 142
Biết rằng chỉ số IQ của sinh viên tuân theo phân phối chuẩn với σ = 10, 50.
(a) Vẽ đồ thị stem & leaf cho dữ liệu trên.
(b) Lập khoảng tin cậy 95% cho chỉ số IQ trung bình.
(c) Lập khoảng tin cậy 99% cho chỉ số IQ trung bình.
24
TH không biết phương sai, mẫu nhỏ
• Các giả định:
4 Mẫu ngẫu nhiên được chọn từ tổng thể có phân phối chuẩn, tức là X1, . . . ,Xn
i.i.d∼ N (µ, σ2).
4 Phương sai σ2 của tổng thể không biết; ta sử dụng phương sai mẫu S2 để thay thế.
4 Cỡ mẫu nhỏ: n ≤ 30.
25
TH không biết phương sai, mẫu nhỏ
• Xây dựng khoảng tin cậy:
4 Chọn mẫu ngẫu nhiên cỡ n: X1, . . . ,Xn
i.i.d∼ N (µ, σ2),
4 Thống kê trung bình mẫu và phương sai mẫu
X¯ =
1
n
n∑
i=1
Xi, S
2 =
1
n− 1
n∑
i=1
(
Xi − X¯
)2
4 Thay σ bởi S trong công thức (9) thu được biến ngẫu nhiên
T =
X¯ − µ
S/
√
n
26
8
TH không biết phương sai, mẫu nhỏ
• Phân phối Student - t:
Định nghĩa 10. Xét X1, . . . ,Xn
i.i.d∼ N (µ, σ2 với µ và σ2 không biết. Biến ngẫu nhiên
T =
X¯ − µ
S/
√
n
(14)
có phân phối Student t với n− 1 bậc tự do.
Hàm mật độ của T có dạng
f(t) =
Γ
(
k+1
2
)
Γ
(
k
2
)√
kpi
(
t2
k + 1
) k+1
2
, −∞ < t < +∞
27
TH không biết phương sai, mẫu nhỏ
• Phân phối Student - t:
28
TH không biết phương sai, mẫu nhỏ
• Phân phối Student - t:
4 Gọi tnα là phân vị mức α của biến ngẫu nhiên T có phân phối Student với n bậc tự do.
4 tnα được xác định như sau:
P (T < tnα) = α (15)
4 Tìm tnα: tra bảng Student.
29
9
TH không biết phương sai, mẫu nhỏ
• Xây dựng khoảng tin cậy:
4 Với độ tin cậy 100(1 − α)% và T = (X¯ − µ)/(S/√n) ta có
P
{
−tn−1
1−α/2
≤ X¯ − µ
S/
√
n
≤ tn−1
1−α/2
}
= 1− α (16)
hay
P
{
X¯ − tn−11−α/2
S√
n
≤ µ ≤ X¯ + tn−11−α/2
S√
n
}
= 1− α (17)
30
TH không biết phương sai, mẫu nhỏ
Định nghĩa 11. Nếu x¯ và s lần lượt là trung bình mẫu và độ lệch tiêu chuẩn của một mẫu ngẫu
nhiên cỡ n được chọn từ tổng thể có phân phối chuẩn với kỳ vọng µ và phương sai σ2 không biết,
khoảng tin cậy 100(1 − α)% cho kỳ vọng µ được xác định như sau
x¯− tn−11−α/2
s√
n
≤ µ ≤ x¯+ tn−11−α/2
s√
n
(18)
với tn−11−α/2 là phân vị mức 1− α/2 của T ∼ t(n− 1).
31
TH không biết phương sai, mẫu lớn
• Các giả định:
4 Mẫu ngẫu nhiên được chọn từ một tổng thể với kỳ vọng µ và phương sai σ2 không biết; sử dụng
phương sai mẫu S2 để thay thế cho σ2.
4 Cỡ mẫu lớn: n > 30.
32
10
TH không biết phương sai, mẫu lớn
Khi cỡ mẫu lớn, đại lượng
X¯ − µ
S/
√
n
sẽ xấp xỉ với phân phối chuẩn hóa N (0, 1) theo định lý giới hạn trung tâm. Do đó, khoảng tin cậy cho
kỳ vọng µ với độ tin cậy 100(1 − α)% cho bởi
x¯− z1−α/2
s√
n
≤ µ ≤ x¯+ z1−α/2
s√
n
(19)
33
Ví dụ
Cadmium (Cd), một kim loại nặng, là chất độc đối với các loài động vật. Tuy nhiên, các loài nấm lại
có khả năng hấp thụ Cd với hàm lượng cao. Chính phủ một số nước ra quy định giới hạn hàm lượng
Cd tối đa trong rau quả khô là 0, 5 (ppm). Trong một nghiên cứu về hàm lượng Cd trong loài nấm
Boletus pinicola do M. Melgar và các cộng sự thực hiện đăng trên tạp chí Journal of Environment
Science and Health, cho số liệu về hàm lượng Cd trong một mẫu gồm 12 cây nấm như sau:
0.24 0.59 0.62 0.16 0.77 1.33
0.92 0.19 0.33 0.25 0.59 0.32
(a) Lập khoảng tin cậy 99% cho hàm lượng Cd trung bình trong nấm Boletus pinicola.
(b) Nếu muốn sai số ước lượng  = 0.1 thì khảo sát tối thiểu bao nhiêu cây nấm?
34
Ví dụ
Biết lương tháng (Đv: triệu đồng) của thanh niên trong độ tuổi 25-35 ở một khu vực có phân phối
chuẩn. Khảo sát 50 thanh niên.
Lương tháng 1.8 2.5 3.2 3.9 4.6 5.3 6.0 6.7 7.4
Số thanh niên 2 3 8 9 11 7 6 2 2
(a) Lập khoảng tin cậy 95% cho lương tháng của thanh niên trong khu vực này.
(b) Nếu muốn sai số ước lượng  = 0.10 mà vẫn giữ cỡ mẫu n = 50 thì độ tin cậy còn bao
nhiêu?
35
11
KTC cho kỳ vọng - Tóm tắt
36
Khoảng tin cậy cho tỷ lệ 37
Giới thiệu
• Bài toán: tìm khoảng tin cậy cho tỷ lệ phần tử thỏa một tính chất A của tổng thể.
4 Lấy mẫu ngẫu nhiên cỡ n: X = (X1, . . . ,Xn).
4 Đặt Y = Số phần tử thỏa tính chất A trong n phần tử khảo sát, thì Y ∼ B(n, p).
4 Đặt
Pˆ =
Y
n
(20)
38
Khoảng tin cậy cho tỷ lệ
4 Biến ngẫu nhiên Pˆ có kỳ vọng và phương sai lần lượt là
E(Pˆ ) = µPˆ = p, Var(Pˆ ) = σ
2
Pˆ
=
p(1− p)
n
4 Nếu cỡ mẫu n lớn, theo định lý giới hạn trung tâm, phân phối của Pˆ sẽ hội tụ về phân phối
chuẩn hóa, tức là
Z =
Pˆ − µPˆ
σPˆ
=
Pˆ − p√
p(1−p)
n
 N (0, 1) (21)
39
12
Khoảng tin cậy cho tỷ lệ
•Xây dựng khoảng tin cậy:
Với độ tin cậy 100(1 − α)% và Z = (Pˆ − p)/√p(1− p)/n ta có
P

−z1−α/2 ≤ Pˆ − p√p(1−p)
n
≤ z1−α/2

 = 1− α (22)
hay
P
{
Pˆ − z1−α/2
√
p(1− p)
n
≤ p ≤ Pˆ + z1−α/2
√
p(1− p)
n
}
= 1− α (23)
40
Khoảng tin cậy cho tỷ lệ
Định nghĩa 12. Nếu pˆ là tỷ lệ mẫu các phần tử thỏa tính chất A quan tâm của một mẫu ngẫu nhiên
cỡ n, khoảng tin cậy với độ tin cậy 100(1 − α)% cho tỷ lệ p các phần tử thỏa tính chất A của tổng
thể là
pˆ− z1−α/2
√
pˆ(1− pˆ)
n
≤ p ≤ pˆ+ z1−α/2
√
pˆ(1− pˆ)
n
(24)
với z1−α/2 là phân vị mức 1− α/2 của biến ngẫu nhiên Z ∼ N (0, 1).
41
Khoảng tin cậy cho tỷ lệ
• Độ chính xác (sai số) của ước lượng
 = z1−α/2
√
pˆ(1− pˆ)
n
(25)
• Với độ chính xác và độ tin cậy 100(1 − α)% cho trước, công thức xác định cỡ mẫu
n =
(z1−α/2

)2
p(1− p) (26)
• Nếu muốn ít nhất 100(1 − α)% độ tin cậy rằng độ chính xác trong ước lương p bởi pˆ bé hơn  thì
cỡ mẫu là
n =
(z1−α/2

)2
(0.25) (27)
42
13
Ví dụ
Biết lương tháng (Đv: triệu đồng) của thanh niên trong độ tuổi 25-35 ở một khu vực có phân phối
chuẩn. Khảo sát 50 thanh niên.
Lương tháng 1.8 2.5 3.2 3.9 4.6 5.3 6.0 6.7 7.4
Số thanh niên 2 3 8 9 11 7 6 2 2
(a) Thanh nhiên có thu nhập cao nếu lương tháng từ 6.0 triệu đồng trở lên. Hãy lập khoảng
tin cậy 95% cho tỷ lệ thanh niên có thu nhập cao.
(b) Nếu muốn sai số  ≤ 0.08 thì cần khảo sát thêm bao nhiêu thanh niên nữa?
43
Ví dụ
Theo dõi 1000 bệnh nhân ung thư phổi thấy có 823 bệnh nhận chết trong vòng 10 năm.
(a) Lập KTC 95% cho tỷ lệ bệnh nhân chết vì ung thư phổi.
(b) Nếu muốn sai số bé hơn 0.03 thì phải theo dõi tối thiểu bao nhiêu bệnh nhân trong 10 năm?
44
14

File đính kèm:

  • pdfbai_giang_xac_suat_thong_ke_chuong_6_uoc_luong_tham_so_thong.pdf
  • pdfChap 6 - Uoc luong tham so thong ke (slide).pdf