Bài giảng Xác suất thống kê - Chương 5: Biến ngẫu nhiên và phân phối xác suất
Biến ngẫu nhiên được chia làm hai loại: biến ngẫu nhiên rời rạc, biến ngẫu nhiên liên tục.
a) Biến ngẫu nhiên rời rạc (Discrete Random Variable)
Nếu giá trị của biến ngẫu nhiên X có thể lập thành dãy rời rạc các số x1, x2, , xn (dãy
hữu hạn hay vô hạn) thì X được gọi là biến ngẫu nhiên rời rạc.
b) 3.1.2.2. Biến ngẫu nhiên liên tục (Continuous Random Variable)
Nếu giá trị của biến ngẫu nhiên X có thể lấp đầy toàn bộ khoảng hữu hạn hay vô hạn (a,b)
của trục số 0x thì biến ngẫu nhiên X được gọi là biến ngẫu nhiên liên tục.
Thí dụ
• Lượng khách hàng đến cửa hàng trong ngày là biến ngẫu nhiên rời rạc.
• Nhiệt độ trong ngày ở Sài Gòn là biến ngẫu nhiên liên tục.
7/8 5.3.2. Hàm phân phối tích lũy (Cumulative Distribution Function) Hàm phân phối tích lũy còn được gọi là hàm phân tích hay hàm phân phối xác suất a) Định nghĩa Hàm phân phối tích lũy, FX(x) của biến ngẫu nhiên liên tục X thể hiện xác suất để X không vượt quá giá trị x. FX(x) là hàm của x. Fx(x) = P(X ≤ x) b) 3.3.2.2. Tính chất 9 Fx(x) = ∫ ∞−x X dx)x(f với fX(x) là hàm mật độ xác suất. 9 FX(x)dx = f ’X(x) = dFX(x)/dx 9 FX(x) là hàm không giảm => FX(x + ∆x) ≥ FX(x) 9 0 ≤ FX(x) ≤ 1 9 F(-∞ ) = 0 9 F(+∞ ) =1 9 P (a < X < b) = FX(b) – FX(a) Cao Hào Thi 55 x y FX(x)1 -1 FX(x) Thí dụ Biến ngẫu nhiên X được cho bởi hàm phân phối FX(x) = 0 1 2 1 ( ) /x − ⎧ ⎨⎪ ⎩⎪ Tính xác suất để biến ngẫu nhiên X nằm trong khoảng (1.5, 2.5) và khoảng (2.5, 3.5) Giải P(1,5 < X < 2,5) = F(2,5) - F(1,5) = (2,5 - 1)/2 - (1,5 -1)/2 = 0,5 P(2,5 < X < 3,5) = F(3,5) - F(2,5) = 1 - (2,5 -1)/2 = 0,25 5.3.3. Kỳ vọng của biến ngẫu nhiên liên tục a) Kỳ vọng của biến ngẫu nhiên Kỳ vọng E(X) của biến ngẫu nhiên liên tục X được định nghĩa như sau : E(X) = dx)x(xfx∫∞∞− Kỳ vọng của biến ngẫu nhiên được gọi là số trung bình ký hiệu là µx E(X) = µx b) Kỳ vọng của hàm số của biến ngẫu nhiên dx)x(f)x(g)]x(g[E X∫∞∞−= Nếu x <1 Nếu 1 ≤ x ≤ 3 Nếu x >1 Cao Hào Thi 56 5.3.4. Phương sai σ² = E[X - µx)²] σ² = −∞ ∞∫ [x - µx)²]fX(x)dx hay σ² = E(X²) - µ²x 5.3.5. Độ lệch chuẩn : σ² = 2xσ 5.3.6. Hàm phân phối chuẩn (The Normal Distribution) a) Hàm mật độ xác suất của phân phối chuẩn Nếu hàm mật độ xác suất của biến ngẫu nhiên X có dạng fX (x) = 2 2 2 22 1 σ µ−− σΠ )x( e Với - ∞ < µ < +∞ và 0 < σ² < +∞ Thì biến ngẫu nhiên X được gọi là tuân theo luật phân phối chuẩn. b) Tính chất của phân phối chuẩn Gọi X là biến ngẫu nhiên tuân theo luật phân phối chuẩn với các tham số µ và σ². Ta có các tính chất sau a. Số trung bình của biến ngẫu nhiên X tuân theo luật phân phối chuẩn là µ. E(X) = µ b. Phương sai của biến ngẫu nhiên X là σ² Var(X) = E[(X - µ)²] = σ² c. Đường cong của hàm mật độ xác suất có dạng hình chuông đối xứng qua trị số trung bình µ và được gọi là đường cong chuẩn (normal curve) Cao Hào Thi 57 µ+σµ−σ µ • Phân phối chuẩn có phương sai giống nhau nhưng số trung bình khác nhau µ1 < µ2 < µ3 µ3µ1 µ2 • Phân phối chuẩn có số trung bình giống nhau nhưng phương sai khác nhau σ21 < σ22 < σ23 σ22 µ σ32 σ12 d. Ký hiệu: Nếu biến ngẫu nhiên X tuân theo phân phối chuẩn có số trung bình là µ và phương sai là σ², ta ký hiệu X ~ N (µ,σ²) Cao Hào Thi 58 c) Hàm phân phối tích lũy của phân phối chuẩn (Cumulative Distribution Function of Normal Distribution) Định nghĩa Cho X ~ N (µ,σ²). Hàm phân phối tích lũy của biến ngẫu nhiên X tuân theo phân phối chuẩn được định nghĩa như sau : FX(x) = P(X<x) = dxe x )x( ∫ ∞− σ µ−− πσ 2 2 2 22 1 Thí dụ Diện tích S = ∫ ∞− xo X dx)x(f FX(xo) = P (X≤xo) = S x µ x0 Diện tích S = FX(x) x F(x) 0 xo FX(xo) P[a<X<b] = ∫ b a X dxxf )( = FX(b) - FX(a) x µ b Diện tích S = FX(x) a x F(x) 0 a b FX(b) FX(a) 5.3.7. Phân phối chuẩn chuẩn hoá (Standard Normal Distribution) a) Định nghĩa Phân phối chuẩn chuẩn hóa là phân phối chuẩn có số trung bình là 0 (zero) và phương sai là 1. Ghi chú • Biến ngẫu nhiên tuân theo phân phối chuẩn chuẩn hóa được gọi là biến ngẫu nhiên chẩn hóa (standard normal variable) và được ký hiệu là Z. Z ~ N(0,1) Cao Hào Thi 59 • Đường cong của hàm mật độ xác suất của phân phối chuẩn chuẩn hóa gọi là đường cong chuẩn chuẩn hóa (standard normal variable) x µ = 0 σ2 = 1 f(x) Tung độ của 1 điểm bất kỳ trên đường cong chuẩn sẽ được xác định từ phương trình của hàm mật độ xác suất của phân phối chuẩn. fX(x) = 2 2 2 22 1 σ µ−− πσ )x( e Với µ = 0 , σ = 1 và x = z ⇒ 2 2 2 0 2 1)( z exf −= πσ • Giá trị của hàm phân phối tích lũy của phân phối chuẩn chuẩn hóa (cũng bằng diện tích nằm dưới đường cong chuẩn) được lập thành bảng và được cho sẵn trong các phụ lục của sách thống kê. Các bảng này cho giá trị của FZ(z) = P (Z ≤ z) = ∫ ∞− z Z dz)z(f Z 0 f(x) Ζ Một số bảng lập sẵn, chỉ cho ta diện tích nằm dưới đường cong chuẩn từ 0 đến z. Z 0 f(x) Ζ Dựa vào bảng này ta có thể tính được xác suất để cho biến ngẫu nhiên Z nằm trong khoảng nào đó. Cụ thể. Cao Hào Thi 60 P(Z b) b) Chuẩn hóa biến ngẫu nhiên (Standardization of Variable) Nếu biến ngẫu nhiên X có số trung bình là µ và phương sai là σ², thì biến ngẫu nhiên Z = (X-µ)/σ sẽ có số trung trung bình là 0 và phương sai là 1. Z được gọi là biến ngẫu nhiên được chuẩn hóa (standardized). Nếu X tuân theo phân phối chuẩn thì Z tuân theo phân phối chuẩn chuẩn hóa và Z được gọi là biến ngẫu nhiên chuẩn chuẩn hóa (Standard normal variable). Khi đó : P(a < X < b) = P[(a-µ)/σ < Z < (b-µ)/σ X µ+σµ−σ µ µ+3σµ−3σ Ζ −3 0 1 2 3−2 −1 µ−2σ µ+2σ Thí dụ Cho Z ~N(0,1). Tìm xác suất để giá trị của Z a) Nhỏ hơn - 1,25 b) Nằm trong khoảng (-0,50 , 0,75) c) Lớn hơn 1 Giải a. P(Z ≤ - 1,25) = FZ (-1,25) = 1 - FZ(1,25) = 1 - 0,8944 = 1 - 0,1056 Ghi chú FZ(-zo) = 1 – FZ (zo) b. P(-0,50 ≤ Z ≤0,75) = FZ (0,75) – FZ(-0,50) = FZ(0,75) - [1 – FZ(0,50)] = 0,7734 - [1 - 0,6915)] 0 f(x) 1.25−1.25 Z 0 f(x) 0.75−0.5 Cao Hào Thi 61 = 0,4649 c. P(Z > 1) = 1 - P(Z ≤ 1) = 1 – FZ(1) = 1 – 0,8413 = 0,1587 Thí dụ Cho X ~ N(15,16). Tìm xác suất để X có giá trị lớn hơn 18 Giải P (X >18) = P(Z> [(18 -µ)/σ] = P(Z> [(18 - 15)/4] = P(Z> 0,75) = 1 - P(Z<0,75) = 1 – FZ(0,75) = 1 – 0,7734 P(X>18) = 0,2266 Thí du Nếu X là biến ngẫu nhiên tuân theo phân phối chuẩn có số trung bình là 3 và độ lệch chuẩn là 2. Tìm P(4<X<6) Giải P (4 <X<6) = P(4-3)/2 < Z(6 - 3)/2] = P(0,5< Z<1,5) = FZ(1,5)- FZ(0,5) = 0,9332 – 0,6915 = 0,2417 Thí dụ Tìm giá trị của b biết rằng P (-b < Z < b) = 0,9010 Giải Z 0 f(x) 1.65 FZ(b) = 1 - (1-0,9010)/2 = 1 – 0,0990/2 = 1 - 0,0495 FZ(b) = 0,9505 ==> b = 1,65 5.3.8. Sự gần đúng của phân phối chuẩn đối với phân phối nhị thức Z 0 f(x) 0.75−0.5 Cao Hào Thi 62 (Normal Approximaton to the Binomial Distribution) Gọi X là số lần thành công trong những phép thử và xác suất thành công trong mỗi phép thử là p Nếu n lớn và p không quá gần 0 hay quá gần 1 thì ta có thể dùng phân phối chuẩn để tính toán gần đúng cho phân phối nhị thức. Biến ngẫu nhiên X tuân theo luật phân phối nhị thức được chuẩn hóa theo công thức Z = )p(np npX − − 1 Với số trung bình của phân phối nhị thức µ = np và độ lệch chuẩn )p(np −=σ 1 Khi đó : P(a ≤ X ≤ b) ≈ P( )p(np npbZ )p(np npa − −≤≤− − 11 ) Điều kiện n ≥ 50 Nếu kể đến sự hiệu chỉnh liên tục (continuity correction) P(a ≤ X ≤ b) ≈ P( )1( 5,0 )1( 5,0 pnp npbZ pnp npa − −+≤≤− −− Điều kiện 20≤ n ≤ 50 P(X=a) = P(a-0,5 ≤ X ≤ a+0,5) ≈ ( )1( 5,0 )1( 5,0 pnp npaZ pnp npa − −+≤≤− −− 5.3.9. Sự gần đúng của phân phối chuẩn đối với phân phối Poisson Gọi X là biến ngẫu nhiên tuân theo phân phối Poisson có số trung bình là λ. Nếu λ lớn thì ta có thể dùng phân phối chuẩn để tính toán gần đúng cho phân phối Poisson. Biến ngẫu nhiên X được chuẩn hóa theo công thức. Z = λ λ−X X Số lần thành công Px(x) Cao Hào Thi 63 P(a≤ X ≤ b) ≈ P )5,05,0( λ λ λ λ −+≤≤−− bZa P(X=a) ≈ P (a-0,5 ≤ X ≤ a+0,5) Thí dụ Một người bán hàng đi chào hàng với 100 khách hàng. Theo kinh nghiệm hy vọng bán được hàng cho mỗi một khách hàng là 40%. Tìm xác suất để số khách hàng sẽ mua hàng nằm trong khoảng 45 đến 50. Giải Gọi X là số khách hàng sẽ mua hàng X tuân theo luật phân phối nhị thức với µ = np = 100 * 4 = 40, độ lệch σ = 246,0*4,0*100)1( ==− pnp Dùng cách tính gần đúng của phân phối chuẩn P(45 ≤ X ≤ 50) = P[ 24 4050 24 4045 −≤≤− Z ] = P[1,02≤ Z ≤ 2,04] = FZ(2,04) – FZ(1,02) = 0,9793 - 0,8461 = 0,1332 Nếu kể đến sự hiệu chỉnh liên tục. P(45 ≤ X ≤ 50) = P[ 24 40550 24 4045 −≤≤− .Z ] = P[0,92≤ Z ≤ 2,14] = FZ(2,04) – FZ(1,02) = 0,9838 - 0,8212 = 0,1626 Ghi chú : Nếu tính trực tiếp bằng phân phối nhị thức. P(45≤X≤50) = PX(45) + PX(46) + PX(46) + PX(47) + PX(48) + PX(49) + PX(50) Các bảng nhị thức ứng với n ≤ 20. Thí dụ Một nhà máy sản xuất thử một loại sản phẩm mới. Mỗi sản phẩm sản xuất có xác suất bị hư là 0,16. Tìm xác suất để có đúng 20 sản phẩm bị hư trong 80 sản phẩm. Giải Gọi X là số sản phẩm bị hư. X tuân thủ theo luật phân phối nhị thức với. Cao Hào Thi 64 µ = np = 80 * 0,16 = 12,8 σ = 279,384,0*16,0*80)1( ==− pnp P(X = 20 ) = P(19,5 <X<20,5) = P(19,5-12,8)/3,279 <Z<(20,5-12,8)/3,279 = P(2,04 <Z<2,35) = FZ (2,35)-FZ (2,05) = 0,9906 - 0,9793 P(X = 20 ) = 0,113 Ghi chú : Lời giải chính xác : P(X = 20 ) = C 80 20 P20 q80-20 = 0,122 5.3.10. Sự gần đúng của phân phối chuẩn đối với tỉ số của số lần thành công của biến ngẫu nhiên X tuân theo luật phân phối nhị thức Gọi X là biến ngẫu nhiên chỉ số lần thành công trong n phép thử. Gọi f = X/n là tỉ số của số lần thành công. Gọi p là xác suất thành công của 1 lần thử. • Kỳ vọng của f E(f) = p • Phương sai của f 2fσ = p(1-p)/n • Độ lệch chuẩn của f σf = n )p(p f −=σ 12 • Sự chuẩn hóa của biến ngẫu nhiên f Z = n )p(p pf − − 1 Thí dụ Giả sử n = 100, p = 0,36. Tìm xác suất sao cho số f của số lần thành công trong n phép thử nằm trong khoảng 0,24 và 0,42. Giải Cao Hào Thi 65 E(f) = p = 0,36 Var(f) = 2fσ = p(1-p)/n = 0,36 * 0,64/100 = 0,002304 σf = 2fσ = 0,048 Biến ngẫu nhiên f được chuẩn hóa dưới dạng Z = (f - 0,36)/0,048 P(0,24 ≤ f ≤ 0,42) = P[(0,24 - 0,36)/0,048 ≤ (f -0,36)/0,048 ≤ (0,42 - 0,36)/0,048] = P(-2,5 ≤ Z ≤ 1,25) = 0,4938 + 0,3944 = 0,8881 ≈ 0,89 Ghi chú P(0,24 ≤ f ≤ 0,42) = P(24 ≤ X ≤ 42)
File đính kèm:
- bai_giang_xac_suat_thong_ke_chuong_5_bien_ngau_nhien_va_phan.pdf