Bài giảng Toán tài chính - Chương 5c: Hồi qui và tương quan
TƯƠNG QUAN
Hai biến (đại lượng) được nói là có tương quan nếu chúng có
quan hệ với nhau, chính xác hơn, sự thay đổi của biến này có
ảnh hưởng đến thay đổi của biến còn lại.
Ký hiệu (x,y) là cặp giá trị quan sát được của hai biến X, Y.
Ta có thể vẽ đồ thị của các quan sát thông qua biểu đồ phân
tán (scatter diagram)
ô hình hồi quy đơn giản nhất: hồi quy tuyến tính Có thể sử dụng các mô hình khác: phi tuyến; bậc 2; bậc 3; mũ; logarit 30 HỒI QUY TUYẾN TÍNH X và Y có tương quan tuyến tính mạnh Ta giả sử X và Y có mối quan hệ tuyến tính với nhau. Mô hình như sau: β1 ∶ hệ số chặn (intercept) β2: hệ số góc (slope) u: sai số ngẫu nhiên (nhiễu ngẫu nhiên, nhiễu trắng) 1 2y x ub b 31 HỒI QUY TUYẾN TÍNH Với giá trị quan sát được ta có: yi : giá trị quan sát được của Y khi X nhận giá trị là xi. xi: giá trị quan sát thứ i của X. ui: sai số ngẫu nhiên khi X nhận giá trị xi. 1 2i i iy x ub b 32 HÀM HỒI QUY TỔNG THỂ Hàm hồi quy tổng thể Đối với một quan sát cụ thể ta có: Mô hình chỉ có một biến phụ thuộc Y và một biến giải thích X. và gọi là hệ số chặn (intercept) và hệ số góc (slope) của đường thẳng hồi quy. ( ) 1 2 1 2 | i E Y X X X Y X b b b b = = + = + 1 2i i i Y X ub b= + + 33 HÀM HỒI QUY MẪU SRF Ta ít khi có số liệu của cả tổng thể mà chỉ có số liệu của mẫu (số liệu quan sát được) Ta dùng số liệu mẫu để ước lượng tổng thể Hàm hồi quy mẫu: Đối với quan sát thứ i: µ µ µ 1 2i i Y Xb b= + µ µ µ 1 2i i i Y X ub b= + + 34 YX 35 1b 2bˆ 1bˆ PRF 2b SRF Hệ số hồi quy trong hàm hồi quy PRF và SRF PRF và SRF PRF VÀ SRF Trong đó là ước lượng cho b1. là ước lượng cho b2. là ước lượng cho Y hay E(Y|Xi) Ta sử dụng phương pháp bình phương nhỏ nhất thông thường (OLS) để tìm ; 36 HỒI QUY TỔNG THỂ VÀ HỒI QUY MẪU 37 CHÚ Ý Tình trạng Biện pháp Hệ số β1 Tham số Không xác định được chính xác giá trị Ước lượng Kiểm địnhHệ số β Phương sai sai số 2 Hệ số Biến ngẫu nhiên Có thể tính được giá trị trên mẫu đã chọn Dùng để ước lượng cho các tham số tổng thể Hệ số Phương sai thặng dư mẫu 2 38 ƯỚC LƯỢNG OLS Tìm giá trị của β1; β2 sao cho: Đạt giá trị nhỏ nhất (pp bình phương tối thiểu) Dễ thấy: ( ) 2 2 1 2 1 1 n n i i i i i u y xb b = = = - -å å ( ) ( ) µ ( )( ) ( ) µ1 2 2 1 22 2 2 2 1 2 2 1 . . . ; n i i i n i i x y x xy xy x y x x x x x x y y y x x x b b b b b= = - - = = - - = - - - - = å å 39 HỆ SỐ HỒI QUY MẪU Là các ước lượng của β1; β2 Dạng biểu diễn khác: µ ( ) ( ) ( ) ( ) µ µ 1 2 2 2 1 1 1 1 2 ; n ni i ii i i in n i i i i i x x y x x c y c x x x x y x b b b = = = = - - = = = - - = - å å å å 40 MỘT SỐ TÍNH CHẤT Giá trị trung bình các hệ số hồi quy mẫu: Phương sai các hệ số hồi quy mẫu: Ta dùng các kết quả trên để ước lượng giá trị của các hệ số hồi quy tổng thể β1; β2 Nhưng giá trị của 2 chưa xác định. µ( ) µ( )1 21 2;E Eb b b b= = µ( ) ( ) ( ) µ( ) ( ) 2 2 2 1 22 2 1 1 1 n n i i i i x V V n x x x x s b s b = = æ ö÷ç ÷ç ÷ç ÷ç ÷ç= + =÷ç ÷ç ÷÷ç - -÷ç ÷çè ø å å 41 MỘT VÀI TÍNH CHẤT 42 MỘT VÀI TÍNH CHẤT Ta có: 1 1 1 1 0 n n n n i i i ii i i i i i i u y y y y y y 43 KÝ HIỆU Ta có: 44 TÁCH NHÓM BIẾN THIÊN: KHÁI NIỆM TSS = tổng của các mức độ khác biệt bình phương giữa từng giá trị yi và trị số trung bình của y. ESS = tổng của các mức độ khác biệt bình phương giữa các giá trị quan sát và giá trị dự đoán của y. RSS = tổng của các mức độ khác biệt bình phương giữa giá trị dự đoán của y và trị số trung bình của y. 45 ĐO SỰ BIẾN THIÊN CỦA DỮ LIỆU Tổng bình phương toàn phần (Total Sum of Squares) Tổng bình phương hồi quy (Regression Sum of Squares) Tổng bình phương sai số (Residual Sum of Squares) ( ) 2 1 n i i R SS y y = = -å $ ( ) 2 1 n i i T SS y y = = -å ( ) 2 1 n ii i E SS y y = = -å $ 46 RSS Tổng chênh lệch 47 ESS SRF Y X yi Xi iy Ý nghĩa hình học của TSS, RSS và ESS Các tổng bình phương độ lệch ( ) 2 1 n i i R SS y y = = -å $ ( ) 2 1 n i i T SS y y = = -å ( ) 2 1 n ii i ESS y y = = -å $ y y= $ CÁC TỔNG BÌNH PHƯƠNG ĐỘ LỆCH Khi điểm quan sát càng gần đường thẳng ước lượng thì “độ thích hợp” càng cao, có nghĩa là ESS càng nhỏ và RSS càng lớn. Tham số đo độ thích hợp: R2 càng lớn càng tốt ESS: biến thiên không giải thích được RSS: biến thiên giải thích được R2 nhỏ nghĩa là nhiều biến thiên của Y không giải thích được bằng X. Cần phải thêm nhiều biến khác vào mô hình. 20 1R£ £ = 48 HỆ SỐ XÁC ĐỊNH Coefficient of determination Là tỷ lệ của tổng sự biến thiên trong biến phụ thuộc gây ra bởi sự biến thiên của các biến độc lập (biến giải thích) so với tổng sự biến thiên toàn phần. Tên gọi: R_bình phương (R squared) Ký hiệu: Dễ thấy: 2 R SSR T SS = 20 1R£ £ 49 HỆ SỐ XÁC ĐỊNH Đánh giá mô hình tìm được có giải thích tốt cho mối liên hệ giữa biến phụ thuộc Y và biến độc lập X hay không. Là bình phương của hệ số tương quan mẫu µ ( ) ( ) µ ( ) ( ) ( ) 2 2 2 2 2 2 2 22 2 2 2 2 i i X Y x x x xR SS R T SS y y y y R r b b - - = = = - - = å å 50 Tính chất của hệ số xác định R2 51 • 0≤ R2≤1 • Cho biết % sự biến động của Y được giải thích bởi các biến số X trong mô hình. • R2 =1: đường hồi quy phù hợp hoàn hảo • R2 =0: X và Y không có quan hệ • R2 càng lớn càng tốt • Đối với dữ liệu chuỗi thời gian thì R2 thường lớn hơn 0,9. Nếu thấp hơn 0,6 hay 0,7 thì xem là thấp • Với dữ liệu chéo thì R2 khoảng 0,6 hay 0,7 cũng chưa hẳn thấp ƯỚC LƯỢNG CHO PHƯƠNG SAI SAI SỐ 2 52 ƯỚC LƯỢNG VÀ DỰ BÁO 1. Ước lượng hệ số góc 2. Ước lượng hệ số chặn 3. Ước lượng phương sai sai số 4. Dự báo giá trị trung bình 5. Dự báo điểm 53 PHÂN PHỐI XÁC SUẤT CỦA 1 Nhớ Với độ tin cậy 95% thì: µ µ( ) ( )1 1 1 ~ 2t n Se b b b - - 2,5%2,5% 95% 0,025 2t n 0,025 2t n ( ) µ µ( ) ( )1 10,025 0,025 1 2 2t n t n Se b b b - - - £ £ - µ ( ) µ( ) µ ( ) µ( )1 10,025 1 1 0,025 12 2t n Se t n Seb b b b b- - £ £ + - 54 2 2 1 2 2t n 2 2t n ƯỚC LƯỢNG CHO 1 Tổng quát với độ tin cậy (1 − ) µ( ) µ( ) ( ) 2 2 1 1 1 xx x Se V n S b b s æ ö÷ç ÷ç ÷ç ÷ç= = + ÷ç ÷ç ÷ç ÷÷çè ø ( ) µ µ( ) ( )1 1 2 2 1 2 2t n t n Se a a b b b - - - £ £ - µ ( ) µ( ) µ ( ) µ( )1 11 1 1 2 2 2 2t n Se t n Se a a b b b b b- - £ £ + - 2 2 ESS n s » - 55 CÔNG THỨC ƯỚC LƯỢNG 1 Khoảng tin cậy (1 − ) của hệ số b1 Trong đó: µ µ( )1 11 1;b e b e- + = − 2 = ⁄ − 2 . . 1 + ̅ 56 PHÂN PHỐI XÁC SUẤT CỦA Nhớ Với độ tin cậy (1- ) thì: µ µ( ) ( )2 2 2 ~ 2t n Se b b b - - / 2/ 2 1 /2 2t n /2 2t n ( ) µ µ( ) ( )2 2/ 2 / 2 2 2 2t n t n Se a a b b b - - - £ £ - µ ( ) µ( ) µ ( ) µ( )2 2/ 2 2 2 / 2 22 2t n Se t n Sea ab b b b b- - £ £ + - µ( ) µ( ) 2 2 2 xx S e V S s b b= = 57 CÔNG THỨC ƯỚC LƯỢNG Khoảng tin cậy (1 − ) của hệ số b2 Trong đó: µ µ( )2 22 2;b e b e- + = ⁄ − 2 . . 1 = − 2 58 CÔNG THỨC ƯỚC LƯỢNG 2 • Khoảng tin cậy của phương sai sai số tổng thể: 2 2 2 /2 1 /2 ; 2 2 ESS ESS n n 59 DỰ BÁO Cho X nhận giá trị là x0. Ta tiến hành dự báo: Trung bình của Y khi X = x0. Ký hiệu: E(Y0|X0) Giá trị cụ thể của Y khi X = x0. Ký hiệu: 0 Công thức chung: Giá trị ước lượng ± Sai số 60 DỰ BÁO GIÁ TRỊ Y0 61 DỰ BÁO GIÁ TRỊ E(Y/X0) 62 BỔ SUNG KIẾN THỨC VỀ PHÂN PHỐI XÁC SUẤT Phân phối chuẩn Phân phối Student Phân phối Khi bình phương 63 GIÁ TRỊ TỚI HẠN 2 (n; α) Giá trị tới hạn mức α (0 ≤ ≤ 1) là số thực ký hiệu 2(n; ) sao cho với Z~ 2(n) thì: 64 2 ;nP Z 2 ;n BẢNG GIÁ TRỊ TỚI HẠN KHI BÌNH PHƯƠNG 65 GIÁ TRỊ TỚI HẠN ( , ) Giá trị tới hạn mức α (0 ≤ ≤ 1) là số thực ký hiệu ( , ) sao cho với Z~ (n) thì: 66 ;nZ tP ;0 ;1 ;0,5 ;1 ; ; 0 n n n n n n n t t t t t t Z BẢNG GIÁ TRỊ TỚI HẠN STUDENT 67 VÍ DỤ Quan sát sự biến động của nhu cầu gạo Y (tấn/tháng) vào đơn giá X (ngàn đồng/kg) ta được các số liệu cho ở bảng. Hãy lập mô hình hôi quy mẫu biễu diễn mối phụ thuộc về nhu cầu vào đơn giá gạo Xi 1 4 2 5 5 7 Yi 10 6 9 5 4 2 68 VÍ DỤ Ta lập bảng sau: Ta có: Stt Xi Yi XiYi X^ 2 1 1 10 10 1 2 4 6 24 16 3 2 9 18 4 4 5 5 25 25 5 5 4 20 25 6 7 2 14 49 sum 24 36 111 120 24 36 4 6 6 6 X Y 69 VÍ DỤ Ta có: 1 2 2 2 2 1 . . 111 6.4.6ˆ 1,375 120 6.(4) .( ) n i i i n i i Y X n X Y X n X b 1 2 ˆ ˆ 6 ( 1,375).4 11,5Y Xb b ii XY .375,15,11 ˆ 70 71 Giải hồi quy bằng máy tính 1. Bật tần số: Shift+Mode+↓ +4+1 (Freq On 2. Chọn Mode Regression: Mode+3+2(chọn A+Bx) 3. Nhập dữ liệu theo cột 4. Kiểm tra và nhấn AC thoát 5. Xem kết quả: Shift +1+ 3,4,5 (tùy theo Sum, Var hay Reg) 72 Bài tập 1 Thu thập số liệu về điểm học tập của học sinh và mức thu nhập hàng năm của bố mẹ ta có bảng số liệu sau: Hãy tìm hàm hồi quy mẫu và tính các đặc trưng của nó Xi: thu nhập (triệu/năm) Yi: điểm trung bình Xi 45 60 30 90 75 45 105 60 Yi 8,75 7,5 6,25 8,75 7,5 5,0 9,5 6,5 73 Bài tập 1 b) Với độ tin cậy 95% hãy ước lượng hệ số chặn, hệ số góc và phương sai sai số. c) Với độ tin cậy 90%, dự đoán điểm và điểm trung bình khi thu nhập là 80 Xi 45 60 30 90 75 45 105 60 Yi 8,75 7,5 6,25 8,75 7,5 5,0 9,5 6,5 74 Bài tập 2 Số liệu về tỷ lệ lạm phát và lãi suất trong năm 2011 của 6 quốc gia như sau: a) Ước lượng và viết phương trình hồi quy tuyến tính = 1 + 2 + b) Tìm hệ số xác định và giải thích ý nghĩa c) Dự đoán lãi suất trung bình khi lạm phát là 10%. Lãi suất Y (%) 7 11 20 10 16 14 Lạm phát X (%) 3 8 17 8 12 12 75 Bài tập 3 Cho bảng số liệu sau: a) Tìm hệ số tương quan mẫu b) Tìm phương trình hồi quy mẫu c) Tính Sxx, Sxy, Syy d) Tính TSS, RSS, ESS. e) Tính các giá trị hồi quy và từ đó tìm ESS f) Ước lượng cho 1; 2; 2 với độ tin cậy 90% g) Dự đoán giá trị của Y khi X là 18. X 4 7 8 15 8 12 14 20 16 9 Y 9 13 17 29 17 23 27 45 34 20
File đính kèm:
- bai_giang_toan_tai_chinh_chuong_5c_hoi_qui_va_tuong_quan.pdf