Báo cáo Bài tập lớn môn Xác suất thống kê - Bách Khoa TP HCM

I. Dạng toán: phân tích phương sai ba yếu tố

II. Cơ sở lý thuyết

 Mục đích của sự phân tích phương sai ba yếu tố là đánh giá sự ảnh hưởng của ba yếu tố (nhân tạo hay tự nhiên) nào đó trên các giá trị quan sát

 Sự phân tích này được dùng để đánh giá về sự ảnh hưởng của 3 yếu tố trên các giá trị quan sát G(i=1,2 r:yếu tố A;j=1,2 r:yếu tố B;k=1,2 r:yếu tố C)

 Mô hình ba yếu tố được trình bày như sau:

 

ppt74 trang | Chuyên mục: Xác Suất Thống Kê | Chia sẻ: tuando | Lượt xem: 435 | Lượt tải: 0download
Tóm tắt nội dung Báo cáo Bài tập lớn môn Xác suất thống kê - Bách Khoa TP HCM, để xem tài liệu hoàn chỉnh bạn click vào nút "TẢI VỀ" ở trên
hiện một phản ứng tổng hợp.các hiệu xuất của phản ứng(%) được trình bày trong bảng sau:Thời gian (phút)X1Nhiệt độ (0C)X2Hiệu xuất (%)Y151051.87301052.02601053.28151203.05301204.07601205.54151355.03301356.45601357.26Hãy cho biết yếu tố nhiệt độ và thời gian/hoặc yếu tố thời gian có liên quan tuyến tính với hiệu xuất của phản ứng tổng hợp?nếu có thì điều kiện nhiệt độ 1150C trong vòng 50 phút thì hiệu xuất phản ứng sẻ là bao nhiêu?Giải:I.Dạng toán:hồi quy tuyến tính đa tham sốII.Cơ sở lý thuyết:HỒI QUY TUYẾN TÍNH ĐA THAM SỐTrong phương trình hồi quy tuyến tính đa tham số ,biến số Y có liên quan đến k biến số độc lập.Phương trình tổng quát:Y(x0,x1,xk) =B0+B1X1++BkXkBảng ANOVANguồn sai sốBậc tự doTổng số bình phươngBình phương trung bìnhGiá trị thống kêHồi quykSSRMSR=SSR/kF=MSR/MSESai sốN-k-1SSEMSE=SSE/(N-k-1) Tổng cộngN-1SST=SSR+SSE  Giá trị thống kê:Giá trị R-bình phươngGiá trị R2-được hiệu chỉnhR2=SSR/SST=Kf/((N-k-1)+Kf) (R2>=0,81 là khá tốt)Độ lệch chuẩnS=(S=α=0.05)=>Chấp nhận giả thiết H0	t1=1.38α=0.05)=>Chấp nhận giả thiết H0F=1.95α=0.05)=>Chấp nhận giả thiết H0	Vậy cả hai hệ số 2.73(B0) và 0.04(B1) của phương trình hồi quy đều không có ý nghĩa thống kê.Nói cách khác phương trình hồi quy này không thích hợp Phương trình hồi quy: t0=3.418> t0.05=2.365(hay Pv2=0.011>α=0.05)=>Bác bỏ giả thiết H0t1= 4.757>t0.05=2.365(hay Pv=0.00206Bác bỏ giả thiết H0F=22.631>F=5.590(hay Fs=0.00206Bác bỏ giả thiết H0	Vậy cả hai hệ số -11.14(B0) và 0.13(B1) của phương trình hồi quy đều có ý nghĩa thống kê.Nói cách khác phương trình hồi quy này phù hợpIV.Kết luận : yếu tố nhiệt độ có liên quan tuyến tính với hiệu xuất của phản ứng tổng hợp.Phương trình hồi quy: (R2=0.97; S=0.33) t0=11.528> t0.05=2.365(hay Pv2=2.260*10-5Bác bỏ giả thiết H0	t1=7.583> t0.05=2.365(hay Pv=0.00027Bác bỏ giả thiết H0	F=131.392>5.14(hay Fs=1.112*10-5Bác bỏ giả thiết H0	Vậy cả hai hệ số -12.70(B0),0.04(B1)và 0.13(B1)của phương trình hồi quy	đều có ý nghĩa thống kê. Nói cách khác,phương trinh hồi quy này thích hợpKết luận: hiệu xuất của phản ứng tổng hợp có liên quan tuyến tính với cả hai yếu tố là thời gian và nhiệt độ.Sự tuyến tính của phương trìnhcó thể được trình bày trong biểu đồ phân tán(scatterplots):BIỂU ĐỒ:Kết luận: hiệu xuất của phản ứng tổng hợp có liên quan tuyến tính với cả hai yếu tố là thời gian và nhiệt độ.Nếu muốn dự đoán hiệu xuất bằng phương trình hồi quy chỉ cần chọn một ô,ví dụ nhưE20,sau đó nhập hàm=E17+E18*50+E19*115 và được kết quả như sau:Ghi chú: E17 tọa độ của B0 ,E18 tọa độ của B1,E19 tọa độ của B2,50 là giá trị của X1(thời gian) và 115 là giá trị của X2 (nhiệt độ)XY5015130115170215270335909521029550551301552702952403151701752102759075XY210255901152402555035240275270315130135270355901352402951301751702355075Bài 2:Tỷ số tương quan của X đối với Y và hệ số xác định của tập số liệu sau đây Bước 1nhập trị vào bảngsau đó vào tool-> data analysisSau khi chỉnh thông tin trong bảngnhấp ok ,ta được bảng sauBước 2:tính hệ số tương quancủa Y với X với bảng giá trị-Input Range(phạm vi đầu vào):kéo thả chuột từ A3 tới B31-Group by: chọn Columns-Chọn Labels in first row( có nhãn ở hàng đầu tiên)-Có thể chọn output range( phạm vi dữ liệu ra) ở trong sheet hiện hành( như hình) hoặc in ra kết quả ra với -sheet mới.-Nhấp OK, thu được kết quả:Hệ số tương quan r =0.971131Hệ số xác định r2=0.943095Ta có: T= 20.75829228 với  Mà:c = 2.056Với :c là phân vị mức α/2=0.025 của phân bố Student với n-2=26 bậc tự doVì lTl>c nên bác bỏ giả thiết HVậy: X và Y có tương quan tuyến tínhKết luận: X và Y không có tương quan phi tuyến-Giả thiết Ho : X và Y không có tương quan phi tuyến.Ta có:	F =0.301137775 với Trong đó :n là số các giá trị của Y, k là số các giá trị của X. n=28, k=7, η2Y/X =0.946903	 Mà:	c=2.68c là phân vị mức α=0,05 của phân bố Fisher bậc tự do (k-2,n-k)=(5,21)Vì:	F thu được bảng Anova ta thu được F	nếu Fchấp nhận giả thiết H0,ngược lại thì bác bỏ giả thiết H0IV.Giải toán bằng Excel:Khởi động Ms- EXCELNhập dử liệu vào bảng:ABCDE1Nhạc nhẹ151822172Nhạc rock132016153Nhạc cổ điển151924284Không có nhạc24231714Áp dụng “Anova:Single-Factor” (phân tích phương sai 1 yếu tố )A)Nhấp lần lượt đơn lệnh Tool và lệnh Data AnalysisB)Chọn chương trình Anova: Single-Factor trong hộp thoại Data Analysis rồi nhấp nút OK.Trong hộp thoại Anova: single factor lần lượt ấn địnhPhạm vi đầu vào(input range)Cách xắp xếp theo hang hay cột(group by)Nhấn dữ liệu(labels in fisrt row/column)Phạm vi đầu ra(output range)Sau khi nhấn OK xuất hiện bảng Anova:V.Kết luận:Từ giá trị trong bảng Anova:F=1.35468 chấp nhận H0(loại nhạc)=>lượng sữa trung bình của mỗi nhóm trên là giống nhau=>vậy âm nhạc không ảnh hưởng đến lượng sửa của các con bòBài 4: Với mức ý nghĩa 2%,Phân tích lãi suất của một lợi cổ phiếu được đầu tư vào 5 khu vực khác nhau trên cơ sở bảng số liệu thống kê sau đây:Thaùng quan saùtKhu vöïcIIIIIIIVV1234560,50,50,60,80,40,70,90,80,50,50,70,50,50,60,80,70,30,40,70,70,90,50,20,60,40,50,70,8Bài giải:I.Dạng toán:Đây là bài toán phân tích phương sai một nhân tốII.Cô sôû lí thuyeát:Giả sử {X11, X21, ....,Xn1}laø moät maãu coù kích thöôùc n1 ruùt ra töø taäp hôïp chính caùc giaù trò cuûa X1; {X12, X22, ....Xn2} laø moät maãu kích thöôùc ruùt ra töø taäp hôïp chính caùc giaù trò cuûa X2,..., {X1k, X2k, ....Xnk} laø moät maãu kích thöôùc nk ruùt ra töø taäp hôïp chính caùc giaù trò cuûa Xk. Caùc soá lieäu thu ñöôïc trình baøy thaønh baûng ôû daïng sau ñaây:Caùc möùc nhaân toá12...kx11x12...x1kx21x22...x2k...............Toång soáT1T2...TkTrung bình...Ta ñöa ra moät soá kí hieäu sau Trung bình cuûa maãu thöù i (töùc laø maãu ôû coät thöù i trong baûng treân):Trung bình chungôû ñoù 	n = n1 + n2 + ... + nk;	T = T1 + T2 + ... + Tk.Toång bình phöông chung kyù hieäu laø SST (vieát taét laø chöõ Total Sum of Squares) ñöôïc tính theo coâng thöùc sau:coù theå chöùng minh raèng Toång bình phöông do nhaân toá kyù hieäu laø SSF (vieát taét cuûa chöõ Sum of Squares for Factor) ñöôïc tính theo coâng thöùc sau:  Toång bình phöông do sai soá kyù hieäu laø SSE (vieát taét cuûa chöõ Sum of Squares for the Error) ñöôïc tính theo coâng thöùc:Töø coâng thöùc treân ta thaáy	SST = SSF + SSE Trung bình bình phöông cuûa nhaân toá, kyù hieäu laø MSF (vieát taét cuûa chöõ Mean Square for Factor) ñöôïc tính bôûi coâng thöùc:k – 1 ñöôïc goïi laø baäc töï do cuûa nhaân toá.Trung bình bình phöông cuûa sai soá, kyù hieäu laø MSE (vieát taét cuûa chöõ Mean Square for Error) ñöôïc tính bôûi coâng thöùc:n – k ñöôïc goïi laø baäc töï do cuûa sai soá.Tyû soá F ñöôïc tính bôûi coâng thöùc Caùc keát quaû noùi treân ñöôïc trình baøy trong baûng sau ñaây goïi laø ANOVA (vieát taét cuûa chuõ Analysis of Variance: phaân tích phöông sai)   Baûng ANOVANguoànToång bình phöôngBaäc töï doTrung bình bình phöôngTyû soá FNhaân toáSSFk – 1MSFMSF/MSESai soáSSEn – kMSEToång soáSSTn – 1 Ngöôøi ta chöùng minh ñöôïc raèng neáu giaû thieát Ho ñuùng thì tyû soá F seõ coù phaân boá Fisher vôùi baäc töï do laø (k – 1, n – k)Thaønh thöû giaû thieát Ho seõ bò baùc boû ôû möùc yù nghóa  cuûa phaân boá Fisher vôùi baäc töï do laø (k – 1, n – k), k – 1 ñöôïc goïi laø baäc töï do ôû maãu soá. III.Tính toán bằng Excel: Nhập dữ liệu vào bảng tính:Nhấp lần lượt đơn lệnh Tool và lệnh Data AnalysisChọn chương trình Anova: Two trong hộp thoại Data Analysis rồi nhấp nút OK.Trong hộp thoại Anova: Single-Factor, lần lượt ấn định các chi tiết:-Input Range : -Label in first row/column-Alpha : 0.02-Output range Sau khi nhấp OK ta được bảng sau:Kết quả và biện luận:F= 0.465581Chấp nhận giả thiết H0.Vậy laõi suaát cuûa moät lôïi coå phieáu ñöôïc ñaàu tö vaøo 5 khu vöïc là giống nhauBài 5: Vôùi möùc yù nghóa 1%,Theo doõi soá hoïc sinh ñeán lôùp muoän cuûa naêm tröôøng PTTH vaøo caùc ngaøy khaùc nhau trong tuaàn ngöôøi ta thu ñöôïc soá lieäu veà soá löôïng hoïc sinh trung bình ñeán lôùp muoän cuûa caùc tröôøng ñoù vaøo moät ngaøy tieâu bieåu trong tuaàn nhö sau: Ngaøy trong tuaànTröôøng PTTHABCDThöù haiThöù töThöù saùuThöù baûy5444453453437252Baïn coù nhaän xeùt gì veà soá löôïng hoïc sinh ñeán lôùp muoän cuûa caùc tröôøng. Coù söï khaùc bieät gì veà soá löôïng hoïc sinh ñeán lôùp muoän vaøo caùc ngaøy khaùc nhau trong tuaàn?Bài giải:II.Cơ sở lý thuyết:I.Dạng toán :Phân tích phương sai hai yếu tố không lặpSöï phaân tích naøy nhaèm ñaùnh giaù söï aûnh höôûng cuûa hai yeáu toá treân caùc giaù trò quan saùt Yij(i=1, 2r:yeáu toá A;j= 1 ,2c:yeáu toá B).*Giaû thieát:H0: µ1= µ2=µk ”Caùc giaù trò trung bình baèng nhau”H1: µ1≠ µ2 ”Ít nhaát coù hai giaù trò trung bình khaùc nhau”*Bieän luaän:Neáu FR chaáp nhaän H0(yeáu toá A)Neáu FC chaáp nhaän H0(yeáu toá B)Ta giaû thieát : H01:yeáu toá ngaøy trong tuaàn khoâng aûnh höôûng ñeán soá löôïng hoïc sinh trung bình ñeán lôùp muoän cuûa caùc tröôøng ñoù H02:yeáu toá tröôøng khaùc nhau khoâng aûnh höôûng ñeán soá löôïng hoïc sinh trung bình ñeán lôùp muoän cuûa caùc tröôøng ñoù*Giaù trò thoáng keâ:III.Tính toán bằng Excel:Nhập dữ liệu vào bảng tính:Thứ 25457Thứ 44532Thứ 64345Thứ 74432Vào Data chọn Data Analysis - Xuất hiện hộp lệnh“ Data Analysis” Chọn “Anova: Two-Factor Without Replication”. Phaïm vi ñaàu vaøo (Input Range)Nhaõn döõ lieäu (Labels in Fisrt Row/Column) Ngöôõng tin caäy ( Alpha ):0.01Phaïm vi ñaàu ra ( Output Range)Sau khi nhấp Ok ta được bảng sau:Anova: Two-Factor Without ReplicationSUMMARYCountSumAverageVarianceThứ 24215.251.583333Thứ 44143.51.666667Thứ 641640.666667Thứ 74133.250.916667A4174.250.25B41640.666667C4153.750.916667D41646ANOVASource of VariationSSdfMSFP-valueF critRows9.533.1666672.0357140.1794166.991917Columns0.530.1666670.1071430.9537956.991917Error1491.555556Total2415     Biện luận: *FR=2.0357chấp nhận H01(yếu tố thứ) => Số học sinh đến muộn giữa các thứ là như nhau .*FC=0.1071chấp nhận H02(yếu tố trường) => số học sinh đến muộn giữa các trường là như nhau.Vaäy caû 2 yeáu toá ngaøy trong tuaàn vaø tröôøng khaùc nhau ñeàu khoâng aûnh höôûng ñeán soá löôïng hoïc sinh trung bình ñeán lôùp muoän cuûa caùc tröôøng ñoù The End Thank you listening

File đính kèm:

  • pptbao_cao_bai_tap_lon_mon_xac_suat_thong_ke_bach_khoa_tp_hcm.ppt