Luận văn Tóm tắt Áp dụng kỹ thuật phân tích dữ liệu trực tuyến (OLAP) phục vụ công tác quản lý điều hành

Xây dựng một hệ trợ giúp quyết định dựa vào dữ liệu, sử dụng phương pháp

luận xử lý phân tích trực tuyến (OLAP). Trong đó tập trung vào hai công việc chính

là tập hợp dữ liệu để tổ chức dữ liệu đa chiều, phân tích và hiển thị dữ liệu để trợ giúp

ra quyết định.

Luận văn gồm 3 chương:

Chương 1: Tổng quan các phương pháp khai thác dữ liệu

Chương 2: Hệ thống trợ giúp quyết định sử dụng phân tích đa chiều trong xử lý

phân tích trực tuyến

Chương 3: Xây dựng hệ thống trợ giúp quản lý với chức năng OLAP

pdf19 trang | Chuyên mục: Kho Dữ Liệu Và OLAP | Chia sẻ: dkS00TYs | Lượt xem: 1712 | Lượt tải: 4download
Tóm tắt nội dung Luận văn Tóm tắt Áp dụng kỹ thuật phân tích dữ liệu trực tuyến (OLAP) phục vụ công tác quản lý điều hành, để xem tài liệu hoàn chỉnh bạn click vào nút "TẢI VỀ" ở trên
hiệu quả của quá trình ra quyết định; 
13 
9. Người ra quyết định điều khiển toàn bộ các bước của quá trình ra quyết 
định trong việc giải quyết các bài toán; 
10. DSS thường sử dụng các mô hình cho sự phân tích các tình huống ra quyết 
định; 
11. DSS ở mức cao được trang bị thành phần tri thức; 
2.2.5. Các thành phần của DSS 
DSS được tạo thành từ 4 hệ thống con sau: 
1. Quản trị dữ liệu. 
2. Quản trị mô hình. 
3. Truyền thông. 
4. Quản trị tri thức. 
Mô hình khái niệm của DSS được cho trong hình dưới đây cung cấp khả năng 
những hiểu biết cơ bản về cấu trúc chung và các thành phần của DSS. 
2.2.6. Hệ con quản trị dữ liệu 
Hệ con quản trị dữ liệu bao gồm những thành phần sau: 
1. Cơ sở dữ liệu về DSS 
2. Hệ quản trị cơ sở dữ liệu. 
3. Phương tiện hỏi đáp. 
4. Danh mục dữ liệu. 
2.2.7. Hệ con quản trị mô hình 
Hệ con quản trị mô hình trong DSS bao gồm các thành phần sau: 
1. Cơ sở mô hình. 
2. Hệ quản trị cơ sở mô hình. 
3. Ngôn ngữ dùng trong mô hình. 
4. Danh mục mô hình. 
5. Thực hiện, tích hợp và điều khiển mô hình. 
Các phần tử này và giao diện với những thành phần khác của DSS được cho ở 
hình vẽ. 
2.2.8. Hệ thống tri thức 
14 
Nhiều bài toán phi cấu trúc và bán cấu trúc rất phức tạp, chúng yêu cầu những 
tri thức tinh thông, những tri thức này cần thiết được bổ sung vào cho những khả 
năng bình thường của DSS, những tri thức nâng cao được trang bị một thành phần 
được gọi là quản trị tri thức. 
2.2.9. Hệ thống giao diện người dùng 
Thành phần hội thoại của DSS là phần mềm và phần cứng cung cấp giao diện 
người dùng DSS. 
2.2.10. Người dùng trong hệ thống DSS 
 DSS có hai lớp người dùng: Các nhà quản lý và các nhà chuyên môn. 
2.2.11. Sự phân lớp DSS và sự trợ giúp của chúng 
 Có nhiều cách phân loại DSS, sau đây là một số cách điển hình: 
 Kiểu của trợ giúp hướng dữ liệu so sánh với kiểu hướng mô hình. 
 Độ phi thủ tục. 
Sự trợ giúp được cung cấp theo cách của DSS: DSS có thể cung cấp nhiều kiểu cuả 
trợ giúp. 
2.2.12. Các công nghệ về DSS 
 Sprague và Carlson đã xác định 3 mức công nghệ của DSS là (i) DSS cụ thể; (ii) các 
bộ tạo sinh DSS; và (iii) các công cụ DSS. 
2.3. KẾT LUẬN CHƯƠNG 
Chương 2 đề cập chi tiết về công cụ OLAP, giới thiệu dịch vụ OLAP của 
Microsoft SQL Server, kiến trúc khối của OLAP và các dạng mô hình OLAP. Những 
kĩ thuật khai phá dữ liệu, phát hiện tri thức có ý nghĩa đối với công tác quản lý và 
người quản lý, trong việc ra các quyết định về đào tạo và nghiên cứu khoa học. 
15 
Chương 3 
XÂY DỰNG HỆ THỐNG TRỢ GIÚP QUẢN LÝ 
VỚI CHỨC NĂNG OLAP 
3.1. MỤC TIÊU CỦA HỆ THỐNG 
3.1.1. Giới thiệu về đơn vị 
Học viện Công nghệ Bưu chính Viễn thông là đơn vị Trực thuộc Tập đoàn Bưu 
chính Viễn thông Việt Nam, dẫn đầu trong gắn kết Nghiên cứu - Đào tạo - Sản xuất 
Kinh doanh trong lĩnh vực Công nghệ thông tin và Truyền thông. 
3.1.1.1. Nguồn nhân lực 
Là đơn vị Nghiên cứu, Đào tạo đầu Ngành Bưu chính Viễn thông, Học viện 
xác định nguồn nhân lực chính là tài sản quý giá nhất, là tài sản cần được đầu tư một 
cách bài bản, chuyên nghiệp và có định hướng lâu dài . Với đội ngũ cán bộ trên 800 
người, Học viện là một trong các đơn vị có mật độ tri thức cao nhất trong Ngành. 
3.1.1.2. Công tác đào tạo 
Học viện là đơn vị đào tạo đa ngành, đa nghề với nhiều loại hình đào tạo 
(Chính qui, Tại chức, Từ xa, Liên thông, Văn bằng 2..) và hệ đào tạo (Cao đẳng, Đại 
học, Cao học, Nghiên cứu sinh) khác nhau 
3.1.2. Đặt vấn đề 
3.1.2.1. Về kho dữ liệu 
Kho dữ liệu là kho lưu trữ dữ liệu lưu trữ bằng thiết bị điện tử của một tổ chức. 
Các kho dữ liệu được thiết kế để hỗ trợ việc phân tích dữ liệu và lập báo cáo 
Trong quá trình hoạt động kinh doanh, các dữ liệu của doanh nghiệp phát sinh 
ngày càng nhiều. Người ta muốn tận dụng nguồn dữ liệu này để sử dụng cho những 
mục đích hỗ trợ cho công việc kinh doanh ví dụ như cho mục đích thống kê hay phân 
tích. Quá trình tập hợp và thao tác trên các dữ liệu này có những đặc điểm sau: 
1. Dữ liệu tích hợp. 
2. Theo chủ đề. 
3. Biến thời gian. 
4. Dữ liệu cố định. 
3.1.2.2. Cấu trúc dữ liệu cho kho dữ liệu 
Vì dữ liệu trong kho dữ liệu rất lớn và không có những thao tác như sửa đổi 
hay tạo mới nên nó được tối ưu cho việc phân tích và báo cáo. Các thao tác với dữ 
16 
liệu của kho dữ liệu dựa trên cơ sở là Mô hình dữ liệu đa chiều, được mô hình vào 
đối tượng gọi là khối dữ liệu. 
3.1.2.3. Ngôn ngữ cho kho dữ liệu 
Ngôn ngữ xử lý phân tích trực tuyến OLAP, rất phù hợp với kho dữ liệu, ngôn 
ngữ này tương tự với ngôn ngữ truy vấn SQL và tập trung vào các câu lệnh sau: 
1. Thu nhỏ: ví dụ nhóm dữ liệu theo năm thay vì theo quý. 
2. Mở rộng: ví dụ mở rộng dữ liệu, nhìn theo tháng thay vì theo quý. 
3. Cắt lát : nhìn theo từng lớp một. Ví dụ: từ danh mục bán hàng của Q1, 
Q2, Q3, Q4 chỉ xem của Q1. 
4. Thu nhỏ: bỏ bớt một phần của dữ liệu (tương ứng thêm điều kiện vào 
câu lệnh WHERE trong SQL). 
3.1.2.4. Cấu trúc của một hệ thống kho dữ liệu 
Người ta thiết kế kho dữ liệu có ba tầng: 
1. Tầng đáy; 
2. Tầng giữa; 
3. Tầng trên cùng; 
3.1.2.5. Nhiệm vụ khai phá dữ liệu của luận văn 
Trong khuôn khổ luận văn này, tôi sử dụng kĩ thuật OLAP để khai phá dữ liệu, 
trong kho dữ liệu nhiều chiều. Các dữ liệu về (i) công tác quản lý sinh viên; (ii) kết 
quả học tập của sinh viên và học viên; (iii) công trình nghiên cứu khoa học của thày 
cô giáo trong Học viện Công nghệ Bưu chính Viễn thông… 
Dựa trên dữ liệu cơ bản đó, để thực hiện công tác trợ giúp quyết định, phục vụ 
quản lý, điều hành công tác đào tạo và nghiên cứu khoa học trong Học viện Công 
nghệ Bưu chính Viễn thông, luận văn sẽ: 
1. Tổ chức dữ liệu, dưới dạng kho dữ liệu; 
2. Thể hiện dữ liệu dưới dạng đồ hoạ, phục vụ quyết định trực quan; 
3. Sử dụng kĩ thuật OLAP, thể hiện dữ liệu dưới các dạng bảng xoay khác 
nhau, tiện cho việc xử lí dữ liệu và ra quyết định. 
3.2. YÊU CẦU VỀ HỆ THỐNG, THIẾT KẾ HỆ THỐNG 
3.2.1. Cơ sở dữ liệu về đào tạo và nghiên cứu khoa học 
17 
Hiện tại, Học viện chưa quản lý tác nghiệp rộng trên cơ sở dữ liệu trực tuyến. 
Dữ liệu thường được tổ chức trong các cơ sở dữ liệu đơn lẻ. Nhiệm vụ của đề tài luận 
văn là thiết kế cơ sở dữ liệu tích hợp, cho phép lưu mọi thông tin về đào tạo và 
nghiên cứu khoa học của cán bộ, học viên và sinh viên của Học viện. 
Hệ quản trị cơ sở dữ liệu là SQL SERVER. Giao diện là tương tác người dùng 
theo đồ họa, gắn với môi trường Windows. 
Hình. Hệ quản trị cơ sở dữ liệu sử dụng trong đề tài luận văn 
Nhiều bảng dữ liệu, liên quan đến đào tạo và nghiên cứu khoa học được mô tả 
trong cơ sở dữ liệu “quản lý nguồn nhân lực”. 
3.2.2. Hạ tầng kĩ thuật 
Đề tài thực hiện trên máy đơn. Mô hình tương lai yêu cầu cơ sở dữ liệu đặt trên 
máy chủ cơ sở dữ liệu của Học viện. Các quyết định liên quan đến quản lý nguồn 
nhân lực sẽ thực hiện trên mạng Intranet, cho phép các người quản lý điều khiển tác 
nghiệp. Các chức năng tìm kiếm, trích rút dữ liệu và xử lý dữ liệu, theo hệ thống cơ 
sở dữ liệu truyền thống được hệ quản trị cơ sở dữ liệu SQL SERVER đảm nhiệm. 
Một số chức năng trợ giúp quyết định do khối OLAP đảm nhiệm. Phần mềm 
với các chức năng OLAP gắn với hệ quản trị SQL SERVER, và chức năng OLAP 
trong các bảng tính sẽ giúp người quản lý tin học hóa quá trình của họ. 
3.2.3. Hỏi dữ liệu nhờ chức năng của hệ quản trị cơ sở dữ liệu 
Hệ quản trị SQL SERVER cho phép đặt các câu hỏi về dữ liệu thông qua ngôn 
ngữ SQL. Tuy tiếp cận này hiệu quả, việc dùng câu hỏi SQL không thuận tiện cho 
người dùng không chuyên ICT. Một số câu hỏi đơn giản được thực hiện trong môi 
trường SQL SERVER, rồi xuất dữ liệu ra tệp, dưới dạng tệp của MS EXCEL, rồi 
được xử lý nhờ các chức năng OLAP của bảng tính. 
Hệ quản trị cơ sở dữ liệu có thể giải thích kết quả trả lời câu hỏi dữ liệu theo 
vết khai thác câu hỏi. 
18 
3.3. DỮ LIỆU TRỢ GIÚP QUYẾT ĐỊNH 
Dữ liệu được mô tả, tổ chức và lưu trữ dưới dạng các bảng quan hệ trong các 
cơ sở dữ liệu theo mô hình quan hệ. 
Tuy nhiên, chúng được thể hiện lại trong các bảng tính, phù hợp việc điều hành 
của cán bộ. Một số dữ liệu minh hoạ ở đây được thể hiện dưới dạng bảng tính MS 
EXCEL. 
3.4. THỬ NGHIỆM THỂ HIỆN DỮ LIỆU 
3.4.1. Thể hiện đồ hoạ 
3.4.2. Sử dụng bảng xoay của MS EXCEL 
3.5. KẾT LUẬN CHƯƠNG 
Dựa trên các kĩ thuật, phương pháp luận xử lý dữ liệu trực tuyến, nhằm tăng 
cường công tác quản lý nguồn nhân lực tại Học viện Công nghệ Bưu chính Viễn 
thông, đề tài luận văn đã tổ chức cơ sở dữ liệu về đào tạo và nghiên cứu khoa học, sử 
dụng hệ quản trị cơ sở dữ liệu SQL SERVER. 
19 
KẾT LUẬN 
Một số vấn đề đã giải quyết: 
Luận văn đã tìm hiểu các phương pháp khai phá dữ liệu, quá trình khai phá dữ 
liệu, giới thiệu về OLAP, một kỹ thuật sử dụng cách thể hiện dữ liệu đa chiều nhằm 
cung cấp khả năng truy xuất nhanh đến dữ liệu của kho dữ liệu. Định hình mô hình 
dữ liệu đa chiều. 
Luận văn đã đề cập chi tiết về công cụ OLAP, giới thiệu dịch vụ OLAP của 
Microsoft SQL Server, kiến trúc khối của OLAP và các dạng mô hình OLAP. Những 
kĩ thuật khai phá dữ liệu, phát hiện tri thức có ý nghĩa đối với công tác quản lý và 
người quản lý, trong việc ra các quyết định về đào tạo và nghiên cứu khoa học. Để 
tăng cường trợ giúp quyết định, chương này đã giới thiệu tổng quan về hệ trợ giúp 
quyết định DSS, giới thiệu các thành phần cơ bản của DSS, phân tích những đặc tính 
và những khả năng của DSS. 
Dựa trên các kĩ thuật, phương pháp luận xử lý dữ liệu trực tuyến, nhằm tăng 
cường công tác quản lý nguồn nhân lực tại Học viện, đề tài luận văn đã tổ chức cơ sở 
dữ liệu về đào tạo và nghiên cứu khoa học, sử dụng hệ quản trị cơ sở dữ liệu SQL 
SERVER. Tuy các dữ liệu đơn giản, đủ để thể hiện vai trò khai phá dữ liệu của kĩ 
thuật OLAP. 
Kiến nghị và hướng nghiên cứu tiếp theo 
Đề tài cần tiếp tục với hệ thống thực, trên mạng Intranet của Học viện. Một số 
cơ sở dữ liệu về đào tạo và nghiên cứu khoa học cần được thiết kế chuẩn hóa, đảm 
bảo tính đúng đắn của dữ liệu và kết quả xử lý. 

File đính kèm:

  • pdfLuận văn tóm tắt Áp dụng kỹ thuật phân tích dữ liệu trực tuyến (OLAP) phục vụ công tác quản lý điều hành.pdf
Tài liệu liên quan