Luận văn Tóm tắt Áp dụng kỹ thuật phân tích dữ liệu trực tuyến (OLAP) phục vụ công tác quản lý điều hành
Xây dựng một hệ trợ giúp quyết định dựa vào dữ liệu, sử dụng phương pháp
luận xử lý phân tích trực tuyến (OLAP). Trong đó tập trung vào hai công việc chính
là tập hợp dữ liệu để tổ chức dữ liệu đa chiều, phân tích và hiển thị dữ liệu để trợ giúp
ra quyết định.
Luận văn gồm 3 chương:
Chương 1: Tổng quan các phương pháp khai thác dữ liệu
Chương 2: Hệ thống trợ giúp quyết định sử dụng phân tích đa chiều trong xử lý
phân tích trực tuyến
Chương 3: Xây dựng hệ thống trợ giúp quản lý với chức năng OLAP
hiệu quả của quá trình ra quyết định; 13 9. Người ra quyết định điều khiển toàn bộ các bước của quá trình ra quyết định trong việc giải quyết các bài toán; 10. DSS thường sử dụng các mô hình cho sự phân tích các tình huống ra quyết định; 11. DSS ở mức cao được trang bị thành phần tri thức; 2.2.5. Các thành phần của DSS DSS được tạo thành từ 4 hệ thống con sau: 1. Quản trị dữ liệu. 2. Quản trị mô hình. 3. Truyền thông. 4. Quản trị tri thức. Mô hình khái niệm của DSS được cho trong hình dưới đây cung cấp khả năng những hiểu biết cơ bản về cấu trúc chung và các thành phần của DSS. 2.2.6. Hệ con quản trị dữ liệu Hệ con quản trị dữ liệu bao gồm những thành phần sau: 1. Cơ sở dữ liệu về DSS 2. Hệ quản trị cơ sở dữ liệu. 3. Phương tiện hỏi đáp. 4. Danh mục dữ liệu. 2.2.7. Hệ con quản trị mô hình Hệ con quản trị mô hình trong DSS bao gồm các thành phần sau: 1. Cơ sở mô hình. 2. Hệ quản trị cơ sở mô hình. 3. Ngôn ngữ dùng trong mô hình. 4. Danh mục mô hình. 5. Thực hiện, tích hợp và điều khiển mô hình. Các phần tử này và giao diện với những thành phần khác của DSS được cho ở hình vẽ. 2.2.8. Hệ thống tri thức 14 Nhiều bài toán phi cấu trúc và bán cấu trúc rất phức tạp, chúng yêu cầu những tri thức tinh thông, những tri thức này cần thiết được bổ sung vào cho những khả năng bình thường của DSS, những tri thức nâng cao được trang bị một thành phần được gọi là quản trị tri thức. 2.2.9. Hệ thống giao diện người dùng Thành phần hội thoại của DSS là phần mềm và phần cứng cung cấp giao diện người dùng DSS. 2.2.10. Người dùng trong hệ thống DSS DSS có hai lớp người dùng: Các nhà quản lý và các nhà chuyên môn. 2.2.11. Sự phân lớp DSS và sự trợ giúp của chúng Có nhiều cách phân loại DSS, sau đây là một số cách điển hình: Kiểu của trợ giúp hướng dữ liệu so sánh với kiểu hướng mô hình. Độ phi thủ tục. Sự trợ giúp được cung cấp theo cách của DSS: DSS có thể cung cấp nhiều kiểu cuả trợ giúp. 2.2.12. Các công nghệ về DSS Sprague và Carlson đã xác định 3 mức công nghệ của DSS là (i) DSS cụ thể; (ii) các bộ tạo sinh DSS; và (iii) các công cụ DSS. 2.3. KẾT LUẬN CHƯƠNG Chương 2 đề cập chi tiết về công cụ OLAP, giới thiệu dịch vụ OLAP của Microsoft SQL Server, kiến trúc khối của OLAP và các dạng mô hình OLAP. Những kĩ thuật khai phá dữ liệu, phát hiện tri thức có ý nghĩa đối với công tác quản lý và người quản lý, trong việc ra các quyết định về đào tạo và nghiên cứu khoa học. 15 Chương 3 XÂY DỰNG HỆ THỐNG TRỢ GIÚP QUẢN LÝ VỚI CHỨC NĂNG OLAP 3.1. MỤC TIÊU CỦA HỆ THỐNG 3.1.1. Giới thiệu về đơn vị Học viện Công nghệ Bưu chính Viễn thông là đơn vị Trực thuộc Tập đoàn Bưu chính Viễn thông Việt Nam, dẫn đầu trong gắn kết Nghiên cứu - Đào tạo - Sản xuất Kinh doanh trong lĩnh vực Công nghệ thông tin và Truyền thông. 3.1.1.1. Nguồn nhân lực Là đơn vị Nghiên cứu, Đào tạo đầu Ngành Bưu chính Viễn thông, Học viện xác định nguồn nhân lực chính là tài sản quý giá nhất, là tài sản cần được đầu tư một cách bài bản, chuyên nghiệp và có định hướng lâu dài . Với đội ngũ cán bộ trên 800 người, Học viện là một trong các đơn vị có mật độ tri thức cao nhất trong Ngành. 3.1.1.2. Công tác đào tạo Học viện là đơn vị đào tạo đa ngành, đa nghề với nhiều loại hình đào tạo (Chính qui, Tại chức, Từ xa, Liên thông, Văn bằng 2..) và hệ đào tạo (Cao đẳng, Đại học, Cao học, Nghiên cứu sinh) khác nhau 3.1.2. Đặt vấn đề 3.1.2.1. Về kho dữ liệu Kho dữ liệu là kho lưu trữ dữ liệu lưu trữ bằng thiết bị điện tử của một tổ chức. Các kho dữ liệu được thiết kế để hỗ trợ việc phân tích dữ liệu và lập báo cáo Trong quá trình hoạt động kinh doanh, các dữ liệu của doanh nghiệp phát sinh ngày càng nhiều. Người ta muốn tận dụng nguồn dữ liệu này để sử dụng cho những mục đích hỗ trợ cho công việc kinh doanh ví dụ như cho mục đích thống kê hay phân tích. Quá trình tập hợp và thao tác trên các dữ liệu này có những đặc điểm sau: 1. Dữ liệu tích hợp. 2. Theo chủ đề. 3. Biến thời gian. 4. Dữ liệu cố định. 3.1.2.2. Cấu trúc dữ liệu cho kho dữ liệu Vì dữ liệu trong kho dữ liệu rất lớn và không có những thao tác như sửa đổi hay tạo mới nên nó được tối ưu cho việc phân tích và báo cáo. Các thao tác với dữ 16 liệu của kho dữ liệu dựa trên cơ sở là Mô hình dữ liệu đa chiều, được mô hình vào đối tượng gọi là khối dữ liệu. 3.1.2.3. Ngôn ngữ cho kho dữ liệu Ngôn ngữ xử lý phân tích trực tuyến OLAP, rất phù hợp với kho dữ liệu, ngôn ngữ này tương tự với ngôn ngữ truy vấn SQL và tập trung vào các câu lệnh sau: 1. Thu nhỏ: ví dụ nhóm dữ liệu theo năm thay vì theo quý. 2. Mở rộng: ví dụ mở rộng dữ liệu, nhìn theo tháng thay vì theo quý. 3. Cắt lát : nhìn theo từng lớp một. Ví dụ: từ danh mục bán hàng của Q1, Q2, Q3, Q4 chỉ xem của Q1. 4. Thu nhỏ: bỏ bớt một phần của dữ liệu (tương ứng thêm điều kiện vào câu lệnh WHERE trong SQL). 3.1.2.4. Cấu trúc của một hệ thống kho dữ liệu Người ta thiết kế kho dữ liệu có ba tầng: 1. Tầng đáy; 2. Tầng giữa; 3. Tầng trên cùng; 3.1.2.5. Nhiệm vụ khai phá dữ liệu của luận văn Trong khuôn khổ luận văn này, tôi sử dụng kĩ thuật OLAP để khai phá dữ liệu, trong kho dữ liệu nhiều chiều. Các dữ liệu về (i) công tác quản lý sinh viên; (ii) kết quả học tập của sinh viên và học viên; (iii) công trình nghiên cứu khoa học của thày cô giáo trong Học viện Công nghệ Bưu chính Viễn thông… Dựa trên dữ liệu cơ bản đó, để thực hiện công tác trợ giúp quyết định, phục vụ quản lý, điều hành công tác đào tạo và nghiên cứu khoa học trong Học viện Công nghệ Bưu chính Viễn thông, luận văn sẽ: 1. Tổ chức dữ liệu, dưới dạng kho dữ liệu; 2. Thể hiện dữ liệu dưới dạng đồ hoạ, phục vụ quyết định trực quan; 3. Sử dụng kĩ thuật OLAP, thể hiện dữ liệu dưới các dạng bảng xoay khác nhau, tiện cho việc xử lí dữ liệu và ra quyết định. 3.2. YÊU CẦU VỀ HỆ THỐNG, THIẾT KẾ HỆ THỐNG 3.2.1. Cơ sở dữ liệu về đào tạo và nghiên cứu khoa học 17 Hiện tại, Học viện chưa quản lý tác nghiệp rộng trên cơ sở dữ liệu trực tuyến. Dữ liệu thường được tổ chức trong các cơ sở dữ liệu đơn lẻ. Nhiệm vụ của đề tài luận văn là thiết kế cơ sở dữ liệu tích hợp, cho phép lưu mọi thông tin về đào tạo và nghiên cứu khoa học của cán bộ, học viên và sinh viên của Học viện. Hệ quản trị cơ sở dữ liệu là SQL SERVER. Giao diện là tương tác người dùng theo đồ họa, gắn với môi trường Windows. Hình. Hệ quản trị cơ sở dữ liệu sử dụng trong đề tài luận văn Nhiều bảng dữ liệu, liên quan đến đào tạo và nghiên cứu khoa học được mô tả trong cơ sở dữ liệu “quản lý nguồn nhân lực”. 3.2.2. Hạ tầng kĩ thuật Đề tài thực hiện trên máy đơn. Mô hình tương lai yêu cầu cơ sở dữ liệu đặt trên máy chủ cơ sở dữ liệu của Học viện. Các quyết định liên quan đến quản lý nguồn nhân lực sẽ thực hiện trên mạng Intranet, cho phép các người quản lý điều khiển tác nghiệp. Các chức năng tìm kiếm, trích rút dữ liệu và xử lý dữ liệu, theo hệ thống cơ sở dữ liệu truyền thống được hệ quản trị cơ sở dữ liệu SQL SERVER đảm nhiệm. Một số chức năng trợ giúp quyết định do khối OLAP đảm nhiệm. Phần mềm với các chức năng OLAP gắn với hệ quản trị SQL SERVER, và chức năng OLAP trong các bảng tính sẽ giúp người quản lý tin học hóa quá trình của họ. 3.2.3. Hỏi dữ liệu nhờ chức năng của hệ quản trị cơ sở dữ liệu Hệ quản trị SQL SERVER cho phép đặt các câu hỏi về dữ liệu thông qua ngôn ngữ SQL. Tuy tiếp cận này hiệu quả, việc dùng câu hỏi SQL không thuận tiện cho người dùng không chuyên ICT. Một số câu hỏi đơn giản được thực hiện trong môi trường SQL SERVER, rồi xuất dữ liệu ra tệp, dưới dạng tệp của MS EXCEL, rồi được xử lý nhờ các chức năng OLAP của bảng tính. Hệ quản trị cơ sở dữ liệu có thể giải thích kết quả trả lời câu hỏi dữ liệu theo vết khai thác câu hỏi. 18 3.3. DỮ LIỆU TRỢ GIÚP QUYẾT ĐỊNH Dữ liệu được mô tả, tổ chức và lưu trữ dưới dạng các bảng quan hệ trong các cơ sở dữ liệu theo mô hình quan hệ. Tuy nhiên, chúng được thể hiện lại trong các bảng tính, phù hợp việc điều hành của cán bộ. Một số dữ liệu minh hoạ ở đây được thể hiện dưới dạng bảng tính MS EXCEL. 3.4. THỬ NGHIỆM THỂ HIỆN DỮ LIỆU 3.4.1. Thể hiện đồ hoạ 3.4.2. Sử dụng bảng xoay của MS EXCEL 3.5. KẾT LUẬN CHƯƠNG Dựa trên các kĩ thuật, phương pháp luận xử lý dữ liệu trực tuyến, nhằm tăng cường công tác quản lý nguồn nhân lực tại Học viện Công nghệ Bưu chính Viễn thông, đề tài luận văn đã tổ chức cơ sở dữ liệu về đào tạo và nghiên cứu khoa học, sử dụng hệ quản trị cơ sở dữ liệu SQL SERVER. 19 KẾT LUẬN Một số vấn đề đã giải quyết: Luận văn đã tìm hiểu các phương pháp khai phá dữ liệu, quá trình khai phá dữ liệu, giới thiệu về OLAP, một kỹ thuật sử dụng cách thể hiện dữ liệu đa chiều nhằm cung cấp khả năng truy xuất nhanh đến dữ liệu của kho dữ liệu. Định hình mô hình dữ liệu đa chiều. Luận văn đã đề cập chi tiết về công cụ OLAP, giới thiệu dịch vụ OLAP của Microsoft SQL Server, kiến trúc khối của OLAP và các dạng mô hình OLAP. Những kĩ thuật khai phá dữ liệu, phát hiện tri thức có ý nghĩa đối với công tác quản lý và người quản lý, trong việc ra các quyết định về đào tạo và nghiên cứu khoa học. Để tăng cường trợ giúp quyết định, chương này đã giới thiệu tổng quan về hệ trợ giúp quyết định DSS, giới thiệu các thành phần cơ bản của DSS, phân tích những đặc tính và những khả năng của DSS. Dựa trên các kĩ thuật, phương pháp luận xử lý dữ liệu trực tuyến, nhằm tăng cường công tác quản lý nguồn nhân lực tại Học viện, đề tài luận văn đã tổ chức cơ sở dữ liệu về đào tạo và nghiên cứu khoa học, sử dụng hệ quản trị cơ sở dữ liệu SQL SERVER. Tuy các dữ liệu đơn giản, đủ để thể hiện vai trò khai phá dữ liệu của kĩ thuật OLAP. Kiến nghị và hướng nghiên cứu tiếp theo Đề tài cần tiếp tục với hệ thống thực, trên mạng Intranet của Học viện. Một số cơ sở dữ liệu về đào tạo và nghiên cứu khoa học cần được thiết kế chuẩn hóa, đảm bảo tính đúng đắn của dữ liệu và kết quả xử lý.
File đính kèm:
- Luận văn tóm tắt Áp dụng kỹ thuật phân tích dữ liệu trực tuyến (OLAP) phục vụ công tác quản lý điều hành.pdf