Luận văn Tóm tắt Biểu diễn dữ liệu mờ bằng XML và ứng dụng

1. Lý do chọn đềtài

Theo hiểu biết của chúng tôi, hầu hết các nghiên cứu vềcơsởdữ

liệu mờchỉxây dựng trên mô hình lý thuyết hoặc được cài đặt trên

các mô hình quan hệ cổ điển mà chưa có một mô hình CSDL mờ

thực sự được cài đặt trên máy tính. Do đó ít nhiều hạn chếviệc ứng

dụng các kết quả lý thuyết thu được. Vì vậy trong luận văn này,

chúng tôi đềxuất một cách biểu diễn cơsởdữliệu mờbằng XML,

mô hình cơ sở dữ liệu mờ được biểu diễn là mô hình dựa trên lý

thuyết về đại sốgia tử.

2. Mục tiêu của đềtài

Mục đích nghiên cứu của đềtài là ứng dụng lý thuyết vềmô hình

cơsởdữliệu mờ, sửdụng ngôn ngữXML đểbiểu diễn nhiều dạng

dữliệu mờkhác nhau, cho phép mờhóa cơsởdữliệu sẵn có nhằm

thu thập, lưu trữvà thực hiện các truy vấn trên cơsởdữliệu mờ ứng

dụng trong việc khai phá dữliệu nhằm đưa ra các dựbáo trong tương

lai.

3. Đối tượng nghiên cứu

Đối tượng mà đềtài nghiên cứu bao gồm việc tìm hiểu một số

vấn đềnảy sinh trong quá trình quản lý thông tin nhân sự, nghiên cứu

về đại sốgia tửvà mô hình cơsởdữliệu mờdựa trên lý thuyết về đại

sốgia tử.

pdf13 trang | Chuyên mục: XML | Chia sẻ: dkS00TYs | Lượt xem: 2396 | Lượt tải: 1download
Tóm tắt nội dung Luận văn Tóm tắt Biểu diễn dữ liệu mờ bằng XML và ứng dụng, để xem tài liệu hoàn chỉnh bạn click vào nút "TẢI VỀ" ở trên
 xác ñịnh gia tử dương hay gia tử âm. Nếu Type=”H+” là gia 
tử dương, nếu Type=”H-” là gia tử âm. Trong phạm vi của thẻ 
 thì thứ tự của các gia tử ñược sắp xếp tăng dần theo quan 
hệ cảm sinh ngữ nghĩa. 
2.3.2.6. Thẻ Dist 
Được dùng ñể xác ñịnh phạm vi của giá trị ngôn ngữ mờ 
15 
 {Phần khai báo giá trị ngôn ngữ mờ} 
Trong ñó n ñược dùng ñể xác ñịnh các kiểu dữ liệu thuộc 1 trong 5 
kiểu dữ liệu mờ ñược nêu trong bài toán. 
2.3.2.7. Thẻ Interval 
Được dùng ñể xác ñịnh tập các giá trị khoảng của biến ngôn ngữ: 
 ……. 
Trong ñó (xi , yi ) là giá trị khoảng của biến ngôn ngữ. 
2.3.3. Truy vấn trên dữ liệu mờ 
2.3.3.1. Biểu diễn truy vấn 
Để thực hiện các truy vấn mờ trên cơ sở dữ liệu mờ biểu diễn 
bằng XML thì trước tiên ta phải chuyển các truy vấn mờ về truy vấn 
rõ sau ñó sử dụng phương pháp ñối sánh mờ mức k ñược trình bày 
trong mục 1.2.3.2 ñể thực hiện truy vấn. Cấu trúc của lệnh truy vấn 
mờ dựa trên cơ sở các câu lệnh SQL nhưng ở ñây chúng tôi quy ñịnh 
một số thẻ trong XML ñể mô tả câu lệnh truy vấn mờ. 
Tương tự như trong CSDL quan hệ, dạng tổng quát của câu lệnh 
truy vấn SQL sử dụng truy vấn trong CSDL mờ ñược biểu diễn như 
sau: 
16 
SELECT [DISTINCT] 
FROM 
[WHERE ] 
Khi ñó câu lệnh SQL sẽ ñược biểu diễn thông qua các thẻ của 
XML. 
a) Thẻ select 
Được dùng ñể liệt kê các trường ñược chọn ñể thực hiện truy 
vấn. Tên các trường ñược liệt kê qua thẻ Field. 
 Truong_1 
 … 
 Truong_n 
b) Thẻ From 
Được dùng ñể chỉ các bảng ñược chọn. Tên các bảng ñược liệt kê 
thông qua thẻ Table. 
 Bang_1 
 …. 
 Bang_n 
c) Thẻ Expression 
Được dùng ñể biểu diễn một biểu thức ñiều kiện. 
17 
- Biểu thức điều kiện mờ 
 Tên-Trường 
 <Math val=”Phép-toán-so-
sánh”> 
 giá-trị-ñối-
sánh 
- Biểu thức điều kiện rõ 
 Tên-Trường 
 <Math val=”Phép-toán-so-
sánh”> 
 giá-trị-ñối-sánh 
d) Thẻ Where 
Được dùng ñể liệt kê các biểu thức ñiều kiện. Các biểu thức ñiều 
kiện ñược kết hợp với nhau thông quả thẻ Math. Thẻ Math ñược 
dùng ñể liệt kê phép toán kết hợp giữa các biểu thức ñiều kiện và nó 
chỉ nhận 2 giá trị hoặc là “And” hoặc là “Or”. 
 … 
 {And, Or} 
 … 
 ….. 
18 
2.3.3.2. Đánh giá truy vấn 
a) Thuật toán xác ñịnh giá trị chân lý của ñiều kiện mờ 
Thuật toán 2.2. Xác ñịnh giá trị chân lý của ña ñiều kiện mờ với 
phép toán θ 
Vào: cho r là một quan hệ xác ñịnh trên vũ trụ các thuộc tính U={ 
A1, A2, …,An}. 
Điều kiện jjii fvalueAfvalueA 1θξθ 
Ra: Với mọi rt∈ thỏa mãn ñiều kiện 
( ( )jjii fvalueAtfvalueAt 1][][ θξθ 
Phương pháp 
(1) Begin 
(2) for each do 
(3) Begin 
(4) If then 
(5) If then 
(6) End 
// Xây dựng các và dựa vào ñộ dài 
các từ. 
(7) K = 1 
(8) While do 
(9) Begin 
(10) ; ; 
(11) For each do 
(12) begin 
19 
(13) If then 
(14) If then 
(15) End 
(16) K = k +1 
(17) End 
(18) For each do 
(19) Begin 
// Trường hợp ξ là phép toán and 
(20) If (( )1)][ =ii fvalueAt θ and 
(( )1)][ 1 =jj fvalueAt θ then
 1)][()][(( 1 =jjii fvalueAtandfvalueAt θθ 
// Trường hợp ξ là phép toán or 
(21) If (( )1)][ =ii fvalueAt θ or 
(( )1)][ 1 =jj fvalueAt θ then 
 1)][()][(( 1 =jjii fvalueAtorfvalueAt θθ 
(22) End 
(23) End. 
b) Phương pháp truy vấn dữ liệu mờ 
Câu lệnh SQL trong CSDL mờ có thể ñược tổng quát hóa sau: 
(1) : Xác ñịnh giá trị chân lý của các ñiều kiện mờ (Sử dụng 
thuật toán 2.1, 2.2, 2.3, 2.4) và liên kết các giá trị chân lý vừa xác 
ñịnh. 
(2) : Chọn các bộ dữ liệu thỏa mãn bước (1). 
20 
 Do ñó, vấn ñề quan trọng của câu lệnh SQL trong CSDL mờ 
chính là xác ñịnh giá trị chân lý của ñiều kiện mờ và liên kết các giá 
trị chân lý ñó. 
2.4. TỔNG KẾT CHƯƠNG 
Trong chương này, luận văn ñã tập trung nghiên cứu các vấn ñề 
nảy sinh trong hệ thống “quản lý thông tin nhân sự”. Qua ñó luận văn 
ñã ñề xuất hướng giải quyết và ñưa ra các mô hình cơ sở dữ liệu mờ 
dựa trên lý thuyết về ñại số gia tử ñã ñược phân tích ñể giải quyết các 
yêu cầu của hệ thống, ñồng thời trình bày phương pháp sử dụng ngôn 
ngữ XML ñể biểu diễn mô hình cơ sở dữ liệu mờ ñó. Từ ñó, luận văn 
ñã ñưa ra cách truy vấn mờ trên cơ sở dữ liệu mờ trên. 
21 
Chương 3. XÂY DỰNG ỨNG DỤNG 
3.1. CÔNG CỤ LỰA CHỌN 
Để hoàn thành ứng dụng này thì chương trình demo ñược viết 
trên ngôn ngữ lập trình C# trong bộ Visual Studio 2005 và ngôn ngữ 
XML, chương trình chạy trên hệ ñiều hành Windows XP, Vista, 
Windows 7. 
3.2. PHÁT TRIỂN CÁC MODUL 
3.3.1. Modul biểu diễn dữ liệu mờ 
Ở ñây, luận văn sử dụng lớp FuzzyField ñể lưu trữ các thuộc tính 
trong cơ sở dữ liệu mờ theo lý thuyết về ñại số gia tử, trên mỗi thuộc 
tính mờ sẽ có các ñặc trưng như phạm vi tham chiếu, tập các phần tử 
sinh, tập các gia tử,... 
Trong ñó miền giá trị tham chiếu ñược xác ñịnh bởi thuộc tính 
min, max; tập các phần tử sinh ñược xác ñịnh qua thuộc tính CE; tập 
các gia tử ñược xác ñịnh bằng thuộc tính HE. 
Những thuộc tính này sẽ ràng buộc trên kiểu dữ liệu ñược ñưa 
vào cơ sở dữ liệu mờ, trong ñó các thông tin ñược ñưa vào phải thuộc 
1 trong 5 kiểu dữ liệu ñược ñề xuất trong mục 2.2.1.1 và ñược biểu 
diễn thông qua lớp SQLField. Trong ñó kiểu dữ liệu ñược quy ñịnh 
bởi thuộc tính dataType, dữ liệu ñược lưu trữ bởi thuộc tính value và 
ñược chuyển thành các khoảng interval nếu là trường thuộc tính mờ. 
Để mờ hóa dữ liệu nguồn theo lý thuyết ñại số gia tử, ta sử dụng 
phương thức ExtendData trong lớp DataTable. Với ñầu vào là danh 
sách các trường ñược lựa chọn từ cơ sở dữ liệu nguồn, tương ứng với 
mỗi kiểu dữ liệu ñược ñề xuất trong luận văn, phương thức này sẽ 
chuyển thành dữ liệu khoảng dựa trên lý thuyết về ñại số gia tử. 
22 
Cơ sở dữ liệu sau khi ñược mờ hóa sẽ ñược lưu trữ trong một file 
xml. 
Tuy nhiên, ñể có thể xử lý ñược dữ liệu mờ lưu trữ trong file xml 
thì việc ñọc cơ sở dữ liệu mờ từ file xml cũng rất quan trọng. Chức 
năng này ñược thực hiện thông qua lớp ReadXML. Lớp ReadXML 
cho phép ñọc danh sách các trường cùng với những thông tin của 
chúng và ñưa vào ñối tượng MyField (ñối tượng quản lý danh sách 
trường thuộc tính) dữ liệu trên mỗi trường sẽ ñược ñọc và ñưa vào 
ñối tượng DataTable. 
3.3.2. Modul biểu diễn truy vấn mờ 
Để thực hiện các truy vấn trên cơ sở dữ liệu mờ thì câu truy vấn 
ở dạng SQL phải ñược chuyển ñổi thành file xml hoặc chuỗi theo cấu 
trúc của file xml. Công việc này sẽ ñược thực hiện thông qua phương 
thức ReadSQLXML trong lớp SQL. 
Phương thức này cho phép chuyển ñổi một câu lệnh SQL thành 
một file truy vấn biểu diễn bằng XML ñể có thể thực hiện truy vấn dễ 
dàng trên cơ sở dữ liệu mờ. 
Truy vấn mờ qua phương thức ExcuteQuery trong lớp SQL kết 
quả truy vấn sẽ ñược lưu trữ trong ñối tượng DataTable mà phương 
thức trả về. 
3.4. GIAO DIỆN CHƯƠNG TRÌNH 
Dựa trên những phân tích và thiết kế về cơ sở dữ liệu mờ theo lý 
thuyết về ñại số gia tử, chúng tôi ñã xây dựng hệ thống “quản lý 
thông tin nhân sự” trong ñó có thêm các chức năng ứng dụng logic 
mờ dựa trên lý thuyết về ñại số gia tử. 
23 
3.5. THỬ NGHIỆM VÀ ĐÁNH GIÁ 
Dựa trên 5 dạng dữ liệu mờ cơ bản chương trình ñã thực hiện 
việc mờ hóa cơ sở dữ liệu nguồn, cho phép biểu diễn nhiều dạng dữ 
liệu mờ khác nhau khi cập nhật. Việc lưu trữ, truy vấn thực hiện 
nhanh chóng và cho kết quả ñúng. 
Với kết quả này chúng ta có thể sử dụng cho việc mờ hóa dữ liệu 
ñã có, lưu trữ dữ liệu mờ trong nhiều hệ thống ứng dụng khác: Hệ 
thống khai phá dữ liệu tri thức bằng các luật kết hợp mờ, Hệ thống 
hỗ trợ quyết ñịnh, … 
3.6. TỔNG KẾT CHƯƠNG 
Nhằm áp dụng cơ sở dữ liệu mờ ñã nghiên cứu vào giải quyết bài 
toán “quản lý thông tin nhân sự”. Trong chương ba ñã ứng dụng các 
kết quả của chương hai ñể bổ sung thêm chức năng ứng dụng logic 
mờ trong hệ thống “quản lý thông tin nhân sự” dựa trên lý thuyết về 
ñại số gia tử. Chức năng này cho phép thực hiện mờ hóa cơ sở dữ 
liệu ñã có, thu thập, lưu trữ cơ sở dữ liệu mờ ñể làm dữ liệu nguồn 
cho các hệ thống khai phá dữ liệu ñể ñưa ra các dự báo trong tương 
lai và ñưa ra các truy vấn mờ trên cơ sở dữ liệu ñã ñược mờ hóa. 
Ngoài ra, trong chương ba cũng ñưa ra kết quả thử nghiệm và ñánh 
giá hệ thống này. 
24 
KẾT LUẬN VÀ KIẾN NGHỊ 
Với mục ñích tìm ra một phương pháp biểu diễn cơ sở dữ liệu 
mờ cho phép mờ hóa cơ sở dữ liệu sẵn có ñể thu thập, lưu trữ và xử 
lý ñược những thông tin mờ trên máy tính làm nguồn dữ liệu ứng 
dụng trong các hệ thống khai phá dữ liệu ñể ñưa ra các dự báo có tính 
chiến lược trong tương lai. Với cách tiếp cận dựa trên những lý 
thuyết ñã có về cơ sở dữ liệu mờ về ngôn ngữ biểu diễn dữ liệu. Luận 
văn ñã ñề xuất một phương pháp mới ñể biểu diễn cơ sở dữ liệu mờ 
có nhiều kiểu dữ liệu khác nhau dựa trên cấu trúc ñịnh lượng của 
ĐSGT bằng ngôn ngữ XML. Mỗi cơ sở dữ liệu mờ ñược biểu diễn 
theo một cấu trúc chung bao gồm: phần khai báo, các thuộc tính và 
phần nội dung bằng các thẻ XML. 
Những nội dung chính mà luận văn ñã tập trung nghiên cứu và 
giải quyết: lý thuyết về ĐSGT, mô hình cơ sở mờ dữ liệu dựa trên lý 
thuyết về ĐSGT, ngôn ngữ XML. Dựa trên cơ sở lý thuyết ñó, luận 
văn ñã vận dụng logic mờ trong hệ thống “quản lý thông tin nhân sự” 
ñể giải quyết vấn ñề về việc sử dụng cơ sở dữ liệu mờ ñể khai phá dữ 
liệu, ñưa ra các dự báo trong tương lai. 
Trong quá trình xây dựng hệ thống vẫn còn tồn tại một số vấn ñề 
cần phải ñược phát triển: Xây dựng thuật toán xấp xỉ dữ liệu ñể biểu 
diễn ñược dữ liệu NULL, bổ sung một số thuật toán trong việc tìm 
kiếm các thẻ của XML nhanh hơn như: sử dụng Xpath và Xquery 
trong tìm kiếm và ñối sánh dữ liệu, xây dựng một số modul cho 
phép thu thập nhiều dạng dữ liệu mờ, cải tiến phương pháp ñối sánh 
mờ, vận dụng lý thuyết về ñại số gia tử không thuần nhất trong các 
ứng dụng logic mờ,… 
25 
Với phương pháp này, bước ñầu chúng tôi ñã cài ñặt thành công 
mô hình cơ sở dữ liệu mờ dựa trên lý thuyết về ñại số gia tử, cho 
phép mờ hóa cơ sở dữ liệu ñã có, thu thập thông tin, cập nhật thông 
tin và thực hiện một số tính toán, cũng như truy vấn mờ trên cơ sở dữ 
liệu ñó. 

File đính kèm:

  • pdfLuận văn tóm tắt Biểu diễn dữ liệu mờ bằng XML và ứng dụng.pdf
Tài liệu liên quan