Bài giảng Hệ chuyên gia - Phan Huy Khánh - Chương 1: Mở đầu về hệ chuyên gia

Hệchuyên gia làlĩnh vực ứng dụng của trí tuệnhân tạo

aCónhiều cách đ ch định nghĩa HCG :

VE. Feigenbaum : «Hệchuyên gia (Expert System) làmột

chương tr chương trình máy tính thông minh sửdụng tri thức

(knowledge) vàcác thủtục suy luận (inference procedures)

đểgiải những bài toán tương đ n tương đối khókhăn đòi h khăn đòi hỏi những

chuyên gia mới giải đư i được»

VHệchuyên gia làmột hệthống tin học cóthểmô phỏng

(emulates) năng l năng lực quyết đo t đoán (decision) vàhành đ nh động

(making abilily) của một chuyên gia (con ngư con người)

VMột hệchuyên gia sửdụng tri thức của một lĩnh vực cụthể

đểcung cấp việc giải quyết vấn đ n đềvới “chất lư t lượng chuyên

gia”trong lĩnh vực đ c đó

pdf57 trang | Chuyên mục: Trí Tuệ Nhân Tạo | Chia sẻ: dkS00TYs | Lượt xem: 2289 | Lượt tải: 5download
Tóm tắt nội dung Bài giảng Hệ chuyên gia - Phan Huy Khánh - Chương 1: Mở đầu về hệ chuyên gia, để xem tài liệu hoàn chỉnh bạn click vào nút "TẢI VỀ" ở trên
arts
Knowledge Base
 (rules)
Inference Engine
Working Memory
 (facts)
U
s
e
r
I
n
t
e
r
f
a
c
e
Knowledge 
Acquisition 
Facility
Explanation 
Facility
Agenda
35/57
User
User
interface
Instructions &
information
Solutions &
explanations Knowledge
Inference
engine
Problem
Domain
Expert and knowledge 
engineer
Expert
system An Expert 
System Model
Know-
ledge
base
Development
engine
36/57
Một số
mô hình khác
Inference 
Engine 
I
i
World 
Model
l
l
Knowledge 
Base
l
User
Knowledge 
Base editor
l
i
Preceptors
Explanation 
Subsystem
l i
37/57
Mô hình J. L. Ermine
Giao 
diện
Hệ
thống
 thu nhận
 tri thức
Cơ sở
tri thức 
Bộ
nhớ
 làm việc
Người sử
dụng 
yêu cầu
Dữ
liệu vấn đề
 cần giải quyết
Tri thức mới
38/57
Mô hình C. Ernest
Cơ sở
 tri thức
Máy
 suy diễn
Tri thức
Cấu trúc
 máy suy diễn
Chuyên 
gia
Dữ
liệu
Người 
sử
 dụng •Lời giải
•Giải thích
•Theo dõi
i i t í
 i
39/57
Mô hình E. V. Popov
Giao diện
 người
 sử
dụng
i i
 i
Chuyên 
gia
i
Người
 sử
dụng
i
Khả năng
 giải thích
 i i t í
Diễn dịchi ị
Sở
hữu
 tri thức
 t i t
Cơ sở
 tri thức
 t i t
Bộ
nhớ
 làm việc
 l i
40/57
Tri thức và Cơ sở
tri thức
a Tri thức trong HCG :
V Phản ánh sự tinh thông được tích tụ từ sách vở, tạp chí,
từ các chuyên gia hay các nhà bác học
a Cơ sở tri thức gồm :
V Các phần tử (hay đơn vị) tri thức được tổ chức như một CSDL
V Tuỳ theo phương pháp phát triển HCG mà các phần tử có đặc 
trưng, tính chất khác nhau
V Chẳng hạn trong các HCG dựa theo luật (Rules-Based ES) :
™ Mỗi phần tử tri thức là một luật
™ Cơ sở tri thức như vậy còn được gọi là bộ nhớ sản xuất 
(Production Memeory)
41/57
Phân loại tri thức
a Người ta thường phân loại tri thức theo nhiều cách
a Theo phân loại chức năng, có hai loại tri thức :
V Tri thức phán đoán (Assertion Knowledge) :
mô tả các tình huống đã được thiết lập hoặc sẽ được thiết lập
V Tri thức thực hành (Operating Knowledge)
thể hiện những hậu quả rút ra hay những thao tác cần phải hoàn 
thiện khi một tình huống đã được thiết lập hoặc sẽ được thiết lập 
trong lĩnh vực đang xét
a Tri thức thực hành :
V Thường được thể hiện bởi các biểu thức Toán học+Lôgic
dễ hiểu, dễ triển khai 
V NSD có thể thao tác với tri thức như khai thác một CSDL
42/57
Phân loại tri thức theo biểu hiện
aTheo phân loại theo biểu hiện, cũng có hai loại :
aTri thức hiện, rõ (explicit knowledge)
V Diễn đạt bằng ngôn ngữ hình thức, dễ trao đổi giữa các cá nhân
V Có thể biểu diễn bằng các công thức khoa học, các thủ tục tường 
minh, hoặc nhiều cách khác
V Bao gồm thông tin, dữ liệu, sách báo, văn bản, tài liệu đã được hệ
thống bằng nhiều phương tiện
aTri thức ngầm, ẩn (tacit knowledge) 
V Có được và ẩn chứa trong kinh nghiệm của từng cá nhân, mang tính 
chủ quan, bao gồm những hiểu biết riêng thấu đáo, trực giác, linh 
cảm, kỹ năng, …
V Khó trao đổi hoặc chia sẻ với người khác
V Chỉ có thể học được từ người khác nhờ quan hệ gần gũi trong một 
khoảng thời gian nào đó
43/57
Knowledge-base may really include many things
Knowledge
Base
Heuristicsri ti
Factst
Hypothesis t i 
Rulesl
Processesr
Eventst
Definitionsfi iti
Relationshipsl ti i
Attributesttri t
Objectsj t
44/57
Khái niệm về
Quản trị
tri thức
a Người ta thường nói : 
V Tri thức là sức mạnh
V Tri thức là của cải 
a Các tổ chức của LHQ rút ra kết luận rằng :
V Kinh tế thế giới phát triển mạnh mẽ do biết dựa vào tri thức
a Làm thế nào để sáng tạo và sử dụng đúng đắn các tri thức
a Quản trị tri thức (Knowledge Management) 
45/57
ES Elements: Máy duy diễn
a Máy duy diễn (inference engine) :
V Công cụ (chương trình, hay bộ xử lý) tạo ra sự suy luận bằng 
cách quyết định xem những luật nào sẽ làm thỏa mãn các sự
kiện, các đối tượng
V Chọn ưu tiên các luật thỏa mãn
V Thực hiện các luật có tính ưu tiên cao nhất
46/57
ES Elements : Giao diện người sử
dụng
a Giao diện người sử dụng (user interface) :
V Là nơi người sử dụng và hệ chuyên gia trao đổi với nhau
47/57
ES Elements : Các thành phần khác
a Lịch công việc (agenda) :
V Danh sách các luật ưu tiên do máy suy diễn tạo ra thoả mãn 
các sự kiện, các đối tượng có mặt trong bộ nhớ làm việc.
a Bộ nhớ làm việc (working memory) :
V Cơ sở dữ liệu toàn cục chứa các sự kiện phục vụ cho các luật
a Khả năng giải thích (explanation facility) :
V Giải nghĩa cách lập luận của hệ thống cho người sử dụng
a Khả năng thu nhận tri thức (explanation facility) :
V Cho phép NSD bổ sung tri thức vào hệ thống
V Khả năng thu nhận tri thức là yếu tố mặc nhiên của nhiều hệ
chuyên gia
48/57
Phát hiện tri thức và
khai phá
dữ
liệu
a Phát hiện tri thức (PHTT) và khai phá dữ liệu (KPDL)
a Bối cảnh :
V Sự phát triển nhanh chóng của lĩnh vực CNTT và ứng dụng CNTT trong đời 
sống, kinh tế, xã hội, quốc phòng… hiện nay
V Khối lượng dữ liệu thu thập, xử lý, khai thác và lưu trữ ngày càng tích luỹ
nhiều lên
V Tuy nhiên, chỉ có khoảng từ 5% đến 10% lượng dữ liệu có ý nghĩa sử dụng 
theo thống kê
V Rất nhiều dữ liệu chưa được sử dụng hiệu quả nhưng vẫn phải tiếp tục thu 
thập rất tốn kém (nỗi lo sợ bỏ sót dữ liệu quan trọng có thể cần đến sau này)
V Trong môi trường cạnh tranh, nhu cầu có nhiều thông tin với tốc độ nhanh 
để trợ giúp ra quyết định và ngày càng có nhiều câu hỏi mang tính chất định 
tính cần phải trả lời dựa trên một khối lượng dữ liệu khổng lồ đã có
V Các phương pháp quản trị và khai thác cơ sở dữ liệu truyền thống ngày càng 
không đáp ứng được thực tế
a Sự ra đời kỹ thuật “Phát hiện tri thức và khai phá dữ liệu”
49/57
Tình hình nghiên cứu PHTT và
KPDL
a Thuật ngữ :
V Phát hiện tri thức (Knowledge Discovery)
V Khai phá dữ liệu (Data Mining)
a Đã và đang được nghiên cứu, ứng dụng trong nhiều lĩnh 
vực khác nhau ở các nước trên thế giới
a Tại Việt Nam :
VKỹ thuật này vẫn còn tương đối mới mẻ 
VĐang được nghiên cứu 
VĐang dần đưa vào ứng dụng thực tiễn
50/57
Khái niệm “Khai phá
dữ
liệu”
a Khai phá dữ liệu (Data Mining) :
quá trình trích xuất các thông tin có giá trị tiềm ẩn bên 
trong lượng lớn dữ liệu được lưu trữ trong các CSDL,
kho dữ liệu…
a Hiện nay, ngoài thuật ngữ khai phá dữ liệu, người ta còn 
dùng một số thuật ngữ khác có ý nghĩa tương tự như :
V Khai phá tri thức từ CSDL
(Knowlegde Mining From Databases)
V Trích lọc dữ liệu (Knowlegde Extraction)
V Phân tích dữ liệu/mẫu (Data/Pattern Analysis)
V Khảo cổ dữ liệu (Data Archaeology)
V Nạo vét dữ liệu (Data Dredging)
51/57
Qui trình 5 bước PHTT và
KPDL
1.
Tìm hiểu lĩnh vực ứng dụng và
hình thành bài toán
Đây là bước quyết định cho phép chọn các phương pháp khai phá
dữ
liệu thích 
hợp với mục đích ứng dụng và
bản chất của dữ
liệu
2.
Thu thập và
xử
lý thô (hay tiền xử
lý dữ
liệu)
Bước này thường chiếm dụng nhiều thời gian trong toàn bộ
qui trình 
3.
Khai phá
dữ
liệu, hay nói cách khác là
trích ra các mẫu và/hoặc các mô 
hình ẩn dưới các dữ
liệu
Đây là giai đoạn thiết yếu, trong đó
các phương pháp thông minh sẽ được áp 
dụng để
trích xuất ra các mẫu dữ
liệu
hay tri thức hữu ích
4.
Đánh giá
mẫu (pattern evaluation)
:
Hiểu tri thức đã tìm được, đặc biệt là
làm sáng tỏ
các mô tả
và
dự đoán, đánh 
giá
sự
hữu ích của các mẫu biểu diễn tri thức dựa vào một số
phép đo
5.
Trình diễn dữ
liệu (knowlegde presentation): 
sử
dụng các kĩ
thuật trình diễn và
trực quan hoá
dữ
liệu để
biểu diễn tri thức 
khai phá được cho người sử
dụng
52/57
Xử
lý thô dữ
liệu
a Làm sạch dữ liệu (data cleaning) :
loại bỏ
nhiễu hoặc các dữ
liệu không thích hợp
a Tích hợp dữ liệu (data integration) :
tích hợp dữ
liệu từ
các nguồn khác nhau như
:
CSDL, Kho dữ
liệu, các loại văn bản khác nhau...
a Chọn dữ liệu (data selection) :
ở bước này, những dữ
liệu liên quan trực tiếp đến nhiệm vụ
sẽ 
được thu thập từ
các nguồn dữ
liệu ban đầu
a Chuyển đổi dữ liệu (data transformation) :
trong bước này, dữ
liệu sẽ được chuyển đổi về
dạng phù
hợp 
cho việc khai phá
bằng cách thực hiện các thao tác nhóm hoặc 
tập hợp
53/57
Qui trình PHTT và
KPDL
a Các bước trong quy trình có thể lặp đi lặp lại một số lần
a Kết quả thu được có thể được lấy trung bình từ số lần thực hiện
54/57
Các phương pháp PHTT và
KPDL
a Nhằm hai mục đích chính :
V Dự đoán (Prediction)
V Mô tả (Description)
a Thường sử dụng các phương pháp sau :
V Phân loại (Classification)
V Hồi qui (Regression)
V Phân nhóm (Clustering)
V Tổng hợp (Summarization)
V Mô hình ràng buộc (Dependency modeling)
V Dò tìm biến đổi và độ lệch (Change and Deviation Dectection)
V Biểu diễn mô hình (Model Representation)
V Kiểm định mô hình (Model Evaluation)
V Phương pháp tìm kiếm (Search Method)
55/57
Các lĩnh vực liên quan đến PHTT và
KPDL
a PHTT và KPD liên quan đến nhiều ngành, nhiều lĩnh vực :
V Thống kê
V Trí tuệ nhân tạo
V Cơ sở dữ liệu
V Thuật toán học
V Tính toán song song và tốc độ cao
V Thu thập tri thức cho các hệ chuyên gia
V Quan sát dữ liệu... 
a PHTT và KPD rất gần gũi với các lĩnh vực :
V Thống kê, sử dụng các phương pháp thống kê để mô hình dữ liệu 
và phát hiện các mẫu, luật...
V Ngân hàng dữ liệu (Data Warehousing) và các công cụ phân tích 
trực tuyến (OLAP)
56/57
Ứng dụng PHTT và
KPDL
a Thông tin thương mại :
V Phân tích dữ liệu marketing, khách hàng
V Phân tích đầu tư
V Phê duyệt cho vay vốn
V Phát hiện gian lận…
a Thông tin kỹ thuật :
V Điều khiển và lập lịch trình
V Quản trị mạng
V Phân tích các kết quả thí nghiệm…
a Thông tin khoa học
a Thông tin cá nhân...
57/57
Các thách thức của PHTT và
KPDL
a Các CSDL thường rất lớn, thường xuyên biến đổi
và phát triển không ngừng
a Đặc điểm :
V Các CSDL thường có số chiều lớn 
V Thay đổi dữ liệu và tri thức có thể làm cho các mẫu đã phát 
hiện không còn phù hợp
V Dữ liệu bị thiếu hoặc nhiễu
V Quan hệ giữa các trường dữ liệu phức tạp
a Vấn đề giao tiếp với người sử dụng
và kết hợp với các tri thức đã có
a Khả năng tích hợp với các hệ thống khác...

File đính kèm:

  • pdfBài giảng Hệ chuyên gia - Phan Huy Khánh - Chương 1 Mở đầu về hệ chuyên gia.pdf
Tài liệu liên quan