Đồ án Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên

Mục lục

Lời nói đầu . . . . 1

Mục lục . . . . 2

Phụ lục . . . . 3

PHẦN 1:TỔNG QUAN VỀ VIỆC ỨNG DỤNG XỬ LÝ NGÔN TRONG

THỰC TIỄN . . . . 4

1.1.Giới thiệu . . . . 4

1.2. Đặt vấn đề . . . . 5

1.2.1.Mục đích của đề tài. . . 5.

1.2.2.Nội dung công việc . . . 6

PHẦN 2:CƠ SỞ LÝ THUYẾT . . . 7

2.1.Giao diện ngôn ngữ tự nhiên . . . 7

2.1.1.Những ưu điểm của giao diện ngôn ngữ tự nhiên . .10

2.1.2.Những nhược điểm của giao diện ngôn ngữ tự nhiên . .11

2.2.Giao diện ngôn ngữ tự nhiên hạn chế . . 12

2.3.Kỹ thuật WYSIWYM editing . . .12

2.3.1.Các mô hình Editor . . .12

2.3.2.Kiến trúc WYSIWYM . . .15

2.3.3.Các thành phần cơ bản của một hệ thống WYSIWYM editing.17

PHẦN 3:HỆ THỐNG HỎI ĐÁP NGÔN NGỮ TỰ NHIÊN. 19

3.1.Các hệ thống truy vấn cơ sở dữ liệu . . 19

3.2.Giới thiệu về một hệ thống CLEF . . .21

3.2.1. Ứng dụng của hệ thống . . .21

3.2.2. Kiến trúc của hệ thống . . .22

3.3.Giao diện CLEF . . . 22

3.3.1.Chức năng và nhiệm vụ của giao diện CLEF . .23

3.3.2.Mô hình hoá các văn bản trả lời . . .24

3.3.3.Cách thức tương tác giữa người dùng và giao diện CLEF . 25

PHẦN 4:XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG GIAO DIỆN

WYSIWYM . . . .38

4.1.Phân tích thiết kế . . . 38

4.1.1.Phân tích chức năng . . .38

4.1.2.Thiết kế cơ sở tri thức . . .40

4.1.2.1.Quan hệ ngữ nghĩa giữa các anchor(liên kết) . . 40

4.1.2.2.Thiết kế logic . . . 51

4.2.Cài đặt chương trình mô phỏng . . .65

4.2.1.Công cụ ngôn ngữ . . .65

4.2.2.Mã hoá chương trình . . .68

PHẦN 5: ĐÁNH GIÁ KẾT QUẢ VÀ HƯỚNG PHÁT TRIỂN .94

5.1. Đánh giá kết quả . . . 94

5.2.Hướng phát triển . . . 95

Các tài liệu tham khảo . . .96

pdf153 trang | Chuyên mục: Các Kỹ Thuật Xử Lý Ngôn Ngữ Tự Nhiên | Chia sẻ: dkS00TYs | Lượt xem: 1338 | Lượt tải: 4download
Tóm tắt nội dung Đồ án Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên, để xem tài liệu hoàn chỉnh bạn click vào nút "TẢI VỀ" ở trên
ttribute!diagnosis & value!Cancer, 
attribute!place & value!Hospital, 
attribute!time & value!Date]) & 
 layout!level!sentence & 
 cset![ meaning!Patient & 
 layout!level!phrase, 
 meaning!diagnose & 
 syntax!category!label & 
 layout!level!word, 
 meaning!Cancer & 
 layout!level!phrase, 
 meaning!at & 
 layout!level!word, 
 meaning!Hospital & 
 layout!level!phrase, 
 meaning!on & 
 syntax!category!prep & 
 layout!level!word, 
 meaning!Date & 
 layout!level!phrase 
 ]). 
 Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên 
Đồ án tốt nghiệp Nguyễn Trung Thành-HTTT-K46 145 
 Luật sinh ra câu khởi tạo từ anchor( liên kết) discuss event (xác định 
thông tin về việc hội chẩn của bệnh nhân) 
rule(english, discuss_sentence, 
 meaning!(<description & 
 predicate!discuss_event & 
 properties![attribute!tumor & value!Tumor, 
attribute!team & value!Team, 
attribute!time & value!Date]) & 
layout!level!sentence & 
cset![meaning!careplan & 
 syntax!category!label & 
 layout!level!word, 
 meaning!Tumor & 
 layout!level!phrase, 
 meaning!discuss & 
 syntax!category!label & 
 layout!level!word, 
 meaning!Team & 
 layout!level!phrase, 
 meaning!on & 
 syntax!category!prep & 
 layout!level!word, 
 meaning!Date & 
 Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên 
Đồ án tốt nghiệp Nguyễn Trung Thành-HTTT-K46 146 
 layout!level!phrase 
 ]). 
 Luật sinh ra câu khởi tạo từ anchor( liên kết) type of care (xác định 
phương pháp điều trị của bệnh nhân) 
rule(english, decide_sentence, 
 meaning!(<description & 
 predicate!decide_event & 
 properties![attribute!care & value!Care]) & 
 layout!level!sentence & 
 cset![ meaning!agreed_care & 
 syntax!category!label & 
 layout!level!word, 
 meaning!Care & 
 layout!level!phrase 
 ]). 
 Luật sinh ra câu khởi tạo từ anchor( liên kết) care record (thông tin 
điều trị bệnh) 
rule(english, care_record_paragraph, 
 meaning!(<description & 
 predicate!care_record & 
 properties![attribute!discuss_section & value!Discuss, 
attribute!decide_section & value!Decide]) & 
 layout!level!paragraph & 
 Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên 
Đồ án tốt nghiệp Nguyễn Trung Thành-HTTT-K46 147 
 cset![ 
 meaning!Discuss & 
 layout!level!sentence, 
 meaning!Decide & 
 layout!level!sentence 
 ]). 
 Luật sinh ra câu khởi tạo từ anchor( liên kết) tests record (xác định kết 
quả thí nghiệm của bệnh nhân) 
rule(english, test_result_record_paragraph, 
 meaning!(<description & 
 predicate!test_result_record & 
 properties![attribute!pat & value!Patient, 
attribute!amount & value!Amount, 
attribute!substance & value!Substance]) & 
 layout!level!sentence & 
 cset![meaning!Patient & 
 layout!level!phrase, 
 meaning!has & 
 syntax!category!label& 
 layout!level!word, 
 meaning!Amount & 
 layout!level!phrase, 
 meaning!level_of & 
 Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên 
Đồ án tốt nghiệp Nguyễn Trung Thành-HTTT-K46 148 
 syntax!category!label & 
 layout!level!word, 
 meaning!Substance & 
 layout!level!phrase]). 
Như vậy những nội dung quan trọng nhất của phần cài đặt đã được trình bày.Các 
kết quả thực hiện chương trình hoàn toàn giống với những gì đã trình bày ở trên. 
 Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên 
Đồ án tốt nghiệp Nguyễn Trung Thành-HTTT-K46 149 
PHẦN 5: ĐÁNH GIÁ KẾT QUẢ VÀ HƯỚNG PHÁT TRIỂN 
5.1. Đánh giá kết quả 
 Đề tài “tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi 
ngôn ngữ tự nhiên” là một quá trình tiếp cận có chọn lọc đối với các kỹ thuật xây 
dựng giao diện ngôn ngữ tự nhiên.Chủ đề của đề tài này liên quan tới nhiều lĩnh 
vực trong đó bao gồm 
 Xử lý ngôn ngữ tự nhiên (Natural Language Processing) 
 Giao diện đồ hoạ người dùng (Graphic user interface –GUI) 
 Lập trình logic (logic programming) 
 Do có sự giao thoa trên mà trong quá trình xây dựng chương trình mô phỏng đòi 
hỏi phải tìm hiểu những kiến thức và vận dụng các kỹ thuật của các lĩnh vực này 
vào bài toán cụ thể. Ở khía cạnh “tìm hiểu” thì coi như mục đích đã đạt được vì để 
xây dựng được chương trình mô phỏng thì phải nắm được các kỹ thuật xây dựng 
giao diện người dùng (cần tìm hiểu các công giao diện đồ hoạ ),với cơ phản hồi 
ngôn ngữ tự nhiên (cần tìm hiểu các đặc trưng của ngôn ngữ tự nhiên), kỹ thuật 
tạo các phản hồi feedback text bằng WYSIWYM đòi hỏi nắm được những nội 
dung về lập trình logic. 
 Tuy nhiên do những hạn chế không thể tránh khỏi nên đồ án có nhiều nhược 
điểm: 
 Nhược điểm lớn nhất là ngôn ngữ tự nhiên được áp dụng là Tiếng Anh (English) 
trong khi đồ án tốt nghiệp lại do một sinh viên Việt Nam thực hiện, điều này 
không phải vì người thực hiện giỏi Tiếng Anh hơn tiếng mẹ đẻ của mình là Tiếng 
Việt.Hạn chế này là do việc áp dụng ngôn ngữ nào để sinh ra các text dạng ngôn 
ngữ tự nhiên trên giao diện phản hồi cho người dùng phụ thuộc vào bộ luật sinh 
ngôn ngữ chuẩn của thứ Tiếng đó,vì sử dụng kỹ thuật WYSIWYM nên các luật 
 Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên 
Đồ án tốt nghiệp Nguyễn Trung Thành-HTTT-K46 150 
này không chỉ tồn tại ở dạng cấu trúc logic mà còn phải được mã hoá theo chuẩn 
của ngôn ngữ ProFIT, điều này được áp dụng đối với tất cả các hệ thống 
WYSIWYM hiện có ,tất nhiên có thể xây dựng được tập luật cho tiếng Việt,tuy 
nhiên điều này đòi hỏi rất nhiều thời gian trong khi điều kiện (thời gian,tài liệu,các 
kiến thức về Tiếng Việt) chưa cho phép 
 Nhược điểm thứ hai liên quan đến phần nội dung tri thức, đó là nội dung của các 
feedback text được phản hồi lại phía người dùng còn rất sơ sài và không mang ý 
nghĩa thực tế,các feedback text chỉ đóng khung trong 6 loại mẫu câu cố định 
sẵn,không đa dạng. Điều này là do kiến thức về lĩnh vực bệnh ung thư (chủ đề tri 
thức áp dụng cho chương trình mô phỏng) còn hạn chế,quy mô của một ứng dụng 
thuộc bất kỳ lĩnh vực nào không chỉ phụ thuộc vào kiến thức của người lập trình 
mà còn phụ thuộc vào kiến thức chuyên môn của các chuyên gia lĩnh vực (domain 
experts) chỉ có những chuyên gia này mới biết được những tri thức trong lĩnh vực 
của họ tức là quan hệ ngữ nghĩa giữa các từ của phạm vi tri thức này,từ đó mới có 
thể xây dựng được bộ từ vựng (lexicon) về lĩnh vực đó,bộ từ vựng càng lớn thì 
quy mô của ứng dụng càng lớn,các phản hồi ngôn ngữ tự nhiên càng đa dạng.Do 
người thực hiện đề tài là một sinh viên chỉ tìm hiểu các tri thức (domains) qua các 
trang web về bệnh ung thư cùng với khả năng dịch thuật hạn chế nên nội dung các 
feedback text xây dựng còn khá đơn điệu và không đảm bảo tính chuyên môn. 
 Nhược điểm cuối cùng là khả năng viêt đồ án chắc chắn còn hạn chế của người 
viết (những hạn chế này người viết không thể tự nhận ra được chỉ có người đọc 
mới phát hiện thấy)do thiếu kinh nghiệm mặc dù có tìm hiểu cách viết luận văn 
của các sinh viên khoá trước.Chính vì lý do đó mà có những nội dung có thể trình 
bày không được cặn kẽ hoặc không nêu bật được nội dung trọng tâm cần đề 
cập.Những thiếu sót về mặt chủ quan này sẽ được khắc phục dần dần. 
5.2.Hướng phát triển 
 Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên 
Đồ án tốt nghiệp Nguyễn Trung Thành-HTTT-K46 151 
 Từ những hạn chế trên mà đề tài cần phải được tiếp tục nghiên cứu trong thời 
gian tới để khắc phục những nhược điểm nói trên.Cần có những công việc cụ thể 
để chuẩn bị cho việc phát triển đề tài này như sau 
 Giành thời gian nghiên cứu các đặc trưng của Tiếng Việt,và các cấu trúc mã hoá 
chuẩn của ProFIT để kết hợp xây dựng một tập luật chuẩn phục vụ cho việc sinh 
ngôn ngữ tự nhiên Tiếng Việt bằng kỹ thuật WYSIWYM.(kỹ thuật xây dựng giao 
diện người dùng bằng cơ chế phản hồi ngôn ngữ tự nhiên). 
 Trong điều kiện có thể lựa chọn một lĩnh vực dễ tiếp cận hoặc có ưu thế về ứng 
dụng trong thực tiễn để xây dựng một ứng dụng WYSIWYM như vậy sẽ mở rộng 
phạm vi của các WYSIWYM sang cả miền Tiếng Việt vì hiện nay trên thế giới chỉ 
có một số nước như Anh,Pháp,Nhật có các hệ thống ứng dụng lớn xây dựng theo 
kiểu kiến trúc này. 
 Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên 
Đồ án tốt nghiệp Nguyễn Trung Thành-HTTT-K46 152 
Các tài liệu tham khảo 
[1] Catalina Hallett,Richard Power,Donia Scott, “Intuitive Querying of e-Healht 
Data Repositories”. (2005) 
[2]Donia Scott,Richard Power and Roger Evans “Generation as a solution to its 
own problem” (1998) 
[3]Donia R Scott “The Multilingual Generation Game: authoring fluent texts in 
unfarmiliar languages”(1999) 
[4]Donia scott,Richard Power and Roger Evans “Generation as a solution to its 
own problem” 
[5]Gregor Enbach “ProFIT prolog with Features ,Inheritance and Templates” 
(1995) 
[6]Peter Lucas “Introduction to ProLog “(2001) 
[7]Paul Piwek,Roger Evans and Richard Power “Editing Speech Acts: A Practical 
Approach to Human-Machine Dialogue”.(1999) 
[8]Kees van Deemter and Richard Power “Conference in Knowledge Editing”. 
[9]Richard Power and Donia Scott “Multilingual authoring using feedback texts”. 
[10]Richar Power “Controlling logic scope in text generation”. 
[11]Richard Power “Generating referring expression with unification grammar” 
[12]Richard Power “Reducing ICONOCLAST to RAGS” 
[13]Roger Evans and Richard Power and Donia Scott “ What You See Is What 
You Mean :direct knowledge editng with natural language feedback”(1998). 
[13]Rodger Kibble,Richard Power,Kees van Deemter “Editing logically complex 
discourse meanings”1998 
 Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên 
Đồ án tốt nghiệp Nguyễn Trung Thành-HTTT-K46 153 
[14]Ofer Biller “Semantic Authoring for Multilingual Text Generation”(2005). 
Các địa chỉ Website có liên quan 

File đính kèm:

  • pdfĐồ án Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên.pdf