Đồ án Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên
Mục lục
Lời nói đầu . . . . 1
Mục lục . . . . 2
Phụ lục . . . . 3
PHẦN 1:TỔNG QUAN VỀ VIỆC ỨNG DỤNG XỬ LÝ NGÔN TRONG
THỰC TIỄN . . . . 4
1.1.Giới thiệu . . . . 4
1.2. Đặt vấn đề . . . . 5
1.2.1.Mục đích của đề tài. . . 5.
1.2.2.Nội dung công việc . . . 6
PHẦN 2:CƠ SỞ LÝ THUYẾT . . . 7
2.1.Giao diện ngôn ngữ tự nhiên . . . 7
2.1.1.Những ưu điểm của giao diện ngôn ngữ tự nhiên . .10
2.1.2.Những nhược điểm của giao diện ngôn ngữ tự nhiên . .11
2.2.Giao diện ngôn ngữ tự nhiên hạn chế . . 12
2.3.Kỹ thuật WYSIWYM editing . . .12
2.3.1.Các mô hình Editor . . .12
2.3.2.Kiến trúc WYSIWYM . . .15
2.3.3.Các thành phần cơ bản của một hệ thống WYSIWYM editing.17
PHẦN 3:HỆ THỐNG HỎI ĐÁP NGÔN NGỮ TỰ NHIÊN. 19
3.1.Các hệ thống truy vấn cơ sở dữ liệu . . 19
3.2.Giới thiệu về một hệ thống CLEF . . .21
3.2.1. Ứng dụng của hệ thống . . .21
3.2.2. Kiến trúc của hệ thống . . .22
3.3.Giao diện CLEF . . . 22
3.3.1.Chức năng và nhiệm vụ của giao diện CLEF . .23
3.3.2.Mô hình hoá các văn bản trả lời . . .24
3.3.3.Cách thức tương tác giữa người dùng và giao diện CLEF . 25
PHẦN 4:XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG GIAO DIỆN
WYSIWYM . . . .38
4.1.Phân tích thiết kế . . . 38
4.1.1.Phân tích chức năng . . .38
4.1.2.Thiết kế cơ sở tri thức . . .40
4.1.2.1.Quan hệ ngữ nghĩa giữa các anchor(liên kết) . . 40
4.1.2.2.Thiết kế logic . . . 51
4.2.Cài đặt chương trình mô phỏng . . .65
4.2.1.Công cụ ngôn ngữ . . .65
4.2.2.Mã hoá chương trình . . .68
PHẦN 5: ĐÁNH GIÁ KẾT QUẢ VÀ HƯỚNG PHÁT TRIỂN .94
5.1. Đánh giá kết quả . . . 94
5.2.Hướng phát triển . . . 95
Các tài liệu tham khảo . . .96
ttribute!diagnosis & value!Cancer, attribute!place & value!Hospital, attribute!time & value!Date]) & layout!level!sentence & cset![ meaning!Patient & layout!level!phrase, meaning!diagnose & syntax!category!label & layout!level!word, meaning!Cancer & layout!level!phrase, meaning!at & layout!level!word, meaning!Hospital & layout!level!phrase, meaning!on & syntax!category!prep & layout!level!word, meaning!Date & layout!level!phrase ]). Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên Đồ án tốt nghiệp Nguyễn Trung Thành-HTTT-K46 145 Luật sinh ra câu khởi tạo từ anchor( liên kết) discuss event (xác định thông tin về việc hội chẩn của bệnh nhân) rule(english, discuss_sentence, meaning!(<description & predicate!discuss_event & properties![attribute!tumor & value!Tumor, attribute!team & value!Team, attribute!time & value!Date]) & layout!level!sentence & cset![meaning!careplan & syntax!category!label & layout!level!word, meaning!Tumor & layout!level!phrase, meaning!discuss & syntax!category!label & layout!level!word, meaning!Team & layout!level!phrase, meaning!on & syntax!category!prep & layout!level!word, meaning!Date & Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên Đồ án tốt nghiệp Nguyễn Trung Thành-HTTT-K46 146 layout!level!phrase ]). Luật sinh ra câu khởi tạo từ anchor( liên kết) type of care (xác định phương pháp điều trị của bệnh nhân) rule(english, decide_sentence, meaning!(<description & predicate!decide_event & properties![attribute!care & value!Care]) & layout!level!sentence & cset![ meaning!agreed_care & syntax!category!label & layout!level!word, meaning!Care & layout!level!phrase ]). Luật sinh ra câu khởi tạo từ anchor( liên kết) care record (thông tin điều trị bệnh) rule(english, care_record_paragraph, meaning!(<description & predicate!care_record & properties![attribute!discuss_section & value!Discuss, attribute!decide_section & value!Decide]) & layout!level!paragraph & Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên Đồ án tốt nghiệp Nguyễn Trung Thành-HTTT-K46 147 cset![ meaning!Discuss & layout!level!sentence, meaning!Decide & layout!level!sentence ]). Luật sinh ra câu khởi tạo từ anchor( liên kết) tests record (xác định kết quả thí nghiệm của bệnh nhân) rule(english, test_result_record_paragraph, meaning!(<description & predicate!test_result_record & properties![attribute!pat & value!Patient, attribute!amount & value!Amount, attribute!substance & value!Substance]) & layout!level!sentence & cset![meaning!Patient & layout!level!phrase, meaning!has & syntax!category!label& layout!level!word, meaning!Amount & layout!level!phrase, meaning!level_of & Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên Đồ án tốt nghiệp Nguyễn Trung Thành-HTTT-K46 148 syntax!category!label & layout!level!word, meaning!Substance & layout!level!phrase]). Như vậy những nội dung quan trọng nhất của phần cài đặt đã được trình bày.Các kết quả thực hiện chương trình hoàn toàn giống với những gì đã trình bày ở trên. Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên Đồ án tốt nghiệp Nguyễn Trung Thành-HTTT-K46 149 PHẦN 5: ĐÁNH GIÁ KẾT QUẢ VÀ HƯỚNG PHÁT TRIỂN 5.1. Đánh giá kết quả Đề tài “tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên” là một quá trình tiếp cận có chọn lọc đối với các kỹ thuật xây dựng giao diện ngôn ngữ tự nhiên.Chủ đề của đề tài này liên quan tới nhiều lĩnh vực trong đó bao gồm Xử lý ngôn ngữ tự nhiên (Natural Language Processing) Giao diện đồ hoạ người dùng (Graphic user interface –GUI) Lập trình logic (logic programming) Do có sự giao thoa trên mà trong quá trình xây dựng chương trình mô phỏng đòi hỏi phải tìm hiểu những kiến thức và vận dụng các kỹ thuật của các lĩnh vực này vào bài toán cụ thể. Ở khía cạnh “tìm hiểu” thì coi như mục đích đã đạt được vì để xây dựng được chương trình mô phỏng thì phải nắm được các kỹ thuật xây dựng giao diện người dùng (cần tìm hiểu các công giao diện đồ hoạ ),với cơ phản hồi ngôn ngữ tự nhiên (cần tìm hiểu các đặc trưng của ngôn ngữ tự nhiên), kỹ thuật tạo các phản hồi feedback text bằng WYSIWYM đòi hỏi nắm được những nội dung về lập trình logic. Tuy nhiên do những hạn chế không thể tránh khỏi nên đồ án có nhiều nhược điểm: Nhược điểm lớn nhất là ngôn ngữ tự nhiên được áp dụng là Tiếng Anh (English) trong khi đồ án tốt nghiệp lại do một sinh viên Việt Nam thực hiện, điều này không phải vì người thực hiện giỏi Tiếng Anh hơn tiếng mẹ đẻ của mình là Tiếng Việt.Hạn chế này là do việc áp dụng ngôn ngữ nào để sinh ra các text dạng ngôn ngữ tự nhiên trên giao diện phản hồi cho người dùng phụ thuộc vào bộ luật sinh ngôn ngữ chuẩn của thứ Tiếng đó,vì sử dụng kỹ thuật WYSIWYM nên các luật Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên Đồ án tốt nghiệp Nguyễn Trung Thành-HTTT-K46 150 này không chỉ tồn tại ở dạng cấu trúc logic mà còn phải được mã hoá theo chuẩn của ngôn ngữ ProFIT, điều này được áp dụng đối với tất cả các hệ thống WYSIWYM hiện có ,tất nhiên có thể xây dựng được tập luật cho tiếng Việt,tuy nhiên điều này đòi hỏi rất nhiều thời gian trong khi điều kiện (thời gian,tài liệu,các kiến thức về Tiếng Việt) chưa cho phép Nhược điểm thứ hai liên quan đến phần nội dung tri thức, đó là nội dung của các feedback text được phản hồi lại phía người dùng còn rất sơ sài và không mang ý nghĩa thực tế,các feedback text chỉ đóng khung trong 6 loại mẫu câu cố định sẵn,không đa dạng. Điều này là do kiến thức về lĩnh vực bệnh ung thư (chủ đề tri thức áp dụng cho chương trình mô phỏng) còn hạn chế,quy mô của một ứng dụng thuộc bất kỳ lĩnh vực nào không chỉ phụ thuộc vào kiến thức của người lập trình mà còn phụ thuộc vào kiến thức chuyên môn của các chuyên gia lĩnh vực (domain experts) chỉ có những chuyên gia này mới biết được những tri thức trong lĩnh vực của họ tức là quan hệ ngữ nghĩa giữa các từ của phạm vi tri thức này,từ đó mới có thể xây dựng được bộ từ vựng (lexicon) về lĩnh vực đó,bộ từ vựng càng lớn thì quy mô của ứng dụng càng lớn,các phản hồi ngôn ngữ tự nhiên càng đa dạng.Do người thực hiện đề tài là một sinh viên chỉ tìm hiểu các tri thức (domains) qua các trang web về bệnh ung thư cùng với khả năng dịch thuật hạn chế nên nội dung các feedback text xây dựng còn khá đơn điệu và không đảm bảo tính chuyên môn. Nhược điểm cuối cùng là khả năng viêt đồ án chắc chắn còn hạn chế của người viết (những hạn chế này người viết không thể tự nhận ra được chỉ có người đọc mới phát hiện thấy)do thiếu kinh nghiệm mặc dù có tìm hiểu cách viết luận văn của các sinh viên khoá trước.Chính vì lý do đó mà có những nội dung có thể trình bày không được cặn kẽ hoặc không nêu bật được nội dung trọng tâm cần đề cập.Những thiếu sót về mặt chủ quan này sẽ được khắc phục dần dần. 5.2.Hướng phát triển Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên Đồ án tốt nghiệp Nguyễn Trung Thành-HTTT-K46 151 Từ những hạn chế trên mà đề tài cần phải được tiếp tục nghiên cứu trong thời gian tới để khắc phục những nhược điểm nói trên.Cần có những công việc cụ thể để chuẩn bị cho việc phát triển đề tài này như sau Giành thời gian nghiên cứu các đặc trưng của Tiếng Việt,và các cấu trúc mã hoá chuẩn của ProFIT để kết hợp xây dựng một tập luật chuẩn phục vụ cho việc sinh ngôn ngữ tự nhiên Tiếng Việt bằng kỹ thuật WYSIWYM.(kỹ thuật xây dựng giao diện người dùng bằng cơ chế phản hồi ngôn ngữ tự nhiên). Trong điều kiện có thể lựa chọn một lĩnh vực dễ tiếp cận hoặc có ưu thế về ứng dụng trong thực tiễn để xây dựng một ứng dụng WYSIWYM như vậy sẽ mở rộng phạm vi của các WYSIWYM sang cả miền Tiếng Việt vì hiện nay trên thế giới chỉ có một số nước như Anh,Pháp,Nhật có các hệ thống ứng dụng lớn xây dựng theo kiểu kiến trúc này. Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên Đồ án tốt nghiệp Nguyễn Trung Thành-HTTT-K46 152 Các tài liệu tham khảo [1] Catalina Hallett,Richard Power,Donia Scott, “Intuitive Querying of e-Healht Data Repositories”. (2005) [2]Donia Scott,Richard Power and Roger Evans “Generation as a solution to its own problem” (1998) [3]Donia R Scott “The Multilingual Generation Game: authoring fluent texts in unfarmiliar languages”(1999) [4]Donia scott,Richard Power and Roger Evans “Generation as a solution to its own problem” [5]Gregor Enbach “ProFIT prolog with Features ,Inheritance and Templates” (1995) [6]Peter Lucas “Introduction to ProLog “(2001) [7]Paul Piwek,Roger Evans and Richard Power “Editing Speech Acts: A Practical Approach to Human-Machine Dialogue”.(1999) [8]Kees van Deemter and Richard Power “Conference in Knowledge Editing”. [9]Richard Power and Donia Scott “Multilingual authoring using feedback texts”. [10]Richar Power “Controlling logic scope in text generation”. [11]Richard Power “Generating referring expression with unification grammar” [12]Richard Power “Reducing ICONOCLAST to RAGS” [13]Roger Evans and Richard Power and Donia Scott “ What You See Is What You Mean :direct knowledge editng with natural language feedback”(1998). [13]Rodger Kibble,Richard Power,Kees van Deemter “Editing logically complex discourse meanings”1998 Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên Đồ án tốt nghiệp Nguyễn Trung Thành-HTTT-K46 153 [14]Ofer Biller “Semantic Authoring for Multilingual Text Generation”(2005). Các địa chỉ Website có liên quan
File đính kèm:
- Đồ án Tìm hiểu kỹ thuật xây dựng giao diện người dùng với cơ chế phản hồi ngôn ngữ tự nhiên.pdf