Bài giảng Ngôn ngữ học máy tính - Nguyễn Tuấn Đăng - Cấu trúc ngữ pháp
Trong ngữ pháp truyền thống: phân tích câu
thành chủ ngữ, vị ngữ, và các thành phần này
tiếp tục được phân tích thành các mệnh đề,
ngữ đoạn, từ.
• Thuật ngữ “thành tố trực tiếp” (Bloomfield,
1933): câu không phải là chuỗi tuyến tính các
thành tố mà có cấu trúc phân cấp các thành tố
trực tiếp.
Tóm tắt nội dung Bài giảng Ngôn ngữ học máy tính - Nguyễn Tuấn Đăng - Cấu trúc ngữ pháp, để xem tài liệu hoàn chỉnh bạn click vào nút "TẢI VỀ" ở trên
1Giới thiệu Ngôn ngữ học lý thuyết Biên soạn theo: “Introduction to theoretical linguistics”, John Lyons, bản dịch của Vương Hữu Lễ, NXB Giáo dục, 1997. CẤU TRÚC NGỮ PHÁP 2 Thành tố trực tiếp • Trong ngữ pháp truyền thống: phân tích câu thành chủ ngữ, vị ngữ, và các thành phần này tiếp tục được phân tích thành các mệnh đề, ngữ đoạn, từ. • Thuật ngữ “thành tố trực tiếp” (Bloomfield, 1933): câu không phải là chuỗi tuyến tính các thành tố mà có cấu trúc phân cấp các thành tố trực tiếp. 3 Thành tố trực tiếp • Mỗi thành tố ở cấp độ thấp hơn là thành phần của một thành tố ở cấp độ cao hơn. • Có thể dùng cấu trúc cây hoặc dùng dấu ngoặc. Hai cách này tương đương nhau. Ví dụ: [(Poor John) (ran away)] • Mô hình này không cho thấy chức năng ngữ pháp của các thành tố như cách phân tích phạm trù của ngữ pháp truyền thống. 4 Thành tố trực tiếp 5 Poor John ran away y z x Ngữ pháp cấu trúc ngữ đoạn • Bloomfield cho rằng một cách “phân tích đúng” là chia câu thành các thành tố và coi đó là một cách phân tích có tính đến nghĩa. • Wells và Harris (các học trò của Bloomfield): đã thiết lập các nguyên tắc phân tích thành tố một cách chi tiết hơn – bằng những tiêu chí tường minh (làm sáng tỏ điều mà Bloomfield gọi là “có tính đến nghĩa”). 6 Ngữ pháp cấu trúc ngữ đoạn • Chomsky đã hình thức hóa một cách hoàn chỉnh nhất lý thuyết cấu trúc thành tố. • “Ngữ pháp cấu trúc thành tố” là thuật ngữ rộng hơn so với thuật ngữ “ngữ pháp cấu trúc ngữ đoạn”. 7 Ngữ pháp cấu trúc ngữ đoạn Các qui tắc viết lại (1) S -> NP + VP (2) VP -> V + Adv (3) NP -> A + N Nếu các qui tắc này được áp dụng thành chuỗi sao cho: ký hiệu ở bên trái mũi tên của mỗi qui tắc (trừ qui tắc (1)) được dùng để thay thế (hay “viết lại”) một ký hiệu nào đó ở bên phải mũi tên trong “output” đã “được đóng ngoặc” của các qui tắc được áp dụng trước. 8 Ngữ pháp cấu trúc ngữ đoạn Output của qui tắc (1): S {NP + VP} Áp dụng qui tắc (2) vào output của (1): S {NP + VP (V + Adv)} Áp dụng qui tắc (3) vào output của chuỗi các qui tắc (1)-(2): S {NP (A + N) + VP (V + Adv)} 9 Ngữ pháp cấu trúc ngữ đoạn • Như vậy, mỗi qui tắc đã: – Đóng ngoặc các thành tố tạo nên một kết cấu được nó xác định, và – Gán nhãn cho kết cấu đó. • Nếu áp dụng qui tắc (3) trước qui tắc (2) thì kết quả cũng tương đương trong ví dụ trên. Nhưng qui tắc (1) phải được áp dụng trước để sản sinh các yếu tốt cần thiết cho các qui tắc (2) và (3). 10 Ngữ pháp cấu trúc ngữ đoạn • Vế xuất hiện bên trái của qui tắc (1) được gọi là ký hiệu khởi đầu, vế này chỉ: – Kết cấu thuộc cấp độ cao nhất, và – Tất cả các kết cấu khác được ngữ pháp tạo sinh ra đều là thành tố của kết cấu đó. • Sau khi áp dụng tất cả các qui tắc có liên quan để tạo sinh một dạng câu cụ thể, ngữ pháp sẽ sản sinh một chuỗi ký hiệu kết thúc đã được đóng ngoặc. 11 Ngữ pháp cấu trúc ngữ đoạn • Mỗi ký hiệu kết thúc chỉ một lớp yếu tố trong bộ từ vựng: danh từ, động từ, tính từ, … • Nếu thay thế mỗi ký hiệu kết thúc trong chuỗi ký hiệu kết thúc bằng một thành viên của lớp từ vựng mà nó chỉ thì sẽ được một câu có cấu trúc thành tố hoàn toàn được qui định bởi các qui tắc đã tạo sinh ra chuỗi các ký hiệu kết thúc đó. 12 Ngữ pháp cấu trúc ngữ đoạn Các qui tắc luân phiên • Mục đích: Mở rộng ngữ pháp để có năng lực sản sinh các câu như: “Old men love young women” ngoài các câu như: “Poor John ran away”. 13 Ngữ pháp cấu trúc ngữ đoạn Các qui tắc luân phiên • Phương pháp: đưa ra các qui tắc cho phép những cách luân phiên viết lại yếu tố VP. (1) S -> NP + VP (2a) VP -> Vintr + Adv (2b) VP -> Vtr + NP (3) NP -> A + N 14 Ngữ pháp cấu trúc ngữ đoạn • Nguyên tắc: một trong hai qui tắc (2a) và (2b) phải được áp dụng, nhưng việc chọn áp dụng qui tắc nào là tự do. • Hệ quả của phương pháp: cần thay đổi cách phân loại từ trong bộ từ vựng: – Vintr = {ran, …} – Vtr = {love, …} 15 Ngữ pháp cấu trúc ngữ đoạn • Nhận xét: – Ngữ pháp trên tạo sinh đúng câu “Old men love young women” nhưng cũng tạo sinh ra những câu bất khả chấp “Poor John eat old women”. – Ngoài ra, ngữ pháp trên cũng không giải quyết được sự hòa hợp giữa chủ ngữ và động từ (vấn đề chia động từ). – Ngữ pháp trên không thể tạo sinh các câu như: “John ran”, “John ran way”, ... 16 Ngữ pháp cấu trúc ngữ đoạn Các qui tắc tùy chọn và các qui tắc bắt buộc • Mục đích: để ngữ pháp trên có thể tạo sinh ra các câu như: “John ran”, “John ran way”, ... • Phương pháp: Tách qui tắc (3) thành hai qui tắc: (3) NP -> N (4) N -> A + N Xác định qui tắc (3) là bắt buộc, qui tắc (4) là tùy chọn. 17 Ngữ pháp cấu trúc ngữ đoạn • Nhận xét: – Việc đưa ra các qui tắc tùy chọn và luân phiên có thể tăng thêm sức mạnh cho ngữ pháp. – Sinh ra các tiểu loại của một loại hình câu (trong ngữ pháp ở ví dụ trên là loại hình câu: S -> NP + VP). 18 Ngữ pháp cấu trúc ngữ đoạn Trật tự của các qui tắc • Giả định hiện tại (trong ngữ pháp ở ví dụ trên): các qui tắc được áp dụng (tại vị trí có thể áp dụng) theo trật tự mà chúng được đánh số. • Nhận xét về hệ quả của giả định (nêu trên): sự áp đặt một trật tự nào đó cho các qui tắc có thể sinh ra những kết quả khác nhau. 19 Ngữ pháp cấu trúc ngữ đoạn • Xét hệ thống qui tắc cú pháp: (1) S -> NP + VP (2a) VP -> Vintr + Adv (2b) VP -> Vtr + NP (3) NP -> N (4) N -> T + N (5) N -> A + N Các qui tắc (4) và (5) là tùy chọn. 20 Ngữ pháp cấu trúc ngữ đoạn • Giả thiết rằng trong bộ từ vựng có: T = {the}. • Vì các qui tắc (4) và (5) là tùy chọn nên ngữ pháp sẽ tạo sinh: “men”, “the men”, “good men”, “the good men”. • Nếu qui tắc (5) được áp dụng trước qui tắc (4) thì những chuỗi bất khả chấp như “good the men” sẽ được xem là hợp ngữ pháp. 21 Ngữ pháp cấu trúc ngữ đoạn Các qui tắc quy hồi • Qui tắc đẳng lập các danh từ là qui tắc được áp dụng nhiều lần: vì có những ngữ đoạn được tạo ra bằng vô số danh từ nối nhau bằng “and”. • Giải pháp đơn giản: sử dụng các qui tắc luân phiên: (6a) N -> N + and + N (6b) N -> N + and + N + and + N … 22 Ngữ pháp cấu trúc ngữ đoạn • Giải pháp như trên là không thỏa đáng về nguyên tắc bởi vì không có giới hạn về số lượng danh từ đẳng lập theo cách đó (trong tiếng Anh). • Do đó: qui định rằng qui tắc (6) có thể áp dụng vô số lần => các qui tắc như vậy được gọi là qui tắc quy hồi. 23 Ngữ pháp cấu trúc ngữ đoạn Các thành tố không liên tục • Trong những nội dung đã đề cập, chúng ta đã ngầm giả định là các thành tố của một kết cấu luôn có vị trí cạnh nhau trong câu. • Có những trường hợp không đúng, chẳng hạn: “John called Bill up” • Thành tố “called … up” có tính chất không liên tục. 24 Ngữ pháp cấu trúc ngữ đoạn Các qui tắc “bổ sung” • Ngữ pháp của một ngôn ngữ có thể bao gồm các qui tắc thuộc hai loại khác nhau: – Các qui tắc cấu trúc ngữ đoạn, – Các qui tắc “bổ sung”: có chức năng “cải biến” các chuỗi ký hiệu kết thúc (được tạo sinh bằng các qui tắc cấu trúc thành tố) thành những câu thực sự. 25 Ngữ pháp cấu trúc ngữ đoạn • Tất cả các quy tắc cấu trúc thành tố (trong các ví dụ) đều thuộc dạng chung: A -> B, “viết lại A thành B”. • Các qui tắc viết lại này được gọi là các qui tắc tự do đối với bối cảnh vì chúng ta viết lại A thành B mà không cần biết bối cảnh của A là gì. 26 Ngữ pháp cấu trúc ngữ đoạn Tương đương yếu và mạnh • Các kết quả nghiên cứu ngữ pháp về mặt lý luận chứng minh được rằng các ngữ pháp cấu trúc thành tố (với những đặc tính hình thức khác nhau) có thể tạo sinh đúng cùng một tập hợp câu. • Các ngữ pháp nào tạo sinh cùng một tập hợp câu thì được gọi là tương đương yếu. 27 Ngữ pháp cấu trúc ngữ đoạn • Những ngữ pháp nào không những tạo sinh các câu giống nhau mà còn gán cho chúng cùng một sơ đồ cấu trúc giống nhau thì được gọi là tương đương mạnh. 28
File đính kèm:
- Bài giảng Ngôn ngữ học máy tính - Nguyễn Tuấn Đăng - Cấu trúc ngữ pháp.pdf