Bài giảng Ngôn ngữ học máy tính - Nguyễn Tuấn Đăng - Cấu trúc ngữ pháp

Trong ngữ pháp truyền thống: phân tích câu

thành chủ ngữ, vị ngữ, và các thành phần này

tiếp tục được phân tích thành các mệnh đề,

ngữ đoạn, từ.

• Thuật ngữ “thành tố trực tiếp” (Bloomfield,

1933): câu không phải là chuỗi tuyến tính các

thành tố mà có cấu trúc phân cấp các thành tố

trực tiếp.

pdf28 trang | Chuyên mục: Ngôn Ngữ Học Máy Tính | Chia sẻ: dkS00TYs | Lượt xem: 2130 | Lượt tải: 5download
Tóm tắt nội dung Bài giảng Ngôn ngữ học máy tính - Nguyễn Tuấn Đăng - Cấu trúc ngữ pháp, để xem tài liệu hoàn chỉnh bạn click vào nút "TẢI VỀ" ở trên
1Giới thiệu
Ngôn ngữ học lý thuyết
Biên soạn theo: “Introduction to 
theoretical linguistics”, John Lyons, bản
dịch của Vương Hữu Lễ, NXB Giáo dục, 
1997.
CẤU TRÚC NGỮ PHÁP
2
Thành tố trực tiếp
• Trong ngữ pháp truyền thống: phân tích câu
thành chủ ngữ, vị ngữ, và các thành phần này
tiếp tục được phân tích thành các mệnh đề,
ngữ đoạn, từ.
• Thuật ngữ “thành tố trực tiếp” (Bloomfield,
1933): câu không phải là chuỗi tuyến tính các
thành tố mà có cấu trúc phân cấp các thành tố
trực tiếp.
3
Thành tố trực tiếp
• Mỗi thành tố ở cấp độ thấp hơn là thành phần
của một thành tố ở cấp độ cao hơn.
• Có thể dùng cấu trúc cây hoặc dùng dấu
ngoặc. Hai cách này tương đương nhau.
Ví dụ: [(Poor John) (ran away)]
• Mô hình này không cho thấy chức năng ngữ
pháp của các thành tố như cách phân tích
phạm trù của ngữ pháp truyền thống.
4
Thành tố trực tiếp
5
Poor John ran away
y z
x
Ngữ pháp cấu trúc ngữ đoạn
• Bloomfield cho rằng một cách “phân tích
đúng” là chia câu thành các thành tố và coi đó
là một cách phân tích có tính đến nghĩa.
• Wells và Harris (các học trò của Bloomfield):
đã thiết lập các nguyên tắc phân tích thành tố
một cách chi tiết hơn – bằng những tiêu chí
tường minh (làm sáng tỏ điều mà Bloomfield
gọi là “có tính đến nghĩa”).
6
Ngữ pháp cấu trúc ngữ đoạn
• Chomsky đã hình thức hóa một cách hoàn
chỉnh nhất lý thuyết cấu trúc thành tố.
• “Ngữ pháp cấu trúc thành tố” là thuật ngữ
rộng hơn so với thuật ngữ “ngữ pháp cấu trúc
ngữ đoạn”.
7
Ngữ pháp cấu trúc ngữ đoạn
Các qui tắc viết lại
(1) S -> NP + VP
(2) VP -> V + Adv
(3) NP -> A + N
Nếu các qui tắc này được áp dụng thành chuỗi
sao cho: ký hiệu ở bên trái mũi tên của mỗi qui
tắc (trừ qui tắc (1)) được dùng để thay thế (hay
“viết lại”) một ký hiệu nào đó ở bên phải mũi
tên trong “output” đã “được đóng ngoặc” của
các qui tắc được áp dụng trước.
8
Ngữ pháp cấu trúc ngữ đoạn
Output của qui tắc (1):
S {NP + VP}
Áp dụng qui tắc (2) vào output của (1):
S {NP + VP (V + Adv)}
Áp dụng qui tắc (3) vào output của chuỗi các qui tắc
(1)-(2):
S {NP (A + N) + VP (V + Adv)}
9
Ngữ pháp cấu trúc ngữ đoạn
• Như vậy, mỗi qui tắc đã:
– Đóng ngoặc các thành tố tạo nên một kết cấu
được nó xác định, và
– Gán nhãn cho kết cấu đó.
• Nếu áp dụng qui tắc (3) trước qui tắc (2) thì
kết quả cũng tương đương trong ví dụ trên.
Nhưng qui tắc (1) phải được áp dụng trước để
sản sinh các yếu tốt cần thiết cho các qui tắc
(2) và (3).
10
Ngữ pháp cấu trúc ngữ đoạn
• Vế xuất hiện bên trái của qui tắc (1) được gọi
là ký hiệu khởi đầu, vế này chỉ:
– Kết cấu thuộc cấp độ cao nhất, và
– Tất cả các kết cấu khác được ngữ pháp tạo sinh ra
đều là thành tố của kết cấu đó.
• Sau khi áp dụng tất cả các qui tắc có liên quan
để tạo sinh một dạng câu cụ thể, ngữ pháp sẽ
sản sinh một chuỗi ký hiệu kết thúc đã được
đóng ngoặc.
11
Ngữ pháp cấu trúc ngữ đoạn
• Mỗi ký hiệu kết thúc chỉ một lớp yếu tố trong
bộ từ vựng: danh từ, động từ, tính từ, …
• Nếu thay thế mỗi ký hiệu kết thúc trong chuỗi
ký hiệu kết thúc bằng một thành viên của lớp
từ vựng mà nó chỉ thì sẽ được một câu có cấu
trúc thành tố hoàn toàn được qui định bởi các
qui tắc đã tạo sinh ra chuỗi các ký hiệu kết
thúc đó.
12
Ngữ pháp cấu trúc ngữ đoạn
Các qui tắc luân phiên
• Mục đích: Mở rộng ngữ pháp để có năng lực
sản sinh các câu như:
“Old men love young women”
ngoài các câu như:
“Poor John ran away”.
13
Ngữ pháp cấu trúc ngữ đoạn
Các qui tắc luân phiên
• Phương pháp: đưa ra các qui tắc cho phép
những cách luân phiên viết lại yếu tố VP.
(1) S -> NP + VP
(2a) VP -> Vintr + Adv
(2b) VP -> Vtr + NP
(3) NP -> A + N
14
Ngữ pháp cấu trúc ngữ đoạn
• Nguyên tắc: một trong hai qui tắc (2a) và (2b)
phải được áp dụng, nhưng việc chọn áp dụng
qui tắc nào là tự do.
• Hệ quả của phương pháp: cần thay đổi cách
phân loại từ trong bộ từ vựng:
– Vintr = {ran, …}
– Vtr = {love, …}
15
Ngữ pháp cấu trúc ngữ đoạn
• Nhận xét:
– Ngữ pháp trên tạo sinh đúng câu “Old men love
young women” nhưng cũng tạo sinh ra những câu
bất khả chấp “Poor John eat old women”.
– Ngoài ra, ngữ pháp trên cũng không giải quyết
được sự hòa hợp giữa chủ ngữ và động từ (vấn đề
chia động từ).
– Ngữ pháp trên không thể tạo sinh các câu như:
“John ran”, “John ran way”, ...
16
Ngữ pháp cấu trúc ngữ đoạn
Các qui tắc tùy chọn và các qui tắc bắt buộc
• Mục đích: để ngữ pháp trên có thể tạo sinh ra các
câu như: “John ran”, “John ran way”, ...
• Phương pháp: Tách qui tắc (3) thành hai qui tắc:
(3) NP -> N
(4) N -> A + N
Xác định qui tắc (3) là bắt buộc, qui tắc (4) là tùy
chọn.
17
Ngữ pháp cấu trúc ngữ đoạn
• Nhận xét:
– Việc đưa ra các qui tắc tùy chọn và luân phiên có
thể tăng thêm sức mạnh cho ngữ pháp.
– Sinh ra các tiểu loại của một loại hình câu (trong
ngữ pháp ở ví dụ trên là loại hình câu: S -> NP +
VP).
18
Ngữ pháp cấu trúc ngữ đoạn
Trật tự của các qui tắc
• Giả định hiện tại (trong ngữ pháp ở ví dụ
trên): các qui tắc được áp dụng (tại vị trí có
thể áp dụng) theo trật tự mà chúng được
đánh số.
• Nhận xét về hệ quả của giả định (nêu trên): sự
áp đặt một trật tự nào đó cho các qui tắc có
thể sinh ra những kết quả khác nhau.
19
Ngữ pháp cấu trúc ngữ đoạn
• Xét hệ thống qui tắc cú pháp:
(1) S -> NP + VP
(2a) VP -> Vintr + Adv
(2b) VP -> Vtr + NP
(3) NP -> N
(4) N -> T + N
(5) N -> A + N
Các qui tắc (4) và (5) là tùy chọn.
20
Ngữ pháp cấu trúc ngữ đoạn
• Giả thiết rằng trong bộ từ vựng có: T = {the}.
• Vì các qui tắc (4) và (5) là tùy chọn nên ngữ
pháp sẽ tạo sinh: “men”, “the men”, “good
men”, “the good men”.
• Nếu qui tắc (5) được áp dụng trước qui tắc (4)
thì những chuỗi bất khả chấp như “good the
men” sẽ được xem là hợp ngữ pháp.
21
Ngữ pháp cấu trúc ngữ đoạn
Các qui tắc quy hồi
• Qui tắc đẳng lập các danh từ là qui tắc được áp
dụng nhiều lần: vì có những ngữ đoạn được tạo
ra bằng vô số danh từ nối nhau bằng “and”.
• Giải pháp đơn giản: sử dụng các qui tắc luân
phiên:
(6a) N -> N + and + N
(6b) N -> N + and + N + and + N
…
22
Ngữ pháp cấu trúc ngữ đoạn
• Giải pháp như trên là không thỏa đáng về
nguyên tắc bởi vì không có giới hạn về số
lượng danh từ đẳng lập theo cách đó (trong
tiếng Anh).
• Do đó: qui định rằng qui tắc (6) có thể áp dụng
vô số lần => các qui tắc như vậy được gọi là
qui tắc quy hồi.
23
Ngữ pháp cấu trúc ngữ đoạn
Các thành tố không liên tục
• Trong những nội dung đã đề cập, chúng ta đã
ngầm giả định là các thành tố của một kết cấu
luôn có vị trí cạnh nhau trong câu.
• Có những trường hợp không đúng, chẳng hạn:
“John called Bill up”
• Thành tố “called … up” có tính chất không liên
tục.
24
Ngữ pháp cấu trúc ngữ đoạn
Các qui tắc “bổ sung”
• Ngữ pháp của một ngôn ngữ có thể bao gồm
các qui tắc thuộc hai loại khác nhau:
– Các qui tắc cấu trúc ngữ đoạn,
– Các qui tắc “bổ sung”: có chức năng “cải biến” các
chuỗi ký hiệu kết thúc (được tạo sinh bằng các qui
tắc cấu trúc thành tố) thành những câu thực sự.
25
Ngữ pháp cấu trúc ngữ đoạn
• Tất cả các quy tắc cấu trúc thành tố (trong các
ví dụ) đều thuộc dạng chung: A -> B, “viết lại A
thành B”.
• Các qui tắc viết lại này được gọi là các qui tắc
tự do đối với bối cảnh vì chúng ta viết lại A
thành B mà không cần biết bối cảnh của A là
gì.
26
Ngữ pháp cấu trúc ngữ đoạn
Tương đương yếu và mạnh
• Các kết quả nghiên cứu ngữ pháp về mặt lý
luận chứng minh được rằng các ngữ pháp cấu
trúc thành tố (với những đặc tính hình thức
khác nhau) có thể tạo sinh đúng cùng một tập
hợp câu.
• Các ngữ pháp nào tạo sinh cùng một tập hợp
câu thì được gọi là tương đương yếu.
27
Ngữ pháp cấu trúc ngữ đoạn
• Những ngữ pháp nào không những tạo sinh
các câu giống nhau mà còn gán cho chúng
cùng một sơ đồ cấu trúc giống nhau thì được
gọi là tương đương mạnh.
28

File đính kèm:

  • pdfBài giảng Ngôn ngữ học máy tính - Nguyễn Tuấn Đăng - Cấu trúc ngữ pháp.pdf