Bài giảng Ngôn ngữ học máy tính - Nguyễn Tuấn Đăng - Giới thiệu ngôn ngữ học lý thuyết

Nguồn gốc triết học: xuất phát từ Hy Lạp ở thế

kỷ thứ V trước C.N.

• Đối lập trong quan điểm: ngôn ngữ là “tự

nhiên” hay “ qui ước”?

– “ Tự nhiên”: bắt nguồn từ những nguyên lý vĩnh

cửu và bất biến nằm ngoài bản thân con người.

– “Qui ước”: do thói quen và truyền thống của cộng

đồng sử dụng ngôn ngữ.

pdf45 trang | Chuyên mục: Ngôn Ngữ Học Máy Tính | Chia sẻ: dkS00TYs | Lượt xem: 2033 | Lượt tải: 5download
Tóm tắt nội dung Bài giảng Ngôn ngữ học máy tính - Nguyễn Tuấn Đăng - Giới thiệu ngôn ngữ học lý thuyết, để xem tài liệu hoàn chỉnh bạn click vào nút "TẢI VỀ" ở trên
với quan điểm “tương đồng”.
=> Các nhà “bất thường”: không phủ nhận có
những hợp qui tắc trong sự hình thành các từ
trong ngôn ngữ nhưng chỉ ra nhiều trường
hợp có các từ bất qui tắc.
=> Một vài dẫn chứng: hiện tượng đồng nghĩa,
đồng âm.
11
Hợp qui tắc
• Hai trường phái “tương đồng” và “bất
thường” đều thừa nhận rằng có những “hợp
qui tắc” nhất định trong ngôn ngữ và cả hai
đều góp phần hệ thống hóa ngữ pháp.
• Không có định nghĩa rõ ràng và không có quan
điểm chung về sự “hợp qui tắc”.
12
Giai đoạn Alexandria
• Sự thành lập thư viện lớn ở Alexandria (thuộc
địa Hy Lạp): trung tâm nghiên cứu văn học và
ngôn ngữ học (thế kỷ thứ III trước C.N).
• Hai sai lầm trong cách tiếp cận nghiên cứu:
– Xem ngôn ngữ nói là phụ thuộc và phát sinh từ
ngôn ngữ viết.
– Sự “trong sáng” của ngôn ngữ được duy trì nhờ
những người có học và sự “hư hỏng” là do kẻ thất
học.
13
Ngữ pháp Hy Lạp
• Protagoras: một nhà triết học ngụy biện thế kỷ V
trước CN đã phân biệt 3 “giống” ngữ pháp trong
tiếng Hy Lạp.
14
Ngữ pháp Hy Lạp
• Platon là người đầu tiên phân biệt minh bạch
“danh từ” và “động từ” (khoảng 429-347
trước CN).
– Danh từ: có thể hoạt động trong câu với tư cách là
chủ ngữ của phát biểu.
– Động từ: có thể diễn đạt hành động hay phẩm
chất được phát biểu.
(Chủ ngữ của một phát biểu gọi tên một sự vật mà
một điều gì đó sẽ được nói về nó; vị ngữ là thành
phần của câu nói một điều gì đó về sự vật được chủ
ngữ gọi tên).
15
Ngữ pháp Hy Lạp
• Hai điểm lưu ý:
– Định nghĩa các lớp ngữ pháp “danh từ” và “động
từ” dựa trên cơ sở logic học: như là những thành
tố của mệnh đề.
– Động từ và tính từ đều đặt chung vào một lớp.
• Những nhà ngữ pháp Hy Lạp sau đó đã thay
thế sự phân loại của Platon bằng một hệ
thống lưỡng phân khác: gộp danh từ và tính
từ trong cùng một loại.
16
Ngữ pháp Hy Lạp
• Aristote (384-322 trước CN): thêm lớp “liên từ”
vào hệ thống của Platon (“danh từ” và “động
từ”). “Liên từ” bao gồm tất cả những từ nào
không phải là “danh từ” và “động từ” theo
Platon.
• Nhận thức được phạm trù “thời” trong tiếng Hy
Lạp: những thay đổi có hệ thống trong hình thức
của động từ có thể tương quan với các khái niệm
về thời gian như “hiện tại” hay “quá khứ”.
17
Ngữ pháp Hy Lạp
• Trường phái triết học Stoic: phân biệt được
“hình thức” và “nghĩa”.
• Trường phái Stoic không coi ngôn ngữ là phản
ánh trực tiếp của tự nhiên, nhấn mạnh sự
thiếu tương ứng giữa từ và sự vật, những cái
phi logic của ngôn ngữ (phần lớn họ là những
nhà “bất thường”).
• Đầu tiên, phân biệt 4 thành phần lời nói: danh
từ, động từ, liên từ, mạo từ.
18
Ngữ pháp Hy Lạp
• Sau đó, phân biệt 5 thành phần lời nói: danh
từ chung, danh từ riêng, động từ, liên từ, mạo
từ. Tính từ được xếp vào danh từ.
• Phân biệt: động từ ngoại động và nội động.
• Phân biệt: chủ động và bị động.
• Phân biệt: hoàn thành hay không hoàn thành.
19
Giai đoạn La mã
• Các nhà ngữ pháp La mã tuân theo các mô
thức Hy Lạp không những trong các giả thuyết
tổng quát về ngôn ngữ mà ở các đặc điểm chi
tiết.
• Ngữ pháp La mã chia thành 3 bộ phận:
– Phần 1: nghệ thuật nói đúng, con chữ và âm tiết.
– Phần 2: các thành phần lời nói và sự biến đổi của
chúng theo giống, số, cách, …
– Phần 3: Phong cách, tu từ.
20
Giai đoạn La mã
• Giai đoạn sau của nghiên cứu ngữ pháp tiếng
Latin: Donatus (khoảng sau C.N 400 năm) và
Priscian (khoảng sau C.N 500 năm).
• Ngữ pháp của Donatus và Priscian nhằm để
giảng dạy ngữ pháp, được dùng suốt thời kz
trung cổ, cho đến thế kỷ 17.
21
Giai đoạn Trung cổ
• Tiếng Latin thống trị hệ thống giáo dục và xã
hội ở châu Âu.
• Phần lớn các sách ngữ pháp đều dựa trên
những sách ngữ pháp của Donatus và Priscian.
• Nhiều tiến bộ đã đạt được trong ngữ pháp
tiếng Latin và đã trở thành một bộ phận quan
trọng của ngữ pháp truyền thống.
22
NGÔN NGỮ HỌC HIỆN ĐẠI
23
Ferdinand de Saussure
• Ferdinand de Saussure (1857 – 1913).
• Các bài giảng “Cours de linguistique générale”
của ông được công bố năm 1915: do các học
trò của ông ghi chép và công bố sau khi ông
mất.
24
Ưu thế của ngôn ngữ nói
• Ngữ pháp truyền thống có xu hướng cho rằng
ngôn ngữ nói là yếu kém hơn và phụ thuộc vào
ngôn ngữ viết tiêu chuẩn.
• Các nhà ngôn ngữ học hiện đại chủ trường rằng
ngôn ngữ nói là có trước và chữ viết chỉ là một
cách thể hiện lời nói bằng một phương tiện khác.
• Tất cả các hệ thống chữ viết đều có thể được
chứng minh dựa trên các đơn vị của ngôn ngữ
nói.
25
Ngôn ngữ là khoa học mô tả
• Ngữ pháp truyền thống cho rằng ngôn ngữ
viết không chỉ cơ bản hơn ngôn ngữ nói mà
ngôn ngữ viết (đặc biệt là ngôn ngữ văn
chương) là “trong sáng” và “đúng” hơn ngôn
ngữ nói.
• Không có tiêu chí tuyệt đối cho tính “trong
sáng” và “đúng”.
26
Ngôn ngữ là khoa học mô tả
• Nhiệm vụ của nhà ngôn ngữ học là mô tả cách
mà người bản ngữ nói (và viết) với ngôn ngữ
của họ, chứ không phải là điển chế cách mà
người bản ngữ phải nói (và viết).
• Không phủ nhận việc nghiên cứu ngôn ngữ với
mục đích văn học và điển chế ngôn ngữ.
• Không bàn đến vấn đề chọn lựa phương ngữ
nào làm tiêu chuẩn để sử dụng rộng rãi hơn
cho cộng đồng.
27
Quan điểm “đồng đại”
• Sự đối lập giữa lịch đại và đồng đại.
• Việc nghiên cứu lịch đại cho một ngôn ngữ cụ
thể là miêu tả sự phát triển lịch sử của nó
theo thời gian.
• Sự nghiên cứu đồng đại về một ngôn ngữ là
mô tả một trạng thái cụ thể của ngôn ngữ đó
ở một thời điểm nào đó.
28
Quan điểm “đồng đại”
• Quan điểm đồng đại cho rằng những nhận xét
lịch sử là không cần thiết đối với việc nghiên
cứu trạng thái của một ngôn ngữ ở một thời
điểm cụ thể.
29
“Ngôn ngữ” và “lời nói”
• Các thành viên của một cộng đồng ngôn ngữ
tạo ra các phát ngôn khi họ sử dụng một ngôn
ngữ.
• Phát ngôn là đơn vị của “lời nói”: cho dù có
các biến thể cá nhân, các phát ngôn vẫn có thể
được mô tả dựa trên một hệ thống các qui tắc
ngữ pháp của ngôn ngữ được sử dụng để tạo
ra phát ngôn.
30
NGỮ PHÁP: CÁC NGUYÊN LÝ CĂN
BẢN
31
Ngữ pháp
• Từ “ngữ pháp” trong tiếng Hy Lạp có nghĩa là
“nghệ thuật viết” và bao gồm toàn bộ việc
nghiên cứu ngôn ngữ.
• Ngày nay, “ngữ pháp” được hiểu theo nghĩa
hẹp hơn, bao gồm: biến hình + cú pháp.
• Biến hình xử lý cấu trúc bên trong của từ.
• Cú pháp giải thích cách kết hợp các từ thành
câu.
32
Ngữ pháp “{ niệm”
• Ngữ pháp truyền thống được gọi là “ngữ pháp
ý niệm”.
• Ngữ pháp truyền thống giả thiết rằng có
những phạm trù ngữ pháp phổ quát cho mọi
ngôn ngữ: các thành phần lời nói, thời, thức,
thể…
• Hiện nay, giới ngôn ngữ học chấp nhận cách
tiếp cận hình thức trong nghiên cứu ngữ
pháp.
33
Ngữ pháp “{ niệm”
• Ngữ pháp hình thức đối lập với ngữ pháp ý
niệm: không giả thiết tồn tại những phạm trù
ngữ pháp phổ quát cho mọi ngôn ngữ.
• Ngữ pháp hình thức đòi hỏi nghiên cứu cấu
trúc của mọi ngôn ngữ một cách khách quan,
đúng với bản chất thực sự của chúng.
34
Ngữ nghĩa trong ngữ pháp
• Ngữ pháp hình thức đòi hỏi nghiên cứu độc
lập ngữ pháp với ngữ nghĩa.
• Lý do:
– cấu trúc ngữ pháp và cấu trúc ngữ nghĩa thường
không đồng nhất và tương hợp với nhau.
– Tách biệt nghiên cứu ngữ pháp và ngữ nghĩa chỉ là
sự phân chia về mặt phương pháp nghiên cứu.
35
Ngữ pháp hình thức
• Tính khả chấp: một phát ngôn khả chấp là một
phát ngôn đã hay có thể được tạo ra do một
người nói bản ngữ trong một bối cảnh thích
hợp nào đó và sẽ được chấp nhận ở những
người bản ngữ nói ngôn ngữ đang xét.
• Nhiệm vụ của nhà ngôn ngữ là xác định một
cách càng đơn giản càng tốt, trong ngôn ngữ
đang xét, những câu nào là khả chấp – bằng
một lý thuyết khái quát về cấu trúc ngôn ngữ.
36
Ngữ pháp hình thức
• Các phát ngôn có thể là khả chấp hay bất khả
chấp theo những cách khác nhau hay những
mức độ khác nhau.
• Không xét tính khả chấp xã hội: những phát
ngôn có nghĩa nhưng không lịch sự, …
37
Ngữ pháp hình thức
• Hợp ngữ pháp và có nghĩa:
– Một số phát ngôn sai ngữ pháp nhưng vẫn có thể
có nghĩa (khả chấp).
– Một số phát ngôn hợp ngữ pháp nhưng có thể vô
nghĩa.
– Một số phát ngôn vừa sai ngữ pháp vừa vô nghĩa.
38
Tính tạo sinh
• Mọi người bản ngữ của một ngôn ngữ đều có
thể tạo ra và hiểu những câu hoàn toàn mới
mà họ chưa từng nghe trước đó.
• Số lượng phát ngôn tiềm tàng của một ngôn
ngữ là vô hạn.
• Nhiệm vụ của nhà ngôn ngữ học là thiết lập là
thiết lập các qui tắc có khả năng giải thích bộ
phát ngôn tiềm tàng vô hạn của một ngôn
ngữ.
39
Tính tạo sinh
• Bất kz một ngữ pháp nào có thể giải thích cơ
chế tạo nên những phát ngôn tiềm tàng vô
hạn của một ngôn ngữ thì đều có tính “tạo
sinh”.
40
Ngữ pháp tạo sinh
• Thuật ngữ “tạo sinh” và “cải biến” thường bị
lẫn lộn vì chúng được Chomsky đưa vào đồng
thời trong ngôn ngữ học.
– Thuật ngữ “cải biến” đã được Harris sử dụng với ý
nghĩa tương tự như cách dùng của Chomsky.
• Ngữ pháp tạo sinh không nhất thiết là ngữ
pháp cải biến.
41
Ngữ pháp tạo sinh
• Thuật ngữ “tạo sinh” (Chomsky): được hiểu
bằng sự tổng hợp hai nghĩa phân biệt nhau:
– Dự phóng (dự đoán).
– Hiển ngôn (hình thức – đối lập với phi hình thức).
• Tính chất dự phóng của ngữ pháp tạo sinh: chỉ
bất cứ một bộ qui tắc cú pháp nào mô tả một
cách hiển ngôn hay ẩn ngôn một bộ câu bằng
cách dự phóng chúng thành một bộ câu lớn
hơn.
42
Ngữ pháp tạo sinh
• Một ngữ pháp có tính chất dự phóng: thiết lập
những câu hiện thực và những câu tiềm tàng
đúng ngữ pháp.
• Hầu hết các ngữ pháp trong lịch sử ngôn ngữ
học đều là “tạo sinh” theo tiêu chí “dự
phóng”.
43
Ngữ pháp tạo sinh
• Tính chất hiển ngôn của ngữ pháp tạo sinh:
tiền giả định một sự hình thức hóa lý thuyết
ngữ pháp.
• Thuật ngữ “hình thức” được dùng ở đây có ý
nghĩa đối lập với “phi hình thức”.
44
Các lớp ngữ pháp
• Trong ngữ pháp truyền thống, các thành phần
lời nói được định nghĩa một cách “{ niệm”:
danh từ là tên của một người hay sự vật nào
đó, …
• Ngữ pháp hình thức đặt ra hai vấn đề:
– Thiết lập những điều kiện để một từ thuộc một
lớp ngữ pháp => dựa trên nguyên tắc phân bố.
– Đặt tên các lớp ngữ pháp như thế nào?
45

File đính kèm:

  • pdfBài giảng Ngôn ngữ học máy tính - Nguyễn Tuấn Đăng - Giới thiệu ngôn ngữ học lý thuyết.pdf