Bài giảng Chương trình dịch - Giới thiệu môn học
Trình biên dịch
→ Có nhiệm vụ dịch một chương trình từ ngôn ngữ này sang ngôn ngữ khác (chương trình thực thi được)
→ Chương trình nên được cải tiến bằng cách này hay cách khác
Trình thông dịch
→ Đọc một chương trình và sinh ra kết quả thực thi chương trình đó
Nguyễn Phương Thái Bộ môn Khoa học Máy tính Thông tin môn học Giảng viên Nguyễn Phương Thái Trang nhà: Trợ giảng: Lê Minh Khôi (Bộ môn Khoa học Máy tính) Nguyễn Duy Khương (Phòng thí nghiệm Tương tác Người-Máy) Môn học tiên quyết: lập trình (C/C++, Java), toán rời rạc, cấu trúc dữ liệu và giải thuật * * Thông tin môn học Sách và tài liệu tham khảo [1] Bài giảng Lý thuyết và Thực hành Chương Trình Dịch. Lê Anh Cường, Khoa Công nghệ, ĐHQG Hà Nội, 2004 [2] Giáo trình lý thuyết, thực hành môn học Chương trình dịch. Phạm Hồng Nguyên, Khoa Công nghệ, ĐHQG Hà Nội, 1998 [3] Ngôn ngữ hình thức. Nguyễn Văn Ba, ĐHBK Hà Nội, 1994 [4] Thực hành kỹ thuật biên dịch. Nguyễn Văn Ba, ĐHBK Hà Nội, 1993 [5] Compiler: principles techniques and tools. A.V. Aho, Ravi Sethi, D. Ulman, 1986 * * Thông tin môn học Khóa học tương tự: Trang web môn học (cho cả hai lớp K51CC và K51CD): * * Chương trình dịch là gì? Nhận dạng chương trình hợp lệ (hay không) Sinh đúng (và hiệu quả) mã * * Chương trình dịch Mã đích Mã nguồn Lỗi Các loại chương trình dịch Trình biên dịch → Có nhiệm vụ dịch một chương trình từ ngôn ngữ này sang ngôn ngữ khác (chương trình thực thi được) → Chương trình nên được cải tiến bằng cách này hay cách khác Trình thông dịch → Đọc một chương trình và sinh ra kết quả thực thi chương trình đó * * * Ngôn ngữ máy, hợp ngữ, và ngôn ngữ bậc cao Ngôn ngữ máy Đây là ngôn ngữ duy nhất máy tính có thể hiểu trực tiếp “Ngôn ngữ tự nhiên” của máy tính Được định nghĩa bằng cách thiết kế phần cứng Phụ thuộc máy Nói chung bao gồm các xâu của các số nhị phân Ra lệnh cho máy tính thực hiện các phép toán cơ sở Mỗi lần một lệnh Khó hiểu với con người Ví dụ: +1300042774+1400593419+1200274027 * Ngôn ngữ máy, hợp ngữ, và ngôn ngữ bậc cao Hợp ngữ Sử dụng các từ viết tắt tiếng Anh để biểu diễn lệnh Dễ hiểu hơn với con người Nhưng lại không phải là “ngôn ngữ tự nhiên” của máy tính Cần các trình biên dịch: hợp ngữ ngôn ngữ máy Ví dụ: LOAD BASEPAYADD OVERPAYSTORE GROSSPAY * Ngôn ngữ máy, hợp ngữ, và ngôn ngữ bậc cao Các ngôn ngữ bậc cao Tương tự tiếng Anh ngày nay, sử dụng các ký hiệu toán học thông dụng Một câu lệnh đơn có thể thực hiện một khối lượng công việc đáng kể so với chương trình tương ứng viết bằng hợp ngữ Ví dụ: grossPay = basePay + overTimePay Các nhiệm vụ của sinh viên Học các kỹ thuật, thuật toán, và công cụ của chương trình dịch Học cách sử dụng chương trình dịch (và chương trình gỡ rối) hiệu quả hơn Hiểu hơn về hành vi của chương trình Học cách xây dựng một hệ thống lớn và đáng tin cậy * * Tri thức sinh viên cần đạt được Ôtômát hữu hạn trạng thái và quan hệ với biểu thức chính qui Văn phạm phi ngữ cảnh và quan hệ với phân tích cú pháp phi ngữ cảnh Các chiến lược đặc tả ngôn ngữ hình thức Phân tích từ dưới lên và từ trên xuống Văn phạm thuộc tính Kiểm tra kiểu Máy ảo Java * * Kỹ năng sinh viên cần đạt được Có thể tự xây dựng các hệ phân tích từ tố, phân tích cú pháp, phân tích ngữ nghĩa và sinh mã Có thể sử dụng các công cụ xây dựng chương trình dịch: từ vựng và cú pháp Biết cách mô tả cú pháp và ngữ nghĩa của một ngôn ngữ Hiểu về sinh mã Hiểu về máy ảo, đặc biệt là JVM * * Kiến trúc của một chương trình dịch * * Phân tích từ tố (từ vựng) Phân tích ngữ nghĩa Phân tích cú pháp Sinh mã trung gian Tối ưu mã Sinh mã đích Mã nguồn Mã đích Phân tích từ vựng Nhiệm vụ Nhóm các ký tự thành các từ tố -- các đơn vị của cú pháp Ví dụ: position = initial + rate * 60 Sẽ được phân tích là: identifier position (tên) assignment operator = (toán tử gán) identifier initial (tên) plus sign (dấu trừ) multiplication sign (dấu nhân) interger constant 60 (hằng số nguyên) Xâu ký tự tạo thành từ tố gọi là từ vị * * Phân tích cú pháp Nhiệm vụ của hệ phân tích cú pháp (parser) Nhóm các từ tố thành các cụm từ cú pháp Biểu diễn các cụm từ cú pháp thành các cây cú pháp trừu tượng AST (abstract syntax tree) Sinh ra các thông báo lỗi đúng Cố gắng phát hiện và khôi phục lỗi Cú pháp của một ngôn ngữ lập trình thường được mô tả bằng một văn phạm phi ngữ cảnh (context-free grammar – CFG) * * Ví dụ về văn phạm phi ngữ cảnh * * * * Phân tích ngữ nghĩa Nhiệm vụ của hệ phân tích ngữ nghĩa Phát hiện lỗi ngữ nghĩa của chương trình, chẳng hạn: Các biến có được khai báo trước khi sử dụng hay không? Các toán hạng có tương thích về kiểu hay không? Các thủ tục có được gọi với đúng số lượng và kiểu tham số hay không? Một công việc quan trọng: kiểm tra kiểu Bảng ký hiệu (symbol table) sẽ được sử dụng * * Sinh mã trung gian Hệ sinh mã trung gian sinh ra một biểu diễn trung gian (intermediate representation – IR) Các đặc điểm quan trọng của IR Dễ sinh Dễ dịch thành mã máy Sự khôn khéo trong thiết kế IR rất ảnh hưởng tới tốc độ và hiệu quả của trình biên dịch Các IR phổ biến: Cây cú pháp trừu tượng (ASTs) Đồ thị định hướng không có chu trình (DAGs) Chú giải hậu tố Mã ba địa chỉ (3AC or quadruples) * * Tối ưu mã Nhiệm vụ của hệ tối ưu mã Phân tích và cải tiến IR Mục tiêu là giảm thời gian chạy Bảo toàn giá trị Các tối ưu phổ biến Phát hiện và truyền đi một số giá trị hằng Chuyển một tính toán tới một nơi được thực hiện với tần suất ít hơn Phát hiện và loại bỏ tính toán không hiệu quả Loại bỏ các đoạn mã vô dụng hoặc không bao giờ được thực hiện * * Sinh mã Nhiệm vụ của hệ sinh mã Sinh mã đích: mã máy có thể định vị lại được hoặc mã hợp ngữ Chọn các chỉ thị cho mỗi thao tác IR (IR operation) Quyết định xem giữ lại cái gì trong các thanh ghi tại mỗi thời điểm * * * * Phát hiện, thông báo, và phục hồi lỗi Phát hiện Lỗi từ vựng: “123 => xâu ký tự không được kết thúc đúng Lỗi cú pháp: ví dụ quên đóng dấu ngoặc Lỗi ngữ nghĩa: sử dụng các toán hạng không tương thích về kiểu đối với một phép toán nào đó Thông báo chính xác nhất có thể vị trí xuất hiện lỗi Sau khi phát hiện lỗi, chương trình cần có khả năng hồi phục và tiếp tục, cho phép phát hiện các lỗi khác nữa (thuộc phần chương trình còn lại) * * Đề cương môn học Phân tích từ vựng Biểu thức chính qui, NFA và DFA Chương trình sinh bộ phân tích từ vựng (lex và JLex) Văn phạm phi ngữ cảnh Phân tích cú pháp Cây cú pháp trừu tượng Phân tích đệ qui từ trên xuống và LL(k) Phân tích từ dưới lên và LR(k) Các chương trình sinh bộ phân tích cú pháp (yacc, JavaCC, JavaCUP) Phân tích ngữ nghĩa Bảng ký hiệu Định danh (i.e., binding) Kiểm tra kiểu Sinh mã Dịch dựa vào cú pháp Hợp ngữ Jasmin Máy ảo Java (JVMs) * * Các bài tập * * VC (a variant of C) Chú thích: // và /* */ Kiểu: Cơ sở: void, int, float và boolean Mảng: int[], float[], boolean[] Biến: toàn cục và cục bộ Literals: integers, reals, boolean, strings Biểu thức: điều kiện, quan hệ, số học và lời gọi Câu lệnh: if, for, while, gán, break, continue, return Các hàm: với tham số được truyền bởi giá trị Sinh viên sẽ cần đọc kỹ tài liệu đặc tả VC để hiểu rõ về ngôn ngữ này * * Kế hoạch Tổng thời gian: 15 tuần 10 tuần học lý thuyết 5 tuần cho bài tập Bài tập 1: tuần 3 2: 6 3: 9 4: 12 5: 15 * * Cách học Hoàn thành mỗi bài tập đúng hạn! Hiểu các lý thuyết được giới thiệu trong các bài giảng và áp dụng chúng khi cài đặt các môđun chương trình Đọc thêm tài liệu Thảo luận Ở lớp Qua trang web môn học Gặp thầy * * Đánh giá Qua bài tập Qua kiểm tra cuối kỳ * * Tổng kết Mục tiêu của bài giảng Tổng quan về chương trình dịch Tổng quan về nội dung sinh viên sẽ học và sẽ làm Một chú ý nhỏ: Sinh viên cần nắm được thuật ngữ (cả Anh và Việt) * *
File đính kèm:
- Bài giảng Chương trình dịch - Giới thiệu môn học.ppt