Trình biên dịch - Chương 9: Kiểm tra kiểu

Nội dung chính:

Hai cách kiểm tra kiểu là kiểm tra tĩnh được thực hiện trong thời gian biên dịch

chương trình nguồn và kiểm tra động được thực hiện trong thời gian thực thi chương

trình đích. Trong chương này ta tập trung vào phần xửlý ngữnghĩa bằng cách kiểm tra

tĩnh mà cụthểlà kiểm tra kiểu. Phần đầu của chương trình bày các khái niệm về hệ

thống kiểu, các biểu thức kiểu. Phần còn lại mô tảcách tạo ra một bộkiểm tra kiểu đơn

giản.

Mục tiêu cần đạt:

Sau khi học xong chương này, sinh viên phải nắm được:

• Hệthống kiểu với các biểu thức kiểu (kiểu cơsởvà kiểu có cấu trúc) thường

gặp ởbất cứmột ngôn ngữlập trình nào.

• Dịch trực tiếp cú pháp cài đặt bộkiểm tra kiểu đơn giản từ đó có thểmởrộng

đểcài đặt cho những ngôn ngữphức tạp hơn.

pdf7 trang | Chuyên mục: Hệ Điều Hành | Chia sẻ: dkS00TYs | Lượt xem: 1652 | Lượt tải: 0download
Tóm tắt nội dung Trình biên dịch - Chương 9: Kiểm tra kiểu, để xem tài liệu hoàn chỉnh bạn click vào nút "TẢI VỀ" ở trên
hảo: 
[1] Compilers : Principles, Technique and Tools - Alfred V.Aho, Jeffrey 
D.Ullman - Addison - Wesley Publishing Company, 1986. 
[2] Modern Compiler Implementation in C - Andrew W. Appel - Cambridge 
University Press, 1997. 
[3] Compiler Design – Reinhard Wilhelm, Dieter Maurer - Addison - Wesley 
Publishing Company, 1996. 
I. HỆ THỐNG KIỂU 
 Trong các ngôn ngữ nói chung đều có kiểu cơ sở và kiểu có cấu trúc. Chẳng hạn 
trang Pascal, kiểu cơ sở là: boolean, char, integer, real, kiểu miền con và kiểu liệt kê. 
Các kiểu có cấu trúc như mảng, mẩu tin, tập hợp, ... 
1. Biểu thức kiểu 
 Biểu thức kiểu bao gồm: 
 1. Kiểu cơ sở là một biểu thức kiểu: boolean, char, integer, real. Ngoài ra còn có các 
kiểu cơ sở đặc biệt như: kiểu type_error: chỉ ra một lỗi trong quá trình kiểm tra kiểu; 
kiểu void, “không có giá trị”, cho phép kiểm tra kiểu đối với lệnh. 
 135
 2. Vì biểu thức kiểu có thể được đặt tên, tên kiểu là một biểu thức kiểu. 
 3. Cấu trúc kiểu là một biểu thức kiểu, các cấu trúc bao gồm: 
a. Mảng (array): Nếu T là một biểu thức kiểu thì array(I, T) là một biểu thức kiểu. 
Một mảng có tập chỉ số I và các phần tử có kiểu T. 
b. Tích (products): Nếu T1, T2 là biểu thức kiểu thì tích Decas T1* T2 là biểu 
thức kiểu. 
c. Mẩu tin (records): Là cấu trúc bao gồm một bộ các tên trường, kiểu trường. 
d. Con trỏ (pointers): Nếu T là một biểu thức kiểu thì pointer(T) là một biểu thức 
kiểu T. 
e. Hàm (functions): Một cách toán học, hàm ánh xạ các phần tử của tập xác định 
(domain) lên tập giá trị (range). Một hàm là một biểu thức kiểu D Æ R 
2. Hệ thống kiểu 
 Hệ thống kiểu là một bộ sưu tập các quy tắc để gán các biểu thức kiểu vào các phần 
của một chương trình. Bộ kiểm tra kiểu cài đặt một hệ thống kiểu. 
3. Kiểm tra kiểu tĩnh và động 
 Kiểm tra được thực hiện bởi chương trình dịch được gọi là kiểm kiểu tĩnh. Kiểm tra 
được thực hiện trong khi chạy chương trình đích gọi là kiểm tra kiểu động. 
II. ÐẶC TẢ MỘT BỘ KIỂM TRA KIỂU ÐƠN GIẢN 
 Trong phần này chúng ta mô tả một bộ kiểm tra kiểu cho một ngôn ngữ đơn giản 
trong đó kiểu của mỗi một danh biểu phải được khai báo trước khi sử dụng. Bộ kiểm 
tra kiểu là một lược đồ dịch mà nó tổng hợp kiểu của mỗi biểu thức từ kiểu của các 
biểu thức con của nó. 
1. Một ngôn ngữ đơn giản 
 Văn phạm sau sinh ra một chương trình, biểu diễn bởi một ký hiệu chưa kết thúc P 
chứa một chuỗi các khai báo D và một biểu thức đơn giản E. 
 P Æ D ; E 
 D Æ D ; D | id : T 
 T Æ char | integer | array[num] of T1 | ↑T1 
 E Æ literal | num | id | E1 mod E2 | E1 [E2] | E1↑ 
Hình 6.1 - Văn phạm của một ngôn ngữ đơn giản 
• Các kiểu cơ sở: char, integer và type-error 
• Mảng bắt đầu từ 1. Chẳng hạn array[256] of char là biểu thức kiểu (1...256, 
char) 
• Kiểu con trỏ ↑T là một biểu thức kiểu pointer(T). 
 Ta có lược đồ dịch để lưu trữ kiểu của một danh biểu 
 P Æ D ; E 
 136
 D Æ D ; D 
 D Æ id : T {addtype(id.entry, T.type) } 
 T Æ char {T.type := char } 
 T Æ integer {T.type := integer } 
 T Æ ↑T1 {T.type := pointer(T1.type) } 
 T Æ array[num] of T1 {T.type := array(1...num.val, T1.type) } 
Hình 6.2- Lược đồ dịch lưu trữ kiểu của một danh biểu 
2. Kiểm tra kiểu của biểu thức 
 Lược đồ dịch cho kiểm tra kiểu của biểu thức như sau: 
 E Æ literal {E.type := char } 
 E Æ num {E.type := integer } 
 E Æ id {E.type := lookup(id.entry) } 
 E Æ E1 mod E2 {E.type := if E1.type = integer and E2.type = integer 
 then integer else type_error } 
E Æ E1[E2] {E.type := if E2.type = integer and E1.type = array(s,t) 
 then t else type_error } 
 E Æ E1↑ { E.type := if E1.type = pointer(t) then t 
 else type_error } 
Hình 6.3- Lược đồ dịch kiểm tra kiểu của biểu thức 
 Ở đây ta dùng hàm lookup(e) để tìm kiểu được lưu trữ trong ô của bảng ký hiệu mà 
ô đó được trỏ bởi e. 
3. Kiểm tra kiểu của các lệnh 
 Ta có lược đồ dịch cho kiểm tra kiểu của lệnh 
 S Æ id := E 
{ S.type := if id.type = E.type then void else type_error } 
 S Æ if E then S1 
{S.type := if E.type = boolean then S1.type else type_error } 
 S Æ while E do S1 
{S.type := if E.type = boolean then S1.type else type_error } 
 S Æ S1 ; S2 {S.type := if S1.type = void and S2.type = void then void 
 else type_error } 
Hình 6.4- Lược đồ dịch kiểm tra kiểu của các lệnh 
 137
4. Kiểm tra kiểu của các hàm 
 Áp dụng hàm vào một đối số có thể được cho bởi luật sinh E → E (E). Lược đồ 
dịch cho kiểm tra kiểu cho một áp dụng hàm là: 
E Æ E1 (E2) {E.type := if E2.type = s and E1.type = s -> t then t 
 else type_error } 
Hình 6.5- Lược đồ dịch kiểm tra kiểu của hàm 
 Luật sinh trên biểu diễn rằng một biểu thức được hình thành áp dụng E1 lên E2, kiểu 
của E1 phải là một hàm s -> t từ kiểu s của E2 tới một kiểu giới hạn t nào đó; kiểu của 
E1 (E2) là t. 
III. SỰ TƯƠNG ÐƯƠNG CỦA CÁC BIỂU THỨC KIỂU 
 Thông thường kiểm tra kiểu có dạng: “nếu hai biểu thức kiểu bằng nhau thì trả về 
một kiểu ngược lại trả về type_error”. Ðiều quan trọng là cần xác định khi nào hai biểu 
thức kiểu tương đương. 
1. Tương đương cấu trúc 
 Hai biểu thức kiểu được gọi là tương đương cấu trúc nếu cấu trúc của chúng giống 
hệt nhau. 
 Ví dụ 6.1: 
- Biểu thức kiểu integer tương đương với integer vì chúng là một kiểu cơ sở. 
- pointer(integer) tương đương với pointer(integer) vì cả hai được hình thành 
bằng cách áp dụng cùng một cấu trúc con trỏ pointer lên các kiểu tương đương. 
 Giả sử, s và t là hai biểu thức kiểu, hàm sau kiểm tra xem chúng có tương đương 
hay không? 
 Function sequiv(s, t) : boolean; 
 Begin 
 if s và t cùng là một kiểu cơ sở then 
 return true 
 else if s = array(s1, s2) and t = array(t1, t2) then 
 return sequiv(s1, t1) and sequiv(s2, t2) 
 else if s = pointer(s1) and t = pointer(t1) then 
 return sequiv(s1, t1) 
 else if s = s1 -> s2 and t = t1 -> t2 then 
 return sequiv(s1, t1) and sequiv(s2, t2) 
 else return false; 
end; 
 138
Hình 6.6- Ðoạn ngôn ngữ giả kiểm tra sự tương đương cấu trúc của hai biểu thức 
kiểu s và t 
2. Tương đương tên 
 Trong một số ngôn ngữ, kiểu được cho bởi tên. Ví dụ trong Pascal 
 type link = ↑ cell; 
 var next : link; 
 last : link; 
 p : ↑cell; 
 q, r : ↑cell; 
 Danh biểu link được khai báo là tên của kiểu ↑cell. Vấn đề đặt ra là next, last, p, q, 
r có kiểu giống nhau hay không? Câu trả lời phụ thuộc vào sự cài đặt. Hai biểu thức 
kiểu là tương đương tên nếu tên của chúng giống nhau. Theo quan niệm tương đương 
tên thì last và next có cùng kiểu; p, q và r có cùng một kiểu nhưng next và p có kiểu 
khác nhau. 
IV. CHUYỂN ÐỔI KIỂU 
 Xét biểu thức x + i trong đó x có kiểu real và i có kiểu integer. Vì biểu diễn các số 
nguyên, số thực khác nhau trong máy tính do đó các chỉ thị máy khác nhau được dùng 
cho số thực và số nguyên. Trình biên dịch có thể thực hiện việc chuyển đổi kiểu để hai 
toán hạng có cùng kiểu khi phép toán cộng xảy ra. 
 Bộ kiểm tra kiểu trong trình biên dịch có thể được dùng để thêm các phép toán biến 
đổi kiểu vào trong biểu diễn trung gian của chương trình nguồn. Chẳng hạn ký hiệu 
hậu tố của x + i có thể là: x i inttoreal real+ 
 Trong đó: inttoreal đổi số nguyên i thành số thực, real+ thực hiện phép cộng các 
số thực. 
 Sự ép buộc chuyển đổi kiểu 
 Sự chuyển đổi từ kiểu này sang kiểu khác được gọi là ẩn (implicit) nếu nó được 
làm một cách tự động bởi chương trình dịch. Chuyển đổi kiểu ẩn còn gọi là ép buộc 
chuyển đổi kiểu (coercions). 
 Ví dụ 6.2: Ðịnh nghĩa trực tiếp cú pháp cho kiểm tra kiểu và ép buộc chuyển đổi 
kiểu biến đổi kiểu từ integer thành real: 
 Luật sinh Luật ngữ nghĩa 
 E Æ num E.type := integer 
 E Æ num.num E.type := real 
 E Æ id E.type := lookup(id.entry) 
 E Æ E1 op E2 E.type := if E1.type = integer and E2.type = integer 
 then integer 
 else if E1.type = integer and E2.type = real 
 139
 then real 
 else if E1.type = real and E2.type = integer 
 then real 
 else if E1.type = real and E2.type = real 
 then real 
 else type_error 
Hình 6.7- Ðịnh nghĩa trực tiếp cú pháp cho kiểm tra kiểu và ép buộc chuyển đổi kiểu 
 Chý ý rằng việc ép buộc chuyển đổi kiểu có thể dẫn đến sự lãng phí thời gian thực 
hiện chương trình. 
 Ví dụ 6.3: Với khai báo x là một mảng các số thực thì lệnh for i:=1 to n do 
x[i]:=1 thực hiện trong 48,4 micro giây còn lệnh for i:=1 to n do x[i]:=1.0 thực 
hiện trong 5,4 micro giây. Sở dĩ như vậy vì mã phát sinh cho lệnh thứ nhất chứa một 
lời gọi thủ tục đổi số nguyên thành số thực tại thời gian thực hiện. 
 140
BÀI TẬP CHƯƠNG VI 
6.1. Viết các biểu thức kiểu cho các kiểu dữ liệu sau đây: 
a) Một mảng của các con trỏ có kích thước từ 1 đến 100, trỏ đến đối tượng các số 
thực. 
b) Mảng 2 chiều của các số nguyên, hàng có kích thước từ 0 đến 9, cột có chỉ số 
từ -10 đến 10. 
c) Các hàm mà miền định nghĩa là các hàm với các đối số nguyên, trị là con trỏ 
trỏ đến các số nguyên và miền xác định của nó là các mẫu tin chứa số nguyên và ký tự. 
6.2. Giả sử có một khai báo C như sau: 
 typedef struct { 
 int a, b ; 
 } CELL, * PCELL ; 
 CELL foo [ 100 ] ; 
 PCELL bar (x, y) int x ; CELL y { .......... } 
Viết các biểu thức kiểu cho các kiểu dữ liệu foo và bar. 
6.3. Cho văn phạm sau đây định nghĩa chuỗi của các chuỗi ký tự: 
 P → D ; E 
 D → D ; D | id : T 
 T → list of T | char | integer 
 E → ( L ) | literal | num | id 
 L → E , L | E 
Hãy viết các quy tắc biên dịch để xác định các biểu thức kiểu (E) và list (L). 
6.4. Giả sử tên kiểu là link và cell được định nghĩa như ở phần tên cho biểu thức kiểu. 
Hãy xác định những biểu thức kiểu nào dưới đây là tương đương cấu trúc, những biểu 
thức kiểu nào tương đương tên. 
a) link 
b) pointer (cell) 
c) pointer (link) 
d) pointer (record ((info x integer) x ( next x pointer (cell))) 
6.5. Giả sử rằng kiểu của mỗi định danh là một miền con của số nguyên. Cho biểu thức 
với các phép toán +, - , * , div và mod như trong Pascal, hãy viết quy tắc kiểm tra kiểu 
để gán mỗi biểu thức con vào vùng miền con giá trị mă nó sẽ nằm trong đó. 
 141

File đính kèm:

  • pdfchuong6_uni.pdf