Trình biên dịch - Chương 5: Dịch trực tiếp cú pháp
Khi viết một chương trình bằng một ngôn ngữlập trình nào đó, ngoài việc quan tâm
đến cấu trúc của chương trình (cú pháp – văn phạm), ta còn phải chú ý đến ý nghĩa của
chương trình. Nhưvậy, khi thiết kếmột trình biên dịch, ta không những chú ý đến văn
phạm mà còn chú ý đến cảngữnghĩa. Chương 5 trình bày các cách biểu diễn ngữ
nghĩa của một chương trình. Mỗi ký hiệu văn phạm kết hợp với một tập các thuộc tính
– các thông tin. Mỗi luật sinh kết hợp với một tập các luật ngữnghĩa– các quy tắc xác
định trịcủa các thuộc tính. Việc đánh giá các luật ngữnghĩa được sửdụng đểthực
hiện một công việc nào đó nhưtạo ra mã trung gian, lưu thông tin vào bảng ký hiệu,
xuất các thông báo lỗi, v.v. Ta sẽthấy rõ việc đánh giá này ởcác chương sau: 6, 8, 9.
Hai cách đểkết hợp các luật sinh với các luật ngữnghĩa được trình bày trong chương
là: Định nghĩa trực tiếp cú phápvà Lược đồdịch. Ởmức quan niệm, bằng cách sử
dụng định nghĩa trực tiếp cú pháp hoặc lược đồdịch, ta phân tích dòng thẻtừ, xây
dựng cây phân tích cú pháp và duyệt cây khi cần để đánh giá các luật ngữnghĩa tại các
nút của cây.
( num.val) }
Với biểu thức 9 - 5 + 2 ta có cây phân tích cú pháp (hình 5.16)
Ðể xây dựng một lược đồ dịch, chúng ta xét hai trường hợp sau đây:
Trường hợp 1: Chỉ chứa thuộc tính tổng hợp:
127
Với mỗi một luật ngữ nghĩa, ta tạo một hành vi ngữ nghĩa và đặt hành vi này vào
cuối vế phải luật sinh.
Ví dụ 5.13:
Luật sinh Luật ngữ nghĩa
T Æ T1 * F T.val := T1.val * F.val
Ta có lược đồ dịch:
T Æ T1 * F { T.val := T1.val * F.val}
Trường hợp 2: Có cả thuộc tính tổng hợp và kế thừa phải thỏa mãn 3 yêu cầu sau
đây:
1. Thuộc tính kế thừa của một ký hiệu trong vế phải của luật sinh phải được xác
định trong hành vi nằm trước ký hiệu đó.
2. Một hành vi không được tham khảo tới thuộc tính tổng hợp của một ký hiệu
nằm bên phải hành vi đó.
3. Thuộc tính tổng hợp của ký hiệu chưa kết thúc trong vế trái chỉ có thể được
xác định sau khi tất cả các thuộc tính mà nó tham khảo đã được xác định. Hành vi xác
định các thuộc tính này luôn đặt cuối vế phải của luật sinh.
Với một định nghĩa trực tiếp cú pháp L_thuộc tính ta có thể xây dựng lược đồ
dịch thỏa mãn 3 yêu cầu nói trên.
E
9
{ print(‘9’) } R
R
R
ε
T
T - { print(‘-’) }
5 { print(‘5’) }
+ T { print(‘+’) }
2 { print(‘2’) }
Hình 5.17 - Cây phân tích cú pháp của các hoạt động biểu diễn 9-5+2
Ví dụ 5.14: Bộ xử lý các công thức toán học – EQN - có thể xây dựng các biểu
thức toán học từ các toán tử sub (subscripts) và sup (superscripts). Chẳng hạn:
input output
BOX sub box BOX box
a sub {i sup 2 } 2ia
128
Ðể xác định chiều rộng và chiều cao của các hộp ta có định nghĩa L_thuộc tính như
sau:
Luật sinh Luật ngữ nghĩa
S Æ B
B Æ B1B2
B Æ B1 sub B2
B Æ text
B.ps := 10
S.ht := B.ht
BB1.ps := B.ps
BB2.ps := B.ps
B.ht := max(B1.ht, B2.ht)
BB1.ps := B.ps
BB2.ps := shrink(B.ps)
B.ht := disp(B1.ht, B2.ht)
B.ht := text.h * B.ps
Hình 5.18 - Ðịnh nghĩa trực tiếp cú pháp xác định kích thước và chiều cao của các
hộp
Trong đó:
- Ký hiệu chưa kết thúc B biểu diễn một công thức.
- Luật sinh B → BB biểu diễn sự kề nhau của hai hộp.
- Luật sinh B → B sub B biểu diễn sự sắp đặt, trong đó hộp chỉ số thứ 2 có kích
thước nhỏ hơn, nằm thấp hơn hộp thứ nhất.
- Thuộc tính kế thừa ps (point size - kích thước điểm) phản ánh độ lớn của công
thức.
- Luật sinh B → text ứng với luật ngữ nghiã B.ht:= text.h * B.ps lấy chiều cao
thực của text (h) nhân với kích thước điểm của B để có được chiều cao của
hộp.
- Luật sinh B → B1B2 được áp dụng thì B1, B2 kế thừa kích thước điểm của B
bằng luật copy. Ðộ cao của B bằng giá trị lớn nhất trong độ cao của B1, B2.
- Khi luật sinh B → B1 sub B2 được áp dụng thì hàm shrink sẽ giảm kích thước
điểm của B2 còn 30% và hàm disp đẩy hộp B2 xuống.
Ðây là một định nghĩa L_thuộc tính vì chỉ có duy nhất một thuộc tính kế thừa ps và
thuộc tính này chỉ phụ thuộc vào vế trái của luật sinh.
Dựa vào 3 yêu cầu nói trên, ta xen các hành vi ngữ nghĩa tương ứng với luật ngữ
nghĩa vào vế phải của mỗi luật sinh để được lược đồ dịch.
S Æ {B.ps := 10 }
B {S.ht := B.ht }
B Æ { B1.ps := B.ps }
B1 {BB2.ps := B.ps }
B2 {B.ht := max(B1.ht, B2.ht ) }
129
B Æ {B1.ps := B.ps }
B1
sub {BB2.ps := shrink(B.ps) }
B2 {B.ht := disp(B1.ht, B2.ht ) }
B Æ text {B.ht := text.h * B.ps }
Hình 5.19 - Lược đồ dịch được tạo ra từ hình 5.18
Chú ý: Ðể dễ đọc mỗi ký hiệu văn phạm trong luật sinh được viết trên một dòng
và hành vi được viết vào bên phải.
Chẳng hạn:
S Æ {B.ps := 10 } B {S.ht := B.ht }
Ðược viết thành S Æ {B.ps := 10 }
B {S.ht := B.ht }
V. DỊCH TRÊN XUỐNG
1. Loại bỏ đệ qui trái
Vấn đề loại bỏ đệ qui trái của một văn phạm đã được trình bày trong mục III của
chương IV. Ở đây chúng ta giải quyết vấn đề chuyển một lược đồ dịch của văn phạm
đệ quy trái thành một lược đồ dịch mới không còn đệ quy.
Giả sử, ta có lược đồ dịch dạng
A Æ A1 Y {A.a := g(A1.a, Y.y) }
A Æ X {A.a := f(X.x) }
Ðây là một văn phạm đệ quy trái, áp dụng giải thuật khử đệ qui trái ta được văn
phạm không đệ quy trái
A Æ X R
R Æ Y R | ε
Bổ sung hành vi ngữ nghĩa cho văn phạm ta được lược đồ dịch:
A Æ X { R.i := f(X.x) }
R {A.a := R.s }
R Æ Y {R1.i := g(R.i, Y.y) }
R1 {R.s := R1.s }
R Æ ε {R.s := R.i }
Ví dụ 5.15: Xét lược đồ dịch của văn phạm đệ quy trái cho biểu thức.
E Æ E1 + T {E.val := E1.val + T.val }
E Æ E1 - T {E.val := E1.val - T.val }
E Æ T {E.val := T.val }
130
T Æ (E) {T.val := E.val }
T Æ num {T.val := num.val }
Hình 5.20 - Lược đồ dịch của một văn phạm đệ quy trái
Vận dụng ý kiến trên ta khử đệ quy trái để được lược đồ dịch không đệ quy trái
E Æ T {R.i := T.val }
R {E.val := R.s }
R Æ +
T {R1.i := R.i + T.val }
R1 {R.s := R1.s }
R Æ -
T {R1.i := R.i - T.val }
R1 {R.s := R1.s }
R Æ ε {R.s := R.i }
T Æ (
E
) {T.val := E.val }
T Æ num { T.val := num.val }
Hình 5.21 - Lược đồ dịch đã được chuyển đổi có văn phạm đệ quy phải
Chẳng hạn đánh giá biểu thức 9 - 5 + 2 E
T.val = 9
Hình 5.22 - Xác định giá trị của biểu thức 9-5+2
Ví du 5.16: Xét lược đồ dịch xây dựng cây cú pháp cho biểu thức
E Æ E1 + T {E.nptr := mknode(‘+’, E1.nptr, T.nptr) }
E Æ E1 - T {E.nptr := mknode(‘-’, E1.nptr, T.nptr) }
E Æ T {E.nptr := T.nptr }
T Æ (E) {T.nptr := E.nptr }
T Æ id {T.nptr := mkleaf(id, id.entry) }
R.i = 6
num.val = 9
R.i = 9
+
T.val = 5
num.val = 5
R.i = 4
T.val = 2
num.val = 2
-
ε
131
T Æ num {T.nptr := mkleaf(num, num.val) }
Áp dụng quy tắc khử đệ quy trái trên với E ≈ A, +T, -T ≈ Y và T ≈ X ta có lược đồ
dịch
E Æ T {R.i := T.nptr }
R {E.nptr := R.s }
R Æ +
T {R1.i := mknode(‘+’, R.nptr, T.nptr) }
R1 {R.s := R1.s }
R Æ -
T {R1.i := mknode(‘-’, R.nptr, T.nptr) }
R1 {R.s := R1.s }
R Æ ε {R.s := R.i }
T Æ (
E
) {T.nptr := E.nptr }
T Æ id {T.nptr := mkleaf(id, id.entry) }
T Æ num { T.nptr := mkleaf(num, num.val) }
Hình 5.23 - Lược đồ dịch được chuyển đổi để xây dựng cây cú pháp
2. Thiết kế bộ dịch dự đoán
Giải thuật: Xây dựng bộ dịch trực tiếp cú pháp dự đoán (Predictive - Syntax -
Directed Translation)
Input: Một lược đồ dịch cú pháp trực tiếp với văn phạm có thể phân tích dự đoán.
Output: Mã cho bộ dịch trực tiếp cú pháp.
Phương pháp:
1. Với mỗi ký hiệu chưa kết thúc A, xây dựng một hàm có các tham số hình thức
tương ứng với các thuộc tính kế thừa của A và trả về giá trị của thuộc tính tổng
hợp của A.
2. Mã cho ký hiệu chưa kết thúc A quyết định luật sinh nào được dùng cho ký hiệu
nhập hiện hành.
3. Mã kết hợp với mỗi luật sinh như sau: chúng ta xem xét token, ký hiệu chưa kết
thúc và hành vi bên phải của luật sinh từ trái sang phải
i) Ðối với token X với thuộc tính tổng hợp x, lưu giá trị của x vào trong biến
được khai báo cho X.x. Sau đó phát sinh lời gọi để hợp thức (match) token X và
dịch chuyển đầu đọc.
132
ii) Ðối với ký hiệu chưa kết thúc B, phát sinh lệnh gán C := B(b1, b2, ..., bk) với
lời gọi hàm trong vế phải của lệnh gán, trong đó b1, b2,..., bk là các biến cho các
thuộc tính kế thừa của B và C là biến cho thuộc tính tổng hợp của B.
iii) Ðối với một hành vi, chép mã vào trong bộ phân tích cú pháp, thay thế mỗi
tham chiếu tới một thuộc tính bởi biến cho thuộc tính đó.
Ví dụ 5.17: Xét lược đồ dịch cho việc xây dựng cây cú pháp cho biểu thức. Ta thấy
đó là một văn phạm LL(1) nên phù hợp cho phân tích trên xuống. Với 3 ký hiệu chưa
kết thúc E, R, T ta xây dựng 3 hàm tương ứng:
function E: ↑ syntax - tree - node; /* E không có thuộc tính kế thừa */
function R (i : ↑ syntax - tree - node) : ↑ syntax - tree - node
function T : ↑ syntax - tree - node;
Dùng token addop biểu diễn cho + và - ta có thể kết hợp hai luật sinh thành một
luật sinh mới.
R Æ addop
T {R1.i := mknode(addop.lexeme, R.i, T.nptr) }
R1 {R.s := R1.s }
R Æ ε {R.s := R.i }
Ta có hàm R như sau:
function R(i : ↑ syntax_ tree_node) : ↑ syntax_tree_node;
var nptr, i1, s1, s : ↑ syntax_tree_node;
addoplexeme : char;
begin
if lookahead = addop then
begin /* luật sinh R → addop TR */
addoplexeme := lexval;
match(addop);
nptr := T;
i1 := mknode(addoplexeme, i, nptr);
s1 := R(i1);
s := s1;
end
else s := i; /* Luật sinh R → ε */
return s;
end;
Hình 5.24 - Xây dựng cây cú pháp đệ quy giảm
133
BÀI TẬP CHƯƠNG V
5.1. Xây dựng một cây phân tích cú pháp chú thích cho biểu thức số học sau:
(4 * 7+ 1) * 2
5.2. Xây dựng một cây phân tích cú pháp và cây cú pháp cho biểu thức ((a) + (b)) theo:
a) Ðịnh nghĩa trực tiếp cú pháp cho biểu thức số học.
b) Lược đồ dịch cho biểu thức số học.
5.3. Xây dựng một DAG cho các biểu thức sau đây:
a) a + a + ( a+ a + a + ( a+ a+ a+ a))
b) x *( 3 *x + x * x)
5.4. Văn phạm sau đây sinh ra các biểu thức có được khi áp dụng một toán tử số học +
cho các hằng số nguyên và số thực. Khi 2 số nguyên được công lại, kiểu kết quả là
kiểu nguyên, ngược lại nó là kiểu số thực.
E → E + T | T
T → num • num | num
a) Ðưa ra một định nghĩa trực tiếp cú pháp xác định kiểu của mỗi biểu thức con.
b) Mở rộng định nghĩa trực tiếp cú pháp trên để dịch các biểu thức thành ký
pháp hậu tố và xác định các kiểu. Dùng toán tử một ngôn inttoreal để chuyển một giá
trị nguyên thành giá trị thực tương đương mà nhờ đó cả hai toán hạng của + ở dạng
hậu tố có cùng kiểu.
5.5. Giả sử các khai báo sinh bởi văn phạm sau:
D → id L
L → , id L | : T
T → integer | real
a) Xây dựng một lược đồ dịch để nhập kiểu của mỗi định danh vào bảng danh
biểu.
b) Xây dựng chương trình dịch dự đoán từ lược đồ dịch trên.
134
5.6. Cho văn phạm sinh ra các dòng text như sau:
S → L
L → L B | B
B → B sub F | F
F → { L } | text
a) Xây dựng một định nghĩa trực tiếp cú pháp cho văn phạm.
b) Chuyển định nghĩa trực tiếp cú pháp trên thành lược đồ dịch.
c) Loại bỏ đệ quy trái trong lược đồ dịch vừa xây dựng.
135
File đính kèm:
chuong5_uni.pdf

