Học XML tiếng Việt
Câu code HTML trên có chứa hai markup Tags, <P>và <STRONG>. Mỗi cặp
Tags gói dữliệu nó đánh dấu giữa opening Tagvà closing Tag. Hai closing
Tags ở đây là </P>và </STRONG>. Tất cảnhững gì nằm bên trong một cặp
Tags được gọi là Element. Đểnói thêm đặc tính của một Element, ta có thể
nhét Attributenhư aligntrong opening Tag của Element ấy dưới dạng
AttributeName="value", thí dụnhư align="center".
Vì Tags trong HTML được dùng đểformat (trìnhbày) tài liệu nên browser cần
biết ý nghĩa của mỗi Tag. Một browser hay HTML parser sẽthu thập các chỉthị
sau từcâu HTML trên:
1. Bắt đầu một Paragraph mới và đặt Text ởgiữa trang (<P
align="center">).
2. Hiển thịcâu Chào mừng bạn đến thăm
3. Hiển thịchữ Vovisoftcách mạnh mẽ(<STRONG>Vovisoft</STRONG>).
4. Hiển thịcâu Web site
5. Gặp điểm cuối của Paragraph (</P>)
Open TextStream for Output Set TS = Fs.OpenTextFile(App.Path & "\Library.htm", ForWriting, False, TristateUseDefault) TS.Write HTMLCode ' Write the whole HTML string in one stroke TS.Close ' Close the Text Stream Set Fs = Nothing ' Dispose FileSystem Object ' Display the HTML file in a listbox PopulateListBoxFromFile lstHTML, "Library.htm", False End Sub Dùng DOM để display XML trong TreeView I nternet Explorer 5.0 cho ta Document Object Model (DOM) ActiveX gọi là MSXML.DLL mà ta có thể dùng trong VB6. Ðầu tiên là Microsoft XML, version 2.0, tiếp theo đó là Microsoft XML, v2.6 và mới nhất là Microsoft XML, v3.0. Cả ba DLL nầy đều có trong danh sách các References mà ta có thể include khi dùng IDE Menu command Project | References. Khi ta Load một XML file vào DOM, nó tự động parse XML data để build một Tree gồm nhiều nodes với thứ bậc cha, con bên trong. Dựa theo đó ta có thể display cái DOM Tree ấy trong một TreeView để có thể hình dung được cấu trúc của XML data. Trong thí dụ dưới đây, ta Load một XML file tên people.xml vào DOM. XML file nầy còn có một Data Type Definition file tên people.dtd. Khi DOM load XML file, ta có thể dặn nó kiểm (validate) xem XML data có theo đúng tiêu chuẩn đòi hỏi trong dtd file. Content của people.xml như sau, lưu ý hàng thứ hai nhắc đến people.dtd mà DOM sẽ dùng để validate data trong XML file: Peter Greenway 234 King St, Newtown, NSW, Australia (612) 97463534 (612) 97463535 pgreenway@ozemail.com.au Sue Williams 72/324 John St, Cabramatta, NSW, Australia (612) 9745 2263 (612) 9745 2264 swilliams@bigpond.com.au Helen Clark 74 GreenHill Rd, Wayville, SA, Australia (618) 9756 3635 (618) 9756 3636 hclark@tgp.com.au Martin Howard 652 Broadbeach Drive, St Kilda, Melbourne, Australia (613) 9756 2312 (613) 9756 2313 mhoward@island.net.au Pam Rose 24/274 Stancey St, Bankstown, NSW, Australia (612) 9867 9821 (612) 9867 9822 prose@globalfreeway.com.au Le Duc Hong 3 Rawson St, Epping, NSW,Australia (612) 9783 1442 (612) 9783 1445 ldhong@dingoblue.com.au Âu Địch Xương 435 Trần Hưng Đạo, Vỉnh Long , Việt Nam 847 74847 847 9682 dixonau@vovisoft.com Lý Phúc Hiếu 234 Lý Công Uẩn, Saigon, Việt Nam 827 3746 827 4645 lyhieu@vnn.vn Content của people.dtd như sau: Trong file people.dtd phía trên ta có: 1. Hàng thứ nhất nói rằng cái root Node (Node gốc) tên là PEOPLE. Nó có một hay nhiều Nodes con tên PERSON. 2. Hàng thứ nhì nói mỗi Node PERSON có những Nodes con tên NAME, ADDRESS, TEL, FAX và EMAIL. 3. Các hàng còn lại cho biết mỗi Node NAME, ADDRESS, TEL, FAX, EMAIL đều chứa text string. Việc đầu tiên khi chạy program là bạn click nút Load XML into DOM and Display Tree. Ðợi một chút xíu, Tree của XML sẽ hiện ra trong TreeView. Ðồng thời XML data cũng được displayed trong WebBrowser phía bên phải. Sau đó, mỗi lần bạn click lên dấu+ hay - bên trái tên của một người trong TreeView, chi tiết của người đó sẽ được display trong các TextBox phía trên. Sau khi selected một Person, bạn có thể Delete tên đó bằng cách click nút Delete. Ngoài ra bạn cũng có thể thêm tên một người bằng cách click nút Clear to Add, điền các chi tiết của Person vào các TextBoxes rồi click Save new record. Mỗi lần bạn Delete một Person hay Add một New Person, program tự động Save kết quả xuống XML file. Hai TextBoxes txtName và txtAddress không phải là TextBoxes thông thường nhưng là TextBoxes của ActiveX Form2. Các Controls của Form2 có thể display chữ Việt bằng Unicode. Do đó nếu bạn Click lên tên Lý Phúc Hiếu chẳng hạn, bạn sẽ thấy tên và địa chỉ được display trong Font Tahoma có dấu đầy đủ của chữ Việt. Muốn có các Controls của Form2 để display chữ Việt bạn dùng menu command Project | Components để popup Components Dialog, kế đó click Microsoft Forms 2.0 Object Library như trong hình dưới đây: Bạn có thể thử viết thêm code để Edit các chi tiết của một Person có sẵn. Bạn có thể download chương trình mẫu DOMTree.zip để chạy thử. Ðể biết thêm các Properties và Methods của các Classes trong MSXML, từ trong VB6 IDE bạn press F2 để display Object Browser. Khi Object Browser Dialog hiện ra, chọn MSXML2 từ ComboBox phía trên đang display , kế đó chọn một class, thí dụ như IXMLDOMElement từ ListBox bên trái, chi tiết của selected Class sẽ được displayed trong ListBox bên phải như trong hình dưới đây: Dùng DOM để display XML thành nhiều tầng trong TreeView I nternet Explorer 5.0 cho ta Document Object Model (DOM) ActiveX gọi là MSXML.DLL mà ta có thể dùng trong VB6. Ðầu tiên là Microsoft XML, version 2.0, tiếp theo đó là Microsoft XML, v2.6 và mới nhất là Microsoft XML, v3.0. Cả ba DLL nầy đều có trong danh sách các References mà ta có thể include khi dùng IDE Menu command Project | References. Khi ta Load một XML file vào DOM, nó tự động parse XML data để build một Tree gồm nhiều nodes với thứ bậc cha, con bên trong. Dựa theo đó ta có thể display cái DOM Tree ấy trong một TreeView để có thể hình dung được cấu trúc của XML data. Trong thí dụ dưới đây, ta Load một XML file tên Library.xml vào DOM. XML file nầy còn có một Schema file tên LibrarySchema.xml. Khi DOM load XML file, ta có thể dặn nó kiểm (validate) xem XML data có theo đúng tiêu chuẩn đòi hỏi trong Schema file. Content của Library.xml như sau, lưu ý hàng thứ 7 nhắc đến LibrarySchema.xml mà DOM sẽ dùng để validate data trong XML file: Northmead Local Library C++ Programming for Beginners Claude Schwartz 005.133/C XML Users Journal August 1999 1999-08-01 005.133/C Titanic James Cameron 643.11/T The C Programming Language Brian Kernighan Dennis Ritchie 005.133/C2 Content của LibrarySchema.xml như sau: <Schema xmlns="urn:schemas-microsoft-com:xml-data" xmlns:dt="urn:schemas-microsoft-com:datatypes"> <!-- Copyright 2000 Wattle Software This Schema is based on XML-Schema support found in Microsoft Internet Explorer 5. --> <!-- first we need to declare all elements that will appear only as child elements --> <ElementType name="price" content="textOnly" dt:type="fixed.14.4"> <ElementType name="title" content="textOnly" dt:type="string"> <ElementType name="artist" content="textOnly" dt:type="string"> <ElementType name="callno" content="textOnly" dt:type="string"> <ElementType name="date" content="textOnly" dt:type="date"> <ElementType name="online_url" content="textOnly" dt:type="string"> <AttributeType name="availableforloan" dt:type="string"> <!-- Now we can define the more interesting elements (i.e. those that can have children ) --> <!-- An author can contain EITHER: a name, or a sequence of first-name then last-name --> <!-- A director can contain EITHER: a name, or a sequence of first-name then last-name --> <!-- declare hardback as an optional attribute of journal with default value of "no" --> Việc đầu tiên khi chạy program là bạn click nút Load XML and Display in TreeView. Ðợi một chút xíu, Tree của XML sẽ hiện ra trong TreeView. Ðồng thời Content của XML file cũng được loaded vào ListBox lstXMLSource và bạn sẽ thấy nó nếu bạn click Tab XML Source. Dĩ nhiên bạn có thể display bất cứ một XML file nào nếu bạn để nó vào folder của program và enter Filename của nó vào TextBox txtXMLFileName trứớc khi click nút Load XML and Display in TreeView. Trong program nầy ta dùng Object IXMLDOMNode, thay vì Object IXMLDOMElement để lần lượt đi qua mọi nodes của XML DOM. Program gọi Sub AddNode để bỏ các Nodes vào TreeView. Ðặc biệt là AddNode gọi chính nó ở bên trong Sub AddNode. Kỹ thuật nầy gọi là recursive, mà ta thường lấy dùng trong những cấu trúc giống như nhánh cây, khi chính một Con lại có nhiều Con khác. Listing của Sub AddNode như sau: Private Sub AddNode(ByRef oElem As IXMLDOMNode, Optional ByRef oTreeNode As Node) ' Add a Node to the TreeView Dim oNewNode As Node Dim oNodeList As IXMLDOMNodeList Dim i As Long ' Create the new node If oTreeNode Is Nothing Then ' Go through here when creating the top level nodes, i.e. childNodes of root node Set oNewNode = TreeView.Nodes.Add Else Set oNewNode = TreeView.Nodes.Add(oTreeNode, tvwChild) End If ' Expand TreeView node oNewNode.Expanded = True ' Prepare the Text for the TreeView Node If oElem.nodeType = NODE_ELEMENT Then ' Element Node type. Use Node name and Attribute values oNewNode.Text = BuildNodeLabel(oElem) ElseIf (oElem.nodeType = NODE_TEXT) Then ' Last Node in the branch. Use Text oNewNode.Text = oElem.Text ElseIf (oElem.nodeType = NODE_COMMENT) Then ' Comment Node. Display the comment oNewNode.Text = "Comment:" & oElem.Text Else ' Display Nodename as default oNewNode.Text = oElem.nodeName End If ' process the childNodes which form a NodeList Set oNodeList = oElem.childNodes ' Iterate through each childNode For i = 0 To oNodeList.length - 1 ' Recursively call AddNode to add more nodes as children of oNewNode, ' treating AddNode just like another Sub AddNode oNodeList.Item(i), oNewNode Next End Sub Có ba loại Nodes ta xử lý ở đây: NODE_ELEMENT, NODE_TEXT và NODE_COMMENT. Element Node thì có Node , Attributes và Con. Text Node và Comment Node thì chỉ có text. Bạn có thể download chương trình mẫu XMLTreeDOM.zip để chạy thử. Ðể biết thêm các Properties và Methods của các Classes trong MSXML, từ trong VB6 IDE bạn press F2 để display Object Browser. Khi Object Browser Dialog hiện ra, chọn MSXML2 từ ComboBox phía trên đang display , kế đó chọn một class, thí dụ như IXMLDOMNode từ ListBox bên trái, chi tiết của selected Class sẽ được displayed trong ListBox bên phải như trong hình dưới đây:
File đính kèm:
- Học XML tiếng Việt.pdf