Bài giảng Ngôn ngữ đánh dấu mở rộng - Chương 1: Tổng quan về XML

HTML: rất phù hợp để hiển thị dữ liệu cho trình duyệt. Những tag này chỉ để mô tả cách hiển thị, không mô tả ý nghĩa của dữ liệu.

SGML: phức tạp không thích hợp để trao đổi dữ liệu trên môi trường web. cần một ngôn ngữ tương tự nhưng đơn giản hơn

 XML là nhánh con của SGML được giản lược hóa.

 

 

ppt47 trang | Chuyên mục: XML | Chia sẻ: dkS00TYs | Lượt xem: 2019 | Lượt tải: 1download
Tóm tắt nội dung Bài giảng Ngôn ngữ đánh dấu mở rộng - Chương 1: Tổng quan về XML, để xem tài liệu hoàn chỉnh bạn click vào nút "TẢI VỀ" ở trên
me formatted 	text, but	no grammar no good! Mỗi tài liệu XML chỉ có duy nhất 1 root element. Sai : JohnJane Đúng : 	John 	Jane 	 XML dùng ở đâu? XML độc lập nền (Windows, Unix) và độc lập với ngôn ngữ (Visual Basic, Java). XML sử dụng để lưu trữ và trao đổi dữ liệu giữa những ứng dụng với nhau. * Introduction XML * XML dùng ở đâu? Ứng dụng web: giảm thời gian load trang web. Chứa nội dung trang web : sử dụng XSLT hay CSS để chuyển đổi và hiển thị trang web. * Introduction XML * XML dùng ở đâu? Remote Procedure Call (RPC): đối tượng ở máy này gọi đối tượng ở máy khác. Sử dụng XML và HTTP. Simple Object Access Protocol (SOAP): tương tự như RPC cho phép thông qua firewall. eCommerce: B2B, B2C, … * Introduction XML * XML là ngôn ngữ siêu đánh dấu XML rất khác so với HTML. HTML định nghĩa một tập những tag cố định miêu tả các element . Do đó, ta không có tag mà ta mong muốn. Đối với XML, chúng ta có thể tạo ra những tag mà chúng ta cần. Tag tạo ra đó phải định nghĩa trong DTD (Document Type Definition). * Introduction XML * XML là ngôn ngữ siêu đánh dấu Tạm hiểu DTD là từ vựng + cú pháp cho những tài liệu nào đó. Ví dụ: CML(Chemical ML), MathML … Trình duyệt không cần biết trước được tất cả các tag được sử dụng bởi hàng ngàn ngôn ngữ đánh dấu (ML) khác nhau. * Introduction XML * XML miêu tả cấu trúc và ý nghĩa XML miêu tả cấu trúc và ngữ nghĩa của tài liệu mà không miêu tả định dạng phần tử dữ liệu. Định dạng có thể được thêm vô bằng một style sheet. * Introduction XML * XML miêu tả cấu trúc và ý nghĩa Tài liệu chỉ chứa những tag để chỉ rằng cái gì trong tài liệu chứ không miêu tả tài liệu được hiển thị như thế nào. Demo ví dụ. * Introduction XML * Tại sao XML được ưa chuộng? XML thì dễ mở rộng, các nhà phát triển thích nó bởi vì nhiều lý do: Phục vụ cho những lĩnh vực (domain) chuyên biệt. Trao đổi dữ liệu giữa các ứng dụng Dữ liệu tự mô tả Dữ liệu hợp nhất và có cấu trúc * Introduction XML * Phục vụ tất cả các lĩnh vực Mọi người có thể thiết kế ngôn ngữ đánh dấu trên chính lĩnh vực của mình. Họ có thể gửi tài liệu của mình cho người nhận và người nhận có thể xem được tài liệu đó. Không cần sự hỗ trợ đặc biệt của những nhà sản xuất Browser hoặc những plug-in tương thích. * Introduction XML * Dữ liệu tự mô tả XML là một định dạng dữ liệu đơn giản đáng kinh ngạc. (100 percent pure ASCII) Ở mức cao hơn, XML là ngôn ngữ tự miêu tả (self-describing) Ví dụ: * Introduction XML * Trao đổi dữ liệu dễ dàng Bởi vì XML không thu phí bản quyền, dễ dàng đọc và viết, được chuẩn hóa nên nó là một định dạng tuyệt vời cho việc trao đổi dữ liệu giữa những ứng dụng với nhau. * Introduction XML * Dữ liệu hợp nhất, có cấu trúc XML là mẫu lý tưởng cho những tài liệu lớn và phức tạp bởi vì dữ liệu XML có cấu trúc. Nó không chỉ để ta chỉ rõ từ vựng (vocabulary) để định nghĩa các phần tử (element) mà còn cho ta chỉ rõ mối quan hệ (relationship) giữa các phần tử. * Introduction XML * Dữ liệu hợp nhất, có cấu trúc XML còn cung cấp cơ chế hợp nhất dữ liệu từ nhiều nguồn và hiển thị nó trên duy nhất một tài liệu. Dữ liệu có thể được sắp xếp lại, có thể hiện hay ẩn một phần tùy thuộc vào nhu cầu người sử dụng. Điều này cực kì hữu dụng khi ta làm việc với cơ sở dữ liệu quan hệ * Introduction XML * Sự hình thành tài liệu XML XML là một định dạng tài liệu. Nó là một tập những luật quy định một tài liệu XML phải như thế nào. Có 2 tiêu chuẩn để đánh giá XML: well-formedness (hợp chuẩn-đúng ngữ pháp) validity (hợp lệ-đúng cấu trúc) * Introduction XML * Sự hình thành tài liệu XML HTML chỉ được thiết kế để sử dụng trên internet và trình duyệt (web browser) XML có nhiều ứng dụng rộng rãi hơn Lưu trữ định dạng cho xử lý văn bản (word processing) Trao đổi định dạng dữ liệu cho những chương trình khác nhau. Bảo tồn dữ liệu mà con người có thể đọc được * Introduction XML * Sự hình thành tài liệu XML Ta phải biết một chút về đặc tả dữ liệu như thế nào. Cần biết cách tài liệu XML được biên tập Cách bộ xử lý đọc tài liệu XML và truyền thông tin đọc được vào ứng dụng Và những ứng dụng này phải làm gì với dữ liệu đó * Introduction XML * Editors-Trình soạn thảo Tài liệu XML thông thường được tạo với một trình soạn thảo văn bản (editor). VD: Notepad, Notepad++, Adobe FrameMaker, JUMBO, FileMaker , Altova XMLSpy,.. * Introduction XML * Parsers and Processors Một XML parser đọc tài liệu và xác minh rằng tài liệu đó đúng ngữ pháp (well-formed). Nó cũng kiểm tra tính hợp lệ (valid) của tài liệu mặc dù việc kiểm tra này là không cần thiết. Cuối cùng parser chuyển tài liệu thành những phần tử ở dạng cây (tree). * Introduction XML * Browsers and Other Tools Cuối cùng parser sẽ truyền cây (tree) đó cho ứng dụng. Ứng dụng này có thể là Mozilla hay một vài chương trình khác hiểu phải là gì với dữ liệu đó. Nếu là browser thì dữ liệu sẽ được hiển thị cho người dùng * Introduction XML * Browsers and Other Tools Nếu là chương trình khác thì, dữ liệu có thể được thông dịch như là đầu vào của CSDL (Java). XML cực kì mềm dẻo và có thể được sử dụng cho nhiều mục đích khác nhau. * Introduction XML * Tổng kết quá trình xử lý Tài liệu XML được tạo bằng một editor. XML parser sẽ đọc tài liệu và chuyển nó thành những phần tử dạng cây Parser truyền cây đó cho browser hiển thị nó Tài liệu XML không phụ thuộc vào chương trình đọc nó * Introduction XML * Những công nghệ liên quan HTML CSS and XSL URLs and URIs XLL (eXtensible Linking Language) Tập kí tự Unicode * Introduction XML * Hypertext Markup Language Trước đây chúng ta cần chuyển đổi nội dung XML thành tài liệu HTML. Vì vậy, khi nghiên cứu về XML chúng ta cần biết một ít về HTML Bởi vì HTML là định dạng đầu ra thông dụng nhất của XML, bạn càng biết nhiều về HTML thì bạn càng dễ tạo ra hiệu ứng mà bạn muốn * Introduction XML * Hypertext Markup Language XML tách biệt nội dung với vẻ bề ngoài của nó. Nội dung sẽ được phát triển trước, sau đó sẽ được định dạng bằng các style sheet. Cho phép tác giả và designer làm việc độc lập với nhau. * Introduction XML * Cascading Style Sheets XML cho phép bạn tạo ra những tag tùy ý. Do đó browser không biết trước được chúng sẽ hiện thị như thế nào. Khi gửi tài liệu cho người sử dụng, cần gửi theo một style sheet để chỉ cho trình duyệt biết cách định dạng mỗi phần tử.(CSS) * Introduction XML * Cascading Style Sheets Ban đầu CSS được thiết kế cho HTML. Nhiều style sheet có thể áp dụng cho một tài liệu và nhiều style có thể được áp dụng cho một phần tử đơn. Bạn cũng có thể sử dụng CSS để định dạng một tài liệu XML. * Introduction XML * eXtensible Style Language XSL là một ngôn ngữ style sheet được thiết kế dành riêng cho XML. Những tài liệu XSL chứa đựng một tập những luật áp dụng cho những mẫu (pattern) phần tử XML. CSS chỉ có thể thay đổi định dạng của một phần tử riêng biệt. * Introduction XML * Extensible Style Language Trong khi đó, XSL style sheets có thể sắp xếp, tổ chức lại những phần tử. Chúng có thể ẩn một vài phần tử và hiển thị những phần tử khác. Nó còn có thể chọn style để sử dụng không chỉ dựa trên tag mà còn dựa trên nội dung và thuộc tính của tag * Introduction XML * URLs and URIs Tài liệu XML có thể tồn tại trên Web giống như tài liệu HTML. Khi đó nó cũng có một địa chỉ URL chẳng hạn như : http :// www.hypermedic.com /style/xml/tempest.xml * Introduction XML * URLs and URIs Mặc dù URL hỗ trợ tốt rồi, đặc tả XML còn sử dụng một URI (Uniform Resource Identifier) tổng quát hơn để xác định vị trí những tài nguyên trên internet. * Introduction XML * XLinks and XPointers Chỉ cần những tài liệu XML được đăng tải trên Internet, bạn sẽ có thể đánh địa chỉ chúng và liên kết chúng lại với nhau. Thẻ link của HTML có thể được sử dụng để liên kết những tài liệu XML đó * Introduction XML * XLinks and XPointers Tuy nhiên XML đã có XLinks để liên kết những tài liệu lại và XPointers để xác định vị trí những phần riêng biệt trong một tài liệu. XLinks cho phép bất cứ phần tử nào trở thành một link (không phải chỉ có thẻ A thôi). Xlinks sử dụng URLs để nhận diện site mà chúng liên kết tới * Introduction XML * XLinks and XPointers XPointers cho phép xác định vị trí không chỉ một tài liệu cụ thể mà còn xác định vị trí những phần trong tài liệu đó. Ví dụ: xác định phần tử đầu tiên, thứ hai, thứ 18 hoặc phần tử đầu tiên của phần tử con… XPointers có thể được sử dụng để chọn một phần cụ thể trong một tài liệu. * Introduction XML * The Unicode Character Set Hầu hết những trang web bằng tiếng Anh. XML hỗ trợ đầy đủ tập kí tự Unicode. Tập kí tự này hỗ trợ hầu hết tất cả các kí tự thông dụng được sử dụng trong chữ viết (script) hiện đại. Để đọc script, ta cần 3 thứ: 1. Tập kí tự cho chữ viết đó 2. Font cho tập kí tự đó 3. Hệ điều hành và ứng dụng hiểu tập kí tự đó * Introduction XML * Kết hợp các công nghệ lại với nhau XML định nghĩa ngữ pháp (grammar) cho những tag bạn sử dụng. Bộ mã mặc định cho những tài liệu XML là Unicode. Ngoài ra, tài liệu XML còn liên kết với những tài liệu và tài nguyên khác. Những liên kết này được tạo theo đặc tả XLink. * Introduction XML * Kết hợp các công nghệ lại với nhau XLink xác định các tài liệu mà chúng liên kết bằng địa chỉ URIs(lý thuyết) hoặc URLs (thực tế). XLink có thể chỉ rõ một phần của tài liệu mà nó liên kết. Những phần này được đánh địa chỉ bằng XPointer * Introduction XML * Kết hợp các công nghệ lại với nhau Nếu tài liệu được gửi cho người khác xem, ta cần cung cấp thêm một style sheet. CSS và XSL là hai style sheet phổ biến nhất. * Introduction XML * Tổng kết chương XML là ngôn ngữ siêu đánh dấu (meta-markup) cho phép tạo những ngôn ngữ đánh dấu cho những tài liệu thuộc những lĩnh vực chuyên biệt. * Introduction XML * Tổng kết chương XML tags miêu tả cấu trúc và ngữ nghĩa của nội dung tài liệu, mà không định dạng nội dung đó. Định dạng được miêu tả bằng một style sheet riêng. Tài liệu XML được tạo bằng một editor, được đọc bởi một Parser, và được hiển thị bởi Browser. * Introduction XML * Tổng kết chương XML trên Web dựa trên những nền tảng được cung cấp bởi HTML: CSS và URLs Các công nghệ hỗ trợ riêng cho XML bao gồm XSL, XLinks và XPointer. * Introduction XML * 

File đính kèm:

  • pptBài giảng Ngôn ngữ đánh dấu mở rộng - Chương 1 Tổng quan về XML.ppt
Tài liệu liên quan