Bài giảng Công cụ Multimedia - Phần 2: Các dạng dữ liệu Multimedia - Trần Nguyên Ngọc
Các dạng dữ liệu Multimedia gồm
Các dạng dữ liệu truyền thống: văn bản, số liệu
Âm thanh: tiếng ồn, âm nhạc, tiếng nói
Hình ảnh tĩnh: đồ họa, ảnh
Ảnh động: animation, video
nh tương thích. Vấn đề tăng chi phí truyền ảnh. Các tiêu chuẩn chất lượng ảnh: Tiêu chuẩn về màu sắc: số lượng màu sắc dùng biểu diễn ảnh. Tiêu chuẩn về độ phân giải: số lượng điểm dùng để biểu diễn ảnh. 66 2.3 Hình ảnh tĩnh Ảnh 3D Hình ảnh 3D là tập hợp của các điểm trong không gian 3 chiều được kết nối với nhau bằng các đoạn thẳng, tam giác hoặc mặt phẳng cong Hình ảnh 3D được tạo ra bằng tay, sử dụng thuật toán hoặc scanner. Các cách biểu diễn hình ảnh 3D: Sử dụng cấu trúc đặc. Sử dụng được biên. 67 2.3 Hình ảnh tĩnh Các khuôn dạng ảnh:hai dạng chính Ảnh vector. Là các dữ liệu đồ hoạ. Các dạng PIC, WMF, ... Một ảnh được coi là tập hợp của các hình hình học đơn giản. Ảnh bitmap. Là các dữ liệu hình ảnh. Các dạng file: BMP, GIF, TIFF, JPG, ... ảnh được biểu diễn bằng ma trận các điểm. Mỗi điểm có các giá trị tương ứng với các màu. 68 Các khuôn dạng ảnh Ảnh vector ảnh được hiểu như tổ hợp các hình hình học đơn giản. ảnh được hiển thị bằng cách vẽ các hình đồ hoạ tương ứng với các đối tượng của ảnh. Có ba dạng đối tượng rời rạc trên ảnh: Các điểm rời rạc: các đối tượng điểm. Các đường rời rạc: các đối tượng đường. Các mặt rời rạc: các đối tượng mặt. 69 Các khuôn dạng ảnh Các ảnh vector. Các ưu điểm: Mã hóa ảnh bằng các hình đơn giản. Gọn, kích thước nhỏ. Thay đổi kích thước đơn giản, không bị mất thông tin. Sửa dễ dàng do các phần tử của ảnh độc lập. Các nhược điểm: Không biểu diễn được các ảnh chụp. Xử lý các ảnh phức tạp với nhiều đối tượng gặp nhiều khó khăn. Khuôn dạng không chuẩn, các trình duyệt web không nhận dạng được. Khuôn dạng WMF: Chứa các thông tin về các đối tượng. Một file WMF có thể chứa 65535 đối tượng. 70 Các khuôn dạng ảnh Ảnh bitmap Hình ảnh được biểu diễn thông qua ma trận các điểm. Giá trị các điểm ảnh chỉ tới các mầu của điểm tương ứng với các sơ đồ biểu diễn màu. Biểu diễn màu theo sơ đồ RGB. Hai sơ đồ mã hóa màu: RGB và CYMK. Không gian màu và chuyển đổi: RGB(1,1,1) -> CMY (0,0,0) C=1-R; G=1-M; R=1-C; Y=1-B; M=1-G;B=1-Y; 71 Các khuôn dạng ảnh Mã hóa màu: Giá trị của điểm ảnh. Màu tương ứng theo giá trị đó tùy theo bảng màu. Phương pháp đơn giản. Đối với mỗi điểm ảnh giá trị của điểm ảnh là giá trị của màu. Màu được lựa chọn theo mô hình RGB. Đối với mỗi pixel: Mã hoá một thành phần RGB sử dụng n bit. Mô hình màu theo RGB sẽ được mã hoá theo 3 x n bit. Số lượng màu cho phép đối với mô hình RGB: 2n x 2n x 2n. Màu thực: true color: sử dụng 8 bit cho một thành phần màu, do đó số lượng màu cho phép biểu diễn sẽ là: 224 màu. 72 Các khuôn dạng ảnh Thành phần thứ tư là phần mở rộng có độ dài 8 bit để biểu diễn. Kênh alpha. Kênh alpha dùng để biểu diễn tính trong suốt của ảnh (transparence). Tính chất này dùng để tránh hiệu ứng bậc thang khi có nhiều ảnh chồng lên nhau. Biểu diễn bảng màu. N được lựa chọn trong số 2m x 2m x 2m màu. m chỉ số lượng bit để biểu diễn một thành phần màu. N là vị trí tương ứng trong bảng màu. Kích thước khối thông tin ảnh: X * Y * n trong đó X: số cột,Y: số hàng, n: số bit dùng để mã hoá một ảnh. ảnh bitmap cho chất lượng cao. 73 2.3 Hình ảnh tĩnh Một số định dạng ảnh phổ biến JPEG (Joint Photographic Experts Group): phương pháp nén ảnh hiệu quả với tỷ lệ nén tới vài chục lần. Sử dụng phương pháp nén mất mát thông tin. Các bước gồm: Phân khối, biến đổi Cosin rời rạc (DCT), lượng tử hóa và mã hóa. BMP: Các tệp tin đồ họa lưu dưới dạng BMP và có phần mở rộng .bmp hoặc .dib. Bitmap header (14 bytes): giúp nhận dạng tệp tin bitmap. Bitmap information (40 bytes): lưu chi tiết hiển thị ảnh. Color pallete (4x bytes), x là số màu của ảnh. Bitmap data: dữ liệu ảnh. GIF (Graphics Interchange Format): là định dạng tệp tin hình ảnh bitmap sử dụng ít hơn 256 bit. TIFF (Tagged Image File Format): được sử dụng trong quét ảnh, gửi fax, xử lý văn bản, nhận dạng chữ viết 74 2.4 Hình ảnh động Video Video là chuỗi các hình ảnh tĩnh được trình diễn trong một đơn vị thời gian khiến người xem có cảm giác như các sự vật trên đó như đang chuyển động. Video có thể lưu trữ và truyền trong nhiều môi trường khác nhau: PAL, NTSC, MPEG-4 hay DVI 3D video được quy định trong chuẩn MPEG-4 Part 16 Animation Framework eXtension (AFX). Các đặc tính của video: Số lượng khung (frame) trên một giây. Interlacing Độ phân giải Kích thước khung hình Phương pháp nén video Tốc độ truyền (đối với video số) 75 2.4 Hình ảnh động Video số Thuận lợi: Truy cập ngẫu nhiên trực tiếp thuận tiện, Việc tạo, lưu trữ và ghi đọc nhiều lần không ảnh hưởng đến chất lượng ảnh. Không cần xung xoá và xung đồng bộ. Xử lý thuận tiện, không gặp trở ngại về giới hạn tần số, băng thông. Khó khăn Tuy nhiên, tín hiệu số gặp một số trở ngại xoay quanh vấn đề về tính hiệu quả, chẳng hạn bộ lọc số có giá thành tương đối cao. Tiêu chuẩn lấy mẫu màu: Thuận lợi trong việc xử lý đối với tín hiệu video thành phần, nhưng băng thông yêu cầu lớn. 76 2.4 Hình ảnh động Video Số lượng khung hình trên một giây (Frame rate) Thông thường từ 6-25 frame/s, tùy theo camera. PAL (EU), SECAM (EU): 25 frame/s NTSC (US, Japan): 29,97 frame/s Interlacing Interlacing: Chia màn hình thành các dòng, mỗi lần chùm electron chỉ quét dòng chẵn hoặc lẻ tiết kiệm băng thông đường truyền. NTSC, PAL, SECAM sử dụng chế độ interlacing: PAL 576i50. Progressive: dòng electron sẽ quét tất cả màn hình cho hình ảnh chất lượng cao, vd: HDTV. Độ phân giải Được tính theo đơn vị pixel đối với dữ liệu số và dòng quét ngang, quét dọc với dữ liệu tương tự. NTSC: 720/704/640x480i60. PAL: 768/720x576i50. HDTV: 1920x1080p60 77 2.4 Hình ảnh động Video Kích thước màn hình Màn hình truyền thống: 4:3 Màn hình HD: 16x9 widescreen. Các phương pháp nén video Intraframe compression: nén tương tự như kỹ thuật nén ảnh. Interframe compression: nén dựa trên sự khác biệt giữa các frame (chỉ lưu sự khác biệt). MPEG-2: sử dụng cho DVD và ti vi truyền từ vệ tinh. MPEG-4 dùng cho video gia đình. Tốc độ truyền (bitrate): Tốc độ càng cao, chất lượng video càng tốt. Video CD; 1 Mbps. DVD: 5 Mbps. HDTV: 20 Mbps. 78 2.4 Hình ảnh động Hoạt hình (Animation) Tạo ra ảo giác quang học về sự chuyển động do nhiều hình ảnh tĩnh được chiếu tiếp diễn liên tục. Nguyên lý: dựa vào hiện tượng lưu ảnh của mắt (persistence of vision). Một số định dạng đồ họa: GIF, MNG, SVG, Flash kích thước nhỏ, cho phép truyền trên máy tính thông qua Internet. Motion capture Kỹ thuật lưu lại chuyển động và tái hiện thông qua mô hình mô phỏng. Được sử dụng rộng rãi trong các lĩnh vực thể thao, giải trí 79 2.4 Hình ảnh động Một số các định dạng video AVI (Audio Video Interleave) là một định dạng của Microsoft được giới thiệu vào tháng 11 năm 1992. AVI là tập tin có thể chứa cả âm thanh và video dữ liệu trong một container cho phép đồng bộ tập tin âm thanh-với-video. AVI là một trong những định dạng của RIFF. Phần header (56 byte) chứa các thông tin : Thời gian trễ giữa các frame Tốc độ dữ liệu, Số lượng frame, Số dòng dữ liệu Kích thước video . MKV (Matroska Multimedia Container) - là một chuẩn mở miễn phí định dạng container. Được công bố vào ngày 06 tháng 12 2002, Matroska là một định dạng tập tin có thể chứa đựng một số lượng không giới hạn video, âm thanh, hình ảnh hoặc phụ đề trong một tập tin duy nhất. 80 2.4 Hình ảnh động Một số các định dạng video MPEG (Moving Picture Expert Group) được ra đời vào năm 1988 nhằm mục đích chuẩn hoá cho nén tín hiệu âm thanh và video Mpeg-1 là chuẩn lưu trữ và phục hồi ảnh động và Audio trong lưu trữ Media Mpeg-2 là chuẩn cho TV số Mpeg-4 là chuẩn cho các ứng dụng MultiMedia Mpeg-7 chứa đặc tả thông tin, giao diện cho việc tìm kiếm thông tin H26x – Do tổ chức ITU đưa ra phục vụ cho dịch vụ hội nghị truyền hình và video phone H261 – phục vụ cho truyền qua ISDN ở tốc độ 64 kbps Sử dụng CIF và QCIF H263 – cải tiến cho video tốc độ thấp, có thể truyền trên mạng thoại công cộng PSTN 81 2.4 Hình ảnh động Một số dạng tín hiệu video số theo các chuẩn CIF : Common Intermediate Format Sử dụng trong chuẩn H261, dễ chuyển sang chuẩn PAL hay NTSC Y resolution: 352 x 288, 8 bits/pixel(sample) CrCb/UV resolution: 176 x 144 Frame rate: 30 frames/second progressive QCIF:Quarter Common Intermediate Format Y resolution: 176 x 144, 8 bits/pixel (sample) CrCb/UV resolution: 88 x 72 Frame rate: 30 frames/second progressive TV –NTSC Resolution: 704 x 480, 30 frames/second interlaced DVD –NTSC Resolution: 720 x 480, 24 –30 frames/second progressive 82 2.4 Hình ảnh động Các vấn đề liên quan đến thao tác: Xử lý Tạo, biên tập theo phương pháp tương tự và số Các phần mềm hiển thị và thao tác với ảnh động Hiển thị và thao tác chuỗi video Chèn các hiệu ứng thích hợp Lưu trữ: Mã hóa và nén Lưu trữ, các khuôn dạng lưu trữ Mất thông tin khi nén dữ liệu Phục hồi ảnh Hiển thị ảnh, chiếu ảnh, cảm nhận ảnh 83 2.4 Hình ảnh động Đồng bộ giữa audio và video Tại sao ? Dữ liệu đa phương tiện : dữ liệu từ nhiều nguồn phương tiện (media) khác nhau cả về thời gian và không gian Nhiệm vụ của đồng bộ: xác lập lại quan hệ thời gian thực giữa các dòng dữ liệu nguồn Một số khái niệm Đồng bộ liên tục : đồng bộ bám liên tục theo thời gian, Đồng bộ điểm : đồng bộ các khối dữ liệu tại các thời điểm, Đồng bộ trong một dòng dữ liệu phương tiện (Intramedia Synchronization) : xác lập lại quan hệ thời gian giữa các sự kiện trong 1 dòng dữ liệu của 1 phương tiện, đơn luồng Đồng bộ giữa các dòng (Intermedia synchronization) : xác lập lại quan hệ thời gian giữa các dòng dữ liệu phương tiện.
File đính kèm:
- bai_giang_cong_cu_multimedia_phan_2_tran_nguyen_ngoc.pdf