Bài giảng Kỹ thuật vi xử lý - Chương 6: Các vi xử lý và công nghệ tiên tiến
A. Giới thiệu các VXL dựa trên kiến trúc IA-32 và Intel 64
1. Các vi xử lý x86 (8086, 80286, 80386, 80486)
2. Các vi xử lý dòng Intel Pentium (Pen I, II, III, M v à IV)
3. Các vi xử lý dòng Xeon, Core v à Atom
B. Các kiến trúc & công nghệ VXL tiên tiến
4. Vi kiến trúc P6
5. Mô tơ thực thi không theo trật tự (Out of Order Execution)
6. Vi kiến trúc Intel NetBurst
7. Vi kiến trúc Intel Core
8. Vi kiến trúc Intel Atom
9. Tập lệnh SIMD
10. Công nghệ Hyper-Threading
11. Kiến trúc Intel 64
12. Công nghệ ảo hoá
CNTT1 Trang 23 CHƯƠNG 6 – CÁC VI XỬ LÝ VÀ CÔNG NGHỆ TIÊN TIẾN 6. Vi kiến trúc Intel NetBurst Kiến trúc siêu vô hướng tăng tốc xử lý song song tốt hơn Mở rộng tập thanh ghi phần cứng sử dụng với kỹ thuật đổi tên thanh ghi giảm các hạn chế với không gian tên của thanh ghi. NetBurst Out-Of-Order Execution Core Cung cấp khả năng thực hiện các lệnh không theo trật tự nâng cao khả năng xử lý song song Các lệnh có thể được sắp xếp lại sao cho nếu một vi thao tác bị trễ thì các vi thao tác khác sẽ được thay thế thực hiện CPU sử dụng một số bộ đệm để lưu luồng các vi thao tác Có khả năng tiếp nhận để thực hiện đồng thời đến 6 vi thao tác trong 1 CK đồng hồ. BÀI GIẢNG MÔN KỸ THUẬT VI XỬ LÝ www.ptit.edu.vn GIẢNG VIÊN: TS. HOÀNG XUÂN DẬU BỘ MÔN: KHOA HỌC MÁY TÍNH - KHOA CNTT1 Trang 24 CHƯƠNG 6 – CÁC VI XỬ LÝ VÀ CÔNG NGHỆ TIÊN TIẾN 6. Vi kiến trúc Intel NetBurst Retirement Unit Retirement Unit tiếp nhận các kết quả từ các vi thao tác đã được thực hiện Xử lý và cập nhật các kết quả theo trật tự ban đầu của chương trình. Bộ phận Reorder Buffer lưu toàn bộ các vi thao tác đã được thực thi và cập nhật trật tự của chúng. Retirement Unit cũng lưu vết các lệnh rẽ nhánh và gửi các thông tin cập nhật về đích rẽ nhánh đến BTB. 7BÀI GIẢNG MÔN KỸ THUẬT VI XỬ LÝ www.ptit.edu.vn GIẢNG VIÊN: TS. HOÀNG XUÂN DẬU BỘ MÔN: KHOA HỌC MÁY TÍNH - KHOA CNTT1 Trang 25 CHƯƠNG 6 – CÁC VI XỬ LÝ VÀ CÔNG NGHỆ TIÊN TIẾN 7. Vi kiến trúc Intel Core BÀI GIẢNG MÔN KỸ THUẬT VI XỬ LÝ www.ptit.edu.vn GIẢNG VIÊN: TS. HOÀNG XUÂN DẬU BỘ MÔN: KHOA HỌC MÁY TÍNH - KHOA CNTT1 Trang 26 CHƯƠNG 6 – CÁC VI XỬ LÝ VÀ CÔNG NGHỆ TIÊN TIẾN 7. Vi kiến trúc Intel Core Intel Wide Dynamic Execution Ống lệnh 14 giai đoạn 3 ALU 4 bộ giải mã có khả năng giải mã đến 5 lệnh/1 CK đồng hồ Macro-fusion và micro-fusion nhằm cải thiện thông lượng Có khả năng tiếp nhận thực thi đến 6 vi thao tác/1 CK đồng hồ Retirement Unit có khả năng xử lý đến 4 vi thao tác/1 CK đồng hồ Dự đoán rẽ nhánh tiên tiến BÀI GIẢNG MÔN KỸ THUẬT VI XỬ LÝ www.ptit.edu.vn GIẢNG VIÊN: TS. HOÀNG XUÂN DẬU BỘ MÔN: KHOA HỌC MÁY TÍNH - KHOA CNTT1 Trang 27 CHƯƠNG 6 – CÁC VI XỬ LÝ VÀ CÔNG NGHỆ TIÊN TIẾN 7. Vi kiến trúc Intel Core Intel Advanced Smart Cache Cache L2 có dung lượng đến 4MB với 16 đường kết hợp Tối ưu hoá truy nhập cho nhiều nhân và các môi trường thực thi đơn luồng Sử dụng bus 256 bit cho trao đổi dữ liệu giữa cache L2 và L1 Smart Memory Access Sử dụng các kỹ thuật đọc trước từ bộ nhớ để giảm miss cho cache khi lệnh được thực thi không theo trật tự: • Đọc trước sử dụng phần cứng để giảm trễ trong trường hợp gặp miss ở cache L2 • Đọc trước sử dụng phần cứng để giảm trễ trong trường hợp gặp miss ở cache L1 • Sử dụng kỹ thuật Memory disambiguation cho phép nâng cao hiệu quả của mô tơ thực thi speculative execution. BÀI GIẢNG MÔN KỸ THUẬT VI XỬ LÝ www.ptit.edu.vn GIẢNG VIÊN: TS. HOÀNG XUÂN DẬU BỘ MÔN: KHOA HỌC MÁY TÍNH - KHOA CNTT1 Trang 28 CHƯƠNG 6 – CÁC VI XỬ LÝ VÀ CÔNG NGHỆ TIÊN TIẾN 7. Vi kiến trúc Intel Core Advanced Digital Media Boost Có khả năng thực hiện các lệnh hầu hết các lệnh SIMD 128 bits trong 1 CK đồng hồ Có khả năng thực hiện đến 8 thao tác dấu phảy động trong 1 CK đồng hồ Cung cấp 3 cổng tiếp nhận các lệnh SIMD để thực hiện. 8BÀI GIẢNG MÔN KỸ THUẬT VI XỬ LÝ www.ptit.edu.vn GIẢNG VIÊN: TS. HOÀNG XUÂN DẬU BỘ MÔN: KHOA HỌC MÁY TÍNH - KHOA CNTT1 Trang 29 CHƯƠNG 6 – CÁC VI XỬ LÝ VÀ CÔNG NGHỆ TIÊN TIẾN 7. Vi kiến trúc Intel Core The Front-End: Khối giải mã có khả năng giải mã 4 lệnh trong 1 CK đồng hồ hoặc lệnh trong 1 CK đồng hồ sử dụng macrofusion Macrofusion kết nối phần chung của 2 lệnh thành một lệnh đã giải mã tăng thông lượng giải mã Đơn vị đọc lệnh đọc trước lệnh vào hàng đợi luôn cung cấp đủ lệnh cho bộ giải mã Microfusion kết nối phần chung của 2 vi thao tác thành một vi thao tác tăng thông lượng của Retirement Unit Bộ phận dự đoán rẽ nhánh sử dụng phần cứng cho phép xử lý nhiều dạng rẽ nhánh và nâng cáo hiệu quả dự đoán Thuật toán dự đoán rẽ nhánh hướng dẫn đơn vị đọc lệnh đọc các lệnh có khả năng được thực hiện cao để giải mã. BÀI GIẢNG MÔN KỸ THUẬT VI XỬ LÝ www.ptit.edu.vn GIẢNG VIÊN: TS. HOÀNG XUÂN DẬU BỘ MÔN: KHOA HỌC MÁY TÍNH - KHOA CNTT1 Trang 30 CHƯƠNG 6 – CÁC VI XỬ LÝ VÀ CÔNG NGHỆ TIÊN TIẾN 7. Vi kiến trúc Intel Core The Execution Core: Có khả năng tiếp nhận & thực thi đến 6 vi thao tác trong 1 CK đồng hồ Retirement Unit có khả năng xử lý đến 4 lệnh trong 1 CK đồng hồ 3 ALU 3 cổng tiếp nhận các lệnh SIMD Có khả năng thực hiện các lệnh hầu hết các lệnh SIMD 128 bits trong 1 CK đồng hồ Có khả năng thực hiện đến 8 thao tác dấu phảy động trong 1 CK đồng hồ Giảm thời gian trễ truy nhập bộ nhớ sử dụng Smart Memory Access BÀI GIẢNG MÔN KỸ THUẬT VI XỬ LÝ www.ptit.edu.vn GIẢNG VIÊN: TS. HOÀNG XUÂN DẬU BỘ MÔN: KHOA HỌC MÁY TÍNH - KHOA CNTT1 Trang 31 CHƯƠNG 6 – CÁC VI XỬ LÝ VÀ CÔNG NGHỆ TIÊN TIẾN 8. Vi kiến trúc Atom BÀI GIẢNG MÔN KỸ THUẬT VI XỬ LÝ www.ptit.edu.vn GIẢNG VIÊN: TS. HOÀNG XUÂN DẬU BỘ MÔN: KHOA HỌC MÁY TÍNH - KHOA CNTT1 Trang 32 CHƯƠNG 6 – CÁC VI XỬ LÝ VÀ CÔNG NGHỆ TIÊN TIẾN 8. Vi kiến trúc Atom Vi kiến trúc Atom được tối ưu hoá cho hiệu năng và tiết kiệm điện năng cho các hệ thống đơn và đa luồng sử dụng các kỹ thuật: Advanced Micro-Ops Execution Intel Smart Cache Efficient Memory Access Intel Digital Media Boost Intel Virtual Technology Atom được sử dụng phổ biến trong các thiết bị “siêu di động” như netbook. 9BÀI GIẢNG MÔN KỸ THUẬT VI XỬ LÝ www.ptit.edu.vn GIẢNG VIÊN: TS. HOÀNG XUÂN DẬU BỘ MÔN: KHOA HỌC MÁY TÍNH - KHOA CNTT1 Trang 33 CHƯƠNG 6 – CÁC VI XỬ LÝ VÀ CÔNG NGHỆ TIÊN TIẾN 9. Tập lệnh SIMD SIMD – Single Instruction Multiple Data bắt đầu được sử dụng trong các CPU kể từ Pentium II và Pentium II MMX phục vụ các ứng dụng đồ hoạ SIMD có nhiều mở rộng: MMX, SSE (Streaming SIMD Extensions), SSE2, SSE3, SSSE3 (Supplemental SSE3) và SSE4 Các lệnh SIMD với số nguyên sử dụng các thanh ghi 64-bit MMX hoặc 128-bit XMM Các lệnh SIMD với số thực sử dụng các thanh ghi 128-bit XMM. BÀI GIẢNG MÔN KỸ THUẬT VI XỬ LÝ www.ptit.edu.vn GIẢNG VIÊN: TS. HOÀNG XUÂN DẬU BỘ MÔN: KHOA HỌC MÁY TÍNH - KHOA CNTT1 Trang 34 CHƯƠNG 6 – CÁC VI XỬ LÝ VÀ CÔNG NGHỆ TIÊN TIẾN 9. Tập lệnh SIMD Các lệnh MMX có thể xử lý hiệu quả các mảng hoặc các luồng số nguyên Các lệnh SSE có thể xử lý cả số nguyên và số thực. Chúng có thể được sử dụng hiệu quả trong các ứng dụng 3-D hoặc nén và giải nén hình ảnh SSE2 mở rộng khả năng của SSE - hỗ trợ các lệnh số nguyên với các thanh ghi XMM 128 bits. SSE3, SSE4 cung cấp các lệnh xử lý hiệu quả các số thực dấu phảy động. BÀI GIẢNG MÔN KỸ THUẬT VI XỬ LÝ www.ptit.edu.vn GIẢNG VIÊN: TS. HOÀNG XUÂN DẬU BỘ MÔN: KHOA HỌC MÁY TÍNH - KHOA CNTT1 Trang 35 CHƯƠNG 6 – CÁC VI XỬ LÝ VÀ CÔNG NGHỆ TIÊN TIẾN 10. Công nghệ Hyper-Threading Hyper-Threading Technology (HT Technology ) được phát triển để cải thiện hiệu năng cho các VXL dựa trên kiến trúc IA-32 khi sử dụng với: Các HĐH đa luồng (multi-threaded) Các ứng dụng đơn luồng chạy trong môi trường đa nhiệm HT Technology cho phép một CPU vật lý hai hay nhiều luồng mã lệnh đồng thời sử dụng các tài nguyên chia sẻ. Mỗi luồng có thể coi như 1 CPU logic với đầy đủ tập các thanh ghi của nó: thanh ghi dữ liệu, đoạn, điều khiển và debug. BÀI GIẢNG MÔN KỸ THUẬT VI XỬ LÝ www.ptit.edu.vn GIẢNG VIÊN: TS. HOÀNG XUÂN DẬU BỘ MÔN: KHOA HỌC MÁY TÍNH - KHOA CNTT1 Trang 36 CHƯƠNG 6 – CÁC VI XỬ LÝ VÀ CÔNG NGHỆ TIÊN TIẾN 10. Công nghệ Hyper-Threading 10 BÀI GIẢNG MÔN KỸ THUẬT VI XỬ LÝ www.ptit.edu.vn GIẢNG VIÊN: TS. HOÀNG XUÂN DẬU BỘ MÔN: KHOA HỌC MÁY TÍNH - KHOA CNTT1 Trang 37 CHƯƠNG 6 – CÁC VI XỬ LÝ VÀ CÔNG NGHỆ TIÊN TIẾN 11. Kiến trúc Intel 64 Không gian địa chỉ: 64 bits không gian địa chỉ tuyến tính cho phần mềm 40 bits không gian địa chỉ vật lý Hỗ trợ 2 chế độ hoạt động: Chế độ tương thích: cho phép HĐH 64-bit chạy các ứng dụng 32 bit Chế độ 64 bits: cho phép HĐH 64-bit chạy các ứng dụng 64 bits BÀI GIẢNG MÔN KỸ THUẬT VI XỬ LÝ www.ptit.edu.vn GIẢNG VIÊN: TS. HOÀNG XUÂN DẬU BỘ MÔN: KHOA HỌC MÁY TÍNH - KHOA CNTT1 Trang 38 CHƯƠNG 6 – CÁC VI XỬ LÝ VÀ CÔNG NGHỆ TIÊN TIẾN 12. Công nghệ ảo hoá Công nghệ ảo hoá (Virtualization Technology): Là sự kết hợp của các công nghệ phần cứng và phần mềm để tạo ra các máy ảo (Virtual Machines (VMs)); Cho phép trừu tượng hoá phần cứng để một máy tính có thể hoạt động giống như có nhiều máy tính Ưu điểm của công nghệ ảo hoá: Giảm số máy vật lý, nhưng vẫn đảm bảo số nền tảng đa dạng theo yêu cầu; Tiết kiệm không gian vật lý, điện năng và các tiện ích phục vụ khác; Hữu ích trong việc phát triển và kiểm thử phần mềm – cần nhiều môi trường để test; Hỗ trợ việc cân bằng tải động và khôi phục sau sự cố; Tạo nhiều desktops ảo trên một máy vật lý. BÀI GIẢNG MÔN KỸ THUẬT VI XỬ LÝ www.ptit.edu.vn GIẢNG VIÊN: TS. HOÀNG XUÂN DẬU BỘ MÔN: KHOA HỌC MÁY TÍNH - KHOA CNTT1 Trang 39 CHƯƠNG 6 – CÁC VI XỬ LÝ VÀ CÔNG NGHỆ TIÊN TIẾN 12. Công nghệ ảo hoá BÀI GIẢNG MÔN KỸ THUẬT VI XỬ LÝ www.ptit.edu.vn GIẢNG VIÊN: TS. HOÀNG XUÂN DẬU BỘ MÔN: KHOA HỌC MÁY TÍNH - KHOA CNTT1 Trang 40 CHƯƠNG 6 – CÁC VI XỬ LÝ VÀ CÔNG NGHỆ TIÊN TIẾN 12. Công nghệ ảo hoá Virtual Machine Monitor (VMM) VMM là thành phần trung tâm của công nghệ ảo hoá Điểm khó khăn nhất trong thiết kế VMM là vấn đề điểu khiển sử dụng tài nguyên vật lý một cách hiệu quả: • Vấn đề ánh xạ bộ nhớ • Vấn đề ánh xạ các thiết bị vào ra Hỗ trợ ảo hoá của Intel CPU giúp cho: Giảm tải cho các thao tác của VMM Tăng tốc và năng lực của VMM Giảm độ phức tạp khi phát triển VMM 11 BÀI GIẢNG MÔN KỸ THUẬT VI XỬ LÝ www.ptit.edu.vn GIẢNG VIÊN: TS. HOÀNG XUÂN DẬU BỘ MÔN: KHOA HỌC MÁY TÍNH - KHOA CNTT1 Trang 41 CHƯƠNG 6 – CÁC VI XỬ LÝ VÀ CÔNG NGHỆ TIÊN TIẾN 12. Công nghệ ảo hoá - VMWare
File đính kèm:
- Bài giảng Kỹ thuật vi xử lý - Chương 6 Các vi xử lý và công nghệ tiên tiến.pdf