I. Tổng Quan Về Kỹ Thuật Mã Hóa Video Giới Thiệu Chung
Trong những năm gần đây, việc truyền tải và lưu trữ video ngày càng trở nên phổ biến. Giá thành các sản phẩm liên quan như máy quay video HD, TV màn hình lớn, các thiết bị lưu trữ giảm nhanh chóng. Bộ vi xử lý mới có tốc độ cao hơn, tốc độ internet được cải thiện đáng kể, giúp việc tải một bộ phim nhanh chóng và trải nghiệm mượt mà hơn. Nhu cầu trải nghiệm video ngày càng lớn, từ độ phân giải 480p đến mHD 720p, và giờ đây là Full HD 1080p. Sự xuất hiện của TV 4K với độ phân giải siêu cao càng thúc đẩy nhu cầu này. Các thiết bị lưu trữ và đường truyền internet cần phải lớn hơn để đáp ứng, đòi hỏi một chuẩn nén video mới hiệu quả hơn. Với hình ảnh độ phân giải Full HD (FHD) 1920x1080, chuẩn nén H.264 có thể dễ dàng thực hiện quá trình mã hóa và giải mã tín hiệu. Tuy nhiên, FHD đang bị thay thế dần bởi độ phân giải 4K x 2K (3840x2610), và H.264 có vẻ bị tụt hậu và phát sinh nhiều lỗi trước các độ phân giải cao này. Vấn đề còn tệ hơn nữa với sự xuất hiện của độ phân giải rất cao 8K x 4K (7680x4320) hay còn được gọi là Ultra HD. H.264 đang gặp vấn đề về dung lượng lưu trữ và đặc biệt là quá trình xử lý các hình ảnh độ nét cao.
1.1. Lịch Sử Phát Triển Của Các Chuẩn Mã Hóa Video
Từ những khái niệm ban đầu về mã hóa video kết hợp không gian-thời gian, các chuẩn mã hóa video đã trải qua một quá trình phát triển liên tục. Hiệu suất mã hóa video được cải thiện khoảng 50% sau mỗi 10 năm, đi kèm với đó là sự tăng lên độ phức tạp tính toán và bộ nhớ. Hiện tại, các chuẩn mã hóa video đang gặp phải những thách thức lớn để cải thiện đáng kể hiệu quả mã hóa, nhằm đáp ứng yêu cầu kỹ thuật của các ứng dụng phương tiện thông minh và công nghệ hiện đại như nhận diện khuôn mặt/cơ thể, theo dõi đối tượng, truy xuất hình ảnh. Các chuẩn như MPEG, H.264, và gần đây nhất là H.265 (HEVC) đều đóng vai trò quan trọng trong việc giảm băng thông video và dung lượng lưu trữ.
1.2. Tại Sao Cần Các Kỹ Thuật Mã Hóa Video Tiên Tiến
Với sự tăng lên nhanh chóng của các thiết bị video, từ máy quay cầm tay đến mạng cảm biến video công suất thấp và điện thoại di động được trang bị đa phương tiện, mã hóa độ phức tạp thấp trở nên quan trọng để đáp ứng với công suất và mức tiêu hao năng lượng của các thiết bị di động. Để đáp ứng những nhu cầu này cho truyền thông video, mã hóa video phân tán (Distributed Video Coding – DVC) được phát triển dựa trên lý thuyết Slepian-Wolf và Wyner-Ziv. Mã hóa video phân tán có thể được phát triển theo một trong hai cách tiếp cận chính. Cách tiếp cận đầu tiên, đề xuất bởi nhóm nghiên cứu ở trường Đại học Stanford, theo hướng mã hóa toàn khung hình. Mỗi video đầu vào được chia tách thành hai loại, khung hình chính (Key frame) và khung hình Wyner-Ziv (WZ frame).
II. Mã Hóa Video Dự Đoán HEVC Tổng Quan Về Tiêu Chuẩn
HEVC (High Efficiency Video Coding) hay H.265 là một chuẩn mã hóa video hiệu quả cao, được Ủy ban Viễn thông Quốc tế ITU-T thông qua và bắt đầu được các nhà phát triển đưa vào sản phẩm thương mại. H.265 hứa hẹn mang lại khả năng nén cao gấp đôi so với người tiền nhiệm H.264, giúp giảm băng thông cần thiết để truyền tải phim, giảm dung lượng lưu trữ và chúng ta phải trả ít tiền hơn cho băng thông internet và thiết bị lưu trữ. Ưu điểm vượt trội này cũng sẽ là cú hích cho thị trường thiết bị nghe nhìn 4K/UHD. Trong tương lai, với các đoạn video trên Youtube, Facebook, chúng ta có thể xem với hình ảnh tuyệt nét mà không cần phải chờ đợi để tải về nữa. Tại triển lãm Mobile World Congress, hãng Qualcomm đã trình diễn hiệu năng của bộ nén mới trên tablet khi mà chuẩn nén mới đã cho chất lượng hiển thị tương đương với dung lượng gần như giảm một nửa.
2.1. Cấu Trúc Mã Hóa Video Theo Chuẩn HEVC
Trong HEVC, mỗi ảnh đầu vào được chia thành các khối ảnh, sau đó được mã hóa và được truyền tải đến các bộ giải mã. Ảnh đầu tiên của một chuỗi video được mã hóa chỉ sử dụng dự đoán trong khung. Đối với các ảnh còn lại của chuỗi sử dụng các chế độ mã hóa dự đoán liên khung theo thời gian. Quá trình mã hóa cho dự đoán liên khung sẽ lựa chọn dữ liệu chuyển động bao gồm các ảnh tham chiếu và vector chuyển động (MV) dùng để dự đoán các mẫu của mỗi khối ảnh. Các bộ mã hóa và giải mã tạo ra tín hiệu dự đoán liên khung giống nhau bằng các sử dụng kỹ thuật bù chuyển động (MC) và thông tin phụ (side information) là dữ liệu để quyết định chế độ.
2.2. Các Đơn Vị Mã Hóa Trong HEVC CTU CU PU TU
Đối với các chuẩn mã hóa trước đó, khung ảnh được chia thành các đơn vị mã hóa là các macroblock, bao gồm một khối 16x16 các mẫu thành phần chói và các khối 8x8 các mẫu thành phần màu, trong khi đó các cấu trúc tương tự trong HEVC là đơn vị cây mã hóa (CTU). Cụ thể, ảnh được chia thành các CTU, mỗi CTU bao gồm các CTB chói và các CTB màu. Một CTB có kích thước là 16, 32 hoặc 64, trong đó các kích thước lớn hơn cho phép nén tốt hơn. HEVC hỗ trợ việc phân chia các CTB thành các khối nhỏ hơn sử dụng cấu trúc cây và tín hiệu hóa cây tứ phân.
2.3. Mã Hóa Trong Khung Intra Coding và Liên Khung Inter Coding
Dự đoán trong khung hoạt động theo kích thước TB, và các mẫu biên giải mã trước đó từ những TB lân cận về mặt không gian được sử dụng để tạo ra tín hiệu dự đoán. Dự đoán trong ảnh hỗ trợ 33 hướng khác nhau với các kích thước TB từ 4x4 đến 32x32. Ngoài ra dự đoán mặt phẳng và dự đoán DC cũng có thể được sử dụng. Đối với thành phần màu, chế độ dự đoán ngang, dọc, mặt phẳng và DC có thể được báo hiệu một cách rõ ràng, hoặc chế độ dự đoán thành phần màu được chỉ định giống các chế độ dự đoán thành phần chói. Mỗi TB được mã hóa bằng một trong những loại mã hóa, tùy thuộc vào loại mảng. HEVC hỗ trợ các phương pháp mã hóa dự đoán trong ảnh khác nhau gọi là Intra_Angular, Intra_Planar, and Intra_DC.
III. Kỹ Thuật Mã Hóa Video Phân Tán DVC Giải Pháp Mới
Mã hóa video phân tán (Distributed Video Coding – DVC) là một mô hình mã hóa video được phát triển dựa trên lý thuyết Slepian-Wolf và Wyner-Ziv. DVC có thể được phát triển theo một trong hai cách tiếp cận chính. Cách tiếp cận đầu tiên, đề xuất bởi nhóm nghiên cứu ở trường Đại học Stanford, theo hướng mã hóa toàn khung hình. Mỗi video đầu vào được chia tách thành hai loại, khung hình chính (Key frame) và khung hình Wyner-Ziv (WZ frame). Trong khi các khung chính được mã hóa bởi các bộ mã hóa chuẩn với cấu hình phức tạp thấp (H.264/AVC Intra), các khung WZ được mã hóa sử dụng các bộ mã hóa kênh như mã turbo hoặc mã LDPC, kết hợp với ước lượng giá trị của khung hình tại phía thu.
3.1. Nguyên Lý Hoạt Động Của Mã Hóa Video Phân Tán
Trong phương pháp truyền thống, video được tạo dự đoán tại cả phía phát và phía thu, thông tin dư thừa được xác định tại phía phát sẽ được gửi đi, do vậy, phía phát sẽ phải làm rất nhiều nhiệm vụ phức tạp. Trong khi đó, với phương pháp mã hóa video phân tán, phía thu sẽ đảm nhiệm vai trò tạo dự đoán, thông qua một bộ tạo thông tin phụ (Side information). Phía phát chỉ đơn giản truyền đi sự khác biệt tương quan giữa thông tin gốc và thông tin phụ tại phía thu. Do vậy, thời gian mã hóa sẽ được giảm đi đáng kể.
3.2. Ưu Điểm Của Mã Hóa Video Phân Tán So Với Mã Hóa Truyền Thống
Ưu điểm chính của mã hóa video phân tán là giảm độ phức tạp tính toán tại bộ mã hóa, chuyển phần lớn công việc xử lý sang bộ giải mã. Điều này đặc biệt hữu ích trong các ứng dụng như mạng cảm biến video, nơi các thiết bị cảm biến có nguồn tài nguyên hạn chế. Mã hóa video phân tán cũng có khả năng chống lỗi tốt hơn trong môi trường truyền dẫn không ổn định.
IV. Xây Dựng Mô Hình Mã Hóa Video Tiên Tiến Trên Nền H
Luận văn này tập trung nghiên cứu và xây dựng một mô hình mã hóa video phân tán thế hệ mới, trên nền tảng chuẩn H.265. Mục đích nghiên cứu là tìm hiểu về chuẩn mã hóa video thế hệ mới H.265/HEVC, mô hình mã hóa video phân tán DVC và từ đó nghiên cứu, đề xuất nhằm cải tiến thông tin phụ đối với mã hóa video thế hệ mới H.265. Đối tượng nghiên cứu là nghiên cứu, cải thiện chất lượng thông tin phụ trong mô hình DVC. Phạm vi và phương pháp nghiên cứu: Luận văn đưa ra cái nhìn tổng quan về mã hóa video dự đoán chuẩn HEVC, mã hóa video phân tán DVC, mô hình DVC dựa trên kiến trúc DISCOVER.
4.1. Kiến Trúc Mã Hóa Video Phân Tán Sử Dụng HEVC
Kiến trúc tổng quan mã hóa video phân tán sử dụng HEVC cho mã hóa intra và sau đó đưa ra mô hình tạo thông tin phụ mới, ứng dụng của mã hóa DVC trong việc giúp cải thiện năng lượng tiêu thụ của các cảm biến. Luận văn sẽ tập trung vào cách hình thành nên thông tin phụ.
4.2. Cải Tiến Thông Tin Phụ Trong Mô Hình DVC HEVC
Mục tiêu chính là cải thiện chất lượng thông tin phụ trong mô hình DVC. Thông tin phụ đóng vai trò quan trọng trong việc giải mã các khung hình Wyner-Ziv, do đó, việc cải thiện chất lượng thông tin phụ sẽ giúp tăng hiệu suất nén và giảm băng thông yêu cầu.
V. Ứng Dụng Thực Tế Của Kỹ Thuật Mã Hóa Video Phân Tán
Mã hóa video phân tán (DVC) có nhiều ứng dụng tiềm năng trong các lĩnh vực khác nhau của công nghệ thông tin. Một trong những ứng dụng quan trọng nhất là trong mạng cảm biến video, nơi các thiết bị cảm biến có nguồn tài nguyên hạn chế và cần truyền tải video một cách hiệu quả. DVC cũng có thể được sử dụng trong các ứng dụng streaming video, video conferencing, và video surveillance.
5.1. Ứng Dụng DVC Trong Mạng Cảm Biến Video
Trong mạng cảm biến video, các thiết bị cảm biến thường có nguồn tài nguyên hạn chế về năng lượng và khả năng tính toán. DVC cho phép các thiết bị cảm biến mã hóa video với độ phức tạp thấp, giảm thiểu tiêu thụ năng lượng và kéo dài tuổi thọ pin. Các khung hình Wyner-Ziv có thể được giải mã tại trung tâm thu thập dữ liệu, nơi có nguồn tài nguyên lớn hơn.
5.2. DVC Trong Các Ứng Dụng Streaming Video và Video Conferencing
DVC có thể được sử dụng để cải thiện chất lượng và hiệu quả của các ứng dụng streaming video và video conferencing. Bằng cách phân tán quá trình mã hóa và giải mã, DVC có thể giảm độ trễ và tăng khả năng chống lỗi trong môi trường truyền dẫn không ổn định. Điều này đặc biệt quan trọng trong các ứng dụng thời gian thực, nơi độ trễ có thể ảnh hưởng đến trải nghiệm người dùng.
VI. Kết Luận và Hướng Phát Triển Của Kỹ Thuật Mã Hóa Video
Kỹ thuật mã hóa video đã trải qua một quá trình phát triển liên tục, từ các chuẩn mã hóa truyền thống đến các kỹ thuật tiên tiến như mã hóa video phân tán. Các chuẩn mã hóa mới như HEVC (H.265) đã mang lại những cải tiến đáng kể về hiệu suất nén, nhưng vẫn còn nhiều thách thức cần giải quyết để đáp ứng nhu cầu ngày càng tăng về video chất lượng cao. Mã hóa video phân tán hứa hẹn sẽ đóng vai trò quan trọng trong tương lai của công nghệ thông tin, đặc biệt là trong các ứng dụng yêu cầu độ phức tạp thấp và khả năng chống lỗi cao.
6.1. Tóm Tắt Các Kết Quả Nghiên Cứu Chính
Luận văn đã trình bày một tổng quan về các kỹ thuật mã hóa video hiện đại, bao gồm cả mã hóa video dự đoán và mã hóa video phân tán. Luận văn cũng đã đề xuất một mô hình mã hóa video phân tán thế hệ mới trên nền tảng chuẩn H.265, tập trung vào việc cải thiện chất lượng thông tin phụ để tăng hiệu suất nén.
6.2. Hướng Phát Triển Trong Tương Lai
Trong tương lai, các nghiên cứu về mã hóa video sẽ tiếp tục tập trung vào việc cải thiện hiệu suất nén, giảm độ phức tạp tính toán, và tăng khả năng chống lỗi. Các kỹ thuật trí tuệ nhân tạo (AI) và học máy (Machine Learning) có thể được sử dụng để phát triển các thuật toán mã hóa thông minh hơn, có khả năng thích ứng với các đặc tính của video và môi trường truyền dẫn.