I. Tổng Quan Về Đánh Giá Hiệu Suất Mã Hóa Video H
Ngày nay, nhu cầu sử dụng các dịch vụ truyền thông đa phương tiện, đặc biệt là video, ngày càng tăng cao. Cùng với đó, những yêu cầu về chất lượng, tốc độ truyền tải của video cũng ngày một khắt khe hơn. Một vấn đề phát sinh là dung lượng của video. Video càng có độ phân giải cao, chất lượng cao thì đi kèm với nó là dung lượng lớn. Một video chưa qua xử lý nén có dung lượng rất lớn. Ví dụ chỉ với video có độ phân giải là 720x576, 25 fps, độ sâu màu 8 bit thì tốc độ bit đã rất cao. Do đó, kể cả những hệ thống máy tính mạnh nhất, nếu không phải vấn đề băng thông thì quản lý lượng dữ liệu video lớn cũng là một vấn đề khó khăn. Tuy nhiên, video là một chuỗi ảnh mà sự khác nhau giữa các ảnh là rất nhỏ, do đó tồn tại một lượng thông tin thừa rất lớn nếu video được truyền tải toàn bộ. Thay vì truyền hai ảnh độc lập, ta có thể truyền chỉ một ảnh và sự khác nhau của nó với ảnh còn lại, qua đó giảm lượng dữ liệu cần truyền, giảm tốc độ bit. Nén video ra đời nhằm giải quyết vấn đề dung lượng và truyền tải video trên.
1.1. Giới Thiệu Chung Về Các Tiêu Chuẩn Mã Hóa Video
Phát triển qua nhiều thập kỷ, nhiều tiêu chuẩn nén video đã được công bố và sử dụng. Một số tiêu chuẩn nén video là H.263, MPEG-2, H.264/AVC và H.265/HEVC. Nén video đã phát triển được trong một thời gian dài, giúp giảm đáng kể dung lượng của một video, tăng khả năng truyền video qua các kênh truyền có băng thông khác nhau. H.264/AVC (Advanced Video Coding), có tên đầy đủ là MPEG-4 Part 10, Advanced Video Coding (MPEG-4 AVC) và là kỹ thuật nén phổ biến nhất. Mục tiêu của H.264/AVC là tập trung vào sự cải tiến trong mã hóa, kiến trúc dữ liệu và sự linh hoạt. H.264/AVC đã đạt được khả năng mã hóa tốt hơn so với chuẩn nén trước đó là H.263 và MPEG-2, giảm một nửa lượng bit-rate cần thiết để hiển thị một video trong khi người dùng cảm nhận về chất lượng video vẫn được đảm bảo.
1.2. Sự Ra Đời Của Chuẩn Mã Hóa Video H.265 HEVC
Nhu cầu về xem, thưởng thức các video có chất lượng cao ngày càng lớn, chẳng hạn như độ phân giải cao (HD, Ultra HD, 4K, 8K), tốc độ khung hình cao hơn và độ trung thực cao hơn, trong khi không có gì thay đổi về khả năng truyền tín hiệu qua mạng. Bên cạnh đó, video hiện nay ngày càng được sử dụng trong nhiều ứng dụng khác nhau, như ứng dụng di động, chat video theo thời gian thực, camera di động. Do đó, video có lượng truyền tải lớn nhất trên các mạng truyền thông, vì vậy cần một chuẩn nén mới tốt hơn. H.265/HEVC (High Efficiency Video Coding) là tiêu chuẩn nén mới nhất, nhằm mục đích cải thiện đáng kể hiệu suất nén, độ phân giải của tất cả các loại video, và các ứng dụng đa phương tiện. Chính thức ra phát triển từ tháng 1 năm 2010 với tên gọi là HEVC - High Efficiency Video Coding (Mã hóa video hiệu suất cao), phiên bản đầu tiên đã được hoàn thành, quy chuẩn H.265 và công bố vào tháng 1 năm 2013, bởi Nhóm các chuyên gia Hình ảnh động ISO/IEC (MPEG) và Nhóm các chuyên gia mã hóa video ITU-T (VCEG), những người đã phát triển Mã hóa video tiên tiến (H.264/AVC hiện tại đang thống trị các kỹ thuật mã hóa video trên toàn thế giới.
II. Ưu Điểm Vượt Trội Của H
Hiệu suất nén video tốt hơn khoảng 50% so với tiêu chuẩn trước (H.264/AVC), có nghĩa là tăng gấp đôi khả năng nén, hay giảm một nửa tốc độ bit trong khi dung lượng của video vẫn không đổi, qua đó H.265/HEVC sẽ sớm được sử dụng phổ biến. Hiệu suất nén video của H.265/HEVC cao, cho phép truyền các video chất lượng cao hơn, độ phân giải, tỷ lệ khung hình với dải động màu cao hơn. Do chỉ cung cấp hiệu suất mã hóa cho các bộ mã hóa, nên nó không đảm bảo video có chất lượng cụ thể, vì vậy H.265/HEVC hiện giờ vẫn còn trong quá trình phát triển và tối ưu hóa. Mục đích của luận án này là thể hiện những khía cạnh quan trọng nhất và các thông tin, kỹ thuật quan trọng về H.265/HEVC, sau đó phân tích và so sánh với các tiêu chuẩn mã hóa trước đó, cụ thể là H.264/AVC.
2.1. Cấu Trúc Mã Hóa Video Trong H.265 HEVC
H.265/HEVC cấu trúc, các thuật toán, kỹ thuật của H.265/HEVC được mở rộng, phát triển dựa trên chuẩn mã hóa H.264. Nó hỗ trợ giao diện mạng, hệ thống, và tầng mã hóa video để truyền tín hiệu video. Các tập tham số chứa dữ liệu bậc cao, có thể truy cập dễ dàng khi mã hóa toàn bộ video, nhóm các hình ảnh liên tiếp nhau hoặc từng slice bên trong một bức ảnh. Tất cả các dữ liệu video đã mã hóa và giá trị của các tham số sử dụng trong quá trình mã hóa được đóng gói và lưu trong các gói tin của lớp trừu tượng hóa mạng (gói NAL – Network Abstraction Layer) trước khi truyền đến bộ giải mã.
2.2. Lớp Trừu Tượng Hóa Mạng NAL Trong H.265 HEVC
Trong H.265/HEVC, NAL được thiết kế “thân thiện với đường truyền”, nó có chức năng truyền tải dữ liệu dạng video trên các kênh truyền khác nhau, cho các ứng dụng khác nhau. Mỗi gói NAL chứa một số lượng byte hạn chế. Dựa trên 2 byte đầu tiên ở tiêu đề gói NAL, người nhận có thể xác định loại dữ liệu có trong gói NAL. Trong H.265/HEVC, có tổng cộng 64 loại gói NAL, được chia thành hai loại: mã hóa video (VCL NAL) và mã hóa phi video (non-VCL NAL). Các gói VCL NAL mang một phần của một dữ liệu hình ảnh của video đã được mã hóa, trong khi các gói non-VCL NAL chứa các dữ liệu kiểm soát, thông số sử dụng trong quá trình giải mã.
III. So Sánh Kỹ Thuật Dự Đoán Nội Ảnh và Liên Ảnh
Chương 3 giải thích và so sánh kỹ thuật dự đoán nội ảnh và dự đoán liên ảnh trong H.265/HEVC, hai phần quan trọng nhất trong mã hóa nén video. Phần cuối cùng là những so sánh về bộ lọc trong, và chức năng khử rung, khử block của nó. H.265/HEVC là một phương pháp mã hóa video hỗn hợp theo khối, nền tảng của mã hóa video, giống như những chuẩn mã hóa trước. H.265/HEVC đề xuất một cấu trúc dữ liệu, có thể cải thiện đáng kể khả năng dự đoán và chuyển đổi của tiêu chuẩn nén H.264.
3.1. Khối Mã Hóa Cây CTB và Đơn Vị Mã Hóa Cây CTU
Thay vì sử dụng khối macroblock như H.264/AVC và tất cả các tiêu chuẩn mã hóa video trước, trong H.265/HEVC, một hình ảnh được phân chia thành nhiều khối vuông, gọi là khối mã hóa cây (CTB – Coding Tree Blocks), như thể hiện trong Hình 2-5 (macroblock) và 2-6 (CTB). H.265/HEVC có kích thước từ 4x4 đến 64x64, lớn hơn so với kích thước lớn nhất của một macroblock (16x16) được sử dụng trong H.264. Một CTB, chính nó có thể chia ra các CTB khác dựa trên độ phức tạp của ảnh theo cấu trúc dữ liệu dạng cây (quad-tree structure). Do đó, một thành phần sáng CTB và 2 thành phần màu CTB tương ứng sẽ tạo ra một đơn vị mã hóa cây (CTU – Coding Tree Units) nếu định dạng nén video là 4:2:0, giống như macroblock, là đơn vị xử lý trong H.264.
3.2. Khối Dự Đoán PB và Đơn Vị Dự Đoán PU
Trường hợp CU được mã hóa theo dự đoán liên ảnh (inter-picture prediction), 2 thành phần sáng (luma) và màu (chroma) của CU đó có thể được chia thành các đơn vị nhỏ hơn làm cơ sở để dự đoán, gọi là các khối dự đoán (PB – Prediction Blocks). Do đó, PB được định nghĩa là các mẫu chứa thành phần sáng hoặc màu mà sử dụng thông số chuyển động (motion parameters) giống nhau. Trong đó, các thông số chuyển động bao gồm các vector chuyển động được dự đoán và những ảnh tham chiếu của các vector đó. Tương tự với cú pháp của CU, một đơn vị dự đoán (PU – Prediction Units) được tạo ra bởi một PB độ sáng và PB màu sắc tương ứng của nó. Một CU có thể chứa nhiều đơn vị dự đoán, trường hợp đặc biệt là khi kích thước của PU bằng với gốc CU nên CU chỉ có một PU.
IV. Cải Tiến Phương Pháp Dự Đoán Nội Ảnh Trong H
Chương 4 giải thích một số kỹ thuật được đề xuất nhằm cải thiện phương pháp dự đoán intra prediction của HEVC. Dự đoán nội ảnh (Intra Prediction) là một kỹ thuật quan trọng trong mã hóa video, đặc biệt là trong các chuẩn nén video hiện đại như H.264/AVC và H.265/HEVC. Kỹ thuật này tận dụng sự tương quan không gian giữa các pixel lân cận trong cùng một khung hình để dự đoán giá trị của một pixel dựa trên các pixel đã được mã hóa trước đó. Mục tiêu chính của dự đoán nội ảnh là giảm thiểu lượng thông tin cần thiết để mã hóa video, từ đó tăng hiệu quả nén và giảm băng thông truyền tải.
4.1. Các Chế Độ Dự Đoán Nội Ảnh Trong H.265 HEVC
H.265/HEVC cung cấp một số lượng lớn các chế độ dự đoán nội ảnh, cho phép mã hóa video hiệu quả hơn so với các chuẩn trước đó. Các chế độ này bao gồm các hướng dự đoán khác nhau, từ đó cho phép dự đoán chính xác hơn các pixel trong khối hiện tại. Việc lựa chọn chế độ dự đoán phù hợp là rất quan trọng để đạt được hiệu quả nén tối ưu. Các thuật toán và kỹ thuật được đề xuất trong chương này nhằm mục đích cải thiện quá trình lựa chọn chế độ dự đoán, từ đó nâng cao hiệu suất tổng thể của mã hóa video.
4.2. Tối Ưu Hóa Quá Trình Dự Đoán Nội Ảnh Bằng Thuật Toán
Một số thuật toán và kỹ thuật đã được đề xuất để tối ưu hóa quá trình dự đoán nội ảnh trong H.265/HEVC. Các phương pháp này bao gồm việc sử dụng các bộ lọc thích nghi, các kỹ thuật làm mịn và các phương pháp dự đoán dựa trên mô hình. Mục tiêu của các thuật toán này là giảm thiểu sai số dự đoán và cải thiện chất lượng video sau khi giải mã. Các kết quả nghiên cứu cho thấy rằng việc áp dụng các thuật toán này có thể cải thiện đáng kể hiệu suất nén video và giảm băng thông truyền tải.
V. Ứng Dụng Thực Tế và Kết Quả Nghiên Cứu Mã Hóa Video
Các kết quả nghiên cứu và ứng dụng thực tế của H.265/HEVC đã chứng minh được hiệu quả vượt trội của chuẩn nén này so với các chuẩn trước đó. Trong nhiều thử nghiệm, H.265/HEVC đã cho thấy khả năng giảm băng thông truyền tải lên đến 50% so với H.264/AVC, trong khi vẫn duy trì chất lượng video tương đương. Điều này có ý nghĩa rất lớn đối với các ứng dụng truyền video trực tuyến, video conferencing và lưu trữ video.
5.1. Ứng Dụng H.265 HEVC Trong Truyền Hình Độ Nét Cao
H.265/HEVC đã được ứng dụng rộng rãi trong các hệ thống truyền hình độ nét cao (HDTV) và truyền hình siêu nét (UHDTV). Khả năng nén video hiệu quả của H.265/HEVC cho phép truyền tải các video có độ phân giải cao mà không cần băng thông quá lớn. Điều này giúp các nhà cung cấp dịch vụ truyền hình có thể cung cấp các kênh truyền hình chất lượng cao hơn cho người dùng.
5.2. H.265 HEVC Trong Các Ứng Dụng Di Động và Video Streaming
H.265/HEVC cũng đã được tích hợp vào các ứng dụng di động và video streaming. Khả năng nén video hiệu quả của H.265/HEVC giúp giảm dung lượng video, từ đó tiết kiệm băng thông và pin cho các thiết bị di động. Điều này đặc biệt quan trọng đối với các ứng dụng video streaming, nơi người dùng thường xuyên xem video trên các thiết bị di động với kết nối mạng không ổn định.
VI. Kết Luận và Hướng Phát Triển Tương Lai Mã Hóa Video
Chương 5 kết luận những mục tiêu đã đạt được sau khi hoàn thành khóa luận và những hướng phát triển sắp tới, có thể mở rộng. H.265/HEVC cấu trúc, các thuật toán, kỹ thuật của H.265/HEVC được mở rộng , phát triển dựa trên chuẩn mã hóa H.264. Nó hỗ trợ giao diện mạng, hệ thống, và tầng mã hóa video để truyền tín hiệu video. Các tập tham số chứa dữ liệu bậc cao, có thể truy cập dễ dàng khi mã hóa toàn bộ video, nhóm các hình ảnh liên tiếp nhau hoặc từng slice bên trong một bức ảnh.
6.1. Tổng Kết Về Hiệu Suất Của H.265 HEVC
H.265/HEVC đã chứng minh được hiệu suất vượt trội so với các chuẩn nén video trước đó. Khả năng nén video hiệu quả của H.265/HEVC cho phép giảm băng thông truyền tải và dung lượng lưu trữ video, đồng thời vẫn duy trì chất lượng video cao. Điều này có ý nghĩa rất lớn đối với các ứng dụng truyền video trực tuyến, video conferencing và lưu trữ video.
6.2. Hướng Phát Triển và Nghiên Cứu Tiếp Theo Về Mã Hóa Video
Mặc dù H.265/HEVC đã đạt được nhiều thành công, nhưng vẫn còn nhiều hướng phát triển và nghiên cứu tiếp theo trong lĩnh vực mã hóa video. Các nhà nghiên cứu đang tiếp tục tìm kiếm các thuật toán và kỹ thuật mới để cải thiện hiệu suất nén video, giảm độ trễ và tăng cường khả năng chịu lỗi. Một số hướng nghiên cứu tiềm năng bao gồm việc sử dụng trí tuệ nhân tạo (AI) và học máy (machine learning) để tối ưu hóa quá trình mã hóa video.