« Home « Kết quả tìm kiếm

Thuật toán tìm kiếm nhanh khối tiên đoán trong ảnh bộ mã hóa H.265/HEVC.


Tóm tắt Xem thử

- NGUYỄN QUỐC VIỆT THUẬT TOÁN TÌM KIẾM NHANH KHỐI TIÊN ĐOÁN TRONG ẢNH BỘ MÃ HÓA H.265/HEVC LUẬN VĂN THẠC SỸ KỸ THUẬT CHUYÊN NGHÀNH KỸ THUẬT ĐIỆN TỬ Hà Nội, 10-2014 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI.
- NGUYỄN QUỐC VIỆT THUẬT TOÁN TÌM KIẾM NHANH KHỐI TIÊN ĐOÁN TRONG ẢNH BỘ MÃ HÓA H.265/HEVC Chuyên nghành: Kỹ thuật điện tử LUẬN VĂN THẠC SỸ KỸ THUẬT Người hướng dẫn khoa học: TS.
- NGUYỄN VŨ THẮNG Hà Nội, 10-2014 Thuật toán tìm kiếm nhanh-HEVC GVHD: TS.
- Nguyễn Vũ Thắng Nguyễn Quốc Việt iii LỜI CAM ĐOAN Tôi xin cam đoan luận văn “ Thuật toán tìm kiếm nhanh khối tiên đoán trong ảnh bộ mã hóa H.265/HEVC” là công trình nghiên cứu của riêng tôi.
- Hà nội, ngày 15 tháng 9 năm 2014 Tác giả luận văn Nguyễn Quốc Việt Thuật toán tìm kiếm nhanh-HEVC GVHD: TS.
- Cho đến nay có rất nhiều kỹ thuật nén dữ liệu đa phương tiện như: chuẩn JPEG, chuẩn JPEG2000, chuẩn MPEG…đã ra đời trong lịch sử số hóa của loài người.
- Gần đây nhất là sự thành công của tiêu chuẩn mã hóa MPEG-4 H.264/AVC đã được áp dụng trong nhiều lĩnh vực từ truyền luồng internet tốc độ bit thấp đến các ứng dụng quảng bá HDTV và cinema số, truyền thông video qua mạng internet, truyền hình di dộng theo chuẩn DVB-H, truyền hình số mặt đất, truyền hình theo yêu cầu, tin nhắn đa phương tiện MMS… qua các mạng ISDN, DSL, Wireless, LAN và vệ tinh…Nhưng với yêu cầu bộ mã hóa có thể tương thích với các ứng dụng tốc độ bit thấp, mà lại cho chất lượng video ngày càng cao thì nghành công nghiệp số hóa không thể dừng lại ở H.264/AVC.
- Từ việc nghiên cứu khắc phục nhược điểm và phát triển bổ sung cho H.264/AVC để cho ra đời những chuẩn nén tiên tiến hơn, mà nổi bật là H.265/HEVC.
- HEVC có H Thuật toán tìm kiếm nhanh-HEVC GVHD: TS.
- Nguyễn Vũ Thắng Nguyễn Quốc Việt v tỷ lệ nén dữ liệu gấp đôi so với H.264/MPEG-4/AVC ở cùng một mức độ chất lượng video.
- Hỗ trợ tới 8k Utral HD và độ phân giải lên đến P).
- Video độ phân giải 4K Ultra-HD cũng vì thế mà trở nên phổ biến hơn, miễn là hạ tầng mạng có thể đáp ứng được băng thông trong khoảng 20-30Mbps (vẫn còn cao hơn nhiều so với băng thông mạng hiện nay, nhưng hoàn toàn có thể trong tương lai).
- Codec H.265/HEVC bao gồm ba cấu hình chính: Main (hỗ trợ video 8-bit 4:2:0), Main 10 (hỗ trợ video 10 bit) và Main Still Picture (dành cho việc nén ảnh tĩnh, dùng chung công cụ với quá trình nén video).
- Phim 3D stereoscopic cũng nằm trong danh sách nghiên cứu để bổ sung cho H.265/HEVC.
- Có khả năng phần mềm giải mã/mã hóa cho H.265 sẽ xuất hiện vào cuối năm 2014, tuy nhiên chỉ khi nào các nhà sản xuất tích hợp bộ chuyển mã vào trong chip thì H.265 mới bắt đầu "cất cánh" (thường giai đoạn này mất từ 12 đến 18 tháng, có thể dài hơn).
- Để có thể hiểu biết hơn về tiêu chuẩn nén tiên tiến này, em đã chọn đề tài “Thuật toán tím kiếm nhanh khối tiên đoán trong ảnh bộ mã hóa H.265/HEVC” làm luận văn tốt nghiệp của mình.
- Sau hơn 6 tháng nỗ lực hết mình, về cơ bản luận văn cũng đã cho ta cái nhìn tổng quát về chuẩn nén H.265/HEVC, đồng thời em đã đưa ra được cải tiến về kỹ thuật nén trong ảnh trong H.265/HEVC.
- Tuy nhiên do có sự hạn chế về kinh Thuật toán tìm kiếm nhanh-HEVC GVHD: TS.
- Kính chúc quý thầy cô và bạn bè được nhiều sức khỏe! Thuật toán tìm kiếm nhanh-HEVC GVHD: TS.
- Nguyễn Vũ Thắng Nguyễn Quốc Việt vii TÓM TẮT ĐỀ TÀI Để thực hiện luận văn, em nghiên cứu chuẩn mã hóa video HEVC và xu hướng cải tiến quá trình mã hóa HEVC từ năm 2010 trở lại đây đặc biệt là xu hướng về cải tiến khối tiên đoán của HEVC.
- Mục đích của em là hiểu được thế giới đã làm được những gì đối với khối tiên đoán trong chuẩn HEVC và những vấn đề còn tồn đọng cần giải quyết trong khối tiên đoán của HEVC.
- Tiếp theo, em thực hiện việc trích xuất các dữ liệu về giá trị của mỗi pixel và các thông tin kèm theo trong quá trình tiên đoán của phần mềm HM 9.1 được cung cấp bởi ITU – T, phân tích các loại dữ liệu đó để tìm ra đặc điểm chung, qua đó tìm ra thuật toán để xác định cách thức hợp lý nhất để tiên đoán được các mode dự đoán một cách chính xác.Từ các thông tin củacác block ảnh đầu vào, thông tin về mật độ phân bổ các mode tốt nhất và qua giải thuật được đề xuất, khối tiên đoán Intra giảm số block cần dự đoán.
- Cuối cùng em đưa ra các kết quả và tổng hợp của thuật toán.
- Thuật toán tìm kiếm nhanh-HEVC GVHD: TS.
- Nguyễn Vũ Thắng Nguyễn Quốc Việt viii MỤC LỤC LỜI CAM ĐOAN.
- BỘ MÃ HÓA/ GIẢI MÃ VIDEO CHUẨN H.265/HEVC.
- 3 1.1 Giới thiệu về nén ảnh, các chuẩn nén.
- 3 1.2 Giới thiệu chuẩn nén H.265/HEVC.
- 7 1.3 Lịch sử phát triển của chuẩn nén H.265/HEVC.
- 8 1.4 Bộ mã hóa video chuẩn HEVC.
- 10 1.4.1 Dự đoán.
- MÔ TẢ CHI TIẾT VỀ BỘ MÃ HÓA TRONG HEVC.
- 15 2.1.1 Phân vùng khối cây mã hóa.
- 15 2.1.3 Khối mã hóa (CU.
- 17 2.1.4 Cấu trúc cây mã hóa.
- 17 2.1.5 Cấu trúc khối dự đoán (PU.
- 19 2.2 Dự đoán trong ảnh.
- 20 2.2.1 Các chế độ dự đoán.
- 22 2.3 Dự đoán liên ảnh.
- 22 2.3.1 Các chế độ dự đoán.
- 23 2.3.3 Các ứng viên kết hợp theo thời gian.
- 27 Thuật toán tìm kiếm nhanh-HEVC GVHD: TS.
- Nguyễn Vũ Thắng Nguyễn Quốc Việt ix 2.4 Dự đoán vector chuyển động.
- PHÂN TÍCH DỮ LIỆU CHUYỂN ĐỘNG SAU QUÁ TRÌNH TIÊN ĐOÁN 38 3.1 Phần mềm tham chiếu H.265/HEVC.
- 38 3.1.1 Giới thiệu về bộ mã hóa và giải mã HM.
- 40 3.2 Thực hiện dự đoán trong phần mềm HM9.1.
- 42 3.2.2 Quyết định mã hóa liên ảnh và trong ảnh.
- TRIỂN KHAI CÁC THUẬT TOÁN ĐÃ ĐỀ XUẤT.
- 54 4.1 Triển khai thuật toán tìm kiếm nhanh dựa vào phân tích mật độ phân bổ mode tốt nhất.
- 62 Thuật toán tìm kiếm nhanh-HEVC GVHD: TS.
- Nguyễn Vũ Thắng Nguyễn Quốc Việt x DANH SÁCH HÌNH VẼ Hình 1-1 Sơ đồ khối chức năng tổng quát bộ mã hóa video chuẩn HEVC.
- 14 Hình 2-1Ví dụ về chia hình ảnh thành các khối cây mã hóa.
- 17 Hình 2-3 Ví dụ về cấu trúc cây mã hóa.
- 18 Hình 2-4 Các chế độ phân vùng trong khối PU mã hóa liên ảnh.
- 19 Hình 2-6 33 hướng dự đoán trong ảnh.
- 25 Hình 2-11 Minh họa cho việc lấy tỉ lệ vector chuyển động cho tìm kiếm ứng viên kết hợp theo thời gian.
- 38 Hình 3-2Xử lý mã hóa video trong HM-9.1.
- 40 Hình 3-4 Cửa sổ lệnh trong quá trình mã hóa.
- 43 Thuật toán tìm kiếm nhanh-HEVC GVHD: TS.
- Nguyễn Vũ Thắng Nguyễn Quốc Việt xi Hình 3-7 Lựa chọn chế độ dự đoán liên ảnh và trong ảnh của hàm xCompressCU .
- 47 Hình 3-11 Mật đổ phân bổ mode tiên đoán với video mẫu BasketballPass.
- 48 Hình 3-12 Mật độ phân bổ mode tiên đoán với video mẫu BlowingBubbles.
- 48 Hình 3-13 Mật độ phân bổ mode tiên đoán với video mẫu BQMall.
- 49 Hình 3-14 Mật độ phân bổ mode tiên đoán với video mẫu BQSquare.
- 49 Hình 3-15 Mật độ phân bổ mode tiên đoán với video mẫu Kimono1.
- 50 Hình 3-16 Mật độ phân bổ mode tiên đoán với video mẫu PartyScene.
- 50 Hình 3-17 Mật độ phân bổ mode tiên đoán với video mẫu PeopleOnStreet.
- 51 Hình 3-18 Mật độ phân bổ mode tiên đoán với video mẫu RaceHorses.
- 51 Hình 3-19 Mật độ phân bổ mode tiên đoán trung bình của các video mẫu.
- 52 Hình 3-20 Giải thuật tìm kiếm nhanh.
- 53 Thuật toán tìm kiếm nhanh-HEVC GVHD: TS.
- Nguyễn Vũ Thắng Nguyễn Quốc Việt xii DANH SÁCH BẢNG BIỂU Bảng 2.1 Độ sâu lớn nhất của cấu trúc cây chuyển đổi.
- 19 Bảng 2.2 Liên hệ giữa hướng dự đoán trong ảnh và chế độ tương ứng của thành phần màu.
- 40 Thuật toán tìm kiếm nhanh-HEVC GVHD: TS.
- Nguyễn Vũ Thắng Nguyễn Quốc Việt xiii DANH SÁCH CÁC TỪ VIẾT TẮT ITU-T International Telecommunication Union Telecommunication Standardization Sector MPEG Moving Picture Experts Group IP Intellectual Property I, P, B Intra, Prediction, Bi-prediction LCU Largest Coding Unit CTB Coding Tree Block CU Coding Unit PU Prediciton Unit TU Transform Unit SAO Sample Adaptive Offset PSNR Peak signal to noise ratio POC Picture Of Counter CBF Coded Block Flag RDO Rate Distortion Optimization SAD Sum of Absolute Difference SATD Hamadard transformed SAD SSE Sum of Square Error ME Motion estimation Thuật toán tìm kiếm nhanh-HEVC GVHD: TS.
- Nguyễn Vũ Thắng Nguyễn Quốc Việt 1 LỜI MỞ ĐẦU Multimedia và các ứng dụng của nó đã đang phát triển hết sức mạnh mẽ trên hầu hết các lĩnh vực.
- Tuy nhiên, dữ liệu video không nén (video thô) thường chiếm dung lượng rất lớn (xấp xỉ 216 Mbits cho mỗi giây video không nén chuẩn NTSC 30 fps độ phân giải 720x 480 điểm ảnh).
- Với sự phát triển của khoa học kỹ thuật, ngày nay đã sản xuất được bộ cảm biến màu có độ phân giải lên đến 16 triệu pixel tương đương với một bức ảnh có độ phân giải 4096x4096 pixels Ứng dụng cần độ phân giải cao nhất đang được sử dụng thông dụng hiện nay là full HD 1920x1080 pixel.
- Một số sản phẩm tiêu dùng hiện đại mới nhất với độ phân giải Ultra HD đã dùng đến công nghệ 4K với một trong hai độ phân giải độ nét cao: 3840 x 2160 pixel hoặc 4096 x 2160 pixel nhưng cũng tùy vào các thời điểm và lĩnh vực, chẳng hạn như trong môi trường chuyên nghiệp hoặc thương mại là 4K x 2K, Quad High Definition, hoặc 2160p.
- Độ phân giải 4K hiện đang được sử dụng ngày càng nhiều trong các máy quay phim điện ảnh kỹ thuật số thương mại sử dụng tùy chọn độ phân giải 4096 x 2160 điểm ảnh, nhiều hơn và nhiều hơn nữa các bộ phim điện ảnh đang quay hoặc sử dụng bản master với định dạng 4K, hoặc upscaled từ 2K (1998x1080 tỉ lệ khung hình 1.85:1 hoặc 2048 x 858 tỉ lệ khung hình 2.35:1).
- Có nhiều chuẩn nén video khác nhau, trong đó chuẩn nén được sử dụng rộng rãi hiện nay là chuẩn MPEG – 2.
- Kế thừa những kết quả đã đạt được từ H.264, chuẩn nén HEVC bắt đầu được đưa vào nghiên cứu từ năm 2010 với mong muốn thu được kết quả nén còn cao hơn nhiều lần so với H.264 Bộ mã hóa/ giải mã video chuẩn HEVC đem lại nhiều cải tiến về chất lượng và hiệu quả nén.
- Với mỗi khối xử lý của H.265 đều được tăng thêm khả năng xử lý Thuật toán tìm kiếm nhanh-HEVC GVHD: TS.
- Trong số các khối xử lý của HEVC, khối tiên đoán là khối chiếm tới 80% khối lượng tính toán trong toàn bộ quá trình mã hóa video cũng là khối chủ đạo giúp cho H265 tăng khả năng nén lên gấp nhiều lần so với các chuẩn nén video trước đây.
- Lợi dụng những tính chất chung của ảnh, để giảm khối lượng tính toán nhưng vẫn giữ nguyên được hiệu quả nén trong khối tiên đoán là một trong những xu hướng chủ đạo trong việc cải tiến khối tiên đoán.
- Để giúp cho việc cải tiến khối tiên đoán, em sử dụng phần mềm mã hóa và giải mã video chuẩn H265 do ITU – T cung cấp để trích xuất thông tin và sử dụng ngôn ngữ lập trình C++ để phân tích dữ liệu và xây dựng thuật toán.
- Sau đó em sử dụng các vector chuyển động để triển khai thuật toán giúp giảm khối lượng tính toán.
- Chương 1: Giới thiệu chung về bộ mã hóa và giải mã chuẩn H.265/HEVC.
- Chương 2: Mô tả chi tiết về bộ mã hóa chuẩn H.265/HEVC.
- Chương 3: Giới thiệu phần mềm HM 9.1, cách trích xuất thông tin sau quá trình tiên đoán, phân tích thông tin chuyển động và đưa ra cách tiên đoán vector chuyển động.
- Chương 4: Thuật toán tìm kiếm nhanh dựa vào vector chuyển động tiên đoán được và kết quả.
- Nguyễn Vũ Thắng Nguyễn Quốc Việt 3 Chương 1.
- BỘ MÃ HÓA/ GIẢI MÃ VIDEO CHUẨN H.265/HEVC Chương này giới thiệu về các chuẩn nén video hiện có cũng như trình bày các nguyên lý cơ bản trong nén video, tập trung đi sâu vào trình bày các ưu điểm của chuẩn nén video HEVC cũng như bộ mã hóa/giải mã video chuẩn HEVC.
- 1.1 Giới thiệu về nén ảnh, các chuẩn nén Nén video là một kỹ thuật giảm khối lượng dữ liệu không cần thiết để lưu trữ hình ảnh, nó là một sự kết hợp giữa nén trong ảnh (giảm thiểu đồ dư thừa về mặt không gian) và nén liên ảnh (giảm thiểu dư thừa về mặt thời gian).
- Nén tổn hao là loại nén không mất không tin, cho phép phục hồi lại dữ liệu giống như dữ liệu ban đầu sau khi qua bộ giải mã.
- Ngược lại với nén không tổn hao là nén có tổn hao, loại nén này dựa trên nguyên lý là hầu hết dữ liệu trong video trước khi nén là không cần thiết do đó có thể tinh giảm những loại dữ liệu đó đi mà vẫn có thể giữ được chất lượng tốt.
- Trong đó, dữ liệu không cần thiết này được tập trung vào phần dư thừa không gian và thời gian.
- Hầu hết các phương pháp đều là nén tổn thất, chúng dựa trên nguyên lý chung là hầu hết dữ liệu trong video trước khi nén là không cần thiết do đó có thể tinh giảm những loại dữ liệu đó đi mà vẫn có thể giữ được chất lượng tốt.
- Ví dụ như DVD sử dụng chuẩn mã hóa video MPEG – 2 có thể nén đoạn video dài khoảng 2 tiếng xuống 15 tới 30 lần mà vẫn cho chất lượng hình ảnh cao so với video thông thường.
- Nén video cũng giống như nén dữ liệu đòi hỏi sự cân bằng giữa dung lượng lưu trữ, chất lượng hình ảnh, độ phức tạp của thuật toán mã hóa/giải mã, ổn định khi có lỗi xảy ra trên đường truyền, độ trễ và giá thành của thiết bị cần để giải nén video trong thời gian chấp nhận được

Xem thử không khả dụng, vui lòng xem tại trang nguồn
hoặc xem Tóm tắt