« Home « Kết quả tìm kiếm

Nghiên cứu ứng dụng kỹ thuật fractal vào nén trong ảnh video


Tóm tắt Xem thử

- 1 LỜI MỞ ĐẦU Nén dữ liệu (data compression) là phương pháp mã hóa kỹ thuật số nhằm giảm dung lượng của dữ liệu.
- Điển hình cho nén không mất dữ liệu có thể kể đến mã hóa RLE (Run-length Encoding), thay thế một loạt dữ liệu liền nhau lặp lại thành một dữ liệu đại diện khác.
- Trước nhu cầu sử dụng thông tin và hình ảnh đòi hỏi ngày càng cao về mặt chất lượng trong khi vẫn bị giới hạn bởi không gian lưu trữ và băng thông kênh truyền đòi hỏi cần có một giải pháp có thể giải quyết được vấn đề này.
- Do đó, để có thể tiết kiệm không gian lưu trữ và băng thông kênh truyền thì cần thiết phải nén tín hiệu video.
- Quá trình nén video thực hiện được là do thông tin trong các video thường có trật tự, có tổ chức, vì thế nếu xem kỹ cấu trúc video có thể phát hiện được nhiều loại thông tin dư thừa khác nhau.
- Phương pháp nén dư thừa về không gian tập trung vào các thuật toán nhằm giảm tối đa các dư thừa về mặt không gian giữa các điểm ảnh, từ đó nâng cao tỷ lệ nén.
- Việc giảm trừ tối đa các điểm ảnh giống nhau này cho phép 2 tăng tỷ lệ nén video.
- H.264 là một tiêu chuẩn nén sử dụng phương pháp nén dư thừa về thời gian.
- Bản chất của tiêu chuẩn H.264 là sự phát triển của tiêu chuẩn MPEG, trong đó áp dụng thêm các kỹ thuật nhằm nâng cao hơn nữa tỷ lệ nén và cố gắng cải thiện chất lượng hình ảnh của video tương ứng với tỷ lệ nén đạt được.
- H.265 có tỷ lệ nén gấp đôi so với tiêu chuẩn H.264 ở cùng một mức độ chất lượng hình ảnh video.
- Đó là nâng cao tỷ lệ nén và cải thiện chất lượng hình ảnh sau giải nén tương đương với tỷ lệ nén đã đạt được.
- Hình học Fractal là nguồn cảm hứng cho thuật toán nén mà điển hình hơn là thuật toán nén hình ảnh.
- Nén hình ảnh sử dụng Fractal mang đến tỉ lệ nén vượt trội so với bất kỳ phương pháp mã hóa nén nào trước đây mà vẫn đảm bảo được chất lượng tốt nhất có thể cho hình ảnh.
- Ưu điểm của nén hình ảnh sử dụng Fractal là tỷ lệ nén cao vượt trội và quá trình giải nén rất nhanh.
- Từ đó, ý tưởng kết hợp Fractal và tiêu chuẩn H.264 được hình thành nhằm áp dụng ưu điểm về tỷ số nén của Fractal vào tiêu chuẩn nén video H.264 đang được áp dụng rộng rãi là một nỗ lực nhằm tạo ra một tiêu chuẩn nén hình ảnh có tỷ số nén cao, thời gian nén ảnh đảm bảo tương đương với các tiêu chuẩn hiện thời và có thời gian giải nén ảnh vượt trội.
- Bên cạnh đó, việc nâng cao tỷ số nén ảnh và giảm thời gian nén ảnh đối với phương pháp nén ảnh sử dụng Fractal cũng là một vấn đề cần được giải quyết.
- Trong Luận án này sẽ trình bày về việc sử dụng Fractal trong việc nén hình ảnh và video để đưa ra một phương pháp giải quyết các vấn đề đã nêu ở trên.
- Chương 2 trình bày nghiên cứu phương pháp nén hình ảnh sử dụng Fractal.
- Nội dung chương 2 giới thiệu về phương pháp sử dụng thuật toán Fractal để nén và giải nén hình ảnh.
- Nghiên cứu cải tiến một số chỉ tiêu quan trọng trong 3 nén ảnh sử dụng Fractal là tăng cường tỉ số nén và giảm thời gian nén cho Fractal.
- CHƯƠNG 1 - TỔNG QUAN Như đã giới thiệu, Fractal là một phương pháp nén có mất dữ liệu dành cho hình ảnh và video.
- Tuy nhiên ở các tỉ lệ nén cao hơn, Fractal vẫn cung cấp các chất lượng vượt trội.
- Đối với hình ảnh vệ tinh, tỉ lệ nén 170:1 vẫn mang đến kết quả chấp nhận được.
- Hơn nữa, điểm được cố định có thể thu được bởi việc bắt đầu từ bất kỳ điểm x0 nào và cứ thế tính được theo trình tự.
- 1-4 ) CHƯƠNG 2 - PHƯƠNG PHÁP NÉN HÌNH ẢNH SỬ DỤNG FRACTAL 2.1.
- Bảng 2.1 : So sánh hiệu suất hoạt động trên nền tảng FPGA và DSP theo phương pháp Fisher Bảng Kết quả Số lớp Thời gian mã hóa (s) PSNR (dB) DSP FPGA Bảng 2.1 chỉ ra thời gian mã hóa PSNR theo phương pháp tăng tốc mã hóa Fractal bằng thuật toán Fisher trên bo mạch FPGA và DSP với số lượng các lớp khác nhau.
- Trong quá trình xử lý FPGA, khi số lượng các lớp thay đổi, thời gian mã hóa còn lại hầu hết không đổi trong khi PSRN nâng cấp đáng kể, điều này là do việc tìm kiếm được thực hiện hoàn chỉnh trong tập các miền đã cho đồng thời do việc song song hóa thuật toán Fisher.
- Tập các vùng và miền được lưu trữ trong khối RAM của SoC (hệ thống trên chip), thời gian mã hóa không bị ảnh hưởng nhiều bởi thời gian đọc và viết.
- Khi tỉ lệ nén cao, số lượng các phép so sánh để tìm kiếm miền nguồn tố nhất cũng nhỏ.
- Do đó, thời gian mã hóa gần như tức thì và chỉ phụ thuộc vào giới hạn tốc độ của SoC.
- Hình 2.2: Ảnh chuẩn và ảnh giải nén Lena với ET = 6, RET = 16, MiS = 4, MaS = 16, NI = 20 (a) NC = 1, (b) NC = 3, (c) NC = 24, (d) NC = 72, (e) Giải nén ảnh trên DSP với NC =72, (f) Ảnh chuẩn Bảng 2.2 : Hiệu suất PSNR và thời gian mã hóa Kết quả Số lớp Thời gian mã hóa(s) PSNR (dB) Phương pháp Fisher Thực nghiệm thực hiện trên FPGA được lặp lại với giá trị RET được cài đặt bằng 20.
- Hiệu suất của PSNR và thời gian mã hóa được biểu diễn trong bảng 2.2.
- Một lần nữa có thể thấy thời gian thực hiện khoảng 11s với số lượng lớp = 72, tuy nhiên PSNR tốt hơn nhiều so với trường hợp số lớp = 6.
- Nó có nghĩa là việc tăng RET có thể cải thiện chất lượng giải nén.
- thuật toán mã hóa Fractal được nhúng vào Microblaze.
- Bộ nhớ cục bộ lưu trữ biến và hệ số mã hóa fractal.
- Nó được sử dụng để theo dõi các việc thực hiện các mã hóa Fractal.
- GPIO là mô-đun kết nối LCD-TFT để Microblaze, nó được sử dụng để hiển thị hình ảnh trước và sau khi áp dụng thuật toán fractal.
- Chương trình mã hóa Fractal được thực hiện ở các mẫu khác nhau theo thứ tự và các chế độ tìm kiếm đầy đủ đã được thiết lập để xác định tỷ lệ nén tối ưu.
- 8 Bảng 2.3 : Bảng kết quả so sánh giữa thực hiện nén ảnh bằng Fractal và JPEG Ảnh đầu vào Lấy mẫu Fractal JPEG Fractal JPEG PSNR PSNR Tỉ lệ nén Tỉ lệ nén Như mô tả trong bảng 2.3, so sánh hiệu suất trong hệ thống PSNR và tỉ lệ nén của hai phương thức trong chế độ lấy mẫu khác nhau đã chỉ ra rằng các chương trình mã hóa fractal có thể vượt trội hơn so với PSNR và tỉ lệ nén tương tự, thậm chí tốt hơn trong một số chế độ lấy mẫu, ví dụ.
- Lena hình ảnh 4: 2: 0, hoặc hình ảnh trái cây tại tỉ lệ 4: 2: 0, hoặc hình ảnh hiện trường 4:4:4 và 4:1:1.
- Các kết quả đầy hứa hẹn đã chỉ ra rằng mã hóa fractal dựa vào RGB để chuyển đổi màu sắc YCrBr và thực hiện trên FPGA có thể được áp dụng cho một ảnh màu, mà hiệu suất nén cũng đem lại kết quả tuyệt vời tương tự như JPEG.
- Cải tiến tỷ số nén cho Fractal coding Trước khi mã hóa ảnh Fractal, việc chuyển đổi ảnh màu từ RGB về YUV được thực hiện.
- Việc chuyển một điểm ảnh từ không gian RGB vào không gian YUV có thể được thực hiện bằng một phép nhân ma trận đơn giản.
- Do đó có thể chia bố cục mà không gặp bất kỳ vấn đề gì về kích thước ảnh.
- Sự phân dạng của các vùng có thể được thực hiện theo một lịch trình cố định hoặc ngữ cảnh khác nhau phụ thuộc vào nội dung ảnh.
- Tuy nhiên, vùng nên gần rìa của ảnh, vùng miền có thể được cuộn lên luôn có 225 vị trí.
- Để tìm miền phù hợp cho phép hình ảnh được kiểm tra cho các miền vùng.
- Để thu được mức độ nén cao nhất có thể của hình ảnh được nén Fractal, 1 định dạng lưu trữ nhỏ gọn được phát triển, mà có thể mỗi vùng với các dữ liệu chuẩn chỉ chứa 3,5 hoặc 4 byte.
- Bộ nhớ của vùng: Một vùng có thể có kích thước nằm trong khoảng 1x1 và 16x16.
- Tuy nhiên vùng vuông đầu ra 16x16 sẽ chỉ có thể được tạo ra ở viền của ảnh, có thể xuất hiện các biến đầu ra bị thay đổi, kích thước vùng có thể được cung cấp trong trường hợp bình thường trong 1 nửa byte.
- Bằng cách sử dụng phân hoạch HV đơn giản luôn được chia theo chiều ngang để vùng nằm ở phía dài hơn, hoặc có thể bao gồm các vùng kích thước 16x16 bằng cách phân chia kích thước các vùng 16x8, 8x8, 8x4, 4x4, 4x2, 2x2, 2x1, 1x1, xảy ra.
- Vị trí tuyệt đối của miền có thể được xác định như sau: đầu tiên hình vuông tìm kiếm được xác định từ vị trí vùng, bằng cách thêm phần bù của miền vào góc trên bên trái của hình vuông tìm kiếm, chúng ta thu được vị trí tuyệt đối của miền.
- Lưu trữ các thông số hình ảnh: Thông số của hình ảnh là một số thực phẩy động nằm trong khoảng từ .
- Nó có thể chứa các giá trị mà không mất mát về chất lượng trong 5bit.
- Bộ nhớ của kiểu sao chép: Bởi vì chỉ có 4, và đối với các vùng chữ nhật chỉ có 8 cách để ánh xạ miền tới vùng, vì thế nên kiểu ảnh có thể được cung cấp 3 bit, Nó làm cho có cảm giác đến các thông số s và phù hợp với kiểu ảnh trong 1 byte.
- Vì những giá trị này được xem xét như một số nguyên thông thường trong dạng hiện tại, nên kích thước ảnh mã hóa lớn nhất là 32767 x 32767.
- Thứ tự của vùng: Bằng việc lựa chọn đúng đắn thuật toán mã hóa đã tạo ra một thứ tự bộ nhớ phù hợp của vùng.
- Việc xếp thứ tự có thể được viết trực tiếp từ vùng stack.
- Đặc biệt, không có hoạt động sắp xếp vùng nào được yêu cầu, vì vậy thao tác lưu này sinh trong việc mã hóa fractal của hình ảnh trong thời gian không đáng kể.
- Dịch bit: Bởi vì vùng có chiều dài 3,5 byte hoặc 4 byte, là trong vùng liên tiếp, có thể 1 sự thay đổi 0,5 byte là cần thiết bởi vì trong 1 file, toàn bộ byte có thể được lưu trữ.
- Tại cuối mỗi ảnh luôn là một vùng trống với 4 byte chiều dài hoặc 4,5 làm điểm đánh dấu cuối cùng, vì vậy tất cả các bytes được đệm và có thể được lưu.
- Vì vậy thuật toán tương tự nhau có thể được sử dụng.
- Kích cỡ nhỏ hơn của thành phần U và V có thể dễ dàng được tính toán từ kích thước của Y.
- Nếu một ảnh được mã hóa Fractal được nạp một lần nữa vào bộ nhớ, có vị trí tuyệt đối của mỗi vùng được khôi phục từ loại thứ tự nhất định, và kích thước của ảnh.
- Bởi vì độ phân giải của ảnh trong vùng theo 1 lịch trình cố định được thực hiện, một thuật toán đệ quy có thể được sử dụng, mà rất giống với thuật toán mã hóa.
- Đầu tiên, kích thước hình ảnh của dữ liệu Header được đọc, hiện giờ bức ảnh theo hàng có với kích cỡ tối đa 16x16 được phân hoạch.
- Điều này có thể được thực hiện bằng cách sử dụng các vùng đã được lưu trữ.
- Trong trường hợp này, vùng có thể được tạo ra với các dữ liệu ảnh với các vị trí nhất định, và tiếp tục với các vùng tiếp theo.
- Thực nghiệm và kết quả Để đánh giá hiệu quả của việc thực hiện đề xuất, một hình ảnh Lena 24 bit với kích thước 512x512 đã được sử dụng trong các thí nghiệm.
- Chương trình mã hóa Fractal được thực hiện ở chế độ lấy mẫu 4:1:1 tương ứng, và các chế độ tìm kiếm đầy đủ đã được thiết lập để xác định tỷ lệ nén tối ưu.
- Các kết quả của tỷ lệ PSNR và nén cho hình ảnh của Lena được thể hiện trong Bảng 2.4 cho các chế độ interation khác nhau.
- Để có được kết quả thực nghiệm nhiều hơn, một số hình ảnh 24 bit nhiều màu sắc với kích thước 512x512 được thử nghiệm.
- Như minh họa trong Bảng 2.4 và Bảng 2.5, so sánh hiệu suất về tỷ lệ PSNR và nén của hai phương thức trong chế độ tương tác khác nhau đã chỉ ra rằng các chương trình mã hóa fractal có thể ngoài thực hiện PSNR tương tự và tỉ lệ nén cao hơn, thậm chí tốt hơn trong hình ảnh Parrot tại chế độ lấy mẫu 4:1:1.
- r=8) Tỉ lệ nén: 31.05 PSNR: 36.6919 Tỉ lệ nén: 43.00 PSNR: 33.7861 Giải nén với 10 tương tác (e=20.
- r=19) Giải nén với 10 tương tác (e=25.
- r=22) C.Ratio: 60.13 PSNR: 32.3635 Tỉ lệ nén: 64.55 PSNR: 32.0520 Giải nén với 10 tương tác (e=30.
- r=29) Giải nén với 10 tương tác (e=49.
- r=48) Tỉ lệ nén: 69.95 PSNR: 31.6728 Tỉ lệ nén: 82.82 PSNR: 30.7350 Bảng 2.4 chứng minh ảnh giải nén tương ứng sử dụng giải nén ảnh Fractal và phương pháp nén JPEG trong các chế độ lặp khác nhau.
- Rõ ràng là chất lượng hình ảnh giải nén bằng phương pháp Fractal là hơi tốt hơn so với JPEG.
- Các kết quả thực nghiệm của hình ảnh Parrot trong Bảng 2.5 cho thấy tỷ lệ nén rất cao của FIC hơn JPEG nhưng PSNR của FIC là không thực sự tốt hơn, dù cho điều chỉnh tương tác đã được thực hiện.
- Để để nâng cao tỉ lệ nén của nén Fractal cho hình ảnh Parrot, RMS điều chỉnh đã được thực hiện với 10 interations bằng cách điều chỉnh các thông số e và r.
- Giảm thời gian nén cho Fractal coding 2.4.1.
- Chúng tôi đã chọn định dạng PPM RAWBITS cho hình ảnh màu thật.
- Tìm miền Để tìm các miền phù hợp, hình ảnh được kiểm tra tất cả khả năng.
- Vì range có được từ HV chỉ có thể là hình chữ nhật hoặc hình vuông, các phương pháp đơn giản được dùng để kiểm tra mỗi 4 hoặc 8 hình một, tuỳ từng hình.
- Định dạng bộ nhớ cho vùng Để mã hóa ảnh màu Fractal có được hiệu quả cao nhất, một định dạng lưu trữ nhỏ gọn được phát triển.
- mỗi con số tương ứng với range có thể được lưu trữ trong 3,5 hoặc 4 byte.
- Lưu trữ kích thước miền: Một vùng có thể có kích thước bất kỳ từ 1 × 1 và 16 × 16.
- Nhưng range hình vuông 16 × 16 chỉ được tạo ra ở ngoại biên của hình ảnh, các biến đầu ra có thể bị lỗi (xem hình 3), kích thước vùng thường chỉ giới hạn trong nửa byte.
- Với nửa byte có sẵn, ta có thể cho phép tất cả các loại kích cỡ từ 1 × 1 và 16 × 16 cho chiều rộng và chiều cao của vùng.
- Identical MappingRotation of 180 degreesReflection Hình 2.6 : Ví dụ về ánh xạ của miền vào vùng Lưu vị trí miền: Như đã nói ở mục 3.2, bằng cách hạn chế khu vực tìm kiếm, vị trí tương đối của miền so với vùng chỉ có thể nằm trong 225 vị trí, lưu trong 1 byte.
- Lưu hệ số ảnh o: Các thông số cộng o của hình ảnh có thể được chọn để giới hạn về các giá trị nguyên trong khoảng vì ta đã giới hạn các giá trị điểm ảnh về các giá trị nguyên trong khoảng [0, 255].
- Các tham số o vẫn có thể được lưu trữ trong một byte, giá trị phải được chia 2.
- Lưu hệ số ảnh s: Tham số hình ảnh s được lưu thành một số dấu phẩy động trong khoảng .
- Theo Fisher, chúng ta có thể chứa giá trị này mà không mất nhiều về chất lượng trong 5 bit.
- Thuật toán song song cho FCIC Có một số thủ tục trong FCIC có thể được thực hiện song song, như: xây dựng bộ codebooks, tìm kiếm cho mỗi phạm vi, và giải nén và hiển thị.
- Thực nghiệm và kết quả Để đánh giá hiệu quả của đề xuất, một hình ảnh màu 24 bit với kích thước 512 × 512 đã được sử dụng trong các thí nghiệm.
- Chương trình mã hóa Fractal được đặt ở chế độ lấy mẫu khác nhau 4: 4: 4, và 4: 1: 1 và thiết lập chế độ tìm kiếm đầy đủ để xác định tỷ lệ nén tối ưu.
- Bảng 2.6 : Kết quả FCIC với 4 thread và so sánh thời gian mã hóa giữa 4 thread với 2 hay 1 thread Hình ảnh đầu vào Chế độ lấy mẫu Fractal 4 thread 4 thread 2 thread PSNR (dB) Tỉ lệ nén Thời gian mã hoá (s) Nhanh hơn 2 thread

Xem thử không khả dụng, vui lòng xem tại trang nguồn
hoặc xem Tóm tắt