You are on page 1of 18

2.

Nén dữ liệu
2.1 Giới thiệu
Cảm biến vệ tinh tạo ra khối lượng dữ liệu khổng lồ, đặc biệt là cảm biến siêu
âm thu được qua hàng trăm hình ảnh của các dải bước sóng hẹp và tạo ra một
khối hình ảnh. Do đó, rất nhiều nỗ lực đã được thực hiện để nghiên cứu các
cách hiệu quả hơn để nén hình ảnh vệ tinh hoặc hình khối. Kỹ thuật nén có thể
được phân thành ba loại:
 Nén không mất dữ liệu
 Nén gần như không mất dữ liệu
 Nén tổn thất dữ liệu
2.2 Đánh giá về nén không mất dữ liệu
Kỹ thuật nén không mất dữ liệu là các kỹ thuật có thể đảo ngược, nén
hình ảnh mà không mất thông tin. Hình ảnh được xây dựng lại giống hệt với
hình ảnh gốc. Do không mất thông tin, loại kỹ thuật nén này được sử dụng cho
các ứng dụng không thể chịu đựng được bất kỳ sự khác biệt nào giữa dữ liệu
gốc và dữ liệu được xây dựng lại.
Tuy nhiên, kỹ thuật nén không mất dữ liệu có thể đạt được tỷ lệ nén cao, tùy
thuộc vào độ dư thừa của hình ảnh. Độ dự phòng càng lớn thì tỷ lệ nén có thể
đạt được càng cao.
Đối với ảnh vệ tinh quang học, tỷ lệ nén không tổn hao thường nhỏ hơn 3: 1.
Đối với hình ảnh có cảnh rất mịn hoặc thông tin không gian hoặc phổ cực thấp
trong dữ liệu, mức cao hơn tỷ lệ nén có thể đạt được.
a) Phương pháp dựa trên dự đoán
Nhiều kỹ thuật nén không mất dữ liệu dựa trên dự đoán đã được báo cáo.
Trong các datacubes hyperspectral, tương quan interband mạnh hơn nhiều
so với tương quan intraband, đó là lý do tại sao hầu hết các kỹ thuật nén
dữ liệu dự đoán, không mất dữ liệu, sử dụng dự đoán giữa các băng tần
cho hiệu suất nén tối đa. Không giống như các hình ảnh đa bán cầu, các
hình ảnh siêu phổ tạo ra các dải quang phổ hẹp trên một dải phổ liên tục.
Điều này dẫn đến sự tương quan cao giữa các hình ảnh dải quang phổ.
Một phương pháp dự đoán mờ được giới thiệu bởi Aiazzi et al. Công cụ
dự đoán được chuyển đổi trong một tập hợp được xác định trước dựa trên
quy tắc logic mờ. Các tác giả đã cải thiện dự đoán bằng cách sử dụng
phân tích các cạnh. Họ tiếp tục phát triển một dự đoán được phân loại cho
cả nén không mất và gần như không mất.

1
Các vùng lân cận nhân quả của mỗi pixel được phân cụm bằng cách sử
dụng c mờ. Nén dữ liệu vệ tinh lossless phân cụm. Đối với mỗi cụm, một
công cụ dự đoán tuyến tính tối ưu được tính từ các giá trị và mức độ
thành viên của các cụm vượt quá ngưỡng. Ước tính cuối cùng được tính
là tổng của các yếu tố dự đoán, trong đó các trọng số là mức độ thành
viên. Phương pháp theo đuổi kết hợp mờ (SFMP) khai thác một dự đoán
quang phổ thuần túy. Trong bài báo của họ, một phương pháp gọi là dự
đoán nhãn thư giãn phổ cũng được đề xuất. Phương thức phân chia các
dải hình ảnh thành các khối và một bộ dự đoán được chọn để dự đoán ra
khỏi một tập hợp.
Một khái niệm về điều chế mã xung phân cụm được giới thiệu bởi
Mielikainen và Toivanen. Quang phổ của một datacube được nhóm lại
thành các lớp đồng nhất về không gian. Một bộ dự báo tuyến tính riêng
biệt giảm thiểu giá trị dự kiến của lỗi dự đoán bình phương được sử dụng
bên trong mỗi cụm. Một công cụ dự đoán tối ưu được tính toán cho từng
cụm, được sử dụng để loại bỏ mối tương quan phổ và để tạo ra lỗi dự
đoán, được mã hóa bằng bộ mã hóa phạm vi. Họ còn đề xuất thêm một
mô hình dự đoán tuyến tính. Bộ dự đoán được tối ưu hóa cho từng pixel
và từng dải trong vùng lân cận nguyên nhân của pixel hiện tại
Một phương pháp dự đoán dựa trên mã hóa hình ảnh lossless thích ứng
theo ngữ cảnh được báo cáo. Phương pháp này chuyển đổi giữa các chế
độ dự đoán trong và xen kẽ dựa trên cường độ tương quan giữa các dải
liên tiếp. Một phương pháp dự đoán nhiều băng tần khác thực hiện dự
đoán bằng cách sử dụng hai pixel trong các dải trước ở cùng vị trí không
gian với pixel hiện tại. Các hệ số dự đoán được tính bằng cách sử dụng
quy trình ngoại tuyến về đào tạo dữ liệu. Một kỹ thuật dự đoán tối ưu hóa
bình phương tối thiểu thích ứng được gọi là các bình phương tối thiểu
theo hướng phổ (SLSQ) đã được trình bày bởi Rizzo et al. Kỹ thuật dự
đoán tương tự như của Mielikainen và Toivanen được sử dụng, nhưng bộ
mã hóa entropy tiên tiến hơn. SLSQ-HEU sử dụng phương pháp phỏng
đoán ngoại tuyến để chọn giữa chế độ nén giữa và giữa. Một phương
pháp tối ưu để lựa chọn chế độ liên mã hóa / nội bộ được gọi là SLSQ-
OPT cũng được trình bày.
Một thuật toán dự đoán máy nén interband dựa trên khối được đề xuất.
Mỗi hình ảnh dải của một datacube đầu vào được chia thành các khối
vuông. Các khối sau đó được dự đoán dựa trên khối tương ứng trong dải
trước đó. Một phương pháp dự đoán trung bình dựa trên tương quan, có
điều kiện được báo cáo. Phương pháp này ước tính giá trị trung bình mẫu
tương ứng với pixel hiện tại trong bối cảnh phù hợp với bối cảnh pixel
hiện tại. Một lựa chọn là

2
sau đó được thực hiện dựa trên hệ số tương quan cho các bối cảnh để
quyết định sử dụng dự đoán hoặc JPEG không mất dữ liệu. Một phương
pháp dự đoán phi tuyến cho hình ảnh siêu âm cũng được báo cáo. Phương
pháp dự đoán pixel trong hình ảnh dải hiện tại dựa trên thông tin trong
bối cảnh nhân quả trong hình ảnh dải hiện tại và pixel nằm cùng trong
hình ảnh dải tham chiếu. Phương pháp này cũng được mở rộng thành một
kỹ thuật dựa trên cạnh, được gọi là dự đoán dựa trên cạnh cho hình ảnh
siêu phổ, phân loại các pixel thành cạnh và pixel không cạnh. Mỗi pixel
sau đó được dự đoán bằng cách sử dụng thông tin từ các pixel trong cùng
một lớp pixel trong ngữ cảnh.
Phương pháp bảng tra cứu là một trong những phương pháp dự đoán. Nó
đưa ra dự đoán về pixel hiện tại bằng cách tìm kiếm tất cả các pixel nhân
quả trong hình ảnh dải hiện tại và trước đó. Nó dựa trên ý tưởng của một
tìm kiếm gần nhất. Việc tìm kiếm được thực hiện theo thứ tự quét raster
ngược. Pixel trong dải trước đó ở cùng vị trí với pixel trong dải hiện tại
được sử dụng làm công cụ dự đoán. Các bảng tra cứu được sử dụng để
tăng tốc độ tìm kiếm. Các phương pháp lượng tử hóa vectơ (VQ) cũng
được sử dụng để dự đoán các giá trị pixel trong nén không mất mát. Ryan
và Arnold đã xác định các kỹ thuật hình thành vectơ khác nhau và nghiên
cứu các tham số lượng tử hóa phù hợp để nén dữ liệu không mất dữ liệu
bằng phương pháp VQ. Họ đã đề xuất một kỹ thuật lượng tử hóa vector
chuẩn hóa trung bình, tạo ra các hiệu suất nén tiếp cận với entropy hình
ảnh nén tối thiểu theo lý thuyết là 5 bit / pixel của các cơ sở dữ liệu
AVIRIS.
Hình ảnh được nén từ các hình ảnh gốc của 8,281010,89 bit / pixel đến
4,83 bit5,90 bit / pixel.Mielikainen và Toivanen đã sử dụng phương pháp
VQ để nén AVIRISdatacubes. Một cuốn sách mã được đào tạo đầu tiên từ
datacube được nén bằng thuật toán Lloyd tổng quát (GLA) và sau đó
được sử dụng để nén datacube. Một datacube được xây dựng lại được tạo
ra bằng cách giải nén ngay sau khi nén và được sử dụng làm datacube dự
đoán. Một datacube còn lại thu được bằng cách trừ datacube được xây
dựng lại từ hình ảnh gốc. Các hình ảnh khác nhau giữa hai hình ảnh dải
liên tiếp của datacube dư được tính toán và hình thành. Cuối cùng, mỗi
hình ảnh khác nhau được mã hóa entropy. Chỉ số và giá trị codebook
cũng được mã hóa entropy riêng biệt. Phương pháp này đạt được tỷ lệ
nén không mất khoảng 3: 1 cho thử nghiệm AVIRIS datacubes....
Một phương pháp nén VQ được phân vùng đã được đề xuất. Một vectơ
quantizer được thiết kế sử dụng nhiều codebook. Các vectơ phổ của
datacube hyperspectral trước tiên được phân vùng thành hai hoặc nhiều
phần tử con có độ dài khác nhau, và sau đó mỗi phần tử con được mã hóa

3
riêng với một cuốn sách mã thích hợp. Các chỉ số của các phần tử con
được mã hóa bằng mã entropy có điều kiện.
Hai phương pháp nén không mất dữ liệu dựa trên VQ cho các hình ảnh đa
bán cầu đã được báo cáo. Phương pháp nén VQ cho hình ảnh siêu âm sử
dụng phương pháp lượng tử hóa trellis được mã hóa theo dự đoán, được
đề xuất. Một thuật toán nén dựa trên lượng tử hóa vectơ tối ưu cục bộ đã
được trình bày. Nó nén hình ảnh siêu phổ bằng cách áp dụng VQ phân
vùng cho chữ ký quang phổ và sau đó mã hóa thông tin lỗi với ngưỡng có
thể thay đổi từ mất chất lượng cao sang gần mất mát đến mất mát. Thuật
toán này yêu cầu mã hóa phức tạp hơn.
Để khắc phục vấn đề phức tạp, một thuật toán có độ phức tạp thấp
Được gọi là bình phương tối thiểu theo hướng phổ được trình bày. Nó sử
dụng dự đoán tuyến tính nhắm vào tương quan phổ theo sau là mã hóa
entropy của lỗi dự đoán.
Sắp xếp lại ban nhạc cũng đã được sử dụng để cải thiện lossless
hiệu suất nén. Cụ thể, trong sắp xếp lại băng tần, hình ảnh dải quang phổ
của datacube được sắp xếp lại theo cách để tối đa hóa mối tương quan của
hình ảnh dải liền kề, do đó tối ưu hóa hiệu suất của giai đoạn nén tiếp
theo. Vấn đề sắp xếp băng tần tối ưu để nén hình ảnh siêu cường đã được
giải quyết. Sắp xếp lại băng tần tối ưu bằng cách tính toán một cây bao
trùm tối thiểu cho một đồ thị có hướng có chứa kích thước của các dải dư
được mã hóa. Một heuristic dựa trên tương quan để ước tính thứ tự tối ưu
đã được đề xuất bởi Toivanen et al. Một phương pháp dự đoán khác dựa
trên sắp xếp lại được giới thiệu bởi Zhang và Liu.
b) Phương pháp dựa trên biến đổi
Một kỹ thuật nén lossless dựa trên biến đổi cho các hình ảnh đa bán cầu
đã được báo cáo. Nó đã áp dụng PCA và biến đổi wavelet số nguyên để
giải mã cả dư thừa quang phổ và không gian. Kỹ thuật này đã được sửa
đổi một chút để có kết quả nén tốt hơn cho cả hình ảnh đa bán cầu và
hình ảnh siêu âm. Một phiên bản số nguyên của PCA được áp dụng để
tạo ra một tập các vectơ cơ sở nhằm giảm thiểu lỗi xấp xỉ theo nghĩa
MSE. Chỉ có một số lượng nhỏ phổ từ hình ảnh được chọn để tính toán
các hàm riêng để giảm độ phức tạp tính toán. Hình ảnh dư được tính từ
hình ảnh gần đúng có sẵn và sau đó được nén bằng cách sử dụng một biến
đổi wavelet số nguyên, đó là một biến đổi số nguyên thành số nguyên có
thể đảo ngược. Nó đã được sử dụng trong màu sắc không mất màu và mã
hóa hình ảnh thang độ xám và cho thấy hiệu suất tốt. Biến đổi sóng con
số nguyên dựa trên sơ đồ nâng: các bộ lọc khác nhau được lấy bằng cách
kết hợp bước dự đoán với bước cập nhật. Biến đổi wavelet số nguyên là
1D trong tự nhiên. Trong trường hợp 2D, biến đổi 1D được áp dụng cho

4
các hàng và cột của hình ảnh. Trong trường hợp 3D, biến đổi 1D được áp
dụng riêng cho các miền không gian và phổ. Sau khi biến đổi PCA, các
hàm riêng được lưu và sự khác biệt giữa các hệ số của chúng được mã
hóa theo kiểu entropy. Các dải của hình ảnh dư được chuyển đổi được mã
hóa riêng bằng cách sử dụng các bộ mã hóa entropy khác nhau, mỗi dải
một lần.
Kỹ thuật nén hình ảnh siêu nhạy, không mất dữ liệu, dựa trên biến đổi đã
được Wang và cộng sự đề xuất Thay vì áp dụng một biến đổi sóng con
rời rạc (DWT) trong miền không gian, kỹ thuật này sử dụng biến đổi
cosine rời rạc (RDCT) ) cho sự phân rã không gian và một số nguyên có
thể đảo ngược, độ phức tạp thấp KarhunenTHER Loève biến đổi Chương
2 (KLT) cho sự phân rã phổ. DCT có những lợi thế đặc biệt của riêng
mình, chẳng hạn như sử dụng bộ nhớ thấp, tính linh hoạt ở cấp độ khối,
xử lý song song, v.v. Tran et al. đã thiết kế bộ lọc trước và bộ lọc sau để
cải thiện hiệu suất của DCT và gọi sự kết hợp của chúng là biến đổi bị
mất thời gian theo miền ( TDLT). TDLT hoạt động tốt hơn DWT trong
khả năng tương thích năng lượng và nén tổn thất. Tuy nhiên, nó không
hoạt động tốt trong các kỹ thuật nén không mất dữ liệu khi cần phải
chuyển đổi thuận nghịch. Một TDLT số nguyên đảo ngược được phát
triển và sử dụng để thay thế số nguyên WT để khắc phục nhược điểm của
TDLT. Nhờ cả DCT và KLT đều có thể đảo ngược, phương pháp được đề
xuất có thể nén dần các hình ảnh siêu âm từ tổn thất sang mất mát trong
một tập tin mã hóa đơn, nhúng.
Baizert et al. đề xuất nén không mất dữ liệu dựa trên biến đổi
thuật toán cho dữ liệu siêu âm bằng kỹ thuật VQ và DCT. Họ đã chứng
minh rằng sự kết hợp của lượng tử hóa vectơ chuẩn hóa trung bình (M-
NVQ) trong miền không gian và các kỹ thuật DCT trong miền phổ là hệ
thống nén được ưa thích. Các tỷ số nén được tạo ra bởi một DCT quang
phổ như vậy cùng với bộ mã hóa M-NVQ không gian tốt hơn 1,5 lần, 2,5
lần so với tỷ lệ nén thu được chỉ bằng kỹ thuật M-NVQ. Công việc của
họ cho thấy, đối với các mức độ biến dạng thấp, có thể đạt được những
cải thiện hơn nữa về tỷ lệ nén bằng cách thay thế kỹ thuật M-NVQ không
gian bằng 2D DCT. Một thuật toán nén 3D dựa trên các phép biến đổi số
nguyên (IWT) và mã hóa zerotree được trình bày. Thuật toán cho các số
biến đổi nhúng của các biến đổi wavelet (EZWs) được mở rộng thành ba
chiều và mã hóa số học thích ứng dựa trên ngữ cảnh được sử dụng để cải
thiện hiệu suất của nó. Thuật toán kết quả được gọi là zerotrees nhúng
dựa trên ngữ cảnh 3D của các biến đổi wavelet (3D CB-EZWs). Nó mã
hóa hiệu quả dữ liệu hình ảnh 3D bằng cách khai thác các phụ thuộc ở tất

5
cả các chiều trong khi cho phép giải nén mất mát và mất mát từ cùng một
dòng bit. So với
Các kỹ thuật nén 2D lossless có sẵn tốt nhất tại thời điểm đó, thuật toán
CB-EZW 3D tạo ra mức giảm trung bình lần lượt là 22%, 25% và 20%
cho các kích thước tệp nén để chụp cắt lớp, cộng hưởng từ và hình ảnh
siêu âm AVIRIS. Hiệu suất lũy tiến của thuật toán cũng được so sánh với
các thuật toán mã hóa lũy tiến mất mát khác. Một thuật toán lossy-
lossless dựa trên biến đổi 2D sử dụng IWT đã được đề xuất bởi Grangetto
et al. Họ lần đầu tiên nghiên cứu các phương pháp để lựa chọn
hệ số tốt nhất của bộ lọc wavelet trong khung sơ đồ nâng. Kết quả thử
nghiệm đã được báo cáo cho một số bộ lọc, hình ảnh thử nghiệm và cho
cả nén không mất và nén, cho thấy việc triển khai IWT thu được đã đạt
được hiệu suất nén rất gần với DWT được định giá. Họ đã đánh giá tác
động của biểu diễn chính xác hữu hạn của Nén dữ liệu vệ tinh không mất
dữ liệu hệ số nâng và kết quả từng phần. Phân tích của họ cho thấy rằng
một số lượng rất nhỏ bit có thể được dành cho lớp phủ với sự suy giảm
hiệu suất chấp nhận được
c) Bộ mã hóa Entropy
Như được mô tả trong phần trên, có thể thấy rằng những nỗ lực nén dữ
liệu không mất dữ liệu đều tập trung vào việc phát triển các dự đoán hiệu
quả hoặc lựa chọn các phương pháp biến đổi mạnh mẽ. Tất cả các kỹ
thuật nén không mất dữ liệu được đề xuất sử dụng ba bộ mã hóa entropy
phổ biến: mã hóa số học, mã hóa Golomb, mã hóa hai và Golomb (GPO2,
còn được gọi là mã hóa Rice) . Một bộ mã hóa entropy đang ở giai đoạn
cuối cùng trong chuỗi nén không tổn hao để tạo ra dòng bit nén. Về bản
chất, các bộ mã hóa entropy như vậy gán các bộ mã dòng bit ngắn hơn
cho các ký hiệu xuất hiện thường xuyên hơn để tối đa hóa độ nén của
dòng bit đại diện. Trong lý thuyết thông tin, bộ mã hóa entropy là một
yếu tố nén dữ liệu không mất dữ liệu độc lập với các đặc tính cụ thể của
phương tiện. Nó tạo và gán một mã không có tiền tố duy nhất cho mỗi ký
hiệu duy nhất xuất hiện trong đầu vào và sau đó nén các ký hiệu bằng
cách thay thế từng ký hiệu đầu vào có độ dài cố định bằng từ mã đầu ra
không có tiền tố, có độ dài thay đổi tương ứng. Độ dài của mỗi từ mã xấp
xỉ tỷ lệ với logarit âm của xác suất. Do đó, các ký hiệu phổ biến nhất sử
dụng các mã ngắn nhất. Phần này mô tả ngắn gọn các bộ mã hóa entropy.
Mã hóa số học thích ứng:
Mã hóa số học (AC) là một bộ mã hóa entropy được sử dụng rộng rãi .
Đây là một dạng mã hóa entropy có độ dài thay đổi. Một chuỗi dữ liệu
thường được biểu diễn bằng cách sử dụng số bit cố định cho mỗi ký tự.
Khi một chuỗi được chuyển đổi thành mã hóa số học, các ký tự được sử

6
dụng thường xuyên sẽ được lưu trữ với ít bit hơn và các ký tự không
thường xuyên xảy ra sẽ được lưu trữ với nhiều bit hơn, dẫn đến tổng số
bit được sử dụng ít hơn. Mã hóa số học khác với các dạng mã hóa entropy
khác, chẳng hạn như mã hóa Huffman, ở chỗ thay vì tách đầu vào thành
các ký hiệu thành phần và thay thế từng mã bằng một mã, AC mã hóa
toàn bộ thông điệp trong một số duy nhất, một phân số n, trong đó
0,0 n < 1.0. Mã hóa số học thích ứng (AAC) liên quan đến việc thay đổi
bảng xác suất (hoặc tần suất) trong khi xử lý dữ liệu. Dữ liệu được giải
mã khớp với dữ liệu gốc miễn là bảng xác suất ở phía giải mã được thay
thế theo cùng một cách và trong cùng một bước như ở phía mã hóa. Việc
đồng bộ hóa thường dựa trên sự kết hợp các ký hiệu xảy ra trong quá
trình mã hóa và giải mã. AAC cải thiện đáng kể hiệu quả mã hóa Chương
2 so với các phương thức tĩnh; kết quả có thể hiệu quả gấp 2 lần 3 lần.
AAC mã hóa một luồng các ký hiệu thành một dòng bit có độ dài rất
gần với giới hạn tối thiểu theo lý thuyết của nó. Giả sử nguồn X tạo ký
hiệu i với xác suất pi. Entropy của nguồn X được định nghĩa là:

Trong đó H(X) có đơn vị bit trên mỗi ký hiệu (bps). Một trong những
nguyên lý cơ bản của lý thuyết thông tin là tốc độ bit trung bình tính bằng
bps của nén không mất hiệu quả nhất (nghĩa là không thể đảo ngược) của
nguồn X không thể nhỏ hơn H(X). Trong thực tế, AAC thường tạo ra một
bitrate khá gần với H(X) bằng cách ước tính xác suất của các ký hiệu
nguồn với tần suất xuất hiện khi nó mã hóa luồng ký hiệu. Về cơ bản,
AAC có thể ước tính pi tốt hơn, nó sẽ đến gần hơn với H(X), giới hạn
thấp hơn về hiệu quả mã hóa. Hiệu quả của AAC thường có thể được cải
thiện bằng cách điều chỉnh bộ mã hóa với thông tin ngữ cảnh đã biết và
duy trì các ước tính xác suất ký hiệu riêng cho từng bối cảnh. Đó là, việc
hạn chế sự chú ý của AAC vào một bối cảnh cụ thể thường làm giảm sự
đa dạng của các ký hiệu, do đó cho phép ước tính tốt hơn các xác suất
trong bối cảnh đó và tạo ra hiệu quả mã hóa cao hơn. Từ quan điểm toán
học, entropy có điều kiện của nguồn X
với thông tin đã biết Y là H (X | Y). Bởi vì nó được biết đến từ lý thuyết
thông tin rằng

điều hòa AAC với Y vì bối cảnh sẽ (thường) tạo ra một dòng bit với tốc
độ bit nhỏ hơn.

7
d) Nén không mất dữ liệu dựa trên biến đổi sử dụng KLT và DCT
Một sự kết hợp của KLT và DCT được thông qua để thực hiện một hình ảnh
hyperspectral lossy-tolossless compression. Một KLT thể đảo ngược được sử
dụng cho decorrelation phổ. Đối với phân rã không gian, thay vì áp dụng
DWT, DCT có thể đảo ngược được sử dụng. KLT (đôi khi được gọi là phân
tích thành phần chính) là một biến đổi trực giao tối ưu để nén năng lượng
của vectơ hoặc hình ảnh vào n thành phần đầu tiên của nó. Ma trận biến đổi
thu được bằng cách tính toán các hàm riêng của hiệp phương sai của vectơ
hoặc hình ảnh đầu vào. Nó đã được sử dụng rộng rãi trong xử lý hình ảnh.
Các nghiên cứu về KLT đảo ngược cho sự suy giảm quang phổ đã được báo
cáo. Hao và Shi đã đề xuất một số nguyên KLT có thể đảo ngược, và cuối
Galli và Salzo đã cải thiện nó. DCT được sử dụng rộng rãi trong nén hình
ảnh và video, chẳng hạn như các định dạng JPEG, MPEG và H.26X. Nó có
những ưu điểm riêng, chẳng hạn như sử dụng bộ nhớ thấp, linh hoạt ở cấp độ
khối, xử lý song song, v.v. Tuy nhiên, một vấn đề quan trọng của mã hóa
dựa trên DCT là cái gọi là hiệu ứng khối chặn ở tốc độ bit thấp do bộ mã hóa
xử lý từng khối độc lập. Để giảm hiệu ứng chặn của nén DCT, một số khử
chặn phương pháp dựa trên bộ lọc đã được đề xuất trong đó một số bộ lọc
thông thấp được áp dụng cho các pixel biên. Tuy nhiên, các phương pháp
dựa trên bộ lọc thường làm mờ nội dung hình ảnh. Tran et al.32 đã thiết kế
các bộ lọc trước và sau lọc để cải thiện hiệu suất của DCT, gọi sự kết hợp
của các bộ lọc là một biến đổi bị mất thời gian theo miền (TDLT), hoạt động
tốt hơn DWT trong khả năng tương thích năng lượng và nén mất mát. Tuy
nhiên, nó không hoạt động tốt trong nén không mất dữ liệu, trong đó yêu cầu
biến đổi thuận nghịch. Vương et al.31 đã giới thiệu một TDLT có thể đảo
ngược bằng cách sử dụng một hoạt động số nguyên để thay thế biến đổi
wavelet số nguyên. Để giảm độ phức tạp tính toán cao, KLT có độ phức tạp
thấp do Penna đề xuất được sử dụng. Trong KLT có độ phức tạp thấp được
đề xuất, tất cả quá trình xử lý không được thực hiện trên bộ vectơ quang phổ
hoàn chỉnh nhưng thay vì một tập hợp con của các vectơ được chọn ngẫu
nhiên. Độ phức tạp của việc tính ma trận hiệp phương sai trở thành
O(rB2MN) chứ không phải O (B2MN), tức là, nó bị giảm bởi một yếu tố r
(ví dụ r ¼ 0,01). Hiệu suất của KLT độ phức tạp thấp rất giống với KLT
thông thường, nhưng độ phức tạp tính toán giảm đáng kể. Để tiếp tục giảm
độ phức tạp tính toán, việc đánh giá ma trận hiệp phương sai được đơn giản
hóa bằng cách lấy mẫu các vectơ đầu vào với tỷ lệ 100: 1. Về mặt lý thuyết
nhân tố ma trận, ma trận không tính toán có thể được nhân tố thành một sản
phẩm của nhiều nhất ba ma trận thuận nghịch hình tam giác (TERMs). Nếu
các phần tử đường chéo của ma trận bằng 1, phép biến đổi số nguyên thành
số nguyên có thể đảo ngược có thể đạt được bằng cách đa biến.

8
Theo cách nén dữ liệu vệ tinh không mất dữ liệu này, các DCT và KLT
nguyên này sang số nguyên được triển khai bằng cách sử dụng đa biến dựa
trên hệ số ma trận.
DCT chuyển tiếp được định nghĩa như sau:

Trong các thuật toán nén DCT thông thường, một hình ảnh thường được
chia thành các khối 8 x 8 pixel. Khối tạo tác xảy ra do mỗi khối được nén
độc lập. Để khắc phục các khiếm khuyết chặn, bộ lọc trước và bộ lọc sau
tám điểm được sử dụng cho DCT tám điểm. Lọc sơ bộ hoạt động như
một hoạt động làm phẳng trên hai khối liền kề. Các pixel trong một khối
đồng nhất hơn sau khi tiền lọc do kết quả của sự tập trung năng lượng tốt
hơn. Trước khi chuyển đổi, các ma trận DCT được lọc được nhân tố
thành HẠN. Một phép biến đổi DCT từ số nguyên sang số nguyên đạt
được bằng các biện pháp để giảm các thành phần chặn. KLT và DCT có
thể đảo ngược được thực hiện theo cùng một cách. Biến đổi số nguyên có
thể đạt được bằng cách dịch chuyển và thêm mà không cần hệ số nhân
khi hệ số nâng điểm nổi được thay thế bằng phân số có người thống trị là
lũy thừa của hai. Ví dụ: tính toán 75/256 = 1/4 +1/32+ 1/64 +1/256 có thể
được chuyển đổi sang hoạt động của 1/4, 1/32, 1/64 và 1/256, có thể là
thực hiện bằng cách dịch chuyển bit. Kết quả thí nghiệm cho thấy
bộ lọc dựa trên đa mức gần đúng với bộ lọc dấu phẩy động. Một thuật
toán nén không tổn thất kết hợp giữa biến đổi thời gian đã đảo ngược
(RTDLT) và KLT có thể đảo ngược đã được đề xuất.31 Thuật toán này
sử dụng RTDLT để giải mã dư thừa không gian và KLT để giải mã dư
thừa phổ. Ba cơ sở dữ liệu AVIRIS đã được thử nghiệm bằng ba thuật
toán RTDLT / KLT, 3D SPECK, và JPEG2000 (JPEG2000-MC) để đánh
giá khả năng giải mã của thuật toán biến đổi KLT và RTDLT có thể đảo
ngược . Hai biến đổi được so sánh là 3D-5 / 3DWT không đối xứng và
2D-5 / 3DWT được sử dụng trong một tác phẩm đầu tiên. Thuật toán
RTDLT / KLT vượt trội so với 3D-5 / 3DWT không đối xứng với tỷ lệ
nén tốt hơn 7.4, 68% so với 2D-5 / 3DWT þ đảo ngược-KLT. Thuật toán
RTDLT / KLT vượt trội so với JPEG2000-MC với tỷ lệ nén tốt hơn
9,310,8%. Tuy nhiên, thuật toán RTDLT / KLT hoạt động kém hơn thuật
toán M-CALIC, 9 là thuật toán nén không tổn thất được dự đoán trước,
với tỷ lệ nén kém hơn 4.2 4.212%.
2.3 Nén gần như không mất dữ liệu
Một kỹ thuật nén gần như không mất mát nằm giữa các kỹ thuật nén
không mất dữ liệu và nén tổn thất dữ liệu. Lỗi được giới thiệu bởi kỹ

9
thuật nén gần như không tổn thất bị ràng buộc bởi ngưỡng được xác định
trước, chẳng hạn như RMSE, độ chính xác của sản phẩm ứng dụng. Một
nén gần như không mất có nghĩa là về mặt lý thuyết nó vẫn là một nén bị
mất do tính không thể đảo ngược của nó; tuy nhiên, việc mất thông tin
gây ra bởi quá trình nén được thiết kế để có tác động không đáng kể hoặc
nhỏ đến việc tạo ra các sản phẩm hoặc ứng dụng dữ liệu cuối cùng.
Người dùng dữ liệu vệ tinh thường không thích dải nén dữ liệu bị mất có
thể sẵn sàng chấp nhận nén gần như không mất bằng cách đánh đổi lợi
ích và chi phí nén
3. Các tiêu chuẩn nén dữ liệu
Có 3 tiêu chuẩn nén dữ liệu
Ba tiêu chuẩn nén dữ liệu CCSDS bao gồm:
1. Nén dữ liệu không mất dữ liệu: CCSDS 121.0-B2 (ISO-15887:
20003,4) để nén không mất dữ liệu khoa học 1D
2. Nén dữ liệu hình ảnh: CCSDS 122.0-B5 (ISO-26868: 20096) để nén
hình ảnh không mất dữ liệu
3. Nén hình ảnh đa bán cầu và hyperspectral lossless: CCSDS123.0-B8
(ISO-18381: 20139) cho giải nén hình ảnh đa bán cầu / hyperspectral
lossless.
3.1 Tiêu chuẩn nén dữ liệu không mất dữ liệu
Tiêu chuẩn nén dữ liệu không tổn hao CCSDS (LDC) (CCSDS-121) có
độ phức tạp tính toán thấp hơn. Nó bao gồm hai phần chức năng: bộ tiền
xử lý và bộ mã hóa entropy thích ứng

Hình 1: Sơ đồ khối của bộ mã hóa CCSDS LDC (nguồn: CCSDS)


a) tiền xử lý
Bộ tiền xử lý biến đổi dữ liệu thành các mẫu có thể được nén hiệu quả
hơn bằng bộ mã hóa entropy thích ứng. Nó biến đổi dữ liệu gốc theo
cách mà các từ mã ngắn hơn xảy ra với xác suất cao hơn dài hơn

10
Hình 2: Bộ tiền xử lý của bộ mã hóa CCSDS-121 LDC (nguồn:
CCSDS).
từ mã. Để đảm bảo nén không mất dữ liệu, bộ tiền xử lý phải có thể
đảo ngược. Một bộ tiền xử lý loại bỏ mối tương quan giữa các mẫu
trong khối dữ liệu đầu vào nói chung sẽ cải thiện hiệu suất của bộ mã
hóa entropy.
Trong CCSDS-121, quá trình tiền xử lý được thực hiện bởi một công
cụ dự đoán theo sau là
dự đoán lỗi ánh xạ. Đối với một số loại dữ liệu, tinh vi hơn
kỹ thuật dựa trên biến đổi có thể cung cấp hiệu quả nén được cải thiện
với chi phí phức tạp cao hơn.
Một bộ tiền xử lý chứa hai chức năng, dự đoán và ánh xạ, như được
hiển thị trong hình 2. Đầu vào của máy nén là x ¼ x1, x2, ..., xJ, là
một khối mẫu cỡ J có độ dài từ n-bit.
Trong CCSDS-121, người dùng được phép chọn bất kỳ sơ đồ dự đoán
nào phù hợp nhất giải mã dữ liệu đầu vào.
b) Bộ mã hóa entropy thích ứng
Chức năng của bộ mã hóa entropy thích nghi (được hiển thị trong
Hình 3) là tính toán các từ mã có độ dài thay đổi tương ứng với từng
khối mẫu đầu vào từ bộ tiền xử lý. Nó chuyển đổi các mẫu được xử lý
trước d thành một chuỗi bit được mã hóa y. Mã được chọn là mã có độ
dài thay đổi, sử dụng thuật toán Rice Rice.
Mã hóa có độ dài thay đổi
Thuật toán Rice sử dụng một bộ mã có độ dài thay đổi để đạt được
nén. Mỗi mã gần như tối ưu cho một nguồn phân phối hình học cụ thể.
Các mã có độ dài thay đổi, chẳng hạn như mã Huffman và mã được sử
dụng bởi thuật toán Rice, nén dữ liệu bằng cách gán các từ mã ngắn
hơn cho các ký hiệu dự kiến sẽ xảy ra với tần suất cao hơn. Bằng cách
sử dụng một số mã khác nhau và truyền mã định danh mã, thuật toán
Rice có thể thích ứng với nhiều bộ dữ liệu nguồn với giá trị entropy
khác nhau

11
Hình 3: Sơ đồ khối của bộ mã hóa entropy thích ứng (nguồn: CCSDS)
Từ thấp (dễ nén hơn) đến cao (ít nén hơn). Do các khối mẫu nguồn được
mã hóa độc lập, thông tin bên không cần phải được mang qua ranh giới
gói dữ liệu và hiệu suất của thuật toán không phụ thuộc vào kích thước
gói. Bộ mã hóa entropy thích ứng bao gồm một tập hợp các mã có độ dài
thay đổi có thể được áp dụng cho từng khối mẫu được xử lý trước cỡ J.
Đối với mỗi khối, tùy chọn mã hóa đạt được mức nén tốt nhất được chọn
để mã hóa khối. Khối được mã hóa được đi trước bởi một bit định danh
(ID)
mẫu xác định tùy chọn mã hóa cho bộ giải mã. Vì có thể chọn tùy chọn
mã mới cho mỗi khối, thuật toán Rice có thể thích ứng với việc thay đổi
thống kê nguồn. Do đó, các giá trị ngắn hơn của tham số độ dài khối J
cho phép thích ứng nhanh hơn với việc thay đổi thống kê nguồn. Tuy
nhiên, phần nhỏ của các bit được mã hóa được sử dụng để biểu thị tùy
chọn mã hóa (phần trên đầu có liên kết với nhận dạng tùy chọn mã) giảm
cho các giá trị lớn hơn của J.
Vấn đề đầu tiên của tiêu chuẩn CCSDS-121 cho phép J lấy các giá trị
{8, 16}. Trong thực tế, kích thước khối lớn hơn thường cung cấp cải thiện
tổng thể
hiệu quả nén vì giảm chi phí. Được thúc đẩy bởi thực tế này, đặc biệt là
khi tiêu chuẩn được sử dụng làm tùy chọn mã hóa entropy để nén hình
ảnh đa bán cầu hoặc siêu cường độ như được chỉ định trong Ref. [8] Phát
hành 2 của tiêu chuẩn CCSDS-121 mở rộng các giá trị được phép của J
thành {8, 16, 32, 64}. Từ thấp (dễ nén hơn) đến cao (ít nén hơn). Vì khối

12
các mẫu nguồn được mã hóa độc lập, thông tin bên không cần phải được
mang qua ranh giới gói dữ liệu và hiệu suất của thuật toán không phụ
thuộc vào kích thước gói.
Bộ mã hóa entropy thích ứng bao gồm một tập hợp các chiều dài thay đổi
mã có thể được áp dụng cho từng khối mẫu được xử lý trước cỡ J. Đối
với mỗi khối, tùy chọn mã hóa đạt được mức nén tốt nhất được chọn để
mã hóa khối. Khối được mã hóa được đi trước bởi mẫu bit định danh (ID)
xác định tùy chọn mã hóa cho bộ giải mã. Vì có thể chọn tùy chọn mã
mới cho mỗi khối, thuật toán Rice có thể thích ứng với việc thay đổi
thống kê nguồn. Do đó, các giá trị ngắn hơn của tham số độ dài khối J
cho phép thích ứng nhanh hơn với việc thay đổi thống kê nguồn. Tuy
nhiên, tỷ lệ bit được mã hóa được sử dụng để chỉ ra tùy chọn mã hóa (
Phần trên cao của người dùng liên kết với nhận dạng tùy chọn mã) giảm
cho các giá trị J.
Vấn đề đầu tiên của tiêu chuẩn CCSDS-121 cho phép J lấy các giá trị
{8, 16}. Trong thực tế, kích thước khối lớn hơn thường cung cấp cải thiện
tổng thể hiệu quả nén vì giảm chi phí. Được thúc đẩy bởi thực tế này, đặc
biệt là khi tiêu chuẩn được sử dụng làm tùy chọn mã hóa entropy để nén
hình ảnh đa bán cầu hoặc siêu cường độ như được chỉ định trong
Tham chiếu [8] Xuất bản 2 của tiêu chuẩn CCSDS-121 mở rộng các giá
trị được phép từ J đến {8, 16, 32, 64}.
Tùy chọn mã hóa
Trong một bộ mã hóa entropy thích ứng, một số tùy chọn mã hóa đồng
thời áp dụng cho một khối các mẫu cỡ J. Tùy chọn mang lại độ dài được
mã hóa ngắn nhất cho khối dữ liệu hiện tại được chọn để truyền. Một
chuỗi bit ID được gắn vào khối mã để chỉ ra cho bộ giải mã tùy chọn giải
mã nào sẽ sử dụng.
k tùy chọn chia mẫu
Như được hiển thị trong Hình 3, có bộ tùy chọn mã k + 4 trong bộ mã hóa
entropy thích ứng, trong đó các tùy chọn mã k được gọi là tùy chọn chia
tách mẫu là đa số. Tùy chọn mẫu phân tách thứ k tách ra các bit có ý
nghĩa nhỏ nhất của từng mẫu trong một khối mẫu cỡ J và mã hóa các bit
bậc cao còn lại bằng một bộ mã cơ bản chuỗi đơn giản (FS) trước khi gắn
các bit phân tách vào kho dữ liệu FS được mã hóa . Mỗi tùy chọn chia
mẫu được thiết kế để tạo dữ liệu nén với phạm vi khoảng 1 bit / mẫu
(khoảng k + 1,5 đến k + 2,5 bit / mẫu); tùy chọn mã thu được ít bit được
mã hóa nhất được chọn cho khối theo logic tùy chọn chọn. Quá trình lựa
chọn tùy chọn này đảm bảo rằng khối sẽ được mã hóa với tùy chọn mã có
sẵn tốt nhất trên cùng một khối dữ liệu, nhưng điều này không nhất thiết
có nghĩa là entropy nguồn nằm trong phạm vi đó. Giá trị entropy nguồn

13
thực tế có thể thấp hơn; số liệu thống kê nguồn và hiệu quả của giai đoạn
tiền xử lý xác định mức độ tiếp cận chặt chẽ của entropy.
Tùy chọn Zeroblock
Tùy chọn zeroblock và tùy chọn mở rộng thứ hai là hai tùy chọn mã mức
thấp. Chúng đặc biệt hiệu quả khi các mẫu được xử lý trước có giá trị rất
nhỏ. Tùy chọn zeroblock là một trường hợp đặc biệt. Tùy chọn này được
chọn khi một hoặc nhiều khối kích thước mẫu J liên tiếp đều là số không.
Trong trường hợp này, số khối zeroblocks n được mã hóa bởi một từ mã
FS có chiều dài bit bằng khối n hoặc khối (n +1) nếu khối n > 4.
Tùy chọn mở rộng thứ hai
Tùy chọn mở rộng thứ hai được thiết kế để tạo ra các tệp dữ liệu nén
trong phạm vi 0,5 bit / mẫu đến 1,5 bit / mẫu. Khi tùy chọn này được
chọn, trước tiên, bộ mã hóa sẽ ghép các khối mẫu cỡ J liên tiếp và sau đó
chuyển đổi các mẫu được ghép thành một giá trị mới được mã hóa bằng
từ mã FS. Từ mã FS cho gama được truyền đi, trong đó:

Tùy chọn mã trình tự cơ bản


Mã trình tự cơ bản là một mã có độ dài thay đổi. Trong bộ mã hóa
entropy thích ứng, một từ mã FS được xác định sao cho mỗi chữ số 1 1
Mã báo hiệu kết thúc của một từ mã và số lượng các số 0 trước đó xác
định biểu tượng nào được truyền đi. Quy trình giải mã đơn giản này cho
phép một từ mã FS được giải mã mà không cần sử dụng bảng tra cứu. Ví
dụ, các từ mã FS 1, Hồi ‘01, Cồng‘ 001, và 00 000101 được sử dụng để
mã hóa ký hiệu s1, s2, s3 và s4.
Lý do mà các mã FS có thể đạt được nén là khi ký hiệu s1 xảy ra rất
thường xuyên và khi các ký hiệu s3 và s4 rất hiếm, trung bình sẽ có ít hơn
hai bit được mã hóa trên mỗi ký hiệu, trong khi một ký hiệu chưa được
mã hóa luôn yêu cầu hai bit cho mỗi ký hiệu. Mã FS dài hơn đạt được nén
theo cách tương tự.
Tùy chọn không nén
Khi không có tùy chọn nào trước đó cung cấp bất kỳ nén dữ liệu nào trên
một khối, tùy chọn không nén được chọn. Trong tùy chọn này, khối dữ
liệu được xử lý trước được truyền đi mà không thay đổi ngoại trừ mã định
danh tiền tố.
Định dạng tập dữ liệu được mã hóa
Định dạng dữ liệu được mã hóa (CDS) có cấu trúc như sau:
• Khi tùy chọn chia mẫu được chọn, chuỗi bit ID là tùy chọn
theo sau là mẫu tham chiếu n-bit, dữ liệu nén và
14
ghép các bit có ý nghĩa nhỏ nhất từ mỗi mẫu.
• Khi tùy chọn zeroblock được chọn, CDS chứa ID tùy chọn
trường, tùy ý theo sau là mẫu tham chiếu n bit và FS yêu cầu
từ mã chỉ định số lượng các khối có giá trị bằng 0 được nối hoặc
phần còn lại của điều kiện phân khúc.
• Khi tùy chọn tiện ích mở rộng thứ hai được chọn, CDS chứa
Trường ID tùy chọn, tùy chọn theo sau là mẫu tham chiếu n-bit và
yêu cầu mã hóa FS cho các mẫu biến đổi J / 2.
• Khi tùy chọn FS được chọn, CDS chứa trường ID tùy chọn,
tùy chọn theo sau là mẫu tham chiếu n-bit và yêu cầu FS
từ mã.
• Khi tùy chọn không nén được chọn, CDS có độ dài cố định
và chứa trường ID tùy chọn, theo sau là n-bit
mẫu tham chiếu J và mẫu tiền xử lý.
3.2 Chuẩn nén dữ liệu ảnh
a)Các tính năng của tiêu chuẩn
Tiêu chuẩn nén dữ liệu hình ảnh CCSDS-122 (IDC) xác định một thuật
toán cụ thể để nén hình ảnh 2D với số nguyên 16 bit được tạo bởi nhiều
loại công cụ hình ảnh. Thuật toán được dự định là phù hợp để sử dụng tàu
vũ trụ trên tàu; đặc biệt, độ phức tạp thuật toán được thiết kế đủ thấp để
thực hiện phần cứng tốc độ cao khả thi.
Ngoài ra, thuật toán cho phép thực hiện hiệu quả bộ nhớ mà không yêu
cầu các khung trung gian lớn để đệm. Do đó, ICD phù hợp với các định
dạng hình ảnh dựa trên khung (hai chiều thu được đồng thời) được tạo ra,
ví dụ, bởi các mảng CCD cũng như các định dạng đầu vào dựa trên dải
(ví dụ: hình ảnh thu được một dòng tại một thời điểm) được tạo bởi loại
hình đẩy cảm biến.
Thuật toán IDC có thể cung cấp cả nén và mất dữ liệu. Khi nén không
mất dữ liệu, dữ liệu ảnh gốc có thể được sao chép chính xác, trong khi
nén nén, lượng tử hóa và / hoặc các xấp xỉ khác được sử dụng trong quá
trình nén dẫn đến việc không thể sao chép dữ liệu gốc.
Nén không mất dữ liệu thường đạt được tỷ lệ nén thấp hơn so với phiên
bản mất dữ liệu cho một hình ảnh nguồn nhất định.
Một biến đổi sóng con rời rạc (DWT) được áp dụng trong tiêu chuẩn để
chuyển đổi dữ liệu gốc sang miền sóng con để tạo điều kiện nén. Thuật
toán IDC hỗ trợ hai lựa chọn DWT: số nguyên và DWT dấu phẩy động.
DWT số nguyên chỉ yêu cầu số học số nguyên và do đó có khả năng cung
cấp nén không mất mát; nó có độ phức tạp thực hiện thấp hơn. DWT
điểm nổi cung cấp hiệu quả nén tổn thất được cải thiện ở tốc độ bit thấp,

15
nhưng nó yêu cầu tính toán dấu phẩy động và không thể cung cấp nén
không tổn hao.
Để tăng cường khả năng phục hồi các lỗi bit của dữ liệu nén và
do đó ngăn ngừa mất dữ liệu có thể xảy ra trong kênh đường xuống
truyền tải, dữ liệu băng con được chuyển đổi bước sóng được phân vùng
thành các phân đoạn, mỗi phân đoạn tương ứng lỏng lẻo với một vùng
khác nhau của hình ảnh. Mỗi phân đoạn được nén độc lập để các ảnh
hưởng của mất dữ liệu hoặc tham nhũng được giới hạn trong phân khúc
bị ảnh hưởng. Phân vùng dữ liệu băng con-sóng con này cũng có lợi ích
là giảm bộ nhớ cần thiết cho một số triển khai.
Kích thước của một phân khúc có thể được điều chỉnh để trao đổi mức độ
bảo vệ dữ liệu so với hiệu quả nén. Các phân đoạn nhỏ hơn cung cấp bảo
vệ tăng chống mất dữ liệu, nhưng chúng có xu hướng giảm tỷ lệ nén tổng
thể.
Mỗi phân đoạn bắt đầu bằng một tiêu đề phân khúc cung cấp thông tin về
các tùy chọn nén và dữ liệu nén trong phân khúc. Các phân đoạn được mã
hóa không bao gồm các dấu đồng bộ hóa hoặc các sơ đồ khác nhằm tạo
điều kiện thuận lợi cho việc xác định tự động các ranh giới phân khúc.
Người dùng thuật toán IDC phải sử dụng sơ đồ đóng gói CCSDS phù hợp
hoặc các phương tiện khác để xác định ranh giới phân khúc. Trong mỗi
phân đoạn nén, dữ liệu được sắp xếp sao cho các phần trước của dữ liệu
nén trong phân đoạn có xu hướng đóng góp lớn hơn trong độ trung thực
được tái cấu trúc tổng thể so với các phần sau. Dữ liệu nhúng này
cấu trúc cho phép người dùng đáp ứng một ràng buộc về khối lượng dữ
liệu của phân đoạn nén bằng cách cắt dòng bit được nén cho một phân
đoạn tại điểm thích hợp.
Sự cân bằng giữa chất lượng hình ảnh được tái tạo và tỷ lệ nén cho từng
phân đoạn được kiểm soát bằng cách chỉ định số byte tối đa trong mỗi
phân đoạn cùng với giới hạn chất lượng. Giới hạn chất lượng ràng buộc
số lượng các hệ số biến đổi bước sóng được mã hóa trong mỗi phân đoạn.
Đối với mỗi phân đoạn, dữ liệu nén được tạo ra cho đến khi đạt đến giới
hạn byte hoặc giới hạn chất lượng, tùy theo điều kiện nào đến trước. Nén
không mất dữ liệu là đạt được khi DWT số nguyên được sử dụng và khi
số byte cần thiết để mã hóa không mất mát mỗi phân đoạn không vượt
quá giới hạn byte phân đoạn.
Tiêu chuẩn CCSDS IDC khác với JPEG2000 ở một số khía cạnh:
1. Nó đặc biệt nhắm mục tiêu sử dụng tàu vũ trụ trên tàu;
2. Một sự đánh đổi cẩn thận đã được thực hiện giữa hiệu suất nén
và độ phức tạp;

16
3. Ít phức tạp hơn, nó có thể được thực hiện dễ dàng hơn trong cả hai
phần cứng
hoặc phần mềm; và
4. Nó có một bộ tùy chọn giới hạn, hỗ trợ ứng dụng thành công của nó
không có kiến thức thuật toán chuyên sâu
3.3 . Nén hình ảnh đa bán cầu và hyperspectral lossless
Thành phần máy nén
Tiêu chuẩn được đề xuất CCSDS (CCSDS-123) này xác định máy nén dữ
liệu không mất dữ liệu cho các bảng dữ liệu 3D được tạo ra, ví dụ, bởi
các hình ảnh đa bán cầu, hình ảnh siêu âm và âm thanh. Đầu ra datacube
được nén từ máy nén là một luồng bit được mã hóa từ đó đầu vào

Hình 4: Hai phần chức năng của thuật toán nén CCSDS-123
datacube có thể được phục hồi chính xác. Do sự thay đổi trong nội dung
hình ảnh, khối lượng của các datacubes sẽ thay đổi từ datacube sang
datacube. Đó là, tỷ lệ nén là biến.
Máy nén bao gồm hai bộ phận chức năng: bộ dự đoán và bộ phận
bộ mã hóa, như trong hình 4. Công cụ dự đoán sử dụng tuyến tính thích
ứng phương pháp dự đoán để dự đoán giá trị của từng mẫu trong
datacube dựa trên giá trị của các mẫu gần đó trong một vùng lân cận 3D
nhỏ. Dự đoán được thực hiện tuần tự trong một lần duy nhất. Dự đoán
còn lại, tức là, sự khác biệt giữa giá trị dự đoán và mẫu, sau đó được ánh
xạ tới một số nguyên không dấu có thể được biểu diễn bằng cách sử dụng
cùng số bit như mẫu dữ liệu đầu vào. Những phần dư dự đoán được ánh
xạ này sau đó được mã hóa bởi một bộ mã hóa entropy. Các tham số bộ
mã hóa Entropy được điều chỉnh thích nghi trong quá trình mã hóa để
thích ứng với các thay đổi trong số liệu thống kê của phần dư dự đoán
được ánh xạ.
Mã hoá
Phần dư dự đoán được ánh xạ được mã hóa tuần tự theo thứ tự được chọn
bởi người dùng. Thứ tự mã hóa này không cần phải tương ứng với thứ tự
các mẫu được xuất ra từ dụng cụ hình ảnh hoặc được xử lý bởi bộ dự
đoán. Để mã hóa phần dư dự đoán được ánh xạ cho datacube, người dùng
có thể chọn sử dụng phương pháp mã hóa entropy thích ứng mẫu hoặc
phương pháp blockadaptive. Cách tiếp cận thứ hai dựa vào máy nén dữ
liệu không mất dữ liệu được xác định trong tiêu chuẩn CCSDS-121. Bộ
mã hóa entropy thích nghi mẫu thường mang lại hình ảnh nén nhỏ hơn so

17
với entropy thích ứng khối lập trình viên Các ví dụ và so sánh khác có thể
được tìm thấy ở nơi khác.
Theo cách tiếp cận mã hóa entropy thích ứng mẫu, mỗi ánh xạ
phần dư dự đoán được mã hóa bằng cách sử dụng bộ mã nhị phân có độ
dài thay đổi. Các mã có độ dài thay đổi được sử dụng được chọn một
cách thích ứng dựa trên số liệu thống kê được cập nhật sau mỗi mẫu được
mã hóa. Số liệu thống kê riêng biệt được duy trì cho từng dải phổ và kích
thước dữ liệu nén không phụ thuộc vào thứ tự mà phần dư dự đoán được
ánh xạ được mã hóa. Theo cách tiếp cận mã hóa entropy thích ứng khối,
chuỗi các phần dư dự đoán mappe được phân chia thành các khối ngắn và
phương pháp mã hóa được sử dụng được chọn độc lập và thích ứng cho
từng khối. Tùy thuộc vào thứ tự mã hóa, phần dư dự đoán được ánh xạ
trong một khối có thể từ cùng 102 Chương 3 hoặc các dải phổ khác nhau,
và do đó kích thước hình ảnh nén phụ thuộc vào thứ tự mã hóa khi
phương pháp này được sử dụng. Dòng bit được nén của một datacube bao
gồm một tiêu đề theo sau là một phần thân. Các tiêu đề nén có độ dài thay
đổi ghi lại các tham số nén. Phần thân bao gồm các phần dư dự đoán
được ánh xạ được mã hóa dz, y, x từ bộ dự đoán

18

You might also like