Tổng quan Text Recoded
Chương trình Text Recoded cung cấp các thao tác hữu ích sau trên một dữ liệu văn bản nhất định:
- Mã hóa, giải mã và mã hóa lại giữa văn bản thuần túy, mã hóa thập lục phân và Base64
- Mật mã và giải mã bằng mật mã Caesar
- Tạo các giá trị băm của dữ liệu văn bản thô và được định dạng nhằm mục đích xác thực tính toàn vẹn của nó
Có thể sử dụng mã hóa dữ liệu văn bản thành mã hóa thập lục phân hoặc Base64 để đảm bảo rằng dữ liệu văn bản gốc sẽ không bị thay đổi do phương tiện lưu trữ hoặc truyền tải xử lý dữ liệu đó trong bộ ký tự không tương thích.
Mật mã bằng mật mã Caesar, một loại mật mã thay thế đơn giản, có thể được sử dụng trong nhiều trường hợp khi dữ liệu văn bản cần được giấu kín khỏi những người bình thường ngoài kia, những người thường không bận tâm đến việc giải mã nó. Tuy nhiên, nó không phù hợp để bảo mật dữ liệu nhạy cảm vì nó có thể dễ dàng được giải mã bằng công nghệ ngày nay.
Quy trình mã hóa và giải mã do chương trình Text Recoded thực hiện được giải thích trong ví dụ sau bằng cách sử dụng “TEXT” làm đầu vào và “kiểm tra” làm khóa:
Đầu vào : TEXT (T=84, E=69, X=88, T=84)
Key : kiểm tra (t=116, e=101, s=115, t=116)
Quy trình: đầu vào + phím
Đầu ra ở dạng thập phân: (200,170,203, 200)
Đầu ra ở dạng thập lục phân: C8AACBC8
Việc giải mã hoàn toàn ngược lại với cách trên, đó là đầu ra được mã hóa – chìa khóa. Trong trường hợp của chúng tôi nó sẽ là:
C8AACBC8 - kiểm tra = TEXT
Chương trình Text Recoded nhận và cung cấp đầu vào và đầu ra dữ liệu văn bản, cũng như khóa để mã hóa, ở dạng mã hóa UTF-8 hỗ trợ toàn bộ bộ ký tự Unicode, chứa các ký tự từ hầu hết các hệ thống chữ viết trên thế giới.
Không có giới hạn về độ dài đầu vào ngoại trừ bộ nhớ khả dụng. Khóa cũng có thể có độ dài bất kỳ, tuy nhiên nếu nó dài hơn đầu vào thì nó sẽ bị cắt bớt theo độ dài đầu vào, được chia thành các phần có độ dài đầu vào và sau đó giá trị của các phần bổ sung sẽ được thêm vào đoạn đầu tiên.
Đầu ra mã hóa có thể ở dạng mã hóa thập lục phân hoặc Base64. Làm việc với dữ liệu nhị phân không được hỗ trợ trong phiên bản này.
Với mục đích đảm bảo tính toàn vẹn của đầu ra nhất định, cũng có thể đưa các giá trị băm của chúng vào hộp Đầu ra, cho cả hoạt động Mã hóa và Mã hóa.
Lưu ý rằng giá trị băm được tạo ra có ba loại được giải thích bên dưới.
Hàm băm cho TẤT CẢ nội dung văn bản được tạo cho toàn bộ nội dung của dữ liệu văn bản được chỉ định, bao gồm các khoảng trống như khoảng trắng, tab và dòng mới, nếu có.
Hàm băm cho nội dung văn bản FMT đã định dạng được tạo cho văn bản cũng như các khoảng trắng bên trong và các dòng mới, loại trừ tất cả các dòng trống và khoảng trắng xung quanh.
Hàm băm cho nội dung văn bản RAW chỉ được tạo cho chính văn bản đó, không bao gồm tất cả các loại khoảng trống: dòng trống, khoảng trắng, tab và dòng mới.
Để xác thực tính toàn vẹn của dữ liệu văn bản nhất định trong trường hợp yêu cầu loại băm không phải RAW, độ dài dòng, số dòng và loại ký tự dòng mới là rất quan trọng. Điều này là do Windows sử dụng mã ký tự #13#10 để lưu trữ các dòng mới, trong khi hệ điều hành Linux chỉ sử dụng mã ký tự #10 để lưu trữ các dòng mới. Do đó, nếu hàm băm cho dữ liệu văn bản được tạo ra trong một hệ điều hành nhưng cần được xác thực ở một hệ điều hành khác thì phải đặt một tùy chọn thích hợp. Với mục đích này, có một hộp lựa chọn để chọn giữa các ký tự dòng mới của Windows và Linux khi tạo bảng băm.
- Mã hóa, giải mã và mã hóa lại giữa văn bản thuần túy, mã hóa thập lục phân và Base64
- Mật mã và giải mã bằng mật mã Caesar
- Tạo các giá trị băm của dữ liệu văn bản thô và được định dạng nhằm mục đích xác thực tính toàn vẹn của nó
Có thể sử dụng mã hóa dữ liệu văn bản thành mã hóa thập lục phân hoặc Base64 để đảm bảo rằng dữ liệu văn bản gốc sẽ không bị thay đổi do phương tiện lưu trữ hoặc truyền tải xử lý dữ liệu đó trong bộ ký tự không tương thích.
Mật mã bằng mật mã Caesar, một loại mật mã thay thế đơn giản, có thể được sử dụng trong nhiều trường hợp khi dữ liệu văn bản cần được giấu kín khỏi những người bình thường ngoài kia, những người thường không bận tâm đến việc giải mã nó. Tuy nhiên, nó không phù hợp để bảo mật dữ liệu nhạy cảm vì nó có thể dễ dàng được giải mã bằng công nghệ ngày nay.
Quy trình mã hóa và giải mã do chương trình Text Recoded thực hiện được giải thích trong ví dụ sau bằng cách sử dụng “TEXT” làm đầu vào và “kiểm tra” làm khóa:
Đầu vào : TEXT (T=84, E=69, X=88, T=84)
Key : kiểm tra (t=116, e=101, s=115, t=116)
Quy trình: đầu vào + phím
Đầu ra ở dạng thập phân: (200,170,203, 200)
Đầu ra ở dạng thập lục phân: C8AACBC8
Việc giải mã hoàn toàn ngược lại với cách trên, đó là đầu ra được mã hóa – chìa khóa. Trong trường hợp của chúng tôi nó sẽ là:
C8AACBC8 - kiểm tra = TEXT
Chương trình Text Recoded nhận và cung cấp đầu vào và đầu ra dữ liệu văn bản, cũng như khóa để mã hóa, ở dạng mã hóa UTF-8 hỗ trợ toàn bộ bộ ký tự Unicode, chứa các ký tự từ hầu hết các hệ thống chữ viết trên thế giới.
Không có giới hạn về độ dài đầu vào ngoại trừ bộ nhớ khả dụng. Khóa cũng có thể có độ dài bất kỳ, tuy nhiên nếu nó dài hơn đầu vào thì nó sẽ bị cắt bớt theo độ dài đầu vào, được chia thành các phần có độ dài đầu vào và sau đó giá trị của các phần bổ sung sẽ được thêm vào đoạn đầu tiên.
Đầu ra mã hóa có thể ở dạng mã hóa thập lục phân hoặc Base64. Làm việc với dữ liệu nhị phân không được hỗ trợ trong phiên bản này.
Với mục đích đảm bảo tính toàn vẹn của đầu ra nhất định, cũng có thể đưa các giá trị băm của chúng vào hộp Đầu ra, cho cả hoạt động Mã hóa và Mã hóa.
Lưu ý rằng giá trị băm được tạo ra có ba loại được giải thích bên dưới.
Hàm băm cho TẤT CẢ nội dung văn bản được tạo cho toàn bộ nội dung của dữ liệu văn bản được chỉ định, bao gồm các khoảng trống như khoảng trắng, tab và dòng mới, nếu có.
Hàm băm cho nội dung văn bản FMT đã định dạng được tạo cho văn bản cũng như các khoảng trắng bên trong và các dòng mới, loại trừ tất cả các dòng trống và khoảng trắng xung quanh.
Hàm băm cho nội dung văn bản RAW chỉ được tạo cho chính văn bản đó, không bao gồm tất cả các loại khoảng trống: dòng trống, khoảng trắng, tab và dòng mới.
Để xác thực tính toàn vẹn của dữ liệu văn bản nhất định trong trường hợp yêu cầu loại băm không phải RAW, độ dài dòng, số dòng và loại ký tự dòng mới là rất quan trọng. Điều này là do Windows sử dụng mã ký tự #13#10 để lưu trữ các dòng mới, trong khi hệ điều hành Linux chỉ sử dụng mã ký tự #10 để lưu trữ các dòng mới. Do đó, nếu hàm băm cho dữ liệu văn bản được tạo ra trong một hệ điều hành nhưng cần được xác thực ở một hệ điều hành khác thì phải đặt một tùy chọn thích hợp. Với mục đích này, có một hộp lựa chọn để chọn giữa các ký tự dòng mới của Windows và Linux khi tạo bảng băm.
Xem thêm