hongphuc
Intern
1. Giới thiệu chung
Trong Veeam Backup & Replication, backup job là thành phần dùng để sao lưu máy ảo, máy chủ hoặc dữ liệu theo cấu hình do quản trị viên thiết lập. Ở mức cơ bản, backup job chỉ cần chọn đối tượng cần sao lưu, nơi lưu trữ và chạy job. Tuy nhiên, trong môi trường thực tế, quản trị viên cần cấu hình nâng cao để hệ thống sao lưu hoạt động ổn định, tiết kiệm dung lượng và đảm bảo khả năng khôi phục khi có sự cố.
Các thiết lập nâng cao của backup job gồm: Schedule, Retention Policy, Health Check, Compact, Active Full và Synthetic Full. Đây là các tùy chọn quan trọng giúp tự động hóa quá trình sao lưu, kiểm soát số lượng bản sao lưu, kiểm tra tính toàn vẹn dữ liệu và tối ưu dung lượng lưu trữ.
2. Schedule – Lập lịch chạy backup job
Schedule là chức năng lập lịch để backup job tự động chạy theo thời gian định sẵn. Thay vì phải chạy thủ công, quản trị viên có thể cấu hình job chạy hằng ngày, hằng tuần, hằng tháng hoặc chạy lặp lại theo khoảng thời gian nhất định.
Các kiểu lập lịch phổ biến gồm:
Cấu hình lịch chạy tự động cho Backup Job trong Veeam
3. Retention Policy – Chính sách lưu giữ bản backup
Retention Policy là chính sách quy định số lượng restore point hoặc số ngày mà hệ thống sẽ giữ lại các bản sao lưu. Restore point là một điểm khôi phục, cho phép đưa máy ảo hoặc dữ liệu trở lại trạng thái tại thời điểm backup.
Retention policy giúp giải quyết hai vấn đề chính:
4. Health Check – Kiểm tra tính toàn vẹn file backup
Health Check là chức năng kiểm tra tính toàn vẹn của các file backup. Trong quá trình lưu trữ lâu dài, file backup có thể bị lỗi do hỏng ổ cứng, lỗi hệ thống lưu trữ, mất điện, lỗi ghi dữ liệu hoặc sự cố phần cứng. Nếu không kiểm tra định kỳ, quản trị viên có thể chỉ phát hiện lỗi khi cần restore, lúc đó việc khôi phục có thể thất bại.
Khi bật Health Check, Veeam sẽ kiểm tra restore point mới nhất trong backup chain. Công cụ này sử dụng CRC để kiểm tra metadata và hash để kiểm tra các khối dữ liệu của máy ảo. Mục tiêu là xác định xem restore point có còn nhất quán và có thể sử dụng để khôi phục hay không.
Cơ chế Health Check phát hiện và xử lý restore point bị lỗi
Health Check nên được cấu hình chạy định kỳ, ví dụ mỗi tháng một lần. Tuy nhiên, quá trình này có thể mất thời gian vì Veeam phải đọc nhiều file trong backup chain để kiểm tra trạng thái mới nhất của máy ảo. Vì vậy, nên đặt lịch health check vào thời điểm hệ thống ít tải.
Cấu hình Health Check để kiểm tra tính toàn vẹn file backup
5. Compact – Chống phân mảnh và tối ưu full backup file
Compact là chức năng chống phân mảnh và tối ưu file full backup. Trong quá trình backup lâu dài, đặc biệt với chuỗi forever forward incremental, file full backup có thể bị biến đổi nhiều lần để đáp ứng retention policy. Việc này làm file backup ngày càng lớn, phân mảnh và khiến tốc độ đọc/ghi giảm.
Khi chạy compact, Veeam tạo một file full backup mới trong repository, sao chép các khối dữ liệu còn cần thiết từ file cũ, sắp xếp lại dữ liệu gần nhau hơn và loại bỏ dữ liệu không còn cần dùng. Kết quả là file full backup gọn hơn, ít phân mảnh hơn và tốc độ xử lý có thể được cải thiện.
Compact phù hợp khi backup chain chạy lâu ngày, repository bị phân mảnh hoặc dung lượng file full backup tăng cao bất thường. Tuy nhiên, compact cần thêm dung lượng tạm thời trong repository vì Veeam phải tạo file mới trong quá trình xử lý.
6. Active Full Backup
Active Full Backup là phương pháp tạo một bản full backup hoàn toàn mới bằng cách đọc toàn bộ dữ liệu từ máy ảo hoặc nguồn dữ liệu gốc. Quá trình này tương tự như lần backup đầu tiên: Veeam lấy dữ liệu từ source, nén, chống trùng lặp và ghi thành file full backup VBK mới.
Ưu điểm của Active Full là tạo ra một chuỗi backup mới, độc lập và đáng tin cậy. Khi có active full mới, các incremental backup sau đó sẽ dựa trên full backup mới này. Điều này giúp giảm rủi ro phụ thuộc vào chuỗi backup cũ.
Nhược điểm của Active Full là tiêu tốn nhiều tài nguyên hơn. Vì phải đọc toàn bộ dữ liệu từ nguồn, quá trình này sử dụng nhiều băng thông mạng, tài nguyên máy chủ, tài nguyên datastore và dung lượng lưu trữ. Do đó, Active Full thường được đặt lịch theo tuần hoặc theo tháng, chạy vào thời điểm hệ thống ít hoạt động.
Mô hình Active Full Backup trong backup chain
7. Synthetic Full Backup
Synthetic Full Backup cũng tạo ra một file full backup mới, nhưng không đọc toàn bộ dữ liệu từ máy ảo nguồn. Thay vào đó, Veeam sử dụng full backup cũ và các file incremental đã có trong backup repository để tổng hợp thành một file full backup mới.
Ưu điểm lớn nhất của Synthetic Full là giảm tải cho môi trường production. Vì dữ liệu được xử lý chủ yếu tại backup repository, synthetic full không tiêu tốn nhiều băng thông từ hệ thống nguồn như active full. Cách này phù hợp với môi trường có nhiều máy ảo, dung lượng lớn hoặc không muốn tạo tải nặng lên hệ thống chính.
Tuy nhiên, Synthetic Full lại tạo tải lớn lên repository, vì repository phải đọc nhiều file backup cũ và ghi ra file full backup mới. Vì vậy, khi dùng synthetic full, cần đảm bảo backup repository có tốc độ đọc/ghi tốt và còn đủ dung lượng trống.
8. Kết luận
Backup job nâng cao giúp hệ thống sao lưu hoạt động ổn định, an toàn và tối ưu hơn. Việc hiểu và cấu hình đúng các chức năng này giúp quản trị viên xây dựng hệ thống backup đáng tin cậy, giảm rủi ro mất dữ liệu và đảm bảo khả năng phục hồi khi có sự cố.
Trong Veeam Backup & Replication, backup job là thành phần dùng để sao lưu máy ảo, máy chủ hoặc dữ liệu theo cấu hình do quản trị viên thiết lập. Ở mức cơ bản, backup job chỉ cần chọn đối tượng cần sao lưu, nơi lưu trữ và chạy job. Tuy nhiên, trong môi trường thực tế, quản trị viên cần cấu hình nâng cao để hệ thống sao lưu hoạt động ổn định, tiết kiệm dung lượng và đảm bảo khả năng khôi phục khi có sự cố.
Các thiết lập nâng cao của backup job gồm: Schedule, Retention Policy, Health Check, Compact, Active Full và Synthetic Full. Đây là các tùy chọn quan trọng giúp tự động hóa quá trình sao lưu, kiểm soát số lượng bản sao lưu, kiểm tra tính toàn vẹn dữ liệu và tối ưu dung lượng lưu trữ.
2. Schedule – Lập lịch chạy backup job
Schedule là chức năng lập lịch để backup job tự động chạy theo thời gian định sẵn. Thay vì phải chạy thủ công, quản trị viên có thể cấu hình job chạy hằng ngày, hằng tuần, hằng tháng hoặc chạy lặp lại theo khoảng thời gian nhất định.
Các kiểu lập lịch phổ biến gồm:
- Daily at this time: chạy hằng ngày vào một thời điểm cụ thể.
- Monthly at this time: chạy theo tháng, vào ngày và giờ được chỉ định.
- Periodically every: chạy lặp lại sau một khoảng thời gian nhất định, ví dụ mỗi 4 giờ hoặc mỗi 6 giờ.
- Retry failed items processing: tự động chạy lại nếu quá trình backup bị lỗi.
Cấu hình lịch chạy tự động cho Backup Job trong Veeam
Retention Policy là chính sách quy định số lượng restore point hoặc số ngày mà hệ thống sẽ giữ lại các bản sao lưu. Restore point là một điểm khôi phục, cho phép đưa máy ảo hoặc dữ liệu trở lại trạng thái tại thời điểm backup.
Retention policy giúp giải quyết hai vấn đề chính:
- Đảm bảo có đủ bản backup để phục hồi khi cần. Nếu retention quá ngắn, hệ thống có thể không còn bản backup phù hợp khi phát hiện lỗi muộn.
- Kiểm soát dung lượng lưu trữ. Nếu retention quá dài, backup repository có thể nhanh chóng đầy, làm job thất bại hoặc ảnh hưởng đến các bản backup khác.
- Theo số restore point: ví dụ giữ 7 restore points gần nhất.
- Theo số ngày: ví dụ giữ các restore point trong 14 ngày gần nhất.
4. Health Check – Kiểm tra tính toàn vẹn file backup
Health Check là chức năng kiểm tra tính toàn vẹn của các file backup. Trong quá trình lưu trữ lâu dài, file backup có thể bị lỗi do hỏng ổ cứng, lỗi hệ thống lưu trữ, mất điện, lỗi ghi dữ liệu hoặc sự cố phần cứng. Nếu không kiểm tra định kỳ, quản trị viên có thể chỉ phát hiện lỗi khi cần restore, lúc đó việc khôi phục có thể thất bại.
Khi bật Health Check, Veeam sẽ kiểm tra restore point mới nhất trong backup chain. Công cụ này sử dụng CRC để kiểm tra metadata và hash để kiểm tra các khối dữ liệu của máy ảo. Mục tiêu là xác định xem restore point có còn nhất quán và có thể sử dụng để khôi phục hay không.
Cơ chế Health Check phát hiện và xử lý restore point bị lỗi
Cấu hình Health Check để kiểm tra tính toàn vẹn file backup
Compact là chức năng chống phân mảnh và tối ưu file full backup. Trong quá trình backup lâu dài, đặc biệt với chuỗi forever forward incremental, file full backup có thể bị biến đổi nhiều lần để đáp ứng retention policy. Việc này làm file backup ngày càng lớn, phân mảnh và khiến tốc độ đọc/ghi giảm.
Khi chạy compact, Veeam tạo một file full backup mới trong repository, sao chép các khối dữ liệu còn cần thiết từ file cũ, sắp xếp lại dữ liệu gần nhau hơn và loại bỏ dữ liệu không còn cần dùng. Kết quả là file full backup gọn hơn, ít phân mảnh hơn và tốc độ xử lý có thể được cải thiện.
Compact phù hợp khi backup chain chạy lâu ngày, repository bị phân mảnh hoặc dung lượng file full backup tăng cao bất thường. Tuy nhiên, compact cần thêm dung lượng tạm thời trong repository vì Veeam phải tạo file mới trong quá trình xử lý.
6. Active Full Backup
Active Full Backup là phương pháp tạo một bản full backup hoàn toàn mới bằng cách đọc toàn bộ dữ liệu từ máy ảo hoặc nguồn dữ liệu gốc. Quá trình này tương tự như lần backup đầu tiên: Veeam lấy dữ liệu từ source, nén, chống trùng lặp và ghi thành file full backup VBK mới.
Ưu điểm của Active Full là tạo ra một chuỗi backup mới, độc lập và đáng tin cậy. Khi có active full mới, các incremental backup sau đó sẽ dựa trên full backup mới này. Điều này giúp giảm rủi ro phụ thuộc vào chuỗi backup cũ.
Nhược điểm của Active Full là tiêu tốn nhiều tài nguyên hơn. Vì phải đọc toàn bộ dữ liệu từ nguồn, quá trình này sử dụng nhiều băng thông mạng, tài nguyên máy chủ, tài nguyên datastore và dung lượng lưu trữ. Do đó, Active Full thường được đặt lịch theo tuần hoặc theo tháng, chạy vào thời điểm hệ thống ít hoạt động.
Mô hình Active Full Backup trong backup chain
Synthetic Full Backup cũng tạo ra một file full backup mới, nhưng không đọc toàn bộ dữ liệu từ máy ảo nguồn. Thay vào đó, Veeam sử dụng full backup cũ và các file incremental đã có trong backup repository để tổng hợp thành một file full backup mới.
Ưu điểm lớn nhất của Synthetic Full là giảm tải cho môi trường production. Vì dữ liệu được xử lý chủ yếu tại backup repository, synthetic full không tiêu tốn nhiều băng thông từ hệ thống nguồn như active full. Cách này phù hợp với môi trường có nhiều máy ảo, dung lượng lớn hoặc không muốn tạo tải nặng lên hệ thống chính.
Tuy nhiên, Synthetic Full lại tạo tải lớn lên repository, vì repository phải đọc nhiều file backup cũ và ghi ra file full backup mới. Vì vậy, khi dùng synthetic full, cần đảm bảo backup repository có tốc độ đọc/ghi tốt và còn đủ dung lượng trống.
8. Kết luận
Backup job nâng cao giúp hệ thống sao lưu hoạt động ổn định, an toàn và tối ưu hơn. Việc hiểu và cấu hình đúng các chức năng này giúp quản trị viên xây dựng hệ thống backup đáng tin cậy, giảm rủi ro mất dữ liệu và đảm bảo khả năng phục hồi khi có sự cố.
Bài viết liên quan
Được quan tâm
Bài viết mới