Veeam [Module 5] Backup Copy & GFS

hongphuc

Intern
1. Mở đầu
Trong hệ thống sao lưu dữ liệu, việc tạo một bản backup duy nhất chưa đủ để đảm bảo an toàn. Khi xảy ra sự cố như hỏng máy chủ, lỗi ổ đĩa, mã độc mã hóa dữ liệu hoặc mất toàn bộ hệ thống tại một địa điểm, bản backup chính cũng có thể bị ảnh hưởng. Vì vậy, ngoài backup job dùng để tạo bản sao lưu ban đầu, Veeam Backup & Replication còn cung cấp tính năng Backup Copy job nhằm tạo thêm bản sao của dữ liệu backup sang một repository khác.

Module 5 tập trung tìm hiểu hai nội dung chính: Backup Copy job và GFS retention. Backup Copy job giúp sao chép dữ liệu backup sang nơi lưu trữ thứ hai, có thể là repository nội bộ, repository đặt tại site khác hoặc cloud repository. GFS retention là chính sách lưu trữ dài hạn theo mô hình Grandfather-Father-Son, cho phép giữ các bản backup theo tuần, tháng và năm để phục vụ khôi phục lâu dài, kiểm toán hoặc tuân thủ quy định lưu trữ.

2. Khái niệm Backup Copy job
Backup Copy job là một loại job trong Veeam Backup & Replication dùng để sao chép các restore point đã được tạo bởi backup job sang một backup repository khác. Nói cách khác, sau khi backup job tạo ra bản sao lưu ban đầu, Backup Copy job sẽ lấy dữ liệu từ repository nguồn và tạo một chuỗi backup độc lập tại repository đích.

Điểm quan trọng là Backup Copy job không chỉ đơn giản là thao tác copy file thông thường. Veeam xử lý dữ liệu backup ở mức restore point, tạo chuỗi backup riêng tại đích và cho phép cấu hình retention độc lập. Nhờ vậy, nếu backup gốc gặp sự cố, bản backup copy vẫn có thể được sử dụng để khôi phục dữ liệu.

Backup Copy job thường được dùng trong các trường hợp sau:
  • Tạo bản sao backup thứ hai để đáp ứng quy tắc 3-2-1.
  • Chuyển bản backup sang site dự phòng.
  • Lưu bản backup lên cloud repository hoặc repository đặt ngoài hệ thống chính.
  • Tạo bản lưu trữ dài hạn bằng GFS retention.
  • Tách biệt backup vận hành hằng ngày và backup lưu trữ lâu dài.
3. Quy tắc 3-2-1 trong sao lưu dữ liệu
Quy tắc 3-2-1 là nguyên tắc phổ biến trong thiết kế hệ thống backup. Nội dung cơ bản gồm:
  • Có ít nhất 3 bản dữ liệu: dữ liệu gốc và 2 bản backup.
  • Lưu trên ít nhất 2 loại thiết bị hoặc môi trường lưu trữ khác nhau.
  • Có ít nhất 1 bản backup đặt ngoài site chính hoặc ngoài hệ thống sản xuất.
Backup Copy job hỗ trợ trực tiếp cho quy tắc này. Ví dụ, một doanh nghiệp có thể lưu backup chính trên NAS nội bộ, sau đó dùng Backup Copy job để sao chép sang repository ở chi nhánh khác hoặc lên cloud. Khi site chính gặp sự cố, hệ thống vẫn còn bản backup copy để phục hồi.
1781886284388.png
4. Cơ chế hoạt động của Backup Copy job
Backup Copy job hoạt động dựa trên dữ liệu backup đã có. Khi job chạy lần đầu tiên, Veeam tạo một full backup tại repository đích. Các lần chạy tiếp theo, job chỉ sao chép phần dữ liệu thay đổi để tạo các restore point mới. Điều này giúp giảm dung lượng truyền tải và tiết kiệm băng thông mạng.

Quá trình hoạt động cơ bản gồm các bước:
  • Backup job tạo restore point tại repository nguồn.
  • Backup Copy job kiểm tra restore point mới.
  • Veeam Data Mover đọc dữ liệu từ repository nguồn.
  • Dữ liệu được truyền sang repository đích.
  • Repository đích tạo chuỗi backup copy riêng.
  • Retention policy tại backup copy job quyết định giữ hoặc xóa restore point cũ.
Backup Copy job có retention riêng, không phụ thuộc hoàn toàn vào retention của backup job gốc. Điều này cho phép backup gốc chỉ giữ dữ liệu ngắn hạn, trong khi backup copy có thể giữ dữ liệu dài hơn bằng GFS.
1781886348347.png
5. Các chế độ Backup Copy
Veeam Backup & Replication hỗ trợ hai chế độ Backup Copy chính: Immediate copy và Periodic copy.

5.1. Immediate copy
Immediate copy là chế độ sao chép restore point ngay khi restore point mới xuất hiện ở repository nguồn. Chế độ này phù hợp khi hệ thống yêu cầu bản backup thứ hai được cập nhật nhanh, giảm khoảng thời gian mất dữ liệu nếu repository nguồn gặp sự cố.

Ưu điểm của Immediate copy là dữ liệu ở repository đích gần với thời điểm backup gốc nhất. Tuy nhiên, chế độ này có thể tạo tải thường xuyên hơn lên mạng và repository đích.​

5.2. Periodic copy
Periodic copy là chế độ sao chép restore point mới nhất theo lịch được cấu hình trong Backup Copy job. Thay vì copy ngay lập tức, hệ thống sẽ copy theo khoảng thời gian định sẵn, ví dụ mỗi ngày một lần hoặc theo khung giờ ngoài giờ làm việc.

Ưu điểm của Periodic copy là dễ kiểm soát thời gian truyền dữ liệu, phù hợp với môi trường có băng thông hạn chế. Nhược điểm là bản backup copy có thể không mới bằng Immediate copy.​

6. Khái niệm GFS retention
GFS là viết tắt của Grandfather-Father-Son. Đây là chính sách lưu trữ dài hạn, trong đó các bản backup được chia thành nhiều chu kỳ lưu trữ:
  • Son: bản backup theo tuần.
  • Father: bản backup theo tháng.
  • Grandfather: bản backup theo năm.
Trong Veeam, GFS retention dùng để giữ một số full backup trong thời gian dài hơn so với retention ngắn hạn. Ví dụ, hệ thống có thể giữ 14 restore point hằng ngày để phục hồi nhanh, đồng thời giữ thêm 4 bản weekly, 12 bản monthly và 3 bản yearly để phục vụ lưu trữ dài hạn.

GFS rất hữu ích trong các môi trường cần lưu dữ liệu lâu dài, chẳng hạn hệ thống kế toán, cơ sở dữ liệu quan trọng, máy chủ dịch vụ nội bộ hoặc hệ thống cần đáp ứng yêu cầu kiểm tra, đối chiếu, tuân thủ.
1781886384731.png
7. Cách GFS retention hoạt động
Khi bật GFS retention cho Backup Copy job, Veeam sẽ tạo hoặc đánh dấu các full backup theo chu kỳ weekly, monthly và yearly. Các bản backup này được giữ lại trong khoảng thời gian do người quản trị cấu hình.

Ví dụ cấu hình:
  • Keep weekly full backups for: 4 weeks.
  • Keep monthly full backups for: 12 months.
  • Keep yearly full backups for: 3 years.
Với cấu hình trên, hệ thống sẽ giữ 4 bản backup theo tuần gần nhất, 12 bản backup theo tháng và 3 bản backup theo năm. Các bản GFS này không bị xóa theo retention ngắn hạn cho đến khi hết thời gian lưu trữ được cấu hình.

Điểm cần chú ý là GFS thường gắn với full backup. Bản GFS là bản backup đầy đủ tại một thời điểm cụ thể, giúp giảm rủi ro phải phụ thuộc vào một chuỗi incremental quá dài. Nếu chỉ giữ nhiều incremental backup liên tiếp, quá trình restore có thể chậm hơn và rủi ro cao hơn khi một file incremental bị lỗi.

8. Phương pháp tạo GFS backup
Veeam hỗ trợ hai cách tạo archive full backup cho GFS: Synthetic full và Active full.

8.1. Synthetic full
Synthetic full là phương pháp mặc định. Với phương pháp này, Veeam không copy lại toàn bộ dữ liệu từ repository nguồn. Thay vào đó, hệ thống sử dụng các backup file đã có tại repository đích để tổng hợp thành một full backup mới.

Ưu điểm của Synthetic full là giảm tải cho mạng và giảm ảnh hưởng đến môi trường sản xuất. Tuy nhiên, phương pháp này có thể tạo tải I/O lớn trên repository đích, đặc biệt khi dùng thiết bị lưu trữ deduplication.​

8.2. Active full
Active full là phương pháp đọc toàn bộ restore point từ repository nguồn để tạo archive full backup tại đích. Phương pháp này có thể phù hợp với một số thiết bị deduplication vì giảm tải xử lý tổng hợp trên repository đích. Tuy nhiên, Active full sẽ làm tăng lưu lượng mạng và tải đọc từ repository nguồn.

Việc lựa chọn Synthetic full hay Active full phụ thuộc vào loại storage, băng thông mạng, hiệu năng repository và yêu cầu vận hành của hệ thống.​

9. Lợi ích của Backup Copy & GFS
Backup Copy và GFS mang lại nhiều lợi ích trong hệ thống bảo vệ dữ liệu:
  • Tăng độ an toàn cho dữ liệu. Khi backup chính gặp sự cố, hệ thống vẫn còn bản backup copy để khôi phục.
  • Hỗ trợ triển khai quy tắc 3-2-1. Dữ liệu không chỉ nằm tại một nơi mà có thể được lưu thêm ở site khác hoặc cloud.
  • Tách biệt retention ngắn hạn và dài hạn. Backup job chính có thể giữ ít restore point để tiết kiệm dung lượng, trong khi Backup Copy job dùng GFS để lưu các mốc quan trọng trong thời gian dài.
  • Phục vụ yêu cầu kiểm toán và tuân thủ. Nhiều tổ chức cần lưu dữ liệu theo tháng hoặc theo năm. GFS giúp cấu hình tự động thay vì phải quản lý thủ công.
  • Giảm rủi ro khi chuỗi incremental quá dài. Các bản full backup định kỳ theo GFS giúp quá trình restore ổn định và dễ quản lý hơn.
10. Hạn chế và lưu ý khi triển khai
Khi triển khai Backup Copy và GFS, cần chú ý một số vấn đề sau:
  • Cần tính toán dung lượng repository đích vì GFS giữ nhiều full backup trong thời gian dài.
  • Cần đảm bảo băng thông mạng đủ ổn định, đặc biệt khi copy sang site khác hoặc cloud.
  • Nên cấu hình lịch chạy phù hợp để tránh ảnh hưởng đến giờ cao điểm.
  • Cần kiểm tra định kỳ khả năng restore từ backup copy.
  • Nên bật mã hóa backup nếu dữ liệu được copy ra ngoài site chính.
  • Cần cân nhắc giữa Synthetic full và Active full tùy theo loại repository.
  • Không nên chỉ bật yearly backup mà không có weekly hoặc monthly, vì chuỗi incremental có thể trở nên quá dài.
  • Cần giám sát job để phát hiện lỗi copy, lỗi repository hoặc thiếu dung lượng.
11. Kết luận
Backup Copy job và GFS retention là hai thành phần quan trọng trong Veeam Backup & Replication. Backup Copy job giúp tạo thêm bản sao backup tại một repository khác, từ đó tăng khả năng an toàn dữ liệu và hỗ trợ quy tắc 3-2-1. GFS retention giúp lưu trữ các full backup quan trọng theo tuần, tháng và năm, phù hợp với yêu cầu bảo vệ dữ liệu dài hạn.

Khi triển khai thực tế, người quản trị cần xác định rõ nhu cầu khôi phục, dung lượng lưu trữ, băng thông mạng và thời gian lưu trữ cần thiết. Một thiết kế tốt nên kết hợp backup ngắn hạn để phục hồi nhanh và GFS backup để lưu trữ lâu dài. Điều này giúp hệ thống vừa linh hoạt trong vận hành, vừa an toàn trước các rủi ro như lỗi phần cứng, xóa nhầm dữ liệu, mã độc hoặc sự cố tại site chính.
 
Back
Top