hongphuc
Intern
1. Giới thiệu
Trong hệ thống sao lưu dữ liệu, repository là nơi lưu trữ các file backup được tạo ra bởi phần mềm Veeam Backup & Replication. Khi dung lượng dữ liệu ngày càng tăng, việc sử dụng một repository đơn lẻ có thể gặp nhiều hạn chế như nhanh đầy dung lượng, khó mở rộng, khó tối ưu hiệu năng và khó xây dựng chiến lược lưu trữ lâu dài. Để giải quyết vấn đề này, Veeam cung cấp tính năng Scale-out Backup Repository, gọi tắt là SOBR.
SOBR cho phép gộp nhiều repository vật lý hoặc logic thành một repository tổng hợp. Người quản trị chỉ cần trỏ backup job đến SOBR, còn việc phân phối dữ liệu đến từng nơi lưu trữ sẽ do Veeam xử lý theo chính sách đã cấu hình. Nhờ đó, hệ thống backup có thể mở rộng linh hoạt, dễ quản lý hơn và tận dụng được nhiều loại lưu trữ khác nhau như ổ đĩa local, NAS, Linux repository, object storage hoặc archive storage.
2. Khái niệm Scale-out Backup Repository
Scale-out Backup Repository là một kiểu repository mở rộng trong Veeam Backup & Replication. Thay vì chỉ sử dụng một nơi lưu trữ duy nhất, SOBR kết hợp nhiều repository lại thành một pool lưu trữ chung. Các repository thành phần trong SOBR được gọi là extent.
Ví dụ, một hệ thống có thể có hai repository local trên Windows Server, một NAS dùng SMB/NFS và một object storage như S3 hoặc MinIO. Khi cấu hình SOBR, các repository này có thể được đưa vào các tầng lưu trữ khác nhau. Backup job sẽ ghi dữ liệu vào SOBR thay vì ghi trực tiếp vào từng repository riêng lẻ.
Mục đích chính của SOBR gồm:
Một SOBR có thể bao gồm ba tầng chính: Performance Tier, Capacity Tier và Archive Tier. Mỗi tầng có vai trò khác nhau trong vòng đời dữ liệu backup.
Mô hình tổng quan Scale-out Backup Repository với ba tầng lưu trữ4. Tiering Policy trong SOBR
Tiering policy là các chính sách quyết định cách Veeam phân phối và di chuyển dữ liệu giữa các tầng lưu trữ trong SOBR. Có thể chia thành ba nhóm chính: chính sách đặt file trong Performance Tier, chính sách chuyển/copy dữ liệu sang Capacity Tier và chính sách archive dữ liệu sang Archive Tier.
Chính sách đặt file backup trong Performance Tier
Cơ chế copy backup từ Performance Tier sang Capacity Tier5. Ví dụ mô hình triển khai SOBR
Một mô hình SOBR cơ bản có thể triển khai như sau:
Performance Tier:
Mô hình SOBR với Performance Tier tại site chính và Capacity Tier tại site dự phòng6. Ưu điểm của SOBR
Mặc dù SOBR rất hữu ích, việc triển khai cần được thiết kế cẩn thận. Nếu chỉ tập trung mở rộng dung lượng mà không tính đến hiệu năng, mạng, chi phí cloud và chính sách retention, hệ thống có thể gặp khó khăn khi restore.
Một số lưu ý quan trọng:
Scale-out Backup Repository là một thành phần quan trọng trong Veeam Backup & Replication, giúp mở rộng khả năng lưu trữ backup và xây dựng mô hình lưu trữ phân tầng. Thông qua Performance Tier, Capacity Tier và Archive Tier, SOBR cho phép quản trị viên cân bằng giữa hiệu năng, dung lượng, chi phí và khả năng an toàn dữ liệu.
Trong triển khai thực tế, Performance Tier nên được dùng cho các bản backup gần nhất để phục hồi nhanh. Capacity Tier nên dùng để copy hoặc move dữ liệu sang object storage nhằm tăng khả năng bảo vệ và tiết kiệm dung lượng local. Archive Tier nên dùng cho các bản GFS backup dài hạn, ít khi truy cập.
Việc lựa chọn tiering policy cần dựa trên nhu cầu cụ thể của hệ thống: yêu cầu RTO/RPO, dung lượng backup, tốc độ mạng, chi phí lưu trữ và yêu cầu bảo mật. Nếu được cấu hình hợp lý, SOBR sẽ giúp hệ thống backup linh hoạt hơn, an toàn hơn và phù hợp hơn với xu hướng lưu trữ dữ liệu hiện đại.
Trong hệ thống sao lưu dữ liệu, repository là nơi lưu trữ các file backup được tạo ra bởi phần mềm Veeam Backup & Replication. Khi dung lượng dữ liệu ngày càng tăng, việc sử dụng một repository đơn lẻ có thể gặp nhiều hạn chế như nhanh đầy dung lượng, khó mở rộng, khó tối ưu hiệu năng và khó xây dựng chiến lược lưu trữ lâu dài. Để giải quyết vấn đề này, Veeam cung cấp tính năng Scale-out Backup Repository, gọi tắt là SOBR.
SOBR cho phép gộp nhiều repository vật lý hoặc logic thành một repository tổng hợp. Người quản trị chỉ cần trỏ backup job đến SOBR, còn việc phân phối dữ liệu đến từng nơi lưu trữ sẽ do Veeam xử lý theo chính sách đã cấu hình. Nhờ đó, hệ thống backup có thể mở rộng linh hoạt, dễ quản lý hơn và tận dụng được nhiều loại lưu trữ khác nhau như ổ đĩa local, NAS, Linux repository, object storage hoặc archive storage.
2. Khái niệm Scale-out Backup Repository
Scale-out Backup Repository là một kiểu repository mở rộng trong Veeam Backup & Replication. Thay vì chỉ sử dụng một nơi lưu trữ duy nhất, SOBR kết hợp nhiều repository lại thành một pool lưu trữ chung. Các repository thành phần trong SOBR được gọi là extent.
Ví dụ, một hệ thống có thể có hai repository local trên Windows Server, một NAS dùng SMB/NFS và một object storage như S3 hoặc MinIO. Khi cấu hình SOBR, các repository này có thể được đưa vào các tầng lưu trữ khác nhau. Backup job sẽ ghi dữ liệu vào SOBR thay vì ghi trực tiếp vào từng repository riêng lẻ.
Mục đích chính của SOBR gồm:
- Mở rộng dung lượng backup khi dữ liệu tăng.
- Tận dụng nhiều loại thiết bị lưu trữ khác nhau.
- Tăng hiệu quả quản lý repository.
- Phân tầng dữ liệu theo nhu cầu truy cập.
- Hỗ trợ chiến lược backup 3-2-1, lưu bản sao tại nhiều vị trí.
- Giảm chi phí lưu trữ dài hạn bằng cách chuyển dữ liệu cũ sang object storage hoặc archive storage.
Một SOBR có thể bao gồm ba tầng chính: Performance Tier, Capacity Tier và Archive Tier. Mỗi tầng có vai trò khác nhau trong vòng đời dữ liệu backup.
Mô hình tổng quan Scale-out Backup Repository với ba tầng lưu trữ
3.1. Performance Tier
Performance Tier là tầng lưu trữ chính và thường là nơi backup job ghi dữ liệu đầu tiên. Đây là tầng dùng cho các restore point cần truy cập nhanh, phục hồi nhanh và thường xuyên được sử dụng trong giai đoạn ngắn hạn.
Performance Tier có thể gồm một hoặc nhiều performance extent. Các extent này có thể là Windows repository, Linux repository, SMB share, NFS share, deduplicating storage appliance hoặc object storage repository tùy theo phiên bản và điều kiện triển khai.
Trong thực tế, Performance Tier thường được đặt trên hệ thống lưu trữ có tốc độ cao như ổ cứng local, DAS, NAS tốc độ tốt hoặc Linux Hardened Repository. Đây là nơi phù hợp để giữ các bản backup gần nhất, phục vụ nhu cầu khôi phục nhanh khi có sự cố.
Ví dụ: một doanh nghiệp cấu hình SOBR với hai repository local dung lượng 2 TB và 3 TB. Cả hai repository này được đưa vào Performance Tier. Khi backup job chạy, dữ liệu sẽ được Veeam phân phối vào các extent theo chính sách đặt file backup đã chọn.
Ưu điểm của Performance Tier:
- Tốc độ ghi và đọc dữ liệu tốt.
- Phù hợp cho khôi phục nhanh.
- Có thể mở rộng bằng cách thêm extent mới.
- Có thể tận dụng các công nghệ như ReFS/XFS Fast Clone nếu cấu hình phù hợp.
- Giúp gom nhiều repository thành một điểm quản lý duy nhất.
Hạn chế của Performance Tier:
- Chi phí lưu trữ local thường cao hơn lưu trữ cloud/object storage.
- Nếu chỉ dùng local storage thì chưa bảo đảm yêu cầu offsite backup.
- Cần theo dõi dung lượng từng extent để tránh đầy repository.
- Nếu cấu hình placement policy không phù hợp có thể ảnh hưởng đến backup chain.
3.2. Capacity Tier
Capacity Tier là tầng lưu trữ mở rộng dùng object storage. Tầng này thường được dùng để lưu các backup ít truy cập hơn hoặc để tạo thêm bản sao dữ liệu ra ngoài hệ thống local. Capacity Tier có thể sử dụng cloud object storage hoặc on-premises object storage như Amazon S3, Azure Blob, S3-compatible storage, Wasabi, MinIO hoặc các hệ thống tương tự.
Capacity Tier có hai chính sách quan trọng: Copy và Move.
Chính sách Copy cho phép sao chép backup lên object storage ngay sau khi backup được tạo. Cách này giúp có thêm một bản sao offsite hoặc object storage gần như ngay lập tức. Đây là lựa chọn phù hợp khi muốn tăng khả năng an toàn dữ liệu, đặc biệt trong tình huống repository local bị lỗi, bị mã hóa bởi ransomware hoặc gặp sự cố vật lý.
Chính sách Move cho phép chuyển các backup chain không còn hoạt động từ Performance Tier sang Capacity Tier sau khi chúng vượt qua khoảng thời gian operational restore window. Nói cách khác, các bản backup cũ không còn cần khôi phục nhanh sẽ được đẩy sang object storage để tiết kiệm dung lượng local.
Hai chính sách Copy và Move có thể được dùng đồng thời. Khi đó, backup mới sẽ được copy lên object storage sớm, còn khi backup chain cũ vượt ngưỡng thời gian cấu hình, dữ liệu tương ứng ở Performance Tier có thể được dọn bớt để tiết kiệm dung lượng.
Ưu điểm của Capacity Tier:
- Mở rộng dung lượng gần như linh hoạt hơn so với local storage.
- Hỗ trợ lưu dữ liệu ở vị trí khác để tăng an toàn.
- Giảm áp lực dung lượng cho Performance Tier.
- Có thể phục hồi trực tiếp từ object storage trong nhiều tình huống.
- Phù hợp với mô hình backup dài hạn hoặc offsite backup.
Hạn chế của Capacity Tier:
- Phụ thuộc vào kết nối mạng hoặc Internet.
- Tốc độ restore có thể chậm hơn local repository.
- Có thể phát sinh chi phí lưu trữ, đọc/ghi và tải dữ liệu từ cloud.
- Cần cấu hình bảo mật, mã hóa và immutability cẩn thận.
- Cần quản lý offload window để tránh ảnh hưởng băng thông trong giờ cao điểm.
3.3. Archive Tier
Archive Tier là tầng lưu trữ dành cho dữ liệu rất ít truy cập, thường là dữ liệu lưu trữ dài hạn theo chính sách GFS như weekly, monthly hoặc yearly backup. Tầng này thường dùng các loại cold storage như Amazon S3 Glacier, Azure Archive Storage hoặc S3-compatible object storage có hỗ trợ archive.
Khác với Performance Tier và Capacity Tier, Archive Tier thường không phục vụ nhu cầu khôi phục nhanh. Dữ liệu ở tầng này có chi phí lưu trữ thấp hơn, nhưng quá trình phục hồi thường lâu hơn và có thể phát sinh thêm chi phí truy xuất dữ liệu. Vì vậy, Archive Tier phù hợp cho các bản backup cần giữ lâu để đáp ứng yêu cầu tuân thủ, kiểm toán hoặc lưu trữ lịch sử.
Ví dụ: doanh nghiệp cần giữ bản backup hàng tháng trong 12 tháng và bản backup hàng năm trong 5 năm. Các bản GFS full backup cũ có thể được chuyển sang Archive Tier để tiết kiệm chi phí lưu trữ, trong khi các restore point gần nhất vẫn nằm ở Performance Tier hoặc Capacity Tier.
Ưu điểm của Archive Tier:
- Chi phí lưu trữ dài hạn thấp hơn.
- Phù hợp với backup GFS và yêu cầu lưu trữ lâu dài.
- Giúp giảm tải cho Performance Tier và Capacity Tier.
- Hỗ trợ chiến lược lưu trữ phân tầng rõ ràng.
Hạn chế của Archive Tier:
- Restore chậm hơn, không phù hợp cho yêu cầu RTO ngắn.
- Có thể cần quá trình chuẩn bị hoặc retrieve dữ liệu trước khi restore.
- Có thể phát sinh chi phí truy xuất dữ liệu.
- Không nên dùng làm nơi duy nhất để lưu các bản backup cần khôi phục nhanh.
Tiering policy là các chính sách quyết định cách Veeam phân phối và di chuyển dữ liệu giữa các tầng lưu trữ trong SOBR. Có thể chia thành ba nhóm chính: chính sách đặt file trong Performance Tier, chính sách chuyển/copy dữ liệu sang Capacity Tier và chính sách archive dữ liệu sang Archive Tier.
4.1. Backup Placement Policy trong Performance Tier
Backup Placement Policy quyết định cách các file backup được đặt lên các performance extent. Có hai chính sách phổ biến là Data Locality và Performance.
Chính sách đặt file backup trong Performance Tier
4.1.1. Data Locality
Với Data Locality, toàn bộ file thuộc cùng một backup chain sẽ được lưu trên cùng một extent. Ví dụ, một file full backup và các file incremental phụ thuộc vào nó sẽ nằm cùng một repository.
Chính sách này giúp backup chain dễ quản lý hơn, giảm rủi ro chain bị phân tán trên nhiều nơi lưu trữ. Đây cũng là lựa chọn phù hợp khi sử dụng ReFS hoặc XFS để tận dụng Fast Clone, vì các file trong cùng chain nằm trên cùng volume/repository.
Ưu điểm:
- Backup chain tập trung, dễ quản lý.
- Phù hợp với ReFS/XFS Fast Clone.
- Giảm phụ thuộc giữa nhiều extent khi restore.
- Đơn giản và an toàn hơn cho đa số môi trường.
Nhược điểm:
- Có thể chưa tận dụng tối đa hiệu năng song song giữa nhiều thiết bị lưu trữ.
- Nếu một extent gần đầy, Veeam cần chọn extent khác cho backup chain mới.
4.1.2. Performance Policy
Với Performance Policy, full backup file và incremental backup file của cùng một chain có thể được lưu trên các extent khác nhau. Mục tiêu là phân tán I/O ra nhiều thiết bị lưu trữ để cải thiện hiệu năng trong một số tác vụ.
Chính sách này phù hợp khi các extent có kết nối nhanh, ổn định và có hiệu năng tương đương. Tuy nhiên, vì backup chain bị phân tán, nếu một extent chứa một phần của chain bị offline, quá trình backup hoặc restore có thể bị ảnh hưởng.
Ưu điểm:
- Có thể cải thiện hiệu năng nhờ phân tán I/O.
- Phù hợp với môi trường có nhiều thiết bị lưu trữ tốc độ cao.
- Có thể chỉ định extent cho full backup và incremental backup.
Nhược điểm:
- Phụ thuộc nhiều vào tình trạng online của các extent.
- Nếu một extent chứa một phần backup chain bị lỗi, chain có thể bị ảnh hưởng.
- Yêu cầu mạng giữa các extent nhanh và ổn định.
- Cấu hình phức tạp hơn Data Locality.
4.2. Chính sách Copy sang Capacity Tier
Chính sách Copy backups to object storage as soon as they are created cho phép copy backup lên object storage ngay sau khi backup được tạo. Đây là lựa chọn phù hợp khi doanh nghiệp muốn có thêm bản sao ngoài Performance Tier trong thời gian sớm nhất.
Ví dụ, backup job ghi dữ liệu vào repository local. Sau khi job hoàn thành, Veeam sẽ copy dữ liệu backup tương ứng lên object storage. Nếu local repository gặp sự cố, hệ thống vẫn còn bản backup ở Capacity Tier để phục hồi.
Chính sách này phù hợp với yêu cầu:
- Tạo bản sao offsite nhanh.
- Tăng khả năng chống mất dữ liệu.
- Hỗ trợ chiến lược 3-2-1.
- Bảo vệ dữ liệu trước sự cố local repository.
4.3. Chính sách Move sang Capacity Tier
Chính sách Move backups to object storage as they age out of the operational restore window cho phép di chuyển backup chain cũ sang Capacity Tier sau một số ngày cấu hình. Các backup cũ, ít được sử dụng để restore nhanh, sẽ được chuyển sang object storage để tiết kiệm dung lượng local.
Ví dụ, doanh nghiệp muốn giữ backup 7 ngày gần nhất ở local repository để restore nhanh. Các backup cũ hơn 7 ngày sẽ được chuyển sang Capacity Tier. Khi cần restore dữ liệu cũ, quản trị viên vẫn có thể khôi phục từ object storage, nhưng tốc độ có thể chậm hơn so với local.
Chính sách này phù hợp với yêu cầu:
- Tiết kiệm dung lượng Performance Tier.
- Giữ local storage cho các restore point mới nhất.
- Lưu dữ liệu cũ trên object storage có chi phí thấp hơn.
- Phù hợp với dữ liệu ít truy cập.
4.4. Kết hợp Copy và Move
Trong thực tế, có thể kết hợp cả Copy và Move. Khi đó, backup mới được copy lên Capacity Tier ngay sau khi tạo, còn dữ liệu cũ ở Performance Tier sẽ được dọn bớt khi vượt qua operational restore window.
Mô hình này có ưu điểm là vừa có bản sao sớm trên object storage, vừa tiết kiệm dung lượng local khi backup cũ không còn cần restore nhanh. Đây là cấu hình phù hợp cho nhiều môi trường doanh nghiệp.
Cơ chế copy backup từ Performance Tier sang Capacity Tier
4.5. Chính sách Archive sang Archive Tier
Archive Tier thường được cấu hình để chuyển các GFS full backup cũ sang archive object storage. Người quản trị có thể đặt số ngày cụ thể, ví dụ archive các GFS backup cũ hơn 30, 60 hoặc 90 ngày.
Chính sách này phù hợp khi dữ liệu cần giữ lâu nhưng rất ít khi khôi phục. Ví dụ, bản backup hàng tháng hoặc hàng năm có thể được đưa vào Archive Tier để giảm chi phí lưu trữ.
Khi thiết kế Archive Tier, cần lưu ý:
- Chỉ nên đưa dữ liệu ít truy cập vào Archive Tier.
- Không nên dùng Archive Tier cho các restore point cần khôi phục nhanh.
- Cần tính đến thời gian retrieve dữ liệu khi restore.
- Cần xem xét chi phí lấy dữ liệu ra từ archive storage.
- Nên kết hợp với GFS retention để quản lý dữ liệu dài hạn.
Một mô hình SOBR cơ bản có thể triển khai như sau:
Performance Tier:
- Repository 1: Windows Server local disk, dung lượng 2 TB.
- Repository 2: Linux Hardened Repository, dung lượng 4 TB.
- Object storage: MinIO hoặc S3-compatible storage.
- Chính sách: Copy backup ngay sau khi tạo và Move backup cũ hơn 7 ngày.
- Archive object storage: Amazon S3 Glacier hoặc Azure Archive.
- Chính sách: Archive GFS full backup cũ hơn 30 ngày.
Mô hình SOBR với Performance Tier tại site chính và Capacity Tier tại site dự phòng
- SOBR giúp mở rộng dung lượng dễ dàng. Khi repository hiện tại gần đầy, người quản trị có thể thêm extent mới thay vì phải di chuyển toàn bộ backup sang repository lớn hơn.
- SOBR giúp đơn giản hóa quản trị. Backup job chỉ cần trỏ đến một repository logic là SOBR, trong khi bên dưới có thể gồm nhiều thiết bị lưu trữ khác nhau.
- SOBR hỗ trợ phân tầng dữ liệu theo giá trị sử dụng. Dữ liệu mới, cần restore nhanh, nằm ở Performance Tier. Dữ liệu cũ hơn được chuyển sang Capacity Tier. Dữ liệu lưu trữ lâu dài được đưa vào Archive Tier.
- SOBR hỗ trợ tốt hơn cho chiến lược an toàn dữ liệu. Khi kết hợp với object storage, immutability và offsite backup, doanh nghiệp có thể tăng khả năng bảo vệ trước sự cố phần cứng, lỗi người dùng hoặc ransomware.
Mặc dù SOBR rất hữu ích, việc triển khai cần được thiết kế cẩn thận. Nếu chỉ tập trung mở rộng dung lượng mà không tính đến hiệu năng, mạng, chi phí cloud và chính sách retention, hệ thống có thể gặp khó khăn khi restore.
Một số lưu ý quan trọng:
- Cần chọn placement policy phù hợp. Với môi trường phổ biến, Data Locality thường an toàn và dễ quản lý hơn.
- Nếu dùng Performance Policy, cần bảo đảm các extent luôn online và kết nối ổn định.
- Cần theo dõi dung lượng từng extent để tránh đầy repository.
- Cần cấu hình offload window hợp lý để tránh chiếm băng thông vào giờ làm việc.
- Cần bật mã hóa khi đưa dữ liệu lên object storage nếu chính sách bảo mật yêu cầu.
- Nên sử dụng immutability cho object storage hoặc Linux Hardened Repository để tăng khả năng chống ransomware.
- Cần kiểm tra restore định kỳ, không chỉ kiểm tra backup job thành công.
- Cần tính toán chi phí lưu trữ, chi phí truy xuất và thời gian phục hồi khi dùng Capacity Tier hoặc Archive Tier.
Scale-out Backup Repository là một thành phần quan trọng trong Veeam Backup & Replication, giúp mở rộng khả năng lưu trữ backup và xây dựng mô hình lưu trữ phân tầng. Thông qua Performance Tier, Capacity Tier và Archive Tier, SOBR cho phép quản trị viên cân bằng giữa hiệu năng, dung lượng, chi phí và khả năng an toàn dữ liệu.
Trong triển khai thực tế, Performance Tier nên được dùng cho các bản backup gần nhất để phục hồi nhanh. Capacity Tier nên dùng để copy hoặc move dữ liệu sang object storage nhằm tăng khả năng bảo vệ và tiết kiệm dung lượng local. Archive Tier nên dùng cho các bản GFS backup dài hạn, ít khi truy cập.
Việc lựa chọn tiering policy cần dựa trên nhu cầu cụ thể của hệ thống: yêu cầu RTO/RPO, dung lượng backup, tốc độ mạng, chi phí lưu trữ và yêu cầu bảo mật. Nếu được cấu hình hợp lý, SOBR sẽ giúp hệ thống backup linh hoạt hơn, an toàn hơn và phù hợp hơn với xu hướng lưu trữ dữ liệu hiện đại.
Bài viết liên quan
Được quan tâm
Bài viết mới