Veeam [Module 7] Replication

hongphuc

Intern
1. Tổng quan về Replication
Replication là chức năng tạo bản sao của máy ảo từ site chính sang một host hoặc datastore khác, thường là site dự phòng DR. Khác với backup chỉ tạo file backup lưu trong repository, replication tạo ra một VM replica ở định dạng native của nền tảng ảo hóa, ví dụ VMware vSphere. VM replica này được duy trì đồng bộ với VM nguồn theo lịch replication job. Khi hệ thống chính gặp sự cố, quản trị viên có thể failover sang VM replica để dịch vụ hoạt động trở lại nhanh hơn.

Điểm quan trọng nhất của Replication là giảm RTO. Vì replica VM đã tồn tại sẵn ở phía target host và ở trạng thái gần như sẵn sàng bật lên, thời gian khôi phục thường thấp hơn so với việc phải restore toàn bộ VM từ file backup. Vì vậy, replication thường dùng cho các VM quan trọng như Domain Controller, File Server, Database Server, Application Server hoặc các hệ thống yêu cầu thời gian gián đoạn thấp.

Tuy nhiên, replication không thay thế hoàn toàn backup. Backup vẫn cần thiết để lưu giữ dữ liệu dài hạn, khôi phục nhiều mốc thời gian cũ, phục hồi file/application item và bảo vệ trước lỗi logic hoặc mã độc. Một thiết kế tốt thường kết hợp cả backup, backup copy và replication.

2. Replication khác Backup như thế nào?
Backup là quá trình sao lưu VM thành các file backup như VBK, VIB, VRB và lưu trong backup repository. Khi cần khôi phục, Veeam sẽ sử dụng các file backup này để restore VM, restore file, restore application item hoặc chạy Instant VM Recovery. Backup phù hợp cho lưu trữ nhiều restore point, lưu dài hạn và đáp ứng yêu cầu retention.

Replication thì khác. Veeam tạo ra một VM replica trực tiếp trên target host/datastore. Replica này là một bản sao của VM nguồn, có thể được bật lên khi xảy ra sự cố. Vì không phải mất thời gian restore toàn bộ dữ liệu từ repository về datastore trước khi chạy, replication thường có RTO thấp hơn backup.

3. Cơ chế hoạt động của Replication
Khi một replication job chạy, Veeam Backup & Replication đọc cấu hình job, kiểm tra tài nguyên backup infrastructure và truy vấn thông tin VM từ vCenter/ESXi. Nếu bật application-aware processing, Veeam sẽ xử lý bên trong guest OS để đảm bảo tính nhất quán ứng dụng.

Sau đó, Veeam yêu cầu vCenter hoặc ESXi tạo snapshot cho VM nguồn. Trong thời gian snapshot tồn tại, disk của VM được đặt ở trạng thái read-only, còn các thay đổi mới phát sinh sẽ ghi vào delta file. Backup proxy đọc dữ liệu từ VM disk ở trạng thái read-only để chuyển sang target.

Ở lần chạy đầu tiên, Veeam tạo full replica trên target host. Các lần chạy sau là incremental, tức là chỉ chuyển các block dữ liệu đã thay đổi từ lần replication trước. Veeam có thể dùng CBT để xác định block thay đổi. Trong quá trình truyền dữ liệu, proxy có thể lọc bỏ zero block, swap file block và các dữ liệu không cần thiết, sau đó nén dữ liệu trước khi gửi sang target proxy. Target proxy sẽ giải nén và ghi dữ liệu xuống datastore đích.
1782222058700.png
4. Replica VM và Restore Point
Replica VM là bản sao của VM nguồn nằm ở site đích. Với VMware, replica được lưu ở định dạng native của VMware vSphere. Điểm đáng chú ý là disk của replica được lưu dạng decompressed/native, không phải file backup nén như trong repository. Điều này giúp replica có thể bật lên nhanh khi cần failover.

Veeam vẫn duy trì restore point cho replica. Khi failover, quản trị viên có thể chọn restore point phù hợp. Trong lúc replica chạy ở trạng thái failover, các thay đổi phát sinh trên replica được ghi vào delta file của snapshot/restore point đã chọn. Sau khi xử lý sự cố, quản trị viên cần quyết định bước tiếp theo: undo failover, permanent failover hoặc failback.

5. Compression trong Replication
Compression giúp giảm lượng dữ liệu truyền qua mạng, đặc biệt hữu ích khi replicate sang site DR qua WAN. Veeam hỗ trợ cơ chế nén và deduplication nhằm giảm lưu lượng truyền qua network và giảm dung lượng lưu trữ cho backup file/replica file.

Trong replication, source proxy có thể nén dữ liệu VM trước khi gửi sang target proxy. Target proxy giải nén dữ liệu và ghi kết quả xuống datastore đích. Cần lưu ý rằng compression chủ yếu tối ưu đường truyền; replica virtual disk ở đích vẫn được lưu ở định dạng native/decompressed.

Veeam có nhiều mức compression như None, Dedupe-friendly, Optimal, High và Extreme. Trong thực tế, mức Optimal thường là lựa chọn cân bằng giữa hiệu năng, CPU proxy và tỷ lệ nén. Mức High hoặc Extreme có thể giảm thêm dung lượng nhưng tiêu tốn nhiều CPU hơn và có thể làm chậm quá trình restore/replication.

Nếu replicate trong cùng site, tài liệu Veeam nêu rằng on-site replication không thực hiện compression vì traffic được truyền decompressed giữa hai Veeam Data Mover trên cùng proxy. Với off-site replication, cần có source proxy ở production site và target proxy ở DR site; khi đường truyền chậm có thể dùng WAN Accelerator.

6. Seeding trong Replication
Seeding dùng để giảm lượng dữ liệu phải truyền trong lần replication đầu tiên. Thông thường, lần đầu replication sẽ phải chuyển toàn bộ dữ liệu VM từ source site sang DR site, rất tốn băng thông nếu VM lớn hoặc đường truyền WAN yếu. Với seeding, ta chuẩn bị sẵn backup của VM tại DR site. Khi replication job chạy lần đầu, Veeam sử dụng backup này như “seed”, restore VM từ backup đó ở site DR rồi chỉ đồng bộ phần chênh lệch với VM nguồn.

Mapping là cơ chế liên quan đến seeding. Nếu ở DR site đã có một VM tương tự, ví dụ VM được restore thủ công hoặc replica cũ từ job khác, có thể map VM nguồn với VM có sẵn. Veeam sẽ đồng bộ VM có sẵn đó với trạng thái mới nhất của VM nguồn và dùng nó làm replica.

Lưu ý quan trọng: nếu bật seeding hoặc mapping trong replication job, tất cả VM trong job phải có seed hoặc mapping tương ứng. Nếu VM nào không có seed/mapping, VM đó có thể bị bỏ qua khi xử lý.
1782222169230.png

Algorithm for Seeding
1782222193505.png

Algorithm for Mapping​
7. Network Mapping và Re-IP
Trong môi trường DR, network ở site chính và site dự phòng thường không giống nhau. Ví dụ production dùng port group “VM Network”, còn DR dùng “DR Network”. Network Mapping cho phép ánh xạ network nguồn sang network đích. Khi replication session chạy, Veeam kiểm tra bảng mapping và tự cập nhật cấu hình replica để thay network production bằng network DR. Nhờ vậy, quản trị viên không cần chỉnh network thủ công cho từng replica VM.

Re-IP dùng khi IP scheme giữa production site và DR site khác nhau. Ví dụ production dùng dải 192.168.10.0/24, DR dùng 192.168.20.0/24. Khi failover sang DR, replica VM cần đổi IP để phù hợp với mạng DR. Veeam cho phép cấu hình Re-IP rules để tự động thay đổi IP của guest OS khi failover.

Tuy nhiên, Re-IP có giới hạn. Theo tài liệu Veeam, Replica re-IP chỉ hoạt động với Microsoft Windows VM và chỉ được áp dụng khi failover thông qua Veeam Backup & Replication. Nếu quản trị viên bật replica VM thủ công từ vCenter/ESXi thì Re-IP rules sẽ không được áp dụng.

8. Failover, Permanent Failover và Failback
Failover là thao tác chuyển workload từ VM nguồn ở production site sang VM replica ở DR site. Khi failover, các thay đổi phát sinh trên replica không tự động phản ánh ngược về VM nguồn. Failover chỉ là trạng thái trung gian, sau đó phải chọn cách kết thúc phù hợp.

Có ba hướng xử lý chính sau failover:
  • Undo failover: dùng khi failover chỉ để test hoặc sự cố không thật sự xảy ra. Hệ thống quay lại VM nguồn và loại bỏ thay đổi đã phát sinh trên replica.
  • Permanent failover: dùng khi quyết định chuyển hẳn sang replica và xem replica như production VM mới. Trường hợp này phù hợp khi site chính hỏng nặng hoặc cần chuyển đổi lâu dài.
  • Failback: dùng khi production site đã được khôi phục. Veeam chuyển các thay đổi phát sinh trong thời gian chạy replica ngược về VM nguồn hoặc về một vị trí production mới.
Planned failover dùng khi biết trước site chính sẽ dừng, ví dụ bảo trì data center. Mục tiêu là chuyển workload sang replica một cách chủ động và ít mất dữ liệu hơn.
1782222239241.png
9. Khi nào nên dùng Replication?
Replication nên dùng cho các VM có yêu cầu RTO thấp, tức là cần chạy lại nhanh khi có sự cố. Các VM phù hợp gồm hệ thống xác thực, ứng dụng nghiệp vụ, cơ sở dữ liệu quan trọng, file server phục vụ nhiều người dùng hoặc các máy chủ mà downtime gây ảnh hưởng lớn.

Không nên replicate mọi VM nếu không có yêu cầu rõ ràng, vì replication tiêu tốn storage, compute ở DR site, băng thông mạng và tài nguyên proxy. Với các VM ít quan trọng, backup và backup copy có thể đủ. Cách chọn hợp lý là phân loại workload theo mức độ quan trọng: VM quan trọng thì backup + replica; VM trung bình thì backup + backup copy; VM ít quan trọng thì backup theo retention phù hợp.
1782222094022.png
10. Kết luận
Replication trong Veeam Backup & Replication là giải pháp quan trọng cho disaster recovery vì giúp tạo sẵn VM replica ở site dự phòng. So với backup, replication có ưu điểm lớn về RTO vì replica VM đã ở trạng thái gần như sẵn sàng chạy. Tuy nhiên, replication không thay thế backup vì backup vẫn cần cho lưu trữ dài hạn, phục hồi nhiều mốc thời gian và bảo vệ trước lỗi dữ liệu.

Khi triển khai replication cần hiểu rõ các thành phần: source proxy, target proxy, target host, datastore đích, repository lưu metadata, network mapping, re-IP, compression và seeding. Với môi trường WAN hoặc DR site băng thông thấp, seeding, mapping, compression và WAN Accelerator là các cơ chế quan trọng giúp giảm lưu lượng truyền và tối ưu quá trình đồng bộ.

Tóm lại, backup giúp “có dữ liệu để khôi phục”, còn replication giúp “chạy lại hệ thống nhanh”. Trong thiết kế thực tế cho khách hàng, nên kết hợp cả hai để vừa có khả năng khôi phục lâu dài, vừa đáp ứng yêu cầu downtime thấp cho các workload quan trọng.
 
Back
Top