Veeam [MODULE4] Backup Proxy & Transport mode

hongphuc

Intern
1. Giới thiệu chung
Trong hệ thống Veeam Backup & Replication, Backup Proxy là một thành phần trung gian có nhiệm vụ xử lý, đọc, truyền và ghi dữ liệu trong quá trình sao lưu, phục hồi hoặc replication máy ảo. Nếu Backup Server được xem là bộ phận quản lý trung tâm thì Backup Proxy chính là thành phần trực tiếp tham gia vào quá trình vận chuyển dữ liệu từ hạ tầng ảo hóa đến nơi lưu trữ backup.

Việc cấu hình Backup Proxy hợp lý có ảnh hưởng rất lớn đến hiệu năng sao lưu. Một hệ thống có Backup Repository tốt nhưng Backup Proxy đặt sai vị trí, chọn sai transport mode hoặc giới hạn tài nguyên không phù hợp vẫn có thể làm tốc độ backup chậm, gây nghẽn mạng hoặc tạo tải lớn lên ESXi host. Vì vậy, trong triển khai thực tế, người quản trị cần hiểu rõ chức năng của Backup Proxy, các chế độ truyền dữ liệu như HotAdd, Direct SAN, NBD và cách lựa chọn chế độ phù hợp với từng mô hình hạ tầng.

2. Khái niệm Backup Proxy
Backup Proxy là thành phần đảm nhận vai trò xử lý dữ liệu trong quá trình backup. Khi một job backup được khởi chạy, Veeam Backup & Replication sẽ lựa chọn proxy phù hợp để đọc dữ liệu từ máy ảo nguồn, xử lý dữ liệu như nén, chống trùng lặp, mã hóa nếu có cấu hình, sau đó chuyển dữ liệu đến Backup Repository.

Backup Proxy giúp giảm tải cho Backup Server. Thay vì để máy chủ quản lý trung tâm phải làm toàn bộ công việc, Veeam cho phép triển khai nhiều proxy ở các vị trí khác nhau trong hệ thống. Nhờ đó, khối lượng công việc có thể được phân tán, tăng tốc độ xử lý và tối ưu luồng truyền dữ liệu.

Trong môi trường VMware vSphere, Backup Proxy thường được triển khai theo một trong các hình thức sau:
  • Cài trên chính máy Veeam Backup Server đối với môi trường nhỏ.
  • Cài trên một máy chủ vật lý có kết nối trực tiếp đến SAN.
  • Cài trên một máy ảo nằm trong cụm VMware để sử dụng chế độ HotAdd.
  • Triển khai nhiều proxy tại các site khác nhau để tối ưu hiệu năng và giảm tải đường truyền WAN.
1781620772482.png
3. Vai trò của Backup Proxy trong hệ thống Veeam
Backup Proxy có một số vai trò chính như sau:
  • Là nơi trực tiếp đọc dữ liệu từ máy ảo. Tùy theo transport mode, proxy có thể đọc dữ liệu trực tiếp từ SAN, gắn ổ đĩa máy ảo vào proxy bằng HotAdd hoặc đọc dữ liệu qua mạng LAN từ ESXi host.
  • Thực hiện xử lý dữ liệu trước khi gửi đến repository. Quá trình này có thể bao gồm nén dữ liệu, loại bỏ dữ liệu trùng lặp, mã hóa hoặc tối ưu luồng truyền.
  • Phân tán tải. Khi có nhiều job backup chạy đồng thời, Veeam có thể phân phối các tác vụ cho nhiều proxy khác nhau, tránh tình trạng một máy chủ bị quá tải.
  • Backup Proxy ảnh hưởng trực tiếp đến tốc độ backup và restore. Nếu proxy có đủ CPU, RAM, băng thông mạng và được đặt gần nguồn dữ liệu thì tốc độ xử lý sẽ tốt hơn.
4. Cấu hình Backup Proxy
Để cấu hình Backup Proxy trong Veeam Backup & Replication, người quản trị thường thực hiện các bước cơ bản sau:

4.1. Chuẩn bị máy chủ làm Backup Proxy
Trước khi thêm proxy, cần chuẩn bị một máy chủ hoặc máy ảo đáp ứng yêu cầu tài nguyên. Máy này cần có kết nối mạng ổn định đến Backup Server, ESXi host, vCenter Server và Backup Repository. Nếu sử dụng Direct SAN, proxy cần có kết nối trực tiếp đến hệ thống lưu trữ SAN. Nếu sử dụng HotAdd, proxy nên là một máy ảo chạy trong cùng môi trường VMware.

4.2. Thêm Backup Proxy vào Veeam
Trong giao diện Veeam Backup & Replication, người quản trị vào mục Backup Infrastructure, chọn Backup Proxies, sau đó thêm mới VMware Backup Proxy. Tại đây cần chọn máy chủ đảm nhận vai trò proxy, cấu hình số lượng tác vụ đồng thời, chọn transport mode và hoàn tất quá trình cài đặt các thành phần cần thiết.

4.3. Cấu hình transport mode
Veeam cho phép chọn transport mode theo hai hướng: tự động hoặc thủ công. Với chế độ Automatic selection, Veeam sẽ tự chọn phương thức truyền dữ liệu phù hợp nhất dựa trên khả năng truy cập datastore của proxy. Với chế độ thủ công, người quản trị có thể chỉ định proxy sử dụng Direct SAN, HotAdd hoặc Network mode.

Trong thực tế, nên bật tùy chọn failover to network mode để nếu chế độ chính không khả dụng thì job vẫn có thể tiếp tục chạy bằng Network/NBD. Tuy nhiên, cần lưu ý rằng khi failover sang NBD, tốc độ backup có thể giảm do dữ liệu phải đi qua mạng LAN.

4.4. Cấu hình Max concurrent tasks
Max concurrent tasks là số lượng tác vụ mà proxy được phép xử lý đồng thời. Nếu đặt quá thấp, proxy không tận dụng hết tài nguyên. Nếu đặt quá cao, CPU, RAM, disk I/O hoặc network có thể bị quá tải. Vì vậy, cần cân đối giữa số lượng CPU core, RAM, tốc độ lưu trữ và số lượng VM cần backup.

5. Các chế độ Transport Mode
Transport mode là cách mà Backup Proxy sử dụng để truy cập và vận chuyển dữ liệu máy ảo. Trong môi trường VMware, ba chế độ phổ biến là Direct SAN Access, Virtual Appliance hay HotAdd, và Network Mode hay NBD.

5.1. Direct SAN Access
Direct SAN Access là chế độ trong đó Backup Proxy truy cập trực tiếp vào hệ thống lưu trữ SAN nơi chứa dữ liệu máy ảo. Proxy có thể đọc dữ liệu trực tiếp từ storage thay vì phải đi qua ESXi host hoặc mạng LAN thông thường.

Nguyên lý hoạt động: Khi sử dụng Direct SAN, Backup Proxy được kết nối trực tiếp với hệ thống lưu trữ thông qua Fibre Channel hoặc iSCSI. Khi job backup chạy, proxy lấy thông tin máy ảo từ ESXi/vCenter, sau đó đọc các block dữ liệu trực tiếp từ datastore trên SAN. Dữ liệu sau khi được xử lý sẽ được chuyển đến Backup Repository.

Ưu điểm: Direct SAN Access có hiệu năng cao vì dữ liệu được đọc trực tiếp từ storage. Chế độ này giúp giảm tải cho ESXi host và giảm lưu lượng đi qua mạng LAN quản trị. Đây là lựa chọn phù hợp với môi trường doanh nghiệp có hệ thống SAN chuyên dụng, số lượng máy ảo lớn và yêu cầu tốc độ backup cao.

Nhược điểm: Chế độ này yêu cầu cấu hình phức tạp hơn. Người quản trị phải cấu hình zoning, LUN masking, quyền truy cập storage và đảm bảo proxy nhìn thấy datastore đúng cách. Nếu cấu hình sai, có thể gây rủi ro đối với dữ liệu trên SAN. Ngoài ra, Direct SAN không phải lúc nào cũng phù hợp với các môi trường sử dụng local storage, vSAN hoặc mô hình nhỏ không có SAN chuyên dụng.

Trường hợp nên dùng: Direct SAN phù hợp với trung tâm dữ liệu có SAN Fibre Channel hoặc iSCSI, số lượng VM lớn, yêu cầu tốc độ backup nhanh và có đội ngũ quản trị storage đủ kinh nghiệm.
1781620579426.png
5.2. Virtual Appliance Mode — HotAdd
Virtual Appliance hay HotAdd là chế độ trong đó Backup Proxy được triển khai dưới dạng một máy ảo trong môi trường VMware. Khi backup, Veeam sử dụng khả năng SCSI HotAdd của VMware để gắn tạm thời ổ đĩa của máy ảo cần backup vào proxy. Sau đó proxy đọc dữ liệu trực tiếp từ datastore thông qua tầng I/O của ESXi.

Nguyên lý hoạt động: Khi job backup bắt đầu, Veeam tạo snapshot cho VM cần sao lưu. Sau đó, các đĩa ảo của VM được hot-add vào máy ảo proxy. Proxy đọc dữ liệu từ các đĩa này, xử lý và gửi đến Backup Repository. Sau khi hoàn tất, các đĩa được tháo khỏi proxy.

Ưu điểm: HotAdd dễ triển khai hơn Direct SAN vì không cần máy chủ vật lý có kết nối SAN trực tiếp. Chế độ này tận dụng hạ tầng VMware hiện có và thường cho hiệu năng tốt hơn Network/NBD. Đây là lựa chọn phổ biến cho môi trường vừa và nhỏ, đặc biệt khi Backup Proxy có thể đặt gần datastore hoặc cùng cụm ESXi với các VM cần backup.

Nhược điểm: HotAdd phụ thuộc vào VMware snapshot và quá trình gắn/tháo đĩa vào proxy. Nếu hạ tầng vSphere có vấn đề về snapshot, datastore hoặc cấu hình quyền, quá trình backup có thể gặp lỗi. Ngoài ra, nếu proxy đặt không đúng host hoặc khác datastore với VM nguồn, hiệu năng có thể không tối ưu. Chế độ này cũng tạo thêm tải lên ESXi host nơi proxy đang chạy.

Trường hợp nên dùng: HotAdd phù hợp với môi trường VMware có shared storage, không muốn triển khai proxy vật lý hoặc không có kết nối SAN trực tiếp. Đây là lựa chọn cân bằng giữa hiệu năng, chi phí và độ phức tạp triển khai.
1781620611486.png
5.3. Network Mode — NBD
Network Mode, còn gọi là NBD, là chế độ trong đó Backup Proxy đọc dữ liệu máy ảo thông qua mạng LAN từ ESXi host. Đây là chế độ đơn giản nhất vì không yêu cầu proxy truy cập trực tiếp vào storage hoặc gắn đĩa HotAdd.

Nguyên lý hoạt động: Khi backup, Backup Proxy kết nối đến ESXi host chứa VM và đọc dữ liệu thông qua giao thức mạng. Dữ liệu từ datastore sẽ đi qua ESXi host, truyền qua network đến proxy, sau đó tiếp tục được gửi đến Backup Repository.

Ưu điểm: NBD dễ cấu hình, ít yêu cầu đặc biệt về storage và phù hợp với hầu hết môi trường. Đây cũng là chế độ dự phòng quan trọng khi Direct SAN hoặc HotAdd không hoạt động. Với hệ thống nhỏ, ít VM hoặc mạng 10GbE trở lên, NBD vẫn có thể đáp ứng tốt nhu cầu backup cơ bản.

Nhược điểm: Nhược điểm lớn nhất của NBD là phụ thuộc vào băng thông mạng. Nếu dùng mạng 1GbE hoặc có nhiều job chạy đồng thời, tốc độ backup có thể chậm và ảnh hưởng đến các dịch vụ khác. Ngoài ra, dữ liệu phải đi qua ESXi host nên có thể làm tăng tải cho host trong quá trình backup.

Trường hợp nên dùng: NBD phù hợp với môi trường nhỏ, không có SAN, không muốn cấu hình phức tạp hoặc dùng làm chế độ dự phòng. Trong môi trường lớn, khi dùng NBD cần đảm bảo băng thông mạng đủ tốt.
1781620637913.png
6. Cách lựa chọn Transport Mode phù hợp
Việc lựa chọn transport mode cần dựa trên hạ tầng thực tế, quy mô hệ thống, yêu cầu tốc độ backup và năng lực quản trị.

Nếu doanh nghiệp có hệ thống SAN chuyên dụng, nhiều VM quan trọng và yêu cầu backup nhanh, Direct SAN Access là lựa chọn tối ưu. Tuy nhiên, phương án này cần người quản trị có kinh nghiệm về storage để tránh lỗi cấu hình.

Nếu hệ thống sử dụng VMware vSphere với shared datastore và không muốn triển khai proxy vật lý, HotAdd là lựa chọn phù hợp. Đây là phương án cân bằng giữa hiệu năng và mức độ phức tạp, thường được sử dụng trong nhiều môi trường thực tế.

Nếu hệ thống nhỏ, ít VM, không có SAN hoặc cần triển khai nhanh, NBD là phương án đơn giản nhất. Tuy nhiên, cần kiểm tra băng thông mạng, đặc biệt khi backup nhiều VM cùng lúc.

Trong nhiều trường hợp, nên để Veeam tự động lựa chọn transport mode. Khi đó, Veeam sẽ ưu tiên các chế độ có hiệu năng tốt hơn trước, sau đó mới chuyển sang Network/NBD nếu cần. Cách này giúp đảm bảo job backup có khả năng hoàn thành cao hơn, nhất là trong môi trường có nhiều loại datastore khác nhau.

7. Một số lưu ý khi triển khai Backup Proxy
Khi triển khai Backup Proxy, cần đặt proxy gần nguồn dữ liệu để giảm độ trễ và giảm lưu lượng mạng không cần thiết. Với các site từ xa, nên có proxy đặt tại từng site thay vì kéo toàn bộ dữ liệu về trung tâm qua WAN.

Cần cấu hình số lượng concurrent tasks hợp lý. Không nên đặt quá cao chỉ để tăng tốc backup vì có thể làm nghẽn CPU, RAM, network hoặc repository. Hiệu năng backup phụ thuộc đồng thời vào proxy, repository, network và storage.

Nên triển khai nhiều proxy nếu hệ thống có nhiều VM hoặc nhiều job chạy đồng thời. Việc có nhiều proxy giúp Veeam phân phối tải tốt hơn và tránh phụ thuộc vào một máy duy nhất.

Cần theo dõi bottleneck trong quá trình backup. Nếu bottleneck nằm ở source, có thể storage hoặc ESXi đang bị tải cao. Nếu bottleneck nằm ở proxy, cần tăng tài nguyên hoặc thêm proxy mới. Nếu bottleneck nằm ở network, cần kiểm tra băng thông hoặc chuyển sang transport mode phù hợp hơn. Nếu bottleneck nằm ở target, cần tối ưu Backup Repository.

Ngoài ra, cần kiểm tra quyền truy cập vCenter, ESXi, datastore và repository. Nhiều lỗi backup không xuất phát từ Veeam mà do quyền truy cập, DNS, firewall, port hoặc cấu hình storage chưa đúng.

8. Kết luận
Backup Proxy là thành phần rất quan trọng trong kiến trúc Veeam Backup & Replication. Đây là nơi trực tiếp tham gia xử lý và vận chuyển dữ liệu, do đó ảnh hưởng lớn đến tốc độ backup, restore và replication. Việc hiểu rõ các transport mode giúp người quản trị thiết kế hệ thống backup hợp lý hơn.

Direct SAN Access có hiệu năng cao nhất nhưng yêu cầu cấu hình phức tạp và phù hợp với môi trường có SAN chuyên dụng. HotAdd là lựa chọn cân bằng, dễ triển khai trong môi trường VMware và thường đáp ứng tốt nhu cầu thực tế. Network Mode/NBD đơn giản, dễ dùng nhưng phụ thuộc nhiều vào băng thông mạng và thường phù hợp với môi trường nhỏ hoặc làm phương án dự phòng.

Trong triển khai thực tế, không có một transport mode nào phù hợp cho mọi hệ thống. Người quản trị cần đánh giá hạ tầng lưu trữ, mạng, số lượng VM, yêu cầu RPO/RTO và năng lực vận hành để lựa chọn phương án phù hợp. Một thiết kế tốt thường kết hợp nhiều proxy, cấu hình concurrent tasks hợp lý và cho phép Veeam tự động lựa chọn transport mode khi cần thiết.
 
Back
Top