Hướng Dẫn Check MULTIPATH trên Solaris
Giúp đảm bảo an toàn và dự phòng về mặt dữ liệu khi Máy chủ Solaris kết nối xuống SAN thông qua SAN SWITCH.
Bài viết gồm các phần sau:
1. Mô hình kết nối
Ví dụ 1
Ví dụ 2
2. Hướng dẫn check multipath
Mô hình thực tế
Các bước kiểm tra
3.Kết Luận
Nội Dung
Bạn phải xác định rõ mô hình đấu nối thực tế của bạn đang có bao nhiêu Path và có khả năng dự phòng hay không
Ví dụ 1:

Giả Sử máy chủ của bạn kết nối đến san switch bằng 1 đường FC, Thiết bị SAN lưu trữ kết nối lên san switch bằng 4 đường FC Vậy tổng số path tối đa là 1*4=4 Path
Đối với mô hình này, khi SAN switch gặp sự cố hoặc khi đường FC kết nối máy chủ và SAN switch gặp sự cố thì sẽ mất kết nối từ máy chủ đến SAN
Ví dụ 2:

Trong trường hợp này:
-Đối với SAN switch 01 đang có 1 đường FC nối tới Máy chủ Solaris và 2 đường FC nối tới SAN => có 1*2 = 2 path
-Tương tự với SAN switch 02 cũng sẽ có 2 path
Vậy tổng cộng sẽ có 4 path kết nối giữa máy chủ và SAN
2. Hướng dẫn check multipath
Mô hình thực tế:

Trong Mô hình thực tế mình đang kiểm tra, sẽ có tất cả là 8 path.
Các Bước kiểm tra:
Bước 1: Xác định các LUN được share từ SAN lên máy chủ.
Trên thiết bị SAN, xác định các LUN được share cho máy chủ Solaris - Đặt biệt phải xác định được UID của LUN

Ở đây mình đã xác định được 12 LUN đang share cho máy chủ solaris và UID của cả 12 LUN.
Bước 2: Tiếp theo, SSH vào máy chủ Solaris và dùng lệnh: mpathadm list lu
Lệnh này sẽ show tất cả các Logical Unit (bao gồm ổ cứng của host, LUN được share thông qua FC,...)

Các thông tin Show ra sẽ cho chúng ta thấy tổng số Path (Total Path Count) và Số path đang hoạt động (Operational Path Count)
Kiểm tra xem số Total Path Count có tương ứng với số Path tối đa trong mô hình của bạn không.
Nếu số path tối đa không tương ứng hãy kiểm tra lại Zoning và việc Share Lun từ SAN.
Nếu số Operational Path Count < Total Path Count, kiểm tra lại các port kết nối, san switch, controller của SAN vì có thể chúng đang gặp sự cố dẫn đến path hoạt động không đủ.
Bước 3: Chọn lấy Logical Unit Name từ output của câu lệnh ở bước 2, sau đó chạy lệnh: mpathadm show lu "Logical Unit Name"
vd: mpathadm show lu /dev/rdsk/c0t600000E00D3000000030091400070000d0s2
Kết quả sẽ trả ra chi tiết thông tin về một Logical Unit Name cụ thể
-Thực hiện tương tự với tất cả các LUN cần kiểm tra

Các thông số cần chú ý:
Current Load Balace - Đây là cơ chế load balance giữa các path (thường sử dụng Round Robin)
Auto Failback - Đối với 1 số SAN, Controller sẽ được chia ra thành Primary và Secondary. Việc truyền dữ liệu trên path của controller Primary có hiệu suất cao hơn path của controller Secondary (hoặc tát cả dữ liệu sẽ đi qua path của Primary, path của Secondary ở chế độ Standby). Khi path của Controller Primary Fail, dữ liệu sẽ chuyển đổi để chạy hết thông qua path của Secondary (tính năng failover operation - chuyển đổi dự phòng). Khi path của Controller Primary được sửa chữa, Multipath sẽ điều chỉnh dữ liệu trở lại path của Primary và path của seconday lại quay lại trạng thái Standby (tính năng Auto Failback)
Initiator Port Name - WWPN của FC trên máy chủ Solaris
Target Port Name - WWPN của FC trên SAN
Path State - Hiển thị trạng thái của path
3. Kết Luận
Sau khi kiểm tra thấy Total Path Count = Operational Path Count = Tổng số path tối đa của mô hình đấu nối và thấy các tất cả các path state đều là OK thì multipath đã hoạt động.
Co chế load balance (Round Robin) và cơ chế Auto Failback nên được bật để có thể cân bằng tải tốt nhất và tự điều chỉnh sử dụng path của controller Primary.
Attachments
-
260.4 KB Views: 0