리눅스 megacli 명령어 - 메가레이드 명령어




    DELL, IBM은 에서는 디스크 관리시에 LSI의 메가레이드(MegaRAID)를 사용하게 됩니다.

    MegaRAID를 설치하게 되면 MegaCLI를 사용할수있으며 RAID구성 및 디스크 상태정보를 보다 쉽게 확인 할 수 있습니다.


    이번에는 MegaCLI를 사용하여 직접 디스크 상태를 확인하는 방법을 알아보겠습니다.




     

     MegaCLI 사용하기



    물리적 디스크 PD 정보 확인 


    명령어 : megacli -pdlist -aall

     

    [root@server ~]# megacli -pdlist -aall
    Raw Size: 931.512 GB [0x74706db0 Sectors]
    Non Coerced Size: 931.012 GB [0x74606db0 Sectors]
    Coerced Size: 930.390 GB [0x744c8000 Sectors]
    Sector Size:  0
    Firmware state: Hotspare, Spun Up
    Device Firmware Level: JC45
    Shield Counter: 0
    Successful diagnostics completion on :  N/A
    SAS Address(0): 0x62721205a604e66
    Connected Port Number: 0(path0) 
    Inquiry Data:             6VPJ579AST31000524AS                            JC45    
    FDE Capable: Not Capable
    FDE Enable: Disable
    Secured: Unsecured
    Locked: Unlocked
    Needs EKM Attention: No
    Foreign State: None 
    Device Speed: Unknown 
    Link Speed: Unknown 
    Media Type: Hard Disk Device
    Drive Temperature : N/A
    PI Eligibility:  No 
    Drive is formatted for PI information:  No
    PI: No PI
    Port-0 :
    Port status: Active
    Port's Linkspeed: Unknown 
    Drive has flagged a S.M.A.R.T alert : No
    
    
    
    Enclosure Device ID: 252
    Slot Number: 1
    Drive's position: DiskGroup: 2, Span: 0, Arm: 1
    Enclosure position: N/A
    Device Id: 47
    WWN: 
    Sequence Number: 2
    Media Error Count: 0
    Other Error Count: 0
    Predictive Failure Count: 0
    Last Predictive Failure Event Seq Number: 0
    PD Type: SATA
    


    여기서 중요하게 확인해야 될 부분은 33~44번째줄 사이입니다.



    물리적 디스크 정보에서 살펴봐야 될 부분


    Sequence Number: 슬롯의 번호(slot 번호)


    Media Eorror Count: 숫자가 1이상 이면 디스크에 문제 발생

    슬롯의 번호를 확인 해두어 교체 준비를 하시면 됩니다.


    Other Error Count: 숫자가 1이상 이면 디스크에 문제 발생

    슬롯의 번호를 확인 해두어 교체 준비를 하시면 됩니다.




    논리적 디스크 정보 확인


    명령어 : megacli -LDInfo -Lall -aALL


    [root@server ~]# megacli -LDInfo -Lall -aALL
                                         
    
    Virtual Drive: 1 (Target Id: 1)
    Name                :
    RAID Level          : Primary-1, Secondary-0, RAID Level Qualifier-0
    Size                : 930.390 GB
    Sector Size         : 512
    Mirror Data         : 930.390 GB
    State               : Optimal
    Strip Size          : 64 KB
    Number Of Drives    : 2
    Span Depth          : 1
    Default Cache Policy: WriteThrough, ReadAheadNone, Direct, No Write Cache if Bad BBU
    Current Cache Policy: WriteThrough, ReadAheadNone, Direct, No Write Cache if Bad BBU
    Default Access Policy: Read/Write
    Current Access Policy: Read/Write
    Disk Cache Policy   : Disk's Default
    Encryption Type     : None
    Is VD Cached: No
    
    



    논리적 디스크 정보에서 살펴봐야 될 부분


    RAID Level: Primary-1, Secondary-0, RAID Level Qualifier-0

    Primary-1의 숫자의 따라 레이드 구성이 확인하시면 됩니다 Primary-1이라면 Raid-1


    Number Of Drives: 2

    2개의 물리적 디스크를 논리적으로 1개의 디스크로 묶음(Disk 2개를 Raid1으로 묶음)



    Default Cache Policy: 캐시 정책을 표시합니다

    Write Back은 캐시가 저장되면 전송 완료 신호를 보냅니다.

    전원 공급이 중단되면 RAID의 배터리(BBU)에서 내용을 유지 시켜 줍니다.


    WriteThrough는 디스크에 저장되면 전송 완료 신호를 보냅니다.




    물리적 논리적 디스크 정보 모두 확인


    명령어 : megacli -LDPDInfo -aALL




    어댑터 정보 확인


    명령어 : megacli -AdpAllInfo -aALL



    간단 요약 정보 확인


    명령어 : megacli -ShowSummary -aALL


    컨트롤러 정보, PD(Physical Drive), VD(Virtual Drive) 정보




    디스크 이상상태 확인


    명령어 : megacli -PDList -aALL



    위의 명령어로 물리적 디스크 정보를 살펴보면 Media Error Count, Other Error Count, Predictive Failure Count, Last Predictive Failure Event Seq Number 부분을 확인할수 있습니다 이부분의 수치가 0보다 높다면 해당 디스크의 문제가 있을 가능성이 높으니 슬롯부분을 확인후 해당 서버의 디스크 외부적인 요인을 확인하신후 교체를 하시기 바랍니다

    또한 서버의 디스크의 외부적인 요인에서 빨간불(디스크 이상상태)이 표시되지 않는 경우도있습니다 서버 관리자 견해로 보았을때는 중요한 파일서버 같은 경우에는 교체를 권장합니다.




    Enclosure Device ID: 252
    Slot Number: 0
    Drive's postion: DiskGroup: 0, Span: 0, Arm: 3
    Enclosure position: 0
    Device Id: 16
    WWN: 500000E114D9B7A1
    Sequence Number: 2
    Media Error Count: 66
    Other Error Count: 1
    Predictive Failure Count: 15
    Last Predictive Failure Event Seq Number: 60536
    PD Type: SAS
    Raw Size: 136.731 GB [0x11176d60 Sectors]
    Non Coerced Size: 136.231 GB [0x11076d60 Sectors]
    Coerced Size: 135.972 GB [0x10ff2000 Sectors]
    Firmware state: Online, Spun Up
    Device Firmware Level: SB19
    Shield Counter: 0
    Successful diagnostics completion on :  N/A
    SAS Address(0): 0x500000e114d9b7a2
    SAS Address(1): 0x0
    Connected Port Number: 0(path0) 
    Inquiry Data: IBM-ESXSMBD2147RC       SB19D0A07BKSSB19SB19SB19
    IBM FRU/CRU: 42D0422     
    FDE Enable: Disable
    Secured: Unsecured
    Locked: Unlocked
    Needs EKM Attention: No
    Foreign State: None 
    Device Speed: 6.0Gb/s 
    Link Speed: 6.0Gb/s 
    Media Type: Hard Disk Device
    Drive Temperature :40C (104.00 F)
    PI Eligibility:  No 
    Drive is formatted for PI information:  No
    PI: No PI
    Drive's write cache : Disabled
    Port-0 :
    Port status: Active
    Port's Linkspeed: 6.0Gb/s 
    Port-1 :
    Port status: Active
    Port's Linkspeed: Unknown 
    Drive has flagged a S.M.A.R.T alert : Yes
    


    위의 디스크 정보는 이상이 있는 디스크 상태 정보이며, 위의 내용을 토대로 어떤 부분을 보아야 되는지 알아보겠습니다.



    Media Error Count: 66

    Other Error Count: 1

    Predictive Failure Count: 15

    Last Predictive Failure Event Seq Number: 60536


    위 부분의 수치는 높은 편이며 0 이상이라면 디스크를 교체하시는것을 권장합니다.

    Posted by 서버이야기