Latar Belakang

Awalnya ditemukan adanya anomali error di salah satu Disk dgn configurasi JBOD. dimana LOGs error akan muncul ketika user sedang merestore data ke salah satu direktori mount point /data23 yang ada di slot disk yang di duga anomali error.

disk slot 1 & 2 itu dibuat RAID 1 utk OS redhat. sedangkan slot 3-24 dibuat JBOD di server cisco UCS. Awalnya yang di duga anomali ini sudah di replace berkali-kali dan hasilnya tetap sama.

maka dari itu kemungkinan yang problem bukan dari sisi Disk, melainkan bisa dari SAS RAID Controller Card, Kabel SAS, Drive Backplane, atau bahkan mungkin System Board.

Langkah Awal

Sesuai diskusi dengan user, kita sepakat untuk mengganti SAS RAID Controller Card, Kabel SAS, Drive Backplane terlebih dahulu, sebelum ke pergantian System Board.

Setelah di lakukan perganti part tersebut, saat booting server malah muncul pesan notifikasi:

“Bad, missing or unsupported RAID controller memory module detected. Press ‘D’ to downgrade RAID controller to IMR mode. Warning!
downgrade to IMR mode, may result in incompatible Logical drives. Press any other key to continue, controller shall boot to safe mode. Or shutdown the system, replace the memory module and reboot in MR mode.
Enter Your Input Here: “

Dari Notifikasi di atas terlihat terjadi masahal pada Controller/Memory Module, sehingga untuk mencegah risiko gagal Logical Drive (RAID OS) kita memutuskan untuk mematikan atau Shutdown server dan Rollback ganti lagi pakai Controller card yang existing.

Permasalahan

OS RHEL tidak mau booting meskipun sudah kita Rollback controller card yang existing, padahal Logical Drive (RAID OS) masih terbaca optimal.

Permasalah Baru

Karena disini saya sempat nge”STUCK” maka kita memutuskan untuk mencoba Replace System Board (beserta isinya, termasuk NIC card yang ternyata menjadi penyebab BIOS POST STUCK selanjutnya) dan ternyata tidak membuahkan hasil dan OS tetap tidak bisa booting. Malah menimbulkan masalah baru yaitu Server sering BIOS POST STUCK di Configuring and testing memory.. dan gejala pada System Boardnya mengeluarkan LED Merah Amber. begitu juga pada LED Path Panel server.

Solusi Masalah STUCK Configuring and testing memory..

Setelah kita lakukan troubleshoot, kita mencoba lakukan Power Draining dengan merakit Setup server se minimal mungkin. yaitu: masing-masing colok 1 memory di CPU, copot semua Card seperti Ethernet NIC Card, FC HBA Card, Riser Card, dll.

Ternyata ditemukan letak masalahnya ada di NIC Card yang rusak dan menyebabkan gagal BIOS POST di Configuring and testing memory.. , jadi saya mencopot untuk sementara dan Me-replace NIC Card dgn yang exisiting. dan akhirnya BIOS dapat kembali melakukan POST dengan normal.

Solusi Masalah Boot OS

Setelah Server dapat melakukan POST dengan normal dan bisa kembali masuk ke BIOS, kita mencoba untuk me-reset configurasi BIOS dan menyeting ulang BIOS sesuai dengan yang existing (bisa cek dari server yang lain melalui CIMC).

Setelah itu kita coba Boot ke OS. namun tetap saja tidak bisa dan masih masuk ke dalam Shell > dan akhirnya jawaban dari solusi ada di Shell Boot Loader & GRUB Loader UEFI disini :

Coba Cari Boot Loader / GRUB Loader yang hilang

1. Di UEFI shell, ketik:

map -r

Ini akan menampilkan daftar partisi dan perangkat yang terdeteksi, misalnya fs0: atau blk0:

fs0:
ls

    Jika muncul daftar file, berarti ini adalah disk utama. Kalau tidak muncul, coba fs1:, fs2:, dst.

    2. Jika sudah menemukan disk yang berisi EFI, lanjutkan dengan mengetik:

    cd EFI
    ls

    3. Periksa isi direktori EFI
    apakah ada direktori redhat dan BOOT, kita cek isinya dengan perintah:

    cd redhat
    ls

    atau

    cd BOOT
    ls

    4. Cari file bootloader
    Jika menggunakan GRUB 2 (umumnya Red Hat 7 ke atas), cari file dengan nama seperti:

    grubx64.efi
    shimx64.efi

    Jika menggunakan GRUB Legacy, biasanya nama file-nya grub.efi atau elilo.efi.

    5. Jalankan file bootloader
    Eksekusi salah satu dari perintah berikut (coba satu per satu sampai berhasil):

    grubx64.efi

    atau

    shim.efi

    atau

    shimx64.efi

    6. Jika berhasil booting ke Red Hat
    Setelah sistem berhasil masuk, jalankan perintah berikut untuk memperbaiki entri boot agar tidak perlu menjalankan secara manual setiap kali restart:

    grub2-install --target=x86_64-efi --efi-directory=/boot/efi --bootloader-id=redhat
    grub2-mkconfig -o /boot/grub2/grub.cfg

    Perintah ini akan memastikan bahwa sistem dapat booting secara otomatis tanpa perlu menjalankan grubx64.efi secara manual lagi.

    7. Jika Sistem Masih Tidak Bisa Booting.
    Coba masuk ke Red Hat Enterprise Linux Server 7.9 Rescue (opsi pertama).
    Jika berhasil masuk ke mode rescue, jalankan perintah:

    chroot /mnt/sysimage
    grub2-install --target=x86_64-efi --efi-directory=/boot/efi --bootloader-id=redhat
    grub2-mkconfig -o /boot/grub2/grub.cfg

    8. Namun, karena disini saya tidak memiliki AKSES LOGIN ROOT ke dalam OS. jadi saya tidak bisa menjalankan COMMAND nomor 6 ataupun 7.

    Jadi saya memilih menambahkan Boot Loader / GRUB Loader melalui SHELL yang tadi.

    Menambahkan Boot loader / GRUB loader UEFI via Shell (Jika tdk ada akses login root OS)

    1. Restart server dan boot ke dalam SHELL lagi.

    2. Jalankan perintah ini:

    bcfg boot dump

    3. Cek lokasi GRUB
    Dari yang sebelumnya, GRUB seharusnya ada di fs0:\EFI\redhat\grubx64.efi

    ls fs0:\EFI\redhat\

    4. Tambahkan boot loader UEFI:

    bcfg boot add 0 fs0:\EFI\redhat\grubx64.efi "Red Hat Linux"

    5. Cek kembali dengan

    bcfg boot dump

    6. Restart server dan coba biarkan supaya BIOS otomatis akan meload Boot Loader ke OS yang telah kita tambahkan tadi.

    reset

    7. Tambahan: Jika anda ingin menghapus Boot Loader yang ada di daftar anda bisa gunakan.
    “bcfg boot rm [Option]” contoh “bcfg boot rm 0”

    bcfg boot rm

    Leave a Reply

    Your email address will not be published. Required fields are marked *