Naik Turun 30 Menit

November 7, 2006 at 11:04 am (solaris)

Sudah duduk dengan nyaman? Sudah sedia secangkir kopi dan cemilan? Kalau sudah, silakan anda lanjutkan baca tulisan ini, soalnya (mungkin) bakal panjang.

Berawal dari beberapa waktu yang lalu, gue ngecek backup server yang sering gagal dalam menjalankan tugasnya. Si backup server ini hanya bertugas mengeksekusi beberapa script untuk membackup server-server yang lain dan script itu dijalankan melalui crontab dieksekusi setiap harinya.

Beberapa hal aneh yang terjadi adalah si backup server ini sering gagal dalam mengirimkan email report, statusnya masih queue sampai harus diflush dahulu. Keanehan yang kedua, beberapa script yang dieksekusi tidak berjalan sebagaimana mestinya. Padahal kalau dicek melalui log crontab (/var/log/cron), script tersebut sudah dijalankan sesuai dengan jadwalnya. Kesalahan pada scriptnya? Kayaknya mah gak mungkin. Soalnya gagal ini hanya kadang-kadang aja. Kalau dieksekusi manual, scriptnya sukses membackup. So? Masalahnya apa ya?

Nggak sengaja pas lagi remote server backup ini, gue iseng ping mail server.
# ping mail
ping: unknown host mail

Lah sih… Unknown host? Cek /etc/resolv.conf, sudah mengarah ke DNS yang benar. Tapi ga bisa resolve? Artinya problem ada di DNS toh. Baiklah™.

Dengan berbekal info ini, gue login ke DNS server. Aneh dan semakin aneh. DNS server kadang-kadang mau nerima query dari host lain. Tapi ada beberapa waktu yang dianya malah ga bekerja. Setelah seharian lebih[1] mempelajari log dari DNS, akhirnya ketemu juga polanya. Si DNS ini mulai tidak menerima query pada setiap jamnya di menit ketujuh. Dari menit ketujuh ini dan 30 menit ke depan, si DNS magabut. Menit ke-37, si DNS mulai bekerja normal lagi dan kembali berhenti pada menit ke-7 jam berikutnya. Bingung dan sebel sih gue sama mesin ini. Tapi waktu ngeliat uptimenya, gue jadi maklum. Sudah tua toh dia.
# uptime
10:36am up 1148 day(s), 1:35, 1 user, load average: 1.51, 1.55, 1.55

Gara-gara magabut ini traffik MRTG gue dapet pujian dari jelantix
mrtg bermasalah

<jelantix> wah keren itu …
<jelantix> gemana cara nya bikin graph mrtg kayak gitu.

Nah, akar dari segala masalah udah ketawan. Gegara DNS yang magabut ini bikin banyak masalah yang lain. Entah mail yang ga bisa diakses, website yang nggak kebuka, backup script yang nggak jalan. Cuma sekarang, apa solusinya? Gue cuma tau si DNS mogok kerja tiap 30 menit. Tapi apa yang bikin dia mogok?

Selama hampir 3 hari gue nunggu wangsit yang turun dari mbah Maridjan sambil bersumpah 3 hari 3 malam nggak akan makan Sushi ataupun Hanamasa dulu soalnya blom gajian lagi.

Setelah melanggar sumpah dengan mimpi makan Yakiniku di Hanamasa, gue mulai menganalisa masalahnya.

1. DNS nggak bisa diquery tiap 30 menit.
2. Selama rentang 30 menit mogok itu, server DNS masih bisa diakses remote.
3. Service ssh artinya tidak mogok tiap 30 menit.
4. Yang bermasalah di server DNS hanya service DNS saja.
5. Jangan mimpi makan Yakiniku, bangun-bangun hanya bikin ngiler aja.

Ok, berbekal hasil analisa itu gue coba restart service DNS melalui script di /etc/init.d. Stopping … Starting … OK.

Coba query lagi…
Loh, masih failed. Masih ngambek juga. Selidik punya selidik, entah kenapa waktu distop, service DNS masih jalan juga. Jadi selama ini kalau direstart, service yang jalan masih itu-itu juga. Belum pernah ada restart service yang benar. Selama ini kalau ada pengubahan isi DNS, service hanya direload saja. Iseng kemarin sekitar jam 4 gue kill servicenya trus gue start lagi. Sekarang ini hasil MRTGnya:
mrtg bener

Done. Mission accomplished!
Next time kalau restart service, mendingan kill manual kali ya.


[1] Kenapa seharian? Ternyata ini mesin Solaris. Gue blom terlalu familiar sama jeroan dari Solaris.

Permalink 7 Comments