Naik Turun 30 Menit

Sudah duduk dengan nyaman? Sudah sedia secangkir kopi dan cemilan? Kalau sudah, silakan anda lanjutkan baca tulisan ini, soalnya (mungkin) bakal panjang.

Berawal dari beberapa waktu yang lalu, gue ngecek backup server yang sering gagal dalam menjalankan tugasnya. Si backup server ini hanya bertugas mengeksekusi beberapa script untuk membackup server-server yang lain dan script itu dijalankan melalui crontab dieksekusi setiap harinya.

Beberapa hal aneh yang terjadi adalah si backup server ini sering gagal dalam mengirimkan email report, statusnya masih queue sampai harus diflush dahulu. Keanehan yang kedua, beberapa script yang dieksekusi tidak berjalan sebagaimana mestinya. Padahal kalau dicek melalui log crontab (/var/log/cron), script tersebut sudah dijalankan sesuai dengan jadwalnya. Kesalahan pada scriptnya? Kayaknya mah gak mungkin. Soalnya gagal ini hanya kadang-kadang aja. Kalau dieksekusi manual, scriptnya sukses membackup. So? Masalahnya apa ya?

Nggak sengaja pas lagi remote server backup ini, gue iseng ping mail server.
# ping mail
ping: unknown host mail

Lah sih… Unknown host? Cek /etc/resolv.conf, sudah mengarah ke DNS yang benar. Tapi ga bisa resolve? Artinya problem ada di DNS toh. Baiklah™.

Dengan berbekal info ini, gue login ke DNS server. Aneh dan semakin aneh. DNS server kadang-kadang mau nerima query dari host lain. Tapi ada beberapa waktu yang dianya malah ga bekerja. Setelah seharian lebih[1] mempelajari log dari DNS, akhirnya ketemu juga polanya. Si DNS ini mulai tidak menerima query pada setiap jamnya di menit ketujuh. Dari menit ketujuh ini dan 30 menit ke depan, si DNS magabut. Menit ke-37, si DNS mulai bekerja normal lagi dan kembali berhenti pada menit ke-7 jam berikutnya. Bingung dan sebel sih gue sama mesin ini. Tapi waktu ngeliat uptimenya, gue jadi maklum. Sudah tua toh dia.
# uptime
10:36am up 1148 day(s), 1:35, 1 user, load average: 1.51, 1.55, 1.55

Gara-gara magabut ini traffik MRTG gue dapet pujian dari jelantix
mrtg bermasalah

<jelantix> wah keren itu …
<jelantix> gemana cara nya bikin graph mrtg kayak gitu.

Nah, akar dari segala masalah udah ketawan. Gegara DNS yang magabut ini bikin banyak masalah yang lain. Entah mail yang ga bisa diakses, website yang nggak kebuka, backup script yang nggak jalan. Cuma sekarang, apa solusinya? Gue cuma tau si DNS mogok kerja tiap 30 menit. Tapi apa yang bikin dia mogok?

Selama hampir 3 hari gue nunggu wangsit yang turun dari mbah Maridjan sambil bersumpah 3 hari 3 malam nggak akan makan Sushi ataupun Hanamasa dulu soalnya blom gajian lagi.

Setelah melanggar sumpah dengan mimpi makan Yakiniku di Hanamasa, gue mulai menganalisa masalahnya.

1. DNS nggak bisa diquery tiap 30 menit.
2. Selama rentang 30 menit mogok itu, server DNS masih bisa diakses remote.
3. Service ssh artinya tidak mogok tiap 30 menit.
4. Yang bermasalah di server DNS hanya service DNS saja.
5. Jangan mimpi makan Yakiniku, bangun-bangun hanya bikin ngiler aja.

Ok, berbekal hasil analisa itu gue coba restart service DNS melalui script di /etc/init.d. Stopping … Starting … OK.

Coba query lagi…
Loh, masih failed. Masih ngambek juga. Selidik punya selidik, entah kenapa waktu distop, service DNS masih jalan juga. Jadi selama ini kalau direstart, service yang jalan masih itu-itu juga. Belum pernah ada restart service yang benar. Selama ini kalau ada pengubahan isi DNS, service hanya direload saja. Iseng kemarin sekitar jam 4 gue kill servicenya trus gue start lagi. Sekarang ini hasil MRTGnya:
mrtg bener

Done. Mission accomplished!
Next time kalau restart service, mendingan kill manual kali ya.


[1] Kenapa seharian? Ternyata ini mesin Solaris. Gue blom terlalu familiar sama jeroan dari Solaris.

7 thoughts on “Naik Turun 30 Menit

  1. chiank says:

    oo.. ini toh hasil tanya-jawab@solaris.or.id ?

    *manggut2*

  2. ire says:

    Makanya kalo nge-restart service cuci tangan dulu rom

  3. jelantix says:

    Gimana sih bisa bikin dns server mati tiap 30 menit ?

    *masih penasaran*

  4. azil says:

    gak install linux (yang baru?)

  5. arjuna says:

    nggak baca footnote?

  6. andriansah says:

    kenapa gak di coba stop dulu, lalu start, bukan restart

  7. arjuna says:

    itu stop dan start kok
    cuma karena waktu stop servicenya masih belum mati, alhasil di start ya ga ngaruh
    pid servicenya tetap di nomor yang sama

    lagian gue liat scriptnya ga ada option buat restart, hanya start dan stop doang😀

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s