[ask] VPS mati, read-only, lalu corrupt (dengan kejadian time-travel)


Status
Not open for further replies.

palingwaras

Beginner 2.0
Agak bingung jg menjelaskannya. Ceritanya kira-kira begini:

Saya punya (mungkin lebih tepatnya, sewa ) vps kvm, lokasi di Indonesia (detil lokasi DCnya, kurang tahu), dengan spek RAM 128mb, space 5GB, diinstall Debian wheezy 32-bit. Vps tersebut saya pakai untuk menjalankan bot IRC, beberapa script, testing aplikasi web, download ini-itu, sambil dipakai sebagai tunnel & proxy (privoxy). Script & aplikasi web dijalankan secara manual lewat terminal didalam session tmux yang persistent, tiap kali saya konek lewat ssh tinggal masuk ke session tmux yang sudah berjalan untuk melihat status script atau melanjutkan pekerjaan sebelumnya. (kondisi ini saya kasih label no. 0)

Nah kejadiannya dua hari lalu tengah malam vpsnya mati, saya taunya karena sedang dipakai sebagai tunnel & tiba2 putus. Saya ping alamat ipnya nggak ada jawaban (kejadian yang ini kita kasih label no. 1).

Saya pun ngecek status vps saya lewat control panel/dashboard virtualizornya provider, eh ternyata enggak nyambung juga. Alamat IP untuk mengakses dashboard juga diping tak menjawab. :33: Network saya (walaupun bapuk) enggak ada masalah karena bisa konek ke tempat lain, jadi saya pikir memang node tempat vps saya berada sedang bermasalah, yowis saya tunggu dulu..

Sekitar 30an menit saya ping lagi alamat IP CP/dashboard, dijawabnyalah pingku itu. Akan tetapi alamat IP vpsku tak menjawab panggilan, berarti masih mati. Benarlah itu yang terjadi, setelah berhasil login ke dashboard kucek status vps memang mati, yowis kupencetlah tombol start supaya hidup lagi.

Setelah alamat IP VPS berhasil diping, saya konek ke vps dgn ssh, jalankan tmux, lalu menjalankan script2 & aplikasi2 sy (manual), lalu saya pakai lagi sebagai tunnel menuju privoxy dari komputer lokal ke dunia luar. (kondisi ini saya kasih label no. 2)

Nggak lama kemudian, koneksi ke vps saya putus lagi. IP vps diping nggak jawab, tapi alamat ip CP/Dashboard menjawab ping, yowis saya bukalah dashboardnya. Tapi koneksinya lambat, dan lagi2 masalah (sepertinya) bukan di network saya karena bisa sambil streaming youtube. :105: Setelah berhasil masuk ke dashboard, ternyata status VPS saya hidup, tapi masih nggak bisa di-ping. (kondisi ini saya kasih label no. 3)

Saya tunggu lagi, nggak terlalu lama vpsnya bisa di-ping ada jawaban, sekali lagi koneklah saya ke vps saya lewat ssh. Seperti biasa saya masuk ke session tmux (``$ tmux a''). Anehnya, session tmux yang saya masuki adalah session pada kondisi no. 0, alias sebelum vps saya mati pada kondisi no. 1, lengkap dengan proses2 yang berjalan didalamnya... :41:

Kalau ini kejadian normal bukan ghaib, mestinya saya masuk ke session tmux pada kondisi no. 2, atau kalo ternyata vps saya habis mati lagi, mestinya nggak ada session tmux berjalan, artinya saya mesti menjalankan session tmux baru, lalu secara menual menjalankan script & aplikasi2 saya... :39:

Ketika itu saya pikir, yowislah. Prasangkanya, pas kejadian vps mati sebelumnya di konsidi no. 1, ada masalah di node tempat vps saya berada atau lagi maintenance, lalu diarahkan ke semacam node backup pas di kondisi no.2, lalu udah balik lagi pas saya masuk ke kondisi no. 3. :33:

Eh, lha, belum lama terhubung, ngecek keberjalanan script & ini-itu, tiba2 session tmux saya error, keluar dari tux sambil ada pesan bahwa filesystem dalam kondisi read-only (pesan lengkapnya, enggak ingat)... Wuaduh.. Saya coba cek diskspace pakai df, masih banyak sisanya, berarti bukan karena kepenuhan. Saya coba bikin file dengan touch, error juga dengan pesan bahwa fs read-only. :17: Ya udah vpsnya saya restart lewat comandline..

Saya tunggu2, vps saya itu masih nggak bisa di-ping. Saya cek di dashboard virtualizor, statusnya hidup tuh.. Cek lah langsung lewat vnc buat liat layarnya.. Ternyata bootingnya berhenti karena gagal fsck.. :29: Disuruh masuk ke recovery-mode, dari recovery-mode saya coba lagi fsck, masih gagal juga, katanya filesystem corrupt.. Beberapa kali restart, sama lagi kondisinya.. :29:

Karena kebetulan pas pemilik hostingannya lagi ol di YM, saya kontaklah dia. Ceritain kejadiannya, tanya2 apa yang terjadi, tanya2 kira2 gimana ngebenerinnya, ternyata pemiliknya nggak tau menahu, dan nggak ada backup di servernya, jadi prasangka saya salah.... Ya udah karena tengah malam & saya ada yang mesti dikerjakan lagi, saya install ulang bersih aja vps saya, untung ada backup & isinya nggak banyak, jadi bisa segera up lagi.. :30:

Itu tadi ceritanya, macam curhat. Pertanyaannya sih, apa yang sebenarnya terjadi? Kenapa bisa begitu? Terutama yang time-travel.. Adakah yang pernah mengalami hal yang sama? Gimana supaya kejadian seperti itu nggak terjadi lagi? Kalo misalnya ini vpsnya buat produksi kan bisa modar... :107:

I'm curious!! :9:

Maaf kalo ada salah2 kata, kurang jelas, atau kepanjangan, harap maklum, newbie
 

idnix

Hosting Guru
Verified Provider
wkwkkw, ram sekecil itu, buat bot + webserver+ privoxy. proces i/o nya di pantau gak? dari curhatan ente cuma mantau disk space doang lalu memory nya gmn?
 

WidigdoNetwork

Apprentice 1.0
bener kata mas @pocarisweat ....
itu spek super minim dipakai buat all-in :D yo gak kuat servernya... :33:

kalau mau dipakai untuk produksi pastiin upgrade ke high-memory. yaa kalau pakai 128MB ancurr.. :24:
 

palingwaras

Beginner 2.0
wkwkkw, ram sekecil itu, buat bot + webserver+ privoxy. proces i/o nya di pantau gak? dari curhatan ente cuma mantau disk space doang lalu memory nya gmn?
bener kata mas

@pocarisweat ....
itu spek super minim dipakai buat all-in :D yo gak kuat servernya... :33:

ya meleduk itu bro 128 aja buat apache ama php udah ngos2san

Memory, dipantau juga dong.. Saya selalu jalanin htop kalo lagi mroses yang berat2, kadang dicek juga kalo pas iseng, normalnya cuma kepake sekitar 50-70mb, padahal pake innodb :28:, pernah iseng2 saya benchmark abal2, aplikasi webnya saya hajar pake boom (100koneksi*100), memory yang kepake mentok2 cuma sekitar 80an mb.

Sesekali emang sampe perlu ngegedein swap, tapi itu cuma pas install/kompil modul R atau perl, jarang banget. Nah pas kejadian ini malah pas lagi gak diakses aplikasinya, ketauannya kan karena proxynya putus..

Sebenernya kalo keberatan gara-gara aplikasinya yang berat, saya gak heran. Yang saya heran crashnya itu lho, kok bisa sampe curropt, +mengalami time-travel.. :40:
 

idnix

Hosting Guru
Verified Provider
Memory, dipantau juga dong.. Saya selalu jalanin htop kalo lagi mroses yang berat2, kadang dicek juga kalo pas iseng, normalnya cuma kepake sekitar 50-70mb, padahal pake innodb :28:, pernah iseng2 saya benchmark abal2, aplikasi webnya saya hajar pake boom (100koneksi*100), memory yang kepake mentok2 cuma sekitar 80an mb.

Sesekali emang sampe perlu ngegedein swap, tapi itu cuma pas install/kompil modul R atau perl, jarang banget. Nah pas kejadian ini malah pas lagi gak diakses aplikasinya, ketauannya kan karena proxynya putus..

Sebenernya kalo keberatan gara-gara aplikasinya yang berat, saya gak heran. Yang saya heran crashnya itu lho, kok bisa sampe curropt, +mengalami time-travel.. :40:

nah, kalau anda sendiri bisa optimize ram sekecil itu dengan beberapa service yang "menurut hemat saya" sangat tidak mungkin bisa running dengan ram sebesar 128MB. karena saya sendiri sering install lamp/ lamp rata2 penggunaan memory nya 246 (belum optimize)

Itu tadi ceritanya, macam curhat. Pertanyaannya sih, apa yang sebenarnya terjadi? Kenapa bisa begitu? Terutama yang time-travel.. Adakah yang pernah mengalami hal yang sama? Gimana supaya kejadian seperti itu nggak terjadi lagi? Kalo misalnya ini vpsnya buat produksi kan bisa modar... :107:

yang saya quote diatas, anda sudah hebat bisa optimize dengan spek minim harusnya anda juga sudah bisa troubleshooting.
intinya semua error bisa diketahui dari error log seperti dmesg, pada folder /var/log/ dan lain-lain


no offense and CMIIW
 

winnervps

Apprentice 2.0
Verified Provider
hmmmm..........saya tidak tahu, tetapi saya ingin sekali membantu memberikan percerahan dari sudut pandang pribadi. Meski jujurnya saya bukan pakar di KVM VPS.
  1. Kalau dilihat dari gejala 'penyakitnya' ini berhubungan erat dengan I/O (read or write) error
  2. Yang menyebabkan I/O error ini kan banyak sekali.
Tetapi dari pengalaman, tanpa bermaksud mengadili 'sang Provider VPS', biasa kalau di Xen, kita menggunakan fungsi:
# xm save dan # xm restore (sedangkan di KVM bisa menggunakan # virsh save # virsh restore) https://www.suse.com/documentation/sles11/book_kvm/data/sec_libvirt_manage_save.html
Nah fungsi ini, sepengalaman saya, bisa mengakibatkan apa yang Tuan @palingwaras ceritakan di atas. Terlebih ada premis mayor nomor 1, dan premis minor nomor 2. Sekali lagi, tolong prejudice positve yah.

Okey saya jelaskan fungsi save dan restore ini:
  1. save ini akan menyimpan kondisi terakhir VPS berdasarkan 'state' terakhir yang dicatat (dan akan disimpan state ini ke dalam bentuk file) dan kemudian akan mem'pause' VPS.
  2. restore akan merestore 'state' VPS dari kondisi terakhir (dari file yang tercatat dengan ID VPS yang dimaksud)
  3. ketika kondisi VPS dalam posisi save, maka VPS jelas tidak akan bisa diakses. (pause). JIka user VPS melakukan restart pada posisi PAUSE? VPS akan restart seperti biasa. Tetapi jika dari posisi biasa ini direstore dengan file restore (nomor 2 diatas), maka VPS akan balik ke state nomor 1 (jelas yah?)
  4. mengapa provider VPS melakukan ini? biasanya fungsi save dan restore ini akan otomatis jalan/eksekusi pada saat server akan direboot (shutdown now itu akan mentrigger fungsi save ini, dan ketika server nyala kembali, restore akan ter-trigger) atau bisa juga karena alasan-alasan lain, tentunya. (no 5 dan 6 akan menjelaskan)
  5. save dan restore ini memiliki resiko, utamanya adalah kondisi HDD menjadi error, apalagi jika terjadi pada klausul nomor 3 di atas. Karenanya saya pribadi, sudah tidak pernah melakukan ini (ngeri ngeri sedap ibaratnya, dulu kita pakai teknik ini untuk mencari 'abusers' VPS dari sebuah server......dulu -ini sedikit bocoran ya ;)) atau juga saya gunakan untuk merefresh sistem, tanpa mereboot/mengurangi uptime server.....dulu).
  6. ohya catatan tambahan: hebatnya fungsi save dan restore ini...uptime VPS tidak berubah lohhhhh.....artinya VPS 'dianggap' tetap nyala pada kondisi "pause", maka itu sebabnya beberapa provider menggunakan ini (termasuk saya.......dulu) untuk menutupi downtime VPS selagi maintenance. :)
Nah semoga membantu ya informasi di atas, khususnya untuk para end-user VPS.
 

el_makong

Hosting Guru
kalo d proxmox sih yg saya tau ini jadi semacam live backup ato snapshot.jadi last state server di save.kemudian server di pindahkan ke node baru.mungkin ya tidak ada downtime, mungkin juga ada downtime.tergantung koneksi yang digunakan antara host node..
nah yg saya dapet, state 0 = last running configuration. state 1 = lagi copy snapshot ke node cadangan/backup. state 2 = last running configuration, alias konfigurasi saat server di shutdown secara normal dimana services dimatikan "gracefully"...mungkin yg bikin berasa ghoib adalah konfigurasi ternyata masih di state 0. padahal udah di set dari state 2 dimana konfigurasi adalah fresh/baru..mungkin ada sedikit ngaco dari host node yg restore backupnya ketuker...hahaha..

cmiiw..just a noob..

tapi lah ya, dengan ram 128mb, untuk optimisasi seperti itu rasanya udah sakti banget dah!
 
Status
Not open for further replies.

Top