Kumparan Logo

Typo oleh Karyawan Bikin Data Center AWS Tumbang

kumparanTECHverified-green

clock

Tempat pengiriman barang Amazon (Foto: Reuters)
zoom-in-whitePerbesar
Tempat pengiriman barang Amazon (Foto: Reuters)

Industri Internet dibuat ribut pada akhir Februari lalu, tepatnya pada Selasa, 28 Februari 2017, karena tumbangnya layanan komputasi awan Amazon Web Service (AWS) sehingga menyebabkan sejumlah situs web mentereng tidak bisa dibuka. Mulai dari situs hiburan, portal berita, sampai dengan situs pemerintah. Rupa-rupanya, penyebab AWS tumbang selama empat jam adalah faktor human error alias kesalahan manusia.

Ini diakui oleh Amazon dalam sebuah publikasi di situs resmi AWS. Perusahaan mengatakan salah seorang karyawan yang berwenang mengurus Simple Storage Service (S3) berusaha memperbaiki proses penagihan layanan yang berjalan lebih lambat dari yang semestinya, dengan menghapus sebagian kecil file pada server salah satu sistem S3.

Sayang, salah satu baris perintah yang dimasukkan ada yang salah ketik alias typo sehingga menyebabkan sebagian besar server, termasuk server yang bukan bagian dalam proses perbaikan pada dua sistem S3 lain, ikut terhapus.

Akibatnya sejumlah layanan yang menggunakan jasa AWS menjadi offline, seperti Netflix, Reddit, Adobe dan Imgur. Lebih dari setengah 100 situs ritel online ternama pun ikut berjalan lambat.

Yang lebih parahnya lagi, Amazon mengakui bahwa server-server tersebut rupanya belum sepenuhnya di-restart selama beberapa tahun, sehingga proses pemulihan membutuhkan waktu yang lama.

Lembaga riset SimilarTech mencatat sistem S3 dari AWS dipakai oleh lebih dari 140.000 situs online di seluruh dunia dan menyimpan 4 triliun kepingan data dari para kliennya.

Usaha perbaikan dilakukan AWS pasca insiden, dengan melakukan sejumlah perubahan agar peristiwa tersebut tidak terulang kembali. Mereka juga menambahkan perlindungan sehingga sistem tidak langsung tumbang dan meningkatkan proses pemulihan menjadi lebih cepat.

"Kami ingin meminta maaf atas insiden ini yang berdampak pada pelanggan kami. Kami akan melakukan semua yang kami bisa untuk belajar dari insiden ini dan menggunakannya untuk meningkatkan layanan kami lebih jauh," tulis Amazon.