Anthropic Meluncurkan Claude Sonnet 5 untuk Operasi Agen AI Lebih Efisien
Tulisan dari Daily Tech Science tidak mewakili pandangan dari redaksi kumparan

Anthropic secara resmi meluncurkan Claude Sonnet 5, model bahasa menengah terbaru yang dirancang untuk meningkatkan kemampuan otonom dalam menjalankan tugas kompleks. Inovasi ini hadir di tengah tren industri di mana kapabilitas agen AI, yakni model yang mampu merencanakan dan mengeksekusi tugas tanpa intervensi manusia terus-menerus, menjadi standar baru bagi perusahaan teknologi global.
Peningkatan Kemampuan Otonom dan Efisiensi Biaya
Claude Sonnet 5 dikembangkan untuk mampu menyusun rencana kerja, mengoperasikan perangkat peramban, hingga berinteraksi dengan terminal komputer secara mandiri. Anthropic menyatakan bahwa model ini mampu bekerja pada tingkat yang beberapa bulan lalu hanya bisa dicapai oleh model yang jauh lebih besar dan mahal.
Kemampuan ini memungkinkan pengguna untuk menyelesaikan pekerjaan kompleks dengan biaya operasional yang lebih rendah dibandingkan model kelas atas seperti Opus 4.8. Anthropic mengungkapkan bahwa “Opus 4.8 masih menjadi pilihan utama untuk akurasi tinggi pada tugas rumit, namun Sonnet 5 memberikan opsi bagi pengembang dengan biaya lebih terjangkau namun memiliki kualitas jauh lebih baik dari generasi sebelumnya.”
Performa Teknis dan Keamanan Sistem
Dalam serangkaian pengujian, Sonnet 5 menunjukkan peningkatan signifikan dalam aspek penalaran, penggunaan perangkat lunak, serta penyusunan kode pemrograman. Sebagai contoh, dalam tolok ukur pengodean agen, model ini mencatatkan skor 63,2 persen, sebuah lompatan dari pendahulunya, Sonnet 4.6, yang berada di angka 58,1 persen.
Aspek keamanan juga menjadi sorotan utama dalam pengembangan model ini. Anthropic mengeklaim bahwa Sonnet 5 memiliki tingkat perilaku yang tidak diinginkan, seperti potensi penipuan atau kepatuhan terhadap permintaan berbahaya, yang jauh lebih rendah dibandingkan versi sebelumnya. Fabian Hedin, salah satu pendiri Lovable, memberikan tanggapan positif terkait hal tersebut:
“Di Lovable, kami memberikan perangkat canggih ke tangan jutaan pengembang. Model yang mampu mengenali kapan harus menolak permintaan berbahaya sama pentingnya dengan kemampuan teknis untuk membangun sesuatu.”

