Akankah chatbots memenuhi hype?

Terlepas dari hype selama bertahun-tahun—dan beberapa terobosan teknologi yang luar biasa—banyak orang menganggap chatbot sebagai bahkan lebih frustasi pengganti call center lepas pantai. Saya adalah CEO dari sebuah perusahaan chatbot, dan bahkan saya tidak dapat menyebutkan satu chatbot yang hebat.

Saya tidak berpikir itu adalah rencana permainan siapa pun untuk chatbots. Tentu saja tidak -ku rencana permainan ketika saya membangun versi pertama Botpress pada tahun 2015.

Jadi bagaimana kita sampai di sini? Dan akan chatbots pernah memenuhi hype? Saya tidak akan menulis ini jika saya tidak percaya jawabannya adalah ya, tetapi jangan mengambil kata-kata saya untuk itu. Mari kita jelajahi apa yang terjadi dengan teknologi bersama-sama dan lihat apakah Anda setuju.

Mengapa chatbot menyebalkan?

Terlepas dari semua kemajuan dalam pemrosesan bahasa alami (NLP), sebagian besar chatbots hanya menggunakan bentuk yang paling dasar. Mereka mengurai percakapan melalui klasifikasi niat—mencoba mengatur segala sesuatu yang mungkin dikatakan pelanggan ke dalam ember yang sudah terbentuk sebelumnya berdasarkan maksud pertanyaan mereka.

Misalnya, “Halo, saya ingin mengubah alamat penagihan saya” mungkin diklasifikasikan ke dalam ubah alamat penagihan ember—dan chatbot akan membalasnya.

Meskipun ini dapat menangani beberapa permintaan umum, sulit untuk memberikan dan mempertahankan pengalaman pelanggan yang memuaskan. Untuk mengklasifikasikan percakapan pelanggan, perancang percakapan harus mengantisipasi maksud yang benar dan menambahkan semua kemungkinan pemicu percakapan untuk maksud tersebut.

Bahkan jika maksud tersebut telah diantisipasi dengan baik dengan frasa pemicu yang baik, chatbot hanya dapat menyampaikan satu maksud. Percakapan dengan orang sungguhan bisa menjadi berantakan dan penuh nuansa, dan orang sering menginginkan banyak hal sekaligus. Klasifikasi berbasis maksud hanya menemukan maksud yang menyerupai percakapan dan mendorong respons terekam untuk keranjang itu. Chatbot mungkin mengetahui jawaban atas pertanyaan, “Dapatkah saya mengubah alamat penagihan saya sehingga cocok dengan profil lain di akun saya?”, tetapi memiliki informasi di bawah pengaturan akunbukan perubahan alamat.

Dalam pandangan saya, ini hampir tidak memenuhi syarat sebagai AI—ini lebih dekat ke fungsi pencarian. Anda tidak sedang melakukan percakapan; Anda berinteraksi dengan mesin percakapan, memainkan petualangan teks seperti Zork. Fungsi ini rawan kesalahan dan banyak pekerjaan yang harus dibangun, tetapi yang lebih penting, pada dasarnya salah. Berikut ini contoh alasannya:

Bayangkan sebuah program klasifikasi gambar yang mengidentifikasi hewan dan furnitur. Anda memberinya setumpuk gambar berlabel—ini binatang, ini furnitur—dan ia belajar mengenalinya. Misalkan di beberapa titik Anda perlu membedakan beruang dari anjing serta sofa dari kursi. Sekarang Anda harus memberi label ulang semuanya agar lebih spesifik. Sekarang anggaplah program menemukan kulit beruang di sofa—itu banyak kecocokan, jadi sekarang Anda memiliki konflik.

Idealnya, chatbot harus dapat mencerna kueri pengguna, memahami apa yang coba dicapai pengguna, dan kemudian membantu pengguna mencapai tujuannya—baik dengan mengambil tindakan atau dengan menghasilkan respons yang membantu dan terdengar seperti manusia.

Ini bukan apa yang disampaikan oleh chatbot hari ini. Sebaliknya, mereka adalah bot Tanya Jawab yang mengklasifikasikan kueri dan mengeluarkan respons terekam. Kemajuan terbaru di beberapa bidang AI, bagaimanapun, menawarkan peluang untuk menghasilkan sesuatu yang lebih baik.

Apa yang bisa dilakukan chatbot, dan mengapa kita belum sampai di sana?

Saat ini, ada cara yang lebih baik dan “tanpa niat” untuk mendesain chatbot. Mereka mengandalkan kemajuan di bidang AI, Machine Learning (ML), dan NLP seperti pencarian informasi, penjawab pertanyaan, pemahaman bahasa alami (NLU), dan pembuatan bahasa alami (NLG).

Segera, chatbots akan memanfaatkan kemajuan ini untuk memberikan pengalaman pelanggan yang jauh melebihi bot Q&A dasar saat ini. Bayangkan sebuah chatbot yang dapat:

  • Pahami pertanyaan kompleks dengan semua nuansa bicara manusia yang berantakan.
  • Hasilkan jawaban seperti manusia untuk pertanyaan kompleks dengan menggambar dari basis pengetahuan.
  • Gunakan bahasa alami untuk membuat kueri tabel terstruktur, seperti database informasi penerbangan.
  • Buat frasa yang terdengar seperti manusia yang cocok dengan dialek atau nada merek tertentu.

Meskipun chatbot dengan fitur-fitur ini akan memberikan pengalaman pengguna yang luar biasa, peningkatan dari versi yang ada membutuhkan lebih banyak upaya daripada yang bersedia ditanggung oleh sebagian besar organisasi. Mereka telah menginvestasikan waktu bertahun-tahun dalam membangun chatbots berbasis niat, termasuk melatih kumpulan data dan menulis tanggapan terekam.

Idealnya, pengembang akan menarik data dari chatbot ini dan membuatnya menjadi bot yang lebih baru dan lebih canggih. Sayangnya, ini tidak mungkin. Kumpulan data Chatbot dibuat dan dipelihara agar sesuai dengan cara kerja bot tertentu. Kumpulan data yang dilatih terhadap kumpulan klasifikasi maksud tertentu tidak berguna untuk chatbot tanpa maksud yang lebih baru yang menggunakan konsep NLP yang lebih canggih. Akibatnya, organisasi yang ingin menerapkan chatbot yang lebih canggih harus membangunnya kembali—dan kumpulan datanya—dari awal.

Mengapa layak untuk dibangun kembali? NLP adalah bidang yang berkembang pesat, dan perubahan akan datang yang akan membantu chatbot memenuhi janji mereka. Biarkan saya memberi Anda beberapa contoh konkret.

Empat kemajuan NLP yang akan membantu chatbots memenuhi hype

Model NLP pada dasarnya adalah “otak” chatbot.

Chatbot berbasis maksud menggunakan model NLP dasar yang mencocokkan input pengguna dengan kumpulan data contoh berlabel dan mencoba mengkategorikannya. Namun, dalam beberapa tahun terakhir, kami telah melihat kemajuan besar dalam model NLP dan teknologi terkait yang akan sangat memengaruhi kemampuan chatbot untuk menafsirkan dan memahami permintaan pengguna. Ini termasuk:

Dukungan untuk model NLP yang lebih besar

Sejak 2018, model NLP telah tumbuh secara hiper-eksponensial. Grafik di bawah ini menunjukkan seberapa cepat jumlah parameter dalam model NLP modern telah berkembang

Anda tidak bisa memberi tahu saya “Megatron-Turing” tidak terdengar sangat keren

Anda dapat menganggap parameter sebanding dengan satu sinapsis di dalam otak manusia. Nvidia memperkirakan bahwa pada tahun 2023 ia akan mengembangkan model yang cocok dengan rata-rata parameter otak manusia untuk sinaps pada 100 triliun parameter. Untuk mendukung model masif ini, Nvidia baru saja mengumumkan mesin Hopper mereka, yang dapat melatih model masif ini hingga enam kali lebih cepat.

Sementara ukuran model bukan satu-satunya faktor dalam mengukur kecerdasan model NLP (lihat kontroversi seputar beberapa model parameter triliun-plus yang ada), itu tidak diragukan lagi penting. Semakin banyak parameter yang dapat dipahami oleh model NLP, semakin besar kemungkinannya untuk dapat menguraikan dan menafsirkan kueri pengguna—terutama ketika mereka rumit atau menyertakan lebih dari satu maksud.

Perkakas

Evolusi kerangka kerja dan pustaka seperti PyTorch, TensorFlow, dan lainnya membuat pembuatan model pembelajaran yang andal menjadi lebih cepat dan mudah. Versi terbaru telah mempermudah pembuatan model kompleks dan menjalankan pelatihan model deterministik.

Perangkat ini awalnya dikembangkan oleh para pemimpin dunia dalam AI/ML—Pytorch dibuat oleh AI Research Lab (FAIR) Facebook dan TensorFlow oleh tim Google Brain—dan kemudian dibuat open-source. Proyek-proyek ini dipelihara secara aktif dan menyediakan sumber daya terbukti yang dapat menghemat waktu pengembangan selama bertahun-tahun, memungkinkan tim membangun chatbot canggih tanpa memerlukan keterampilan AI, ML, dan NLP tingkat lanjut.

Sejak itu, alat baru semakin mempercepat kekuatan model NLP. Bagi mereka yang menginginkan kecanggihan alat ini tanpa beban untuk mengonfigurasinya, platform MLOps seperti Weights & Biases menyediakan platform layanan lengkap untuk pengoptimalan model, pelatihan, dan pelacakan eksperimen. Saat bidang ML menjadi lebih canggih, alat yang lebih canggih akan muncul.

Perangkat keras komputasi paralel

Sementara CPU menyediakan pemrosesan tujuan umum untuk fungsi apa pun, GPU berevolusi untuk memproses sejumlah besar transformasi matematika sederhana secara paralel. Kemampuan komputasi paralel yang sangat besar ini membuatnya ideal untuk NLP. Perangkat keras khusus seperti TPU dan akselerator NPU/AI telah menggunakan kemampuan ini dan menciptakan perangkat keras khusus untuk aplikasi ML dan AI.

Seiring bertambahnya kekuatan perangkat keras, menjadi lebih cepat dan lebih murah untuk membangun dan mengoperasikan model NLP besar. Bagi kita yang tidak mengeluarkan uang untuk chipset yang kuat ini, banyak penyedia cloud menawarkan waktu komputasi di server khusus mereka sendiri.

Kumpulan data

Kumpulan data NLP telah tumbuh secara eksponensial, sebagian karena sumber terbuka dari kumpulan data yang dibangun dan dilatih secara komersial oleh perusahaan seperti Microsoft, Google, dan Facebook. Kumpulan data ini adalah aset yang sangat besar saat membuat model NLP, karena berisi volume kueri pengguna tertinggi yang pernah dikumpulkan. Komunitas baru seperti HuggingFace telah muncul untuk berbagi model yang efektif dengan komunitas yang lebih besar.

Untuk melihat efek dari kumpulan data ini, lihatlah SQuAD, Basis Data Penjawab Pertanyaan Stanford. Ketika SQuAD pertama kali dirilis pada tahun 2016, tampaknya merupakan tugas yang mustahil untuk membangun model NLP yang dapat menghasilkan skor yang baik terhadap SQuAD. Hari ini, tugas ini dianggap mudah, dan banyak model mencapai akurasi yang sangat tinggi.

Akibatnya, kumpulan data pengujian baru menantang pembuat model NLP. Ada SQuAD 2.0, yang dimaksudkan untuk menjadi versi yang lebih sulit dari aslinya, tetapi bahkan itu menjadi mudah untuk model saat ini. Kumpulan data baru seperti GLUE dan SuperGLUE kini menawarkan tantangan multi-kalimat untuk memberikan tantangan pada model NLP yang canggih.

Haruskah Anda membangun atau membeli?

Mendengar tentang semua kemajuan dalam AI, ML, NLP, dan teknologi terkait, Anda mungkin berpikir sudah waktunya untuk membuang chatbot Anda dan membuat yang baru. Kamu mungkin benar. Tetapi pada dasarnya ada dua solusi untuk tim pengembangan:

  1. Bangun chatbot dari bawah ke atas untuk menggabungkan teknologi superior saat ini.
  2. Beli perangkat yang mengabstraksi sisi NLP yang sulit—idealnya dengan beberapa fitur tambahan—dan buat dari sana.

Ini adalah dilema klasik “membangun atau membeli”, tetapi dalam kasus ini, jawabannya lebih sederhana dari yang Anda kira.

Untuk tim pengembangan yang lebih kecil dengan sumber daya terbatas, membangun chatbot dari awal untuk menggabungkan konsep AI, ML, dan NLP terbaru membutuhkan bakat hebat dan banyak pekerjaan. Keterampilan di bidang ini sulit (dan mahal) didapat, dan sebagian besar pengembang lebih memilih untuk tidak menghabiskan waktu bertahun-tahun untuk mendapatkannya.

Bagaimana dengan tim pengembangan di organisasi yang lebih besar dengan sumber daya untuk merekrut ilmuwan data dan spesialis AI/ML/NLP? Saya percaya kemungkinan masih tidak layak untuk membangun dari awal.

Bayangkan sebuah bank besar dengan tim khusus yang mengerjakan chatbot terbarunya, termasuk lima ilmuwan data yang mengerjakan saluran NLP khusus. Proyek ini mungkin membutuhkan waktu 18 bulan untuk menghasilkan chatbot yang dapat digunakan—tetapi pada saat itu, kemajuan dalam alat dan sumber daya open-source telah menyusul apa pun yang baru telah dibuat oleh tim. Akibatnya, tidak ada ROI yang terlihat dari proyek dibandingkan dengan bekerja dengan perangkat yang tersedia secara komersial.

Lebih buruk lagi, karena chatbot bergantung pada saluran NLP kustom, tidak ada cara sederhana untuk menggabungkan kemajuan lebih lanjut dalam NLP atau teknologi terkait. Melakukannya akan membutuhkan upaya yang cukup besar, yang selanjutnya mengurangi ROI proyek.

Saya akui saya bias, tapi jujur ​​saya percaya bahwa membangun, memelihara, dan memperbarui model NLP terlalu sulit, terlalu intensif sumber daya, dan terlalu lambat untuk bermanfaat bagi sebagian besar tim. Ini akan seperti membangun infrastruktur cloud Anda sendiri sebagai startup, daripada membonceng penyedia besar dengan peralatan canggih dan skala hampir tak terbatas.

Apa alternatifnya?

Perangkat seperti Botpress dapat mengabstraksi sisi NLP dan menyediakan IDE bagi pengembang untuk membangun chatbot tanpa mempekerjakan atau mempelajari keterampilan baru—atau membangun alat yang mereka butuhkan dari awal. Ini dapat memberikan serangkaian manfaat untuk proyek chatbot:

  • Secara signifikan mengurangi waktu pengembangan.
  • Upgrade mudah ke teknologi NLP terbaru tanpa pengerjaan ulang yang signifikan.
  • Lebih sedikit upaya untuk memelihara chatbot karena pembaruan dilakukan secara otomatis.

Yang terbaik dari semuanya, pengembang dapat fokus untuk membangun dan meningkatkan pengalaman dan fungsionalitas perangkat lunak mereka sendiri—bukan mempelajari AI/ML/NLP.

Mulai buat chatbot hari ini

Jika saya telah menggelitik minat Anda untuk membuat chatbot, Anda dapat mulai sekarang. Di Botpress, kami menyediakan platform pengembang sumber terbuka yang dapat Anda unduh dan jalankan secara lokal dalam waktu kurang dari satu menit.

Untuk memulai, kunjungi halaman pengembang chatbot kami. Untuk panduan tentang cara menginstal platform dan membangun chatbot pertama Anda, lihat panduan memulai dengan Botpress kami.

Anda juga dapat menguji demo langsung dari produk terbaru kami—metode baru yang radikal untuk membuat chatbot “tanpa tujuan” berbasis pengetahuan, yang disebut OpenBook, yang diumumkan minggu ini.

Tags: ai, chatbots, NLP, konten mitra, konten mitra