Keyboard? Aneh sekali

Era pencarian suara dan perangkat lunak yang dioperasikan dengan suara sudah dekat kita. Sebagai pengembang, saya hidup dan mati dengan keyboard, tetapi saya sudah dapat melihat tanda-tandanya: Seperti banyak orang, misalnya, saya berbicara dengan ponsel Android saya (misalnya, "Navigasi ke Lowes [atau Starbucks atau Harris Teeter]") ke mendapatkan petunjuk.

Dalam Laporan Tren Internet 2016 Mary Meeker, dia melaporkan bahwa permintaan pencarian Google Voice telah meningkat dengan faktor tujuh sejak 2010. Saya juga memperhatikan bahwa putra saya yang berusia 12 tahun melakukan hampir semua pencarian melalui suara - dan saya pacar saya mengirimi saya pesan seperti ini secara teratur. Selain itu, perusahaan tempat saya bekerja, Lucidworks, baru-baru ini mengumumkan kemitraan baru dengan IBM untuk mengintegrasikan kemampuan Watson dan text-to-speech ke dalam produk pencarian perusahaan kami. 

Teknologi ini bekerja jauh lebih baik daripada sebelumnya, dan lebih mudah diintegrasikan ke dalam aplikasi. Jika Anda mengembangkan untuk Android atau iOS, Anda dapat dengan mudah menghubungkan ke API untuk pengenalan suara. Namun pengenalan ucapan tidak dimulai dan diakhiri dengan perintah suara dan teks sederhana.

Memahami maksud pencarian adalah tugas yang sangat kontekstual, terutama dengan bahasa lisan. Selain itu, orang cenderung menggunakan lebih banyak kata dalam bahasa lisan daripada saat dihadapkan dengan bilah pencarian. Ada lebih banyak "kata berisik" dalam bahasa lisan daripada dalam penelusuran tekstual biasa.

Ini adalah tantangan AI yang signifikan. Tapi saat kami mengatasi masalah konteks, pengembang akan belajar bahwa lebih banyak yang bisa dilakukan dengan suara daripada dengan teks. Konteks emosional akan berperan. Jika Anda sedang mencari SPBU, Anda mau yang termurah atau yang terdekat? Isi emosi dari suara Anda bisa menyiratkan hal itu. Tentu, Anda mungkin mengklarifikasi, tetapi mungkin tidak perlu.

Masa depan banyak bicara Anda

Zaman yang didorong oleh suara bukanlah tentang penelusuran saja. Ini akan mempengaruhi seluruh cara kita berinteraksi dengan komputer. Dalam waktu yang tidak terlalu lama, keyboard akan dianggap "kuno", seperti yang digambarkan oleh Scotty dalam "Star Trek IV".

Namun perubahan itu juga menuntut UI yang sama sekali baru. Inilah ilustrasi kuno yang saya maksud: Ketika Windows 95 keluar, IBM telah mengintegrasikan perintah suara ke dalam PC-nya. Pada saat itu, saya bekerja sebagai wiraniaga di Office Depot, dan dengan cepat menjadi jelas betapa tidak praktisnya perintah suara. Antarmuka berjendela tidak cocok untuk bentuk interaksi ini sama sekali.

Maksud saya, bagaimana Anda bisa memindahkan jendela dari jendela lain dan mengubah ukurannya agar pas di layar secara efisien dengan perintah suara? Kamu tidak. Anda membuang semua jendela itu (dan mungkin Windows) sama sekali. UI berbasis suara tidak menggunakan motif yang sama. Anda tidak pernah melihat antarmuka berjendela di "Star Trek".

Berbicara tentang "Star Trek," ketika orang mulai membuat kode atau melakukan sesuatu yang teknis, mereka selalu beralih ke antarmuka taktil (Oke, tidak persis taktil - ini lebih mirip keyboard microwave yang dilapisi dengan rendering art nouveau papan sirkuit). Tetapi apakah regresi untuk "mengetik" perlu? Benar, saya tidak dapat membayangkan menggunakan antarmuka suara untuk membuat kode di Scala. Mungkin bahasa baru (tanpa tanda kurung, tidak seperti Scala - dan artikel saya) akan dikembangkan yang secara khusus disesuaikan dengan suara.

Situs web pasti tidak akan terlihat sama dan akan menawarkan paradigma navigasi baru. Anda akan mengatakan "tunjukkan penawaran untuk sepatu", dan apa yang Anda dapatkan mungkin akan lebih terorganisir dan lebih sensitif secara kontekstual daripada situs web Anda pada umumnya ("promo" && "sepatu"). Selain itu, saya tidak ingin menggulir atau mengatakan banyak "halaman berikutnya", jadi interaksi harus dipersonalisasi. Sistem seharusnya sudah tahu bahwa saya menginginkan sepatu pria dan saya tidak ingin sepatu hak keras karena tendonitis Achilles saya. Mungkin dia tahu saya lebih suka warna gelap. Mungkin saya menceritakannya atau mungkin menganalisis perilaku saya.

Apakah ini situs web? Tentu, jika saya belanja sepatu, saya ingin representasi visual, tetapi jika saya berbicara mungkin mesin berbicara kembali. Mungkin ia menunjukkan sepatu kepada saya, lalu bertanya: "Apakah Anda mencari jenis sepatu tertentu? Untuk apa sepatu ini? Apakah Anda memakainya untuk hiking atau ke pesta?"

Era pencarian suara akan mengubah segalanya mulai dari cara kita berinteraksi dengan mesin hingga cara kita membuat kode. Banyak teknologi yang kita butuhkan sudah tersedia bagi kita saat ini, sementara yang lain belum ditemukan. Efeknya pada antarmuka pengguna bisa lebih besar daripada peralihan dari punch card ke keyboard.

Perubahan besar ini tidak akan datang sekaligus. Hari ini bukan hari untuk membuang keyboard Anda. Tetapi mungkin ini hari untuk mulai berpikir tentang mendesain ulang situs web Anda agar benar-benar dapat diakses oleh suara.