Ulasan: Google Cloud AI menerangi pembelajaran mesin

Google memiliki salah satu tumpukan pembelajaran mesin terbesar di industri, yang saat ini berpusat pada Google Cloud AI dan Platform Pembelajaran Mesin. Google mengeluarkan TensorFlow sebagai open source beberapa tahun yang lalu, tetapi TensorFlow masih merupakan framework pembelajaran mendalam yang paling matang dan banyak dikutip. Demikian pula, Google mengeluarkan Kubernetes sebagai open source bertahun-tahun yang lalu, tetapi masih menjadi sistem pengelolaan container yang dominan.

Google adalah salah satu sumber alat dan infrastruktur teratas untuk pengembang, ilmuwan data, dan pakar pembelajaran mesin, tetapi secara historis AI Google belum begitu menarik bagi analis bisnis yang tidak memiliki latar belakang ilmu data atau pemrograman yang serius. Itu mulai berubah.

Google Cloud AI dan Machine Learning Platform mencakup elemen penyusun AI, platform AI dan akselerator, serta solusi AI. Solusi AI cukup baru dan ditujukan untuk manajer bisnis daripada ilmuwan data. Mereka mungkin termasuk konsultasi dari Google atau mitranya.

Blok penyusun AI, yang telah dilatih sebelumnya tetapi dapat disesuaikan, dapat digunakan tanpa pengetahuan mendalam tentang pemrograman atau ilmu data. Namun demikian, mereka sering digunakan oleh data scientist yang terampil karena alasan pragmatis, pada dasarnya untuk menyelesaikan pekerjaan tanpa pelatihan model yang ekstensif.

Platform AI dan akselerator umumnya untuk ilmuwan data yang serius, dan membutuhkan keterampilan pengkodean, pengetahuan tentang teknik persiapan data, dan banyak waktu pelatihan. Saya sarankan pergi ke sana hanya setelah mencoba blok bangunan yang relevan.

Masih ada beberapa tautan yang hilang dalam penawaran AI Google Cloud, terutama dalam persiapan data. Hal terdekat yang dimiliki Google Cloud dengan impor data dan layanan pengkondisian adalah Cloud Dataprep oleh Trifacta pihak ketiga; Saya mencobanya setahun yang lalu dan tidak puas. Namun, rekayasa fitur yang dibangun ke dalam Cloud AutoML Tables cukup menjanjikan, dan akan berguna untuk menyediakan layanan semacam itu untuk skenario lain.

Bagian bawah AI yang seamy berkaitan dengan etika dan tanggung jawab (atau ketiadaan), bersama dengan bias model yang persisten (seringkali karena data bias yang digunakan untuk pelatihan). Google menerbitkan Prinsip AI-nya pada tahun 2018. Ini sedang dalam proses, tetapi ini adalah dasar untuk panduan seperti yang dibahas dalam posting blog baru-baru ini tentang AI yang Bertanggung Jawab.

Ada banyak persaingan di pasar AI (lebih dari selusin vendor), dan banyak persaingan di pasar cloud publik (lebih dari setengah lusin vendor yang kredibel). Untuk melakukan keadilan perbandingan, saya harus menulis artikel setidaknya lima kali lebih panjang dari yang ini, jadi walaupun saya benci mengabaikannya, saya harus menghilangkan sebagian besar perbandingan produk. Untuk perbandingan teratas yang jelas, saya dapat meringkas: AWS melakukan sebagian besar dari apa yang Google lakukan, dan juga sangat bagus, tetapi umumnya mengenakan harga yang lebih tinggi.

Building Block Google Cloud AI

Building Block Google Cloud AI adalah komponen yang mudah digunakan yang dapat Anda gabungkan ke dalam aplikasi Anda sendiri untuk menambahkan visual, bahasa, percakapan, dan data terstruktur. Banyak dari blok penyusun AI adalah jaringan saraf pra-terlatih, tetapi dapat disesuaikan dengan pembelajaran transfer dan pencarian jaringan saraf jika mereka tidak memenuhi kebutuhan Anda di luar kotak. Tabel AutoML sedikit berbeda, karena mengotomatiskan proses yang akan digunakan oleh data scientist untuk menemukan model pembelajaran mesin terbaik untuk kumpulan data tabular.

AutoML

Layanan Google Cloud AutoML menyediakan jaringan neural dalam yang disesuaikan untuk terjemahan pasangan bahasa, klasifikasi teks, deteksi objek, klasifikasi gambar, serta klasifikasi dan pelacakan objek video. Mereka membutuhkan data yang diberi tag untuk pelatihan, tetapi tidak memerlukan pengetahuan yang signifikan tentang pembelajaran mendalam, pembelajaran transfer, atau pemrograman.

Google Cloud AutoML menyesuaikan jaringan neural dalam dengan akurasi tinggi dan teruji oleh Google untuk data Anda yang diberi tag. Daripada memulai dari awal saat melatih model dari data Anda, AutoML mengimplementasikan pembelajaran transfer dalam otomatis (artinya dimulai dari jaringan neural dalam yang ada yang dilatih pada data lain) dan penelusuran arsitektur saraf (artinya ia menemukan kombinasi yang tepat dari lapisan jaringan tambahan ) untuk terjemahan pasangan bahasa dan layanan lain yang tercantum di atas.

Di setiap area, Google sudah memiliki satu atau beberapa layanan terlatih berdasarkan jaringan neural dalam dan kumpulan besar data berlabel. Ini mungkin berfungsi untuk data Anda yang tidak dimodifikasi, dan Anda harus mengujinya untuk menghemat waktu dan uang. Jika mereka tidak melakukan apa yang Anda perlukan, Google Cloud AutoML membantu Anda membuat model yang sesuai, tanpa mengharuskan Anda mengetahui cara melakukan pembelajaran transfer atau cara merancang jaringan neural.

Pembelajaran transfer menawarkan dua keuntungan besar dibandingkan melatih jaringan saraf dari awal. Pertama, memerlukan lebih sedikit data untuk pelatihan, karena sebagian besar lapisan jaringan sudah terlatih dengan baik. Kedua, ini berlatih jauh lebih cepat, karena ini hanya mengoptimalkan lapisan akhir.

Meskipun sebelumnya layanan Google Cloud AutoML disajikan bersama sebagai satu paket, kini layanan tersebut terdaftar dengan layanan dasar terlatihnya. Apa yang oleh sebagian besar perusahaan lain disebut AutoML dilakukan oleh Google Cloud AutoML Tables.

Baca ulasan lengkap Google Cloud AutoML

Tabel AutoML

Proses sains data yang biasa untuk banyak masalah regresi dan klasifikasi adalah membuat tabel data untuk pelatihan, membersihkan dan mengkondisikan data, melakukan rekayasa fitur, dan mencoba melatih semua model yang sesuai pada tabel yang diubah, termasuk langkah untuk mengoptimalkan hyperparameter model terbaik. Tabel AutoML Google Cloud dapat melakukan seluruh proses ini secara otomatis setelah Anda mengidentifikasi bidang target secara manual.

Tabel AutoML secara otomatis menelusuri kebun binatang model Google untuk data terstruktur guna menemukan model terbaik untuk kebutuhan Anda, mulai dari model regresi linier / logistik untuk kumpulan data yang lebih sederhana hingga metode penelusuran mendalam, ansambel, dan arsitektur lanjutan untuk yang lebih besar dan lebih kompleks. Ini mengotomatiskan rekayasa fitur pada berbagai data tabular primitif - seperti angka, kelas, string, stempel waktu, dan daftar - dan membantu Anda mendeteksi dan menangani nilai yang hilang, pencilan, dan masalah data umum lainnya.

Antarmuka tanpa kode memandu Anda melalui siklus proses pembelajaran mesin ujung-ke-ujung penuh, memudahkan siapa pun di tim Anda untuk membuat model dan dengan andal menggabungkannya ke dalam aplikasi yang lebih luas. Tabel AutoML menyediakan data masukan yang luas dan fitur penjelasan perilaku model, bersama dengan pagar pembatas untuk mencegah kesalahan umum. Tabel AutoML juga tersedia di lingkungan API dan notebook.

Tabel AutoML bersaing dengan Driverless AI dan beberapa implementasi dan kerangka kerja AutoML lainnya.

Vision API

Google Cloud Vision API adalah layanan pembelajaran mesin terlatih untuk mengkategorikan gambar dan mengekstrak berbagai fitur. Ini dapat mengklasifikasikan gambar ke dalam ribuan kategori terlatih, mulai dari objek umum dan hewan yang ditemukan dalam gambar (seperti kucing), hingga kondisi umum (misalnya, senja), hingga landmark tertentu (Menara Eiffel, Grand Canyon), dan mengidentifikasi properti umum gambar, seperti warna dominannya. Ini dapat mengisolasi area yang merupakan wajah, kemudian menerapkan analisis geometris (orientasi wajah dan landmark) dan emosional pada wajah, meskipun tidak mengenali wajah sebagai milik orang tertentu, kecuali selebriti (yang memerlukan izin penggunaan khusus). Vision API menggunakan OCR untuk mendeteksi teks di dalam gambar dalam lebih dari 50 bahasa dan berbagai jenis file. Itu juga dapat mengidentifikasi logo produk, dan mendeteksi dewasa,kekerasan, dan konten medis.

Baca ulasan lengkap tentang Google Cloud Machine Learning API

Video Intelligence API

Google Cloud Video Intelligence API secara otomatis mengenali lebih dari 20.000 objek, tempat, dan tindakan dalam video streaming dan yang disimpan. Ini juga membedakan perubahan adegan dan mengekstrak metadata yang kaya pada tingkat video, pengambilan gambar, atau bingkai. Ini juga melakukan deteksi teks dan ekstraksi menggunakan OCR, mendeteksi konten eksplisit, mengotomatiskan teks tertulis dan subtitle, mengenali logo, dan mendeteksi wajah, orang, dan pose.

Google merekomendasikan Video Intelligence API untuk mengekstrak metadata untuk mengindeks, mengatur, dan menelusuri konten video Anda. Ini dapat mentranskripsikan video dan menghasilkan teks, serta menandai dan memfilter konten yang tidak pantas, semuanya lebih hemat biaya daripada transkrip manusia. Kasus penggunaan termasuk moderasi konten, rekomendasi konten, arsip media, dan iklan kontekstual.

Natural Language API

Pemrosesan bahasa alami (NLP) adalah bagian besar dari "saus rahasia" yang membuat masukan ke Google Penelusuran dan Asisten Google berfungsi dengan baik. Google Cloud Natural Language API memperlihatkan teknologi yang sama ke program Anda. Itu dapat melakukan analisis sintaks (lihat gambar di bawah), ekstraksi entitas, analisis sentimen, dan klasifikasi konten, dalam 10 bahasa. Anda dapat menentukan bahasanya jika Anda mengetahuinya; jika tidak, API akan mencoba mendeteksi bahasa secara otomatis. API terpisah, yang saat ini tersedia untuk akses awal berdasarkan permintaan, mengkhususkan diri pada konten terkait perawatan kesehatan.

Baca ulasan lengkap tentang Google Cloud Machine Learning API

Terjemahan

Google Cloud Translation API dapat menerjemahkan lebih dari seratus pasangan bahasa, dapat mendeteksi bahasa sumber secara otomatis jika Anda tidak menentukannya, dan hadir dalam tiga jenis: Dasar, Lanjutan, dan Terjemahan Media. Advanced Translation API mendukung glosarium, terjemahan batch, dan penggunaan model kustom. Basic Translation API pada dasarnya adalah apa yang digunakan oleh antarmuka Google Terjemahan konsumen. AutoML Translation memungkinkan Anda melatih model kustom menggunakan pembelajaran transfer.

Media Translation API menerjemahkan konten langsung dari audio (ucapan), file audio atau streaming, dalam 12 bahasa, dan secara otomatis menghasilkan tanda baca. Ada model terpisah untuk audio video dan panggilan telepon.

Baca ulasan lengkap tentang Google Cloud Machine Learning API