Buat model kustom dengan Azure Machine Learning Designer

Pembelajaran mesin adalah bagian penting dari pengembangan aplikasi modern, menggantikan banyak hal yang biasanya dilakukan menggunakan serangkaian mesin aturan yang kompleks, dan memperluas cakupan ke rangkaian masalah yang lebih luas. Layanan seperti Azure's Cognitive Services menyediakan model yang telah dibuat sebelumnya dan telah dilatih sebelumnya yang mendukung banyak kasus penggunaan umum, tetapi banyak lagi yang memerlukan pengembangan model kustom.

Melakukan penyesuaian dengan ML

Bagaimana cara kami membuat model pembelajaran mesin kustom? Anda dapat mulai dari satu sisi menggunakan bahasa analisis statistik seperti R untuk membangun dan memvalidasi model, di mana Anda sudah merasakan struktur yang mendasari data Anda, atau Anda dapat bekerja dengan fitur aljabar linier dari rangkaian Anaconda Python. Demikian pula, fitur seperti PyTorch dan TensorFlow dapat membantu membuat model yang lebih kompleks, memanfaatkan jaringan neural dan pembelajaran mendalam sambil tetap berintegrasi dengan bahasa dan platform yang sudah dikenal.

Itu semua bagus jika Anda memiliki tim ilmuwan data dan ahli matematika yang dapat membangun, menguji, dan (yang paling penting) memvalidasi model mereka. Dengan keahlian machine learning yang sulit ditemukan, yang dibutuhkan adalah alat untuk membantu memandu developer melalui proses pembuatan model yang dibutuhkan bisnis. Dalam praktiknya, sebagian besar model pembelajaran mesin terbagi dalam dua jenis: yang pertama mengidentifikasi data yang serupa, yang kedua mengidentifikasi data luar.

Kami mungkin menggunakan jenis aplikasi pertama untuk mengidentifikasi item tertentu di ban berjalan atau melihat masalah kedua dalam data dari serangkaian sensor industri. Skenario seperti ini tidak terlalu rumit, tetapi masih memerlukan pembuatan model yang divalidasi, memastikan bahwa model tersebut dapat mengidentifikasi apa yang Anda cari dan menemukan sinyal dalam data, tidak memperkuat asumsi atau merespons kebisingan.

Memperkenalkan Azure Machine Learning Designer

Azure menyediakan berbagai alat untuk ini, bersama modelnya yang telah dibuat sebelumnya, dilatih sebelumnya, dan dapat disesuaikan. Satu, Azure Machine Learning Designer, memungkinkan Anda bekerja dengan data yang sudah ada dengan seperangkat alat desain visual dan kontrol seret dan lepas.

Anda tidak perlu menulis kode untuk membangun model Anda, meskipun ada opsi untuk memasukkan R atau Python khusus jika diperlukan. Ini adalah pengganti dari alat ML Studio asli, menambahkan integrasi yang lebih dalam ke dalam SDK pembelajaran mesin Azure dan dengan dukungan untuk lebih dari model berbasis CPU, menawarkan pembelajaran mesin bertenaga GPU dan pelatihan dan penyetelan model otomatis.

Untuk memulai dengan Azure Machine Learning Designer, buka situs Azure Machine Learning dan masuk dengan akun Azure. Mulailah dengan menghubungkan ke langganan dan membuat ruang kerja untuk model Anda. Panduan penyiapan meminta Anda untuk menentukan apakah model yang dihasilkan memiliki titik akhir publik atau pribadi dan apakah Anda akan bekerja dengan data sensitif sebelum memilih bagaimana kunci dikelola. Data sensitif akan diproses dalam apa yang Azure definisikan sebagai "ruang kerja berdampak bisnis tinggi", yang mengurangi jumlah data diagnostik yang dikumpulkan oleh Microsoft dan menambahkan tingkat enkripsi tambahan.

Mengonfigurasi ruang kerja pembelajaran mesin

Setelah Anda menelusuri wizard, Azure memeriksa pengaturan Anda sebelum membuat ruang kerja ML Anda. Berguna menawarkan template ARM sehingga Anda dapat mengotomatiskan proses pembuatan di masa mendatang, menyediakan kerangka kerja untuk skrip yang dapat digunakan analis bisnis dari portal internal untuk mengurangi beban pada administrator Azure Anda. Menerapkan sumber daya yang diperlukan untuk membuat ruang kerja dapat memakan waktu, jadi bersiaplah untuk menunggu beberapa saat sebelum Anda dapat mulai membuat model apa pun.

Ruang kerja Anda berisi fitur untuk mengembangkan dan mengelola model pembelajaran mesin, mulai dari desain dan pelatihan hingga mengelola komputasi dan penyimpanan. Ini juga membantu Anda memberi label pada data yang ada, meningkatkan nilai kumpulan data pelatihan Anda. Anda mungkin ingin memulai dengan tiga opsi utama: bekerja dengan Azure ML Python SDK di notebook bergaya Jupyter, menggunakan alat pelatihan otomatis Azure ML, atau permukaan Designer drag-and-drop kode rendah. 

Menggunakan Azure ML Designer untuk membuat model

Desainer adalah cara tercepat untuk memulai dengan pembelajaran mesin khusus, karena ini memberi Anda akses ke sekumpulan modul bawaan yang dapat dirangkai bersama untuk membuat API pembelajaran mesin yang siap digunakan dalam kode Anda. Mulailah dengan membuat kanvas untuk pipeline ML Anda, dengan menyiapkan target komputasi untuk pipeline Anda. Target komputasi dapat disetel untuk seluruh model, atau untuk modul individual dalam pipeline, memungkinkan Anda menyesuaikan performa dengan tepat.

Sebaiknya anggap resource komputasi model Anda sebagai komputasi tanpa server, yang naik turun sesuai kebutuhan. Saat Anda tidak menggunakannya, skala akan turun menjadi nol dan dapat memakan waktu selama lima menit untuk memutarnya lagi. Ini mungkin memengaruhi operasi aplikasi, jadi pastikan aplikasi tersedia sebelum menjalankan aplikasi yang bergantung padanya. Anda perlu mempertimbangkan resource yang diperlukan untuk melatih model saat memilih target komputasi. Model kompleks dapat memanfaatkan dukungan GPU Azure, dengan dukungan untuk sebagian besar opsi komputasi Azure (bergantung pada kuota yang tersedia).

Setelah Anda menyiapkan sumber daya komputasi pelatihan, pilih kumpulan data pelatihan. Ini bisa berupa data Anda sendiri atau salah satu sampel Microsoft. Kumpulan data kustom bisa dibuat dari file lokal, dari data yang sudah disimpan di Azure, dari Web, atau dari kumpulan data terbuka terdaftar (yang seringkali merupakan informasi pemerintah).

Menggunakan data di Azure ML Designer

Alat di Designer memungkinkan Anda menjelajahi kumpulan data yang Anda gunakan, sehingga Anda dapat yakin memiliki sumber yang tepat untuk model yang Anda coba buat. Dengan sumber data di kanvas, Anda dapat mulai menyeret modul dan menghubungkannya untuk memproses data pelatihan Anda; misalnya, menghapus kolom yang tidak berisi cukup data atau membersihkan data yang hilang. Proses seret dan sambungkan ini sangat mirip bekerja dengan alat kode rendah, seperti yang ada di Power Platform. Yang berbeda di sini adalah Anda memiliki opsi untuk menggunakan modul Anda sendiri.

Setelah data diproses, Anda dapat mulai memilih modul yang Anda inginkan untuk melatih model Anda. Microsoft menyediakan sekumpulan algoritme umum, serta alat untuk memisahkan kumpulan data untuk pelatihan dan pengujian. Model yang dihasilkan dapat dinilai menggunakan modul lain setelah Anda menjalankannya melalui pelatihan. Skor diteruskan ke modul evaluasi sehingga Anda dapat melihat seberapa baik algoritme Anda beroperasi. Anda memang membutuhkan pengetahuan statistik untuk menginterpretasikan hasil sehingga Anda dapat memahami jenis kesalahan yang dihasilkan, meskipun dalam praktiknya semakin kecil nilai kesalahannya, semakin baik. Anda tidak perlu menggunakan algoritme yang telah disiapkan, karena Anda dapat membawa kode Python dan R. Anda sendiri.

Model yang terlatih dan teruji dapat dengan cepat diubah menjadi pipeline inferencing, siap digunakan dalam aplikasi Anda. Ini menambahkan titik akhir REST API input dan output ke model Anda, siap digunakan dalam kode Anda. Model yang dihasilkan kemudian di-deploy ke cluster kesimpulan AKS sebagai container yang siap digunakan.

Biarkan Azure melakukan semuanya untuk Anda: Pembelajaran Mesin Otomatis

Dalam banyak kasus, Anda bahkan tidak perlu melakukan pengembangan sebanyak itu. Microsoft baru-baru ini merilis opsi ML Otomatis, berdasarkan pekerjaan yang dilakukan di Microsoft Research. Di sini Anda mulai dengan kumpulan data yang dapat diakses Azure, yang harus berupa data tabel. Ini ditujukan untuk tiga jenis model: klasifikasi, regresi, dan perkiraan. Setelah Anda memberikan data dan memilih jenis model, alat tersebut akan secara otomatis menghasilkan skema dari data yang dapat Anda gunakan untuk mengaktifkan dan menonaktifkan bidang data tertentu, membuat eksperimen yang kemudian dijalankan untuk membuat dan menguji model.

ML otomatis akan membuat dan memberi peringkat beberapa model, yang dapat Anda selidiki untuk menentukan mana yang terbaik untuk masalah Anda. Setelah Anda menemukan model yang Anda inginkan, Anda dapat dengan cepat menambahkan tahapan input dan output dan menerapkannya sebagai layanan, siap digunakan di alat seperti Power BI.

Dengan pembelajaran mesin, alat prediksi yang semakin penting di berbagai jenis masalah bisnis, Azure Machine Learning Designer dapat menghadirkannya ke audiens yang lebih luas. Jika Anda memiliki data, Anda dapat membuat model analitik dan prediktif, dengan sedikit keahlian ilmu data. Dengan layanan Automated ML baru, mudah untuk beralih dari data ke layanan ke analisis tanpa kode.