Peran ilmu data saat ini tidak akan ada dalam 10 tahun

Dalam dekade mendatang, peran data scientist seperti yang kita ketahui akan terlihat sangat berbeda dari saat ini. Tapi jangan khawatir, tidak ada yang memprediksi pekerjaan hilang, hanya berganti pekerjaan.

Ilmuwan data akan baik-baik saja - menurut Biro Statistik Tenaga Kerja, peran tersebut masih diproyeksikan tumbuh pada klip yang lebih tinggi dari rata-rata hingga tahun 2029. Namun kemajuan dalam teknologi akan menjadi pendorong perubahan besar dalam tanggung jawab data scientist dan dalam cara bisnis mendekati analitik secara keseluruhan. Dan alat AutoML, yang membantu mengotomatiskan pipeline machine learning dari data mentah ke model yang dapat digunakan, akan memimpin revolusi ini.

Dalam 10 tahun, data scientist akan memiliki perangkat keterampilan dan alat yang sama sekali berbeda, tetapi fungsinya akan tetap sama: berfungsi sebagai pemandu teknologi yang percaya diri dan kompeten yang dapat memahami data kompleks untuk memecahkan masalah bisnis.

AutoML mendemokrasikan ilmu data

Hingga saat ini, algoritme dan proses pembelajaran mesin hampir secara eksklusif merupakan domain dari peran ilmu data yang lebih tradisional — peran dengan pendidikan formal dan gelar lanjutan, atau bekerja untuk perusahaan teknologi besar. Ilmu data telah memainkan peran yang sangat berharga di setiap bagian spektrum pengembangan pembelajaran mesin. Namun seiring berjalannya waktu, peran mereka akan semakin kolaboratif dan strategis. Dengan alat seperti AutoML untuk mengotomatiskan beberapa keterampilan akademis mereka, data scientist dapat berfokus untuk memandu organisasi menuju solusi masalah bisnis melalui data.

Dalam banyak hal, ini karena AutoML mendemokrasikan upaya menerapkan pembelajaran mesin ke dalam praktik. Vendor dari startup hingga cloud hyperscaler telah meluncurkan solusi yang cukup mudah bagi pengembang untuk digunakan dan bereksperimen tanpa hambatan pendidikan atau pengalaman yang besar untuk masuk. Demikian pula, beberapa aplikasi AutoML cukup intuitif dan sederhana sehingga pekerja non-teknis dapat mencoba sendiri menciptakan solusi untuk masalah di departemen mereka sendiri — menciptakan semacam "ilmuwan data warga" dalam organisasi.

Untuk menjelajahi kemungkinan yang dibuka oleh jenis alat ini bagi developer dan data scientist, pertama-tama kita harus memahami status sains data saat ini yang berkaitan dengan pengembangan machine learning. Paling mudah dipahami jika ditempatkan pada skala kedewasaan.

Organisasi dan bisnis yang lebih kecil dengan peran yang lebih tradisional yang bertanggung jawab atas transformasi digital (yaitu, bukan ilmuwan data yang terlatih secara klasik) biasanya berada pada ujung skala ini. Saat ini, mereka adalah pelanggan terbesar untuk aplikasi pembelajaran mesin out-of-the-box, yang lebih ditujukan untuk audiens yang tidak terbiasa dengan seluk-beluk pembelajaran mesin.

  • Kelebihan: Aplikasi siap pakai ini cenderung mudah diimplementasikan, dan relatif murah serta mudah diterapkan. Untuk perusahaan kecil dengan proses yang sangat spesifik untuk diotomatiskan atau ditingkatkan, kemungkinan ada beberapa opsi yang layak di pasar. Hambatan yang rendah untuk masuk membuat aplikasi ini sempurna bagi ilmuwan data yang memasuki pembelajaran mesin untuk pertama kalinya. Karena beberapa aplikasi sangat intuitif, mereka bahkan memungkinkan karyawan non-teknis kesempatan untuk bereksperimen dengan otomatisasi dan kemampuan data tingkat lanjut — yang berpotensi memperkenalkan kotak pasir yang berharga ke dalam organisasi.
  • Kekurangan: Kelas aplikasi pembelajaran mesin ini terkenal tidak fleksibel. Meskipun mudah diterapkan, mereka tidak mudah disesuaikan. Dengan demikian, tingkat akurasi tertentu mungkin tidak mungkin dilakukan untuk aplikasi tertentu. Selain itu, aplikasi ini dapat sangat dibatasi oleh ketergantungannya pada model dan data yang telah dilatih sebelumnya. 

Contoh dari aplikasi ini mencakup Amazon Comprehend, Amazon Lex, dan Amazon Forecast dari Amazon Web Services dan Azure Speech Services dan Azure Language Understanding (LUIS) dari Microsoft Azure. Alat ini sering kali cukup untuk ilmuwan data yang sedang berkembang untuk mengambil langkah pertama dalam pembelajaran mesin dan mengantarkan organisasi mereka lebih jauh ke dalam spektrum kedewasaan.

Solusi yang dapat disesuaikan dengan AutoML

Organisasi dengan kumpulan data yang besar namun relatif umum — pikirkan data transaksi pelanggan atau metrik email pemasaran — membutuhkan lebih banyak fleksibilitas saat menggunakan pembelajaran mesin untuk memecahkan masalah. Masukkan AutoML. AutoML mengambil langkah-langkah dari alur kerja pembelajaran mesin manual (penemuan data, analisis data eksplorasi, penyetelan hyperparameter, dll.) Dan memadatkannya menjadi tumpukan yang dapat dikonfigurasi.

  • Kelebihan: Aplikasi AutoML memungkinkan lebih banyak eksperimen dijalankan pada data di ruang yang lebih besar. Tetapi kekuatan super AutoML yang sebenarnya adalah aksesibilitasnya - konfigurasi khusus dapat dibuat dan input dapat disempurnakan dengan relatif mudah. Terlebih lagi, AutoML tidak dibuat secara eksklusif dengan data scientist sebagai audiens. Pengembang juga dapat dengan mudah mengotak-atik kotak pasir untuk menghadirkan elemen pembelajaran mesin ke dalam produk atau proyek mereka sendiri.
  • Kekurangan: Meskipun mendekati, keterbatasan AutoML berarti akurasi dalam keluaran akan sulit untuk disempurnakan. Karena itu, data scientist yang memegang gelar dan memegang kartu sering kali meremehkan aplikasi yang dibuat dengan bantuan AutoML - meskipun hasilnya cukup akurat untuk menyelesaikan masalah yang dihadapi.

Contoh aplikasi ini mencakup Amazon SageMaker AutoPilot atau Google Cloud AutoML. Ilmuwan data satu dekade dari sekarang pasti perlu terbiasa dengan alat seperti ini. Layaknya developer yang mahir dalam berbagai bahasa pemrograman, data scientist harus menguasai beberapa lingkungan AutoML agar dapat dianggap sebagai talenta terbaik.

Solusi pembelajaran mesin "linting tangan" dan buatan sendiri 

Bisnis skala perusahaan terbesar dan perusahaan Fortune 500 adalah tempat sebagian besar aplikasi pembelajaran mesin canggih dan eksklusif saat ini sedang dikembangkan. Data scientist di organisasi ini adalah bagian dari tim besar yang menyempurnakan algoritme machine learning menggunakan kumpulan data perusahaan historis, dan membangun aplikasi ini dari awal. Aplikasi khusus seperti ini hanya dapat dilakukan dengan sumber daya dan bakat yang besar, itulah sebabnya imbalan dan risikonya sangat besar.

  • Kelebihan: Seperti aplikasi apa pun yang dibuat dari awal, pembelajaran mesin kustom "canggih" dan dibuat berdasarkan pemahaman mendalam tentang masalah yang dihadapi. Ini juga lebih akurat - jika hanya dengan margin kecil - daripada AutoML dan solusi pembelajaran mesin out-of-the-box.
  • Kekurangan: Mendapatkan aplikasi pembelajaran mesin khusus untuk mencapai ambang akurasi tertentu bisa sangat sulit, dan seringkali membutuhkan pengangkatan berat oleh tim ilmuwan data. Selain itu, opsi pembelajaran mesin kustom adalah yang paling memakan waktu dan paling mahal untuk dikembangkan.

Contoh solusi pembelajaran mesin linting tangan dimulai dengan notebook Jupyter kosong, mengimpor data secara manual, lalu melakukan setiap langkah dari analisis data eksplorasi melalui penyelarasan model secara manual. Ini sering kali dicapai dengan menulis kode kustom menggunakan framework machine learning open source seperti Scikit-learn, TensorFlow, PyTorch, dan banyak lainnya. Pendekatan ini membutuhkan tingkat pengalaman dan intuisi yang tinggi, tetapi dapat memberikan hasil yang sering kali mengungguli layanan pembelajaran mesin siap pakai dan AutoML.

Alat seperti AutoML akan mengubah peran dan tanggung jawab ilmu data selama 10 tahun ke depan. AutoML mengambil beban pengembangan pembelajaran mesin dari awal para ilmuwan data, dan alih-alih menempatkan kemungkinan teknologi pembelajaran mesin langsung ke tangan pemecah masalah lainnya. Dengan waktu yang terbebas untuk fokus pada apa yang mereka ketahui — data dan masukan itu sendiri - data scientist satu dekade dari sekarang akan menjadi panduan yang lebih berharga bagi organisasi mereka.

Eric Miller menjabat sebagai direktur senior strategi teknis di Rackspace, di mana dia memberikan kepemimpinan konsultasi strategis dengan rekam jejak yang terbukti dari pembangunan praktik di ekosistem Amazon Partner Network (APN). Pemimpin teknologi yang berprestasi dengan 20 tahun terbukti sukses dalam TI perusahaan, Eric telah memimpin beberapa AWS dan inisiatif arsitektur solusi, termasuk Program Mitra Penilaian AWS Well Architected Framework (WAF), Amazon EC2 untuk Windows Server, Program Pengiriman Layanan AWS, dan berbagai macam penulisan ulang AWS untuk organisasi multi-miliar dolar.

-

Forum Teknologi Baru menyediakan tempat untuk mengeksplorasi dan mendiskusikan teknologi perusahaan yang sedang berkembang secara mendalam dan luas. Pemilihannya subjektif, berdasarkan pilihan teknologi yang kami yakini penting dan paling menarik bagi pembaca. tidak menerima jaminan pemasaran untuk publikasi dan berhak untuk mengedit semua konten yang dikontribusikan. Kirim semua pertanyaan ke [email protected]