3 Alternatif Kaggle untuk ilmu data kolaboratif

Apa cara terbaik untuk mendapatkan jawaban yang bagus untuk pertanyaan sulit? Bertanyalah kepada sekelompok orang, dan buatlah persaingan darinya. Itu sudah lama menjadi pendekatan Kaggle terhadap ilmu data: Ubah misi sulit, seperti membuat deteksi kanker paru-paru lebih akurat, menjadi kompetisi pembayaran hadiah, di mana tim terbaik dan algoritme terbaik menang.

Sekarang Kaggle diluncurkan ke Google, dan sementara semua tanda menunjukkan bahwa situs tersebut tetap apa adanya untuk saat ini, akan ada kegelisahan tentang prospek jangka panjang untuk situs dengan komunitas yang begitu setia dan pendekatan yang istimewa.

Berikut adalah tiga situs lain yang memiliki misi serupa, jika tidak secara eksplisit mengikuti jejak Kaggle. (Perhatikan bahwa beberapa situs, seperti CrowdAnalytix, mungkin menganggap solusi yang diterima dalam kontes sebagai karya untuk disewa dan juga properti mereka.)

CrowdAI

Sebuah produk dari École Polytechnique Fédérale de Lausanne di Swiss, CrowdAI adalah platform open source untuk menyelenggarakan tantangan data terbuka dan mendapatkan wawasan tentang bagaimana masalah tersebut diselesaikan. Platform ini cukup baru, dengan hanya enam tantangan yang ditawarkan sejauh ini, tetapi tutorial yang diturunkan dari tantangan tersebut sangat rinci dan berharga, menyediakan metodologi langkah demi langkah untuk mereproduksi pekerjaan itu atau membuat sesuatu yang serupa. Latihan yang ada mencakup framework umum seperti Torch atau TensorFlow, jadi ini adalah tempat yang baik untuk memperoleh detail langsung untuk menggunakannya.

DrivenData

DrivenData, dibuat oleh konsultan yang menangani masalah data profesional, menyelenggarakan tantangan online yang berlangsung selama beberapa bulan. Masing-masing difokuskan secara khusus pada masalah mendesak yang dihadapi dunia pada umumnya, seperti memprediksi penyebaran penyakit atau menambang data Yelp untuk meningkatkan proses pemeriksaan restoran. Seperti Kaggle, DrivenData juga memiliki papan daftar pekerjaan sains data - fitur yang dikhawatirkan orang mungkin hilang dari Kaggle pasca akuisisi.

CrowdAnalytix

Didukung oleh investor dari Accel Partners dan SAIF Partners, CrowdAnalytix berfokus pada penyelenggaraan kompetisi pemecahan masalah berbasis data, daripada berbagi informasi yang dihasilkan dari kompetisi tersebut. Kontes ditawarkan untuk menemukan solusi atas masalah dalam kategori seperti pemodelan, visualisasi, dan penelitian, dan masing-masing memiliki hadiah dalam ribuan dolar. Beberapa tantangan sebelumnya termasuk memprediksi biaya sebenarnya dari klaim kompensasi pekerja atau penundaan maskapai penerbangan. Kontes lain, bagaimanapun, tidak diselenggarakan untuk uang, tetapi untuk memberikan pilihan kompetitif untuk mempelajari disiplin terkait, seperti bahasa R.