Apa sebenarnya arti penyimpanan hyperscale

Mari kita perjelas: Hyperscale bukan tentang seberapa besar Anda.

Organisasi tidak harus besar untuk memanfaatkan solusi hyperscale. Tapi itulah yang dipikirkan oleh banyak infrastruktur TI, operasi, dan pengembang profesional ketika mereka pertama kali belajar tentang hiperskala.

Keyakinan yang berlaku adalah bahwa arsitektur hyperscale dimaksudkan untuk infrastruktur yang sangat besar - seperti yang dioperasikan oleh LinkedIn, Amazon, atau Netflix - karena dapat menskalakan hingga ribuan instance dan petabyte data. Ternyata, lebih baik menganggap hyperscale menggambarkan pendekatan daripada ukuran . Ini tentang otomatisasi, orkestrasi, dan membangun TI yang secara cerdas dapat diskalakan saat dan saat bisnis membutuhkannya. Penerapan skala besar dapat dan harus dimulai dari skala kecil, lalu diskalakan tanpa batas. Mereka juga harus memungkinkan Anda untuk secara mandiri menskalakan hanya sebagian dari infrastruktur yang membutuhkannya, yang berlawanan dengan tren pusat data perusahaan yang sedang berkembang lainnya, hyperconvergence.

Bingung belum? Jika demikian, Anda tidak sendiri. Mari selami lebih dalam.

Mendefinisikan hyperscale

Konsep membangun arsitektur hyperscale dikacaukan oleh banyak istilah tangensial. Secara khusus, kami melihat pelanggan bingung tentang hyperconverged, hyperscale (atau Web-scale), converged, software-defined, dan infrastruktur berbasis komoditas.

Mari luangkan waktu sejenak untuk memperjelas definisi tentang istilah bahan ini:

  • Ditentukan perangkat lunak: Infrastruktur di mana fungsionalitasnya benar-benar dipisahkan dari perangkat keras yang mendasarinya dan dapat dikembangkan serta terprogram. Baca posting ini untuk penjelasan kami tentang penyimpanan yang ditentukan perangkat lunak secara khusus.
  • Berbasis komoditas: Infrastruktur yang dibangun di atas komoditas atau infrastruktur standar industri, biasanya server blade atau rak x86. Seperti yang telah kami tulis di masa lalu, jangan menggabungkan komoditas dengan murah.
  • Konvergen: Arsitektur penskalaan tempat server, penyimpanan, jaringan, dan komponen virtualisasi / penampung diikat menjadi satu sebagai solusi pra-terintegrasi yang telah teruji. Komponen masih berbeda dalam arsitektur ini.
  • Hyperconverged: Arsitektur scale-out yang membawa infrastruktur terkonvergensi selangkah lebih maju dengan menggabungkan komponen yang ditentukan perangkat lunak di atas perangkat keras komoditas, yang dikemas sebagai solusi tunggal - seringkali satu alat. Komponen tidak lagi berbeda.
  • Hyperscale: Arsitektur penskalaan yang juga ditentukan perangkat lunak dan berbasis komoditas, tetapi di mana sumber daya server, penyimpanan, jaringan, dan virtualisasi / containerisasi tetap terpisah. Setiap komponen berbeda dan dapat diskalakan secara independen.

Singkatnya, pikirkan infrastruktur hyperconverged sebagai sistem konvergensi modern dan logis, sedangkan hyperscale adalah ekstrem modern dan logis tentang bagaimana kita telah membangun pusat data selama 30 tahun. Keduanya masuk akal untuk lingkungan tertentu, seperti yang ditunjukkan di bawah ini.

Hyperscale dan hyperconverged

Di Hedvig, kami berusaha memberikan solusi penyimpanan yang dapat disesuaikan secara fleksibel untuk beban kerja apa pun, mulai dari cloud pribadi, termasuk Docker dan OpenStack, hingga penerapan data besar yang menjalankan Hadoop atau NoSQL hingga virtualisasi server yang lebih tradisional, pemulihan bencana, pencadangan, dan pengarsipan. Platform Penyimpanan Terdistribusi Hedvig memvirtualisasikan dan menggabungkan flash dan disk yang berputar dalam cluster server atau cloud, menyajikannya sebagai sistem penyimpanan tunggal dan elastis yang dapat diakses oleh antarmuka file, blok, atau objek.

Platform Penyimpanan Terdistribusi Hedvig terdiri dari tiga komponen:

  • Hedvig Storage Service: Mesin sistem terdistribusi yang dipatenkan yang mengukur kinerja dan kapasitas penyimpanan dengan server ARM dan x86 siap pakai. Layanan Penyimpanan Hedvig dapat dijalankan di tempat atau di cloud publik seperti AWS, Azure, dan Google. Ini memberikan semua opsi penyimpanan dan kemampuan yang diperlukan untuk penerapan perusahaan, termasuk deduplikasi inline, kompresi inline, snapshot, klon, thin provisioning, autotiering, dan caching.
  • Hedvig Storage Proxy: VM atau container ringan yang memungkinkan akses ke Hedvig Storage Service melalui protokol standar industri. Hedvig saat ini mendukung NFS untuk file dan iSCSI untuk blokir, serta driver OpenStack Cinder dan Docker. Hedvig Storage Proxy juga memungkinkan caching dan deduplikasi sisi klien dengan SSD lokal dan sumber daya flash PCIe untuk pembacaan lokal yang cepat dan transfer data yang efisien.
  • API Hedvig: API berbasis REST dan RPC untuk penyimpanan objek dan operasi Hedvig. Hedvig saat ini mendukung Amazon S3 dan Swift untuk penyimpanan objek. Pengembang dan admin operasi TI dapat menggunakan API manajemen untuk mengaktifkan akses ke semua fitur penyimpanan Hedvig untuk mengotomatiskan penyediaan dan manajemen dengan portal, aplikasi, dan cloud layanan mandiri.

Hedvig mendukung hyperconvergence dengan menggabungkan Hedvig Storage Proxy dan Hedvig Storage Service sebagai peralatan virtual yang berjalan di server komoditas dengan hypervisor atau container OS. Untuk hyperscale, Hedvig Storage Service di-deploy di server bare-metal untuk membentuk tingkat penyimpanan khusus sementara Hedvig Storage Proxy di-deploy sebagai VM atau container di setiap server di tingkat komputasi.

Mengapa memilih hyperscale untuk penyimpanan

Data tumbuh jauh lebih cepat daripada anggaran penyimpanan. Ekonomi melumpuhkan perusahaan yang tidak memiliki sumber daya internet seperti Amazon, Google, dan Facebook. Dengan demikian, perusahaan harus merangkul penyimpanan yang ditentukan perangkat lunak dan berbasis komoditas untuk mengurangi biaya dan menjaga fleksibilitas dan skalabilitas yang diperlukan untuk memenuhi persyaratan bisnis.

Di Hedvig, kami memperhatikan bahwa sekitar 80 persen dari waktu, pelanggan memilih arsitektur hyperscale daripada hyperconverged, meskipun faktanya kami mendukung keduanya. Yang lebih menarik adalah banyak pelanggan yang datang kepada kami dengan pemikiran yang sebaliknya. Sekitar 80 persen awalnya meminta solusi hyperconverged, tetapi setelah mereka mengerjakan pekerjaan rumah mereka, mereka memilih pendekatan hyperscale.

Mengapa? Singkatnya, karena mereka menyukai fleksibilitas (atau kelincahan, jika Anda harus menggunakan istilah itu) di atas segalanya saat merancang infrastruktur mereka. Pertimbangkan hal berikut:

  • Sistem hyperconverged menawarkan pendekatan "blok bangunan" yang disederhanakan untuk TI. Untuk organisasi TI yang ramping yang ingin menurunkan overhead penerapan dan perluasan infrastruktur mirip cloud, hyperconvergence memberikan solusi yang baik. Namun hal ini membutuhkan sekumpulan beban kerja yang relatif dapat diprediksi di mana "lokalitas data" adalah prioritas utama, yang berarti bahwa aplikasi atau VM harus ditempatkan sedekat mungkin dengan data. Inilah sebabnya mengapa VDI telah menjadi anak poster untuk hyperconvergence. Pengguna menginginkan lokal "virtual C: drive" mereka. Tapi itu tidak fleksibel, karena melibatkan penskalaan semua elemen secara berurutan.
  • Sistem hyperscale membuat penyimpanan tidak bergantung pada komputasi, memungkinkan TI perusahaan untuk mengukur kapasitas saat bisnis membutuhkannya. Pendekatan hyperscale ke pusat data dan infrastruktur cloud menawarkan tingkat elastisitas yang tinggi, membantu organisasi dengan cepat merespons kebutuhan aplikasi dan penyimpanan data yang berubah. Ini juga merupakan arsitektur yang lebih cocok dengan beban kerja modern seperti Hadoop dan NoSQL, serta yang dirancang dengan platform cloud seperti OpenStack dan Docker. Semua ini adalah contoh sistem terdistribusi yang mendapat manfaat dari penyimpanan bersama berskala independen.

Apa yang kami alami dengan pelanggan kami adalah konfirmasi berkumpulnya apa yang telah kami mencatat untuk sementara waktu sekarang: yang hyperconverged adalah sebuah jawaban dan tidak dengan jawaban ketika menjelajahi arsitektur penyimpanan modern. Yang pasti, industri melihat ayunan pendulum besar menjadi hyperconverged karena kesederhanaannya. Tetapi jika data Anda tumbuh secara eksponensial dan kebutuhan komputasi Anda tidak, maka Anda memiliki ketidakcocokan impedansi yang tidak cocok untuk hyperconvergence.

Hyperscale atau hyperconverged?

Hyperconverged bisa menjadi pendekatan yang lebih sederhana dan hemat biaya. Namun, yang ditemukan pelanggan kami dengan Hedvig adalah bahwa kami mendukung fitur yang membuat skala hiper sesuai untuk hampir semua beban kerja: cache sisi klien. Hedvig dapat memanfaatkan SSD lokal dan perangkat PCIe di tingkat komputasi Anda untuk membuat cache tulis. Ini secara signifikan meningkatkan kinerja membaca dan, yang lebih penting, memecahkan tantangan lokalitas data. Penyimpanan masih dipisahkan dan berjalan di tingkat hyperscale miliknya sendiri, tetapi aplikasi, VM, dan container dapat memanfaatkan data yang di-cache secara lokal di tingkat komputasi. Ini juga memecahkan masalah tentang cara menumbuhkan tingkat caching Anda, tetapi itu adalah topik untuk artikel lain.

Sebagai contoh dari manfaat ini, satu pelanggan memilih pendekatan hiperskala Hedvig untuk VDI, beban kerja yang secara tradisional disediakan untuk solusi hyperconverged seperti yang dibahas di atas. Dalam contoh ini, pelanggan memiliki "power users" yang membutuhkan 16 vCPU dan 32GB memori untuk didedikasikan untuk setiap desktop yang dihosting. Akibatnya, perusahaan terpaksa menyebarkan sejumlah besar node hyperconverged untuk mendukung persyaratan pemrosesan dan memori, sambil meningkatkan kapasitas penyimpanan secara tidak perlu.

Dengan platform Hedvig, pelanggan dapat membuat node khusus untuk menjalankan peternakan Citrix XenDesktop pada server blade yang kokoh dengan CPU dan RAM yang memadai. Data disimpan di cluster Hedvig hyperscale terpisah di server pemasangan rak, dengan data di-cache kembali di server XenDesktop di SSD lokal. Hasil? Solusi yang jauh lebih murah (60 persen lebih murah). Lebih penting lagi, ini juga menyediakan lingkungan yang lebih fleksibel di mana perusahaan dapat menggunakan Hukum Moore dan membeli server paling kuat yang diperlukan untuk meningkatkan kinerja desktop mereka tanpa harus meningkatkan server penyimpanan.

Berdasarkan pengalaman kami, ada beberapa aturan praktis untuk menentukan arsitektur mana yang tepat untuk Anda.

  • Pilih skala besar jika… organisasi Anda memiliki 5.000 karyawan atau lebih, lebih dari 500 terabyte data, lebih dari 500 aplikasi, atau lebih dari 1.000 VM.
  • Pilih hyperconverged ketika… Anda berada di bawah nomor watermark ini, memiliki lima atau kurang staf yang mengelola infrastruktur virtual Anda, atau Anda berada di remote atau kantor cabang.

Kabar baiknya adalah bahwa ini tidak harus berupa keputusan salah satu / atau. Anda bisa mulai di lingkungan hyperconverged, lalu beralih ke hyperscale, atau Anda bisa mencampur dan mencocokkan keduanya. Filosofi kami adalah bahwa aplikasi Anda menentukan aplikasi mana yang harus Anda gunakan. Dan karena kebutuhan aplikasi Anda akan berubah dari waktu ke waktu, begitu pula penerapan Anda.

Dalam bisnis modern, perubahan dan pertumbuhan adalah hal yang wajib. Semakin, tidak ada cara untuk memecahkan teka-teki ini tanpa arsitektur hiperskala yang dirintis oleh raksasa Web. Apa yang berubah adalah bahwa setiap perusahaan sekarang bisa mendapatkan keuntungan dari pendekatan hyperscale.

Rob Whiteley adalah VP pemasaran di Hedvig.

Forum Teknologi Baru menyediakan tempat untuk mengeksplorasi dan mendiskusikan teknologi perusahaan yang sedang berkembang secara mendalam dan luas. Pemilihannya subjektif, berdasarkan pilihan teknologi yang kami yakini penting dan paling menarik bagi pembaca. tidak menerima jaminan pemasaran untuk publikasi dan berhak untuk mengedit semua konten yang dikontribusikan. Kirim semua pertanyaan ke [email protected]