Semakin banyak perusahaan yang berfokus pada menemukan cara untuk terhubung ke sumber data baru dan berharga untuk meningkatkan kemampuan analitis mereka, memperkaya model mereka, atau memberikan lebih banyak wawasan ke unit bisnis mereka. Karena meningkatnya permintaan akan sumber data baru, perusahaan juga melihat data internal mereka secara berbeda. Organisasi yang memiliki akses ke kumpulan data berharga mulai mencari peluang yang memungkinkan mereka berbagi dan memonetisasi data di luar empat dinding bisnis mereka. Seperti apa lanskap berbagi data?Semakin banyak fokus ditempatkan pada berbagi data. Pentingnya terkait erat dengan penemuan data, yang telah menjadi sorotan selama berbulan-bulan sekarang. Venturebeat menampilkan berbagi data secara khusus sebagai bagian dari Pembelajaran Mesin, AI, dan Lanskap Data 2021 mereka, dan menyoroti beberapa perkembangan utama di bidang tersebut: Google meluncurkan Analytics Hub pada Mei 2021 sebagai platform untuk menggabungkan set data dan berbagi data, dasbor, dan model pembelajaran mesin. Google juga meluncurkan Datashare , yang dikembangkan lebih untuk layanan keuangan dan berdasarkan Analytics Hub. Databricks mengumumkan Delta Sharing pada hari yang sama dengan rilis Google. Delta Sharing adalah protokol open source untuk berbagi data yang aman di seluruh organisasi. Pada Juni 2021, Snowflake membuka akses luas ke pasar datanya , ditambah dengan kemampuan berbagi data yang aman. ThinkData selalu menjadikan berbagi data sebagai landasan teknologi kami, dan baru-baru ini, kapasitas kami untuk berbagi data dengan aman di dalam dan di luar organisasi telah meningkat. Perubahan kebutuhan perusahaanAda beberapa hal yang perlu diperhatikan dalam berbagi data. Memilih siapa yang akan Anda izinkan menggunakan data Anda, dan untuk tujuan apa, adalah pertanyaan strategis yang harus dipikirkan oleh organisasi. Namun di luar aturan tentang siapa yang akan menggunakan data Anda dan mengapa, ada juga masalah logistik yang terkait dengan berbagi data yang lebih bersifat teknologi daripada legal. Ketika datang ke data – apakah itu masuk atau keluar, publik atau pribadi, bagian dari proses inti atau bagian kecil dari eksperimen – bagaimana Anda terhubung dengannya seringkali sama pentingnya dengan mengapa. Untuk perusahaan modern yang ingin mendapatkan lebih banyak dari data mereka, memilih untuk menggunakan katalog data tidak berarti Anda harus memindahkan data Anda. Manfaat platform yang memungkinkan Anda mengatur, menemukan, membagikan, dan memonetisasi data Anda tidak dapat diperoleh dengan memigrasikan database Anda ke cloud publik. Itu menemukan dan menggunakan data baru jelas , tetapi proses di mana organisasi harus berbagi dan menerima data tidak. Memory stick tidak akan memotongnya, jadi seperti apa solusi berbagi yang baik? Apa itu akses yang ditentukan pemilik?Seringkali, ketika organisasi ingin berbagi data yang mereka miliki, mereka harus memotong-motong set data untuk menghapus informasi sensitif atau membuat salinan set data yang menghadap pelanggan. Selain biaya untuk membangun versi set data yang ramah klien, ini adalah praktik yang buruk dari perspektif tata kelola data. Membuat dan mendistribusikan salinan kumpulan data menciptakan cara baru untuk menangani data dan data yang salah setiap saat, dan membuka kemungkinan inkonsistensi, kesalahan, dan masalah keamanan. Jika Anda ingin membagikan kumpulan data ke sepuluh orang yang berbeda untuk sepuluh kasus penggunaan yang berbeda, Anda mengulangi pekerjaan dan melipatgandakan risiko setiap kali Anda melakukannya. Solusi berbagi data yang baik memungkinkan pemilik data membuat izin tingkat baris dan kolom pada kumpulan data, membuat tampilan yang disesuaikan dari satu file master, memastikan semua pembagian data tetap terintegrasi ke satu sumber kebenaran. Metadata yang konsisten dan dapat dikonfigurasiSebagian besar kumpulan data tidak dibuat untuk menghadap konsumen. Jika data dihasilkan sebagai produk sampingan dari proses bisnis inti, data tersebut mungkin khusus untuk kasus penggunaan yang sangat spesifik yang mungkin tidak dibagikan oleh pengguna akhir yang ingin menggunakan data tersebut. Metadata adalah kunci yang memungkinkan kita memahami dan menggunakan data secara efektif. Baik itu deskriptif (memberi tahu kami siapa yang membuat data dan bagaimana kami harus menafsirkannya) atau administratif (menyatakan siapa pemiliknya dan bagaimana data itu dapat digunakan), menambahkan dan memelihara metadata kualitas adalah cara paling efisien untuk memastikan siapa pun memahami cara menggunakan data yang mereka akses. Bagaimana seharusnya data dibagikan dengan aman?Ini seharusnya tidak perlu dipikirkan lagi, tetapi Anda mungkin terkejut betapa banyak organisasi yang masih mengirim spreadsheet melalui email dari satu lantai ke lantai berikutnya. Jika Anda berbagi data terbuka, Anda mungkin tidak perlu khawatir tentang keamanan data, tetapi jika data tersebut bahkan cukup sensitif (belum lagi berharga), Anda harus memastikan bahwa Anda memiliki cara untuk melacak dengan tepat di mana data itu berada. pergi. Memastikan data dikirimkan melalui layanan dengan langkah-langkah perlindungan data yang memadai adalah penting, dan memastikan pengiriman yang andal dan stabil akan meningkatkan kepercayaan. Itu mencakup berbagi internal, tetapi bagaimana dengan berbagi data antar organisasi, atau bahkan antar departemen? Secara historis, jika Anda memberikan data Anda ke unit bisnis lain, itu adalah transaksi dari satu kotak hitam ke kotak hitam lainnya. Tetapi jika Anda adalah organisasi yang memiliki batasan tentang siapa yang dapat menggunakan data, Anda perlu mengetahui pengguna mana yang terhubung ke kumpulan data secara terus-menerus. Platform berbagi data yang baik seharusnya tidak hanya memungkinkan Anda mengontrol aliran data, tetapi juga memberi Anda wawasan tentang bagaimana pengguna terhubung ke sana, dan kapan. Dukungan untuk cloud lokal dan publikSebagian besar inisiatif berbagi data modern dirancang untuk cloud publik secara eksklusif, yang tidak hanya membatasi siapa yang dapat memanfaatkannya, tetapi juga meningkatkan pengeluaran untuk penyedia dan konsumen karena mereka menggunakan lebih banyak penyimpanan untuk mengakses semua data yang telah dibagikan kepada mereka. Kenyataannya adalah bahwa modernisasi perusahaan yang pada setiap tahap menjadi data-driven memerlukan sistem dan infrastruktur yang mengganggu prosedur operasi standar mereka sesedikit mungkin. Salah satu masalah dengan banyak solusi berbagi dan katalog data tradisional adalah ada langkah migrasi utama ke cloud publik yang tidak mungkin dilakukan. Untuk organisasi dengan misi penting atau data sensitif dan beban kerja transaksional, kontrol yang baik dari pusat data lokal akan selalu menjadi kebutuhan. Bahkan untuk organisasi yang ingin melakukan lift-and-shift ke cloud publik, ada bermil-mil pertimbangan hukum dan praktis yang membuat proses terhenti, tepat ketika mereka sedang dalam proses mencoba untuk memodernisasi. Lembaga keuangan multinasional tidak memerlukan waktu beberapa bulan untuk memindahkan data mereka secara fisik ke cloud. Apa pun status basis data Anda, Anda tetap dapat memberikan akses ke data Anda di mana pun dengan aman, tanpa memigrasikannya ke cloud publik atau membuat salinan yang tidak perlu. Mekanisme untuk menemukan data baruMunculnya pasar data menunjukkan kebutuhan yang kuat bagi sebagian besar organisasi untuk memanfaatkan solusi yang membantu mereka menemukan dan terhubung ke data yang berada di luar empat dinding bisnis mereka. Di mana pasar data sering gagal, bagaimanapun, adalah bahwa mereka memberikan pengalaman berbelanja, bukan model konsumsi. Pasar data, secara historis, telah menjadi tempat yang memberi pengguna kemampuan untuk menemukan data tetapi bukan mekanisme yang dengannya mereka dapat terhubung dengannya, yang sedikit mirip dengan membiarkan seseorang berbelanja pakaian tetapi tidak membiarkan mereka mencoba sesuatu. Model berbagi data baru telah muncul dari kebutuhan ini, dan Snowflake membuat gelombang tahun lalu ketika mereka meluncurkan Snowflake Data Marketplace sebagai tempat di mana pengguna dapat berbagi data secara bilateral ke akun satu sama lain. Model ini bekerja dengan baik di cloud publik, di mana relatif mudah untuk membuat kumpulan data di wilayah cloud baru, tetapi agak berat (membuat ulang data di setiap wilayah cloud menambahkan overhead yang cukup besar ke proses) dan juga dapat membuat biaya tak terkendali untuk komputasi dan penyimpanan jika Anda tidak hati-hati. Platform ThinkData memungkinkan organisasi mana pun untuk memanfaatkan data secara konsisten, dari berbagai sumber, dan mengirimkannya dengan cara standar secara langsung. ThinkData Marketplace adalah etalase untuk jagat data publik yang tersedia dan hub pusat di mana penyedia data dapat terhubung dengan pembeli data. Platform ThinkData menawarkan berbagai model konsumsi. Dengan produksi data sesuai permintaan, Anda dapat dengan mudah mengonfigurasi aset data publik ke format dan skema yang ideal. Melalui virtualisasi data, Anda dapat memastikan berbagi data secara instan tanpa menimbulkan masalah seputar pergudangan data dan keamanan. ThinkData Marketplace menyediakan model konsumsi data yang memungkinkan organisasi yang haus data tidak hanya menemukan beragam data, tetapi juga mulai menggunakan sumber data baru dengan cepat dan efisien. Memperkenalkan berbagi data migrasi rendahYang dibutuhkan adalah cara bagi organisasi untuk membagikan data mereka tanpa perlu memindahkannya terlebih dahulu. Virtualisasi data menawarkan solusi di sini, karena memungkinkan pengguna melihat data dari gudang eksternal bersama data dari sumber lain tanpa harus memindahkan atau menyalinnya.
Platform
ThinkData memungkinkan virtualisasi data untuk organisasi yang ingin menerapkan
tata kelola, manajemen metadata, dan berbagi data ke data mereka tanpa
memindahkannya dari tempatnya. Dengan mengambil data langsung dari gudang
dan menyediakannya melalui platform UI, kami memungkinkan pengguna mendapatkan
semua manfaat katalog data tanpa hambatan operasional (dan biaya) dari migrasi
ekstensif. |