Fenomena Big Data
Daftar Isi
- Kompleksitas Big Data
- Siklus Manajemen Data Dan Data Warehouse
- Wrangle Data
- Explore & Visualize Data
- Analyze & Interpret Data
- Communicate With Data
- Download Materi Power Point
- Referensi
Kompleksitas Big Data
Big Data telah menjadi tren popular dalam beberapa tahun terakhir. Terkait hal itu, Big Data semakin merebaknya implementasi Internet og Things (IoT). IoT bisa dikatakan sebagai konektivitas jaringan yang memungkinkannya untuk mengumpulkan data dan terhubung lewat jaringan internet di antara satu sama lain ataupun server.
Mengingat kepopulerannya, ada baiknya mempertajam terlebih dahulu konsep big data itu sendiri. Istilah big data seringkali dimaknai keliru, karena ukuran data itu merupakan hal yang paling penting. Kebanyakan organisasi telah menyadari kegunaannya untuk “menambang” basis data informasi mereka (data mining). Analisis terhadap dataset bisa digunakan baik untuk optimasi bisnis maupun penciptaan baru
Pengembangan Bisnis
Analisis terhadap data bisa digunakan untuk merancang strategi aset yang tepat. Keandalan (reliability) dari aset akan berdampak pada pendapatan bisnis, namun untuk mengelola ini, kita butuh wawasan baik dari segi risiko maupun segi finansial.
Misalnya, untuk menekan risiko operasi suatu mesin, pemilik industry mungkin ingin melakukan pemeliharaan seminggu sekali, yang sebenarnya mungkin tidak diperlukan, dan akan memakan biaya. Solusinya adalah memanfaatkan data-data terkait perilaku dari mesin tersebut. Sumber data ini bisa digunakan untuk mendapatkan profil risiko yang dapat ditoleransi oleh bisnis dengan biaya minimum.
Wawasan yang didapat tidak hanya bisa digunakan untuk optimalisasi bisnis yang ada, tetapi juga membuka peluang untuk menciptakan baru.
Hal yang perlu dilakukan untuk implementasi Big Data
- Implementasi
Implementasi sistem basis data dan arsitektur yang scalable
- Penambangan Data
Melakukan penambangan data yang terotomatisasi
Siklus Manajemen Data Dan Data Warehouse
Wrangle Data
Wrangle Data adalah membersihkan data yang tidak valid, tidak wajar atau mungkin ada nilai yang kosong. Misalkan kita memiliki data mahasiswa Angkatan 2020. pada data tersebut ada variable tanggal lahir yang terdiri atas tanggal, bulan dan tahun. Ketika ada mahasiswa yang memiliki tahun kelahiran 2020, tentunya nilai tersebut sangat tidak wajar.
Untuk itu kita harus memperbaiki data yang ada. Cara perbaikannya bisa bermacam-macam bergantung tujuan risetnya. Jika risetnya ada kaitan dengan usia mahasiswa maka data ini akan menjadi outlier atau pencilan. Untuk mengantisipasinya, data ini bisa kita hapus atau diubah berdasarkan informasi pendukung lainnya. Jika risetnya tidak ada kaitan dengan usia mahasiswa, maka data ini bisa kita biarkan.
Explore & Visualize Data
Explore & Visualize Data
Setelah Data sudah bersih, kita dapat melakukan eksplorasi dan visualisasi data untuk mencari tahu hubungan antar variable. Yang dimaksud variable adalah karakteristik dari suatu data, misalkan pada data mahasiswa ada variable nama, Alamat, asal sekolah, dan sebagainya.
Eksplorasi data dilakukan dengan memeriksa variable-variable yang ada, dimulai dari variable target, satu per satu. Selanjutnya dilakukan perbandingan antar pasangan variable yang ada untuk mencari tahu relasi antara dua variable.
Terakhir, kita lakukan eksplorasi untuk mencari tahu relasi antara tiga variable atau lebih. Visualisasi data yang baik dapat membantu kita dalam mengidentifikasi relasi antar variable-variable tersebut
Analyze & Interpret Data
Analyze & Interpret Data
Dari tahapan eksplorasi data kita bisa mendapatkan pola umum dari data yang kita miliki. Akan tetapi hal itu masih belum cukup untuk digunakan dalam membuat suatu kesimpulan yang spesifik.
Langkah berikutnya yang perlu kita lakukan adalah melakukan eksplorasi yang lebih detail, untuk mendapatkan pola dan relasi yang lebih jelas. Lalu melakukan uji statistic dan membangun model statistic. Dengan melakukan semua hal ini, kita bisa mendapatkan klaim yang lebih kuat untuk kemudian memperluas klaimnya ke populasi yang lebih umum.
Communicate With Data
Communicate With Data
Pada tahap terakhir, kita akan focus ke strategi bagaimana menulis, menjelaskan, dan mempresentasikan hal-hal yang sudah kita temukan ke berbagai audiens. Kita bisa mempertajam visualisasi data yang sudah kita dapatkan pada tahap sebelumnya agar lebih mudah dipahami oleh audiens. Akan lebih baik lagi jika kita bisa membuat visualisasi yang interaktif.
Download Materi Power Point
https://drive.google.com/drive/folders/16tV2vXyDXEE5I_D1q4huG7R80LyLucwj?usp=drive_link
Referensi
-