5v Big Data dan Karakteristik big data 3v, 4v,5v, 6v, 8v

5v Big data adalah 5 ciri ciri yang mencerminkan data tersebut adalah big data, Pada awalnya big data hanya mempunyai 3 karakteristik atau yang dikenal dengan 3v big data, namun kemudian berkembang menjadi 4v big data dan yang terbaru menjadi 5v big data bahkan menjadi 6,7,8,10 17 bahkan 42 karakteristik, untuk mempermudah karakteristik pertama akan kita bahas mengenari arti dari karakteristik big data

Karakteristik big data

Apa karakteristik big data? karakteristik big data adalah sifat sifat, keistimewaan ataupun ciri ciri yang mencerminkan bahwa data tersebut adalah data yang di kategorikan sebagai big data, untuk lebih lanjut berikut karakteristik big data :

3v Big Data 

Apa itu 3v dalam big data?

Big data 3v adalah sebutan untuk 3 karakteristik big data yang terdiri dari volume, variety dan velocity 

berikut penjelasan 3 karakteristik big data :

1. Volume

Apa itu volume dalam big data?

Volume dalam big data 3v ini diartikan sebagai kuantitas atau jumlah data yang dihasilkan dari banyak transaksi serta volume data yang disimpan.

Apa saja contoh data ini? Bisa berbentuk log history pengguna seperti history browser, pencatatan transaksi pada ecommerce, data ktp atau data penduduk indonesia, data pelanggan pada perbankan dan masih banyak lagi.

Ukuran big data biasanya menggunakan skala Terabytes (per 1000 Gigabytes) dan ukuran Petabytes (per 1000.000 Gigabytes), pada contohnya berdasarkan publikasi yg dilakukan oleh facebook di https://research.fb.com/blog/2014/10/facebook-s-top-open-data-problems , facebook menghasilkan sejumlah 400 petabytes per hari atau 400.000.000 Gigabytes per hari,  tentu data sebesar ini sudah dikategorikan sebagai big data

2. Variety

Apa yang dimaksud dengan Variety dalam big data 3v?

variety ini artinya variasi tipe dan variasi sifat dari data, apakah data tersebut bersifat terstruktur / structured, semi terstruktur ataupun tidak terstruktur

  • Apa itu data terstruktur atau Structured data?

Data terstruktur / structured data adalah data yang mempunyai elemen-elemen yang dapat di akses seperti keys (primary key, relational keys, foreign key) untuk dapat dianalisis ataupun data yang disimpan pada format tertentu contohnya data yang berada pada relational database ataupun database SQL

  • Semiterstruktur / Semi-structured data

Informasi yang tidak disimpan dalam relational database tetapi mempunyai pattern atau terorganisir dengan rapi sehingga lebih mudah untuk di analisa, dengan sedikit pengolahan kita dapat menyimpan data ini ke dalam relational database contohnya data pada file XML dan csv yang sering dipergunakan untuk export data pada database.

  • Data Tidak Terstruktur / Unstructured data

Informasi atau data yang tidak terorganisir dengan baik karena sifat alaminya, atau tidak memiliki predefined data model  atau model yang sudah terdefinisi contohnya file gambar, suara, vidio, pdf, log files dan lainnya

3. Velocity

Apa itu Velocity dalam big data?

Velocity dalam 3v big data ini artinya adalah kecepatan dalam men generate data, mengakses data serta memproses data. big data platform dan big data analytics software tentu harus dapat memproses banyak data secepat mungkin ketika ada request, contoh velocity salah satunya adalah pada search engine google, berdasarkan data pada https://www.internetlivestats.com/google-search-statistics/ google harus memproses rata-rata 40.000 pencarian setiap detiknya.

 

Big Data 4v

Apa itu 4v big data?

4v big data adalah karakteristik big data yang terdiri dari volume, variety, velocity dan veracity, pada 4v big data ini bertambah Veracity 

4. Veracity 

Apa itu veracity pada big data? Veracity dalam big data 4v ini bermaksud pada truthfulness, reliability, quality and availability of the data, yang dapat diartikan dalam bahasa indonesianya adalah bahwa data yang ada ini dapat dipercaya kebenarannya, dapat diandalkan, berkualitas serta dapat dapat diakses dengan baik.

Contoh pada veracity dalam bisnis yaitu ketika semakin besar data biasanya data ini akan semakin sulit untuk di jaga ataupun di maintenance keakuratan datanya terutama pada jenis data bergerak contohnya data informasi pelanggan, data partner perusahaan, data keluarga, data-data ini pasti dalam beberapa bulan ataupun tahun pasti ada perubahan misalnya pada data pelanggan, ada pelanggan yang mengganti nomor handphone, ganti email, pindah alamat ataupun dalam kasus data pada keluarga misalnya keluarga yang tadinya belum memiliki anak pada tahun lalu sekarang sudah memiliki anak ataupun ada anggota keluarga yang sudah meninggal.

Lantas mengapa data-data perusahaan tersebut harus akurat?  karena data-data ini dipergunakan untuk big data analytics tentu datanya harus akurat kalau tidak, saat melakukan analisa akan menghasilkan analisis yang salah, biasanya di perusahaan besar ada yang melakukan kegiatan update / pembaharuan data salah satunya update data customer. Pada kegiatan ini perusahaan akan menghubungi dan meminta customer mereka untuk melakukan update data seperti umur, alamat tempat tinggal, nomor handphone, email ataupun social media jika ada perubahan agar ketika perusahaan melakukan analisa menghasilkan analisis yang akurat ataupun saat mereka melakukan kegiatan marketing, campaign mereka yang berbentuk sms informasi, email penawaran produk dapat tersampaikan kepada customer dengan baik.

 

5v Big Data

Apa saja 5v dalam big data?

5v dalam big data ada volume, variety, velocity, veracity dan value, pada big data 5v bertambah satu karateristiknya yaitu value

5. Value

Value ini merupakan puncak dari 5v big data dan karakteristik yang paling penting dalam analisa bisnis. Value pada 5v big data ini bermaksud pada nilai pada data, nilai pada data ini juga bergantung pada isi data dan bergantung pada skill tim data analyst yang menganalisa data, dengan data dan pengolah yang tepat, big data ini dapat menghasilkan informasi yang sangat berharga untuk mengambil suatu keputusan.

Contoh value dalam 5v big data salah satunya adalah  informasi yang dapat dihasilkan oleh big data dalam use case satu data indonesia,  dengan satu data indonesia, pemerintah dapat mengambil berbagai data dari berbagai kementrian ataupun instansi, misalkan program ketahanan pangan indonesia.

Dalam contoh program ketahanan pangan ini pemerintah dapat menganalisa ketahanan pangan indonesia menggunakan data kementerian pertanian, perdagangan dan instansi terkait untuk melihat kapasitas produksi pangan, stok pangan, serta kebutuhan pangan indonesia, dengan data-data serta analisa, pemerintah dapat memprediksi kapan indonesia akan mengalami kekurangan stok pangan, maka dari itu untuk mencegah indonesia kekurangan pangan, pemerintah dapat meluncurkan program penambahan kapasitas produksi pangan dan juga impor pangan untuk mencukupi kebutuhan pangan dalam negeri,

untuk melihat use case satu data indonesia dapat anda baca disini use case satu data indonesia.

 

setelah membahas 3v 4v 5v big data ternyata selain 3 versi tersebut terdapat juga karakteristik lainnya ada yang berjumlah 6, 7,8 10 bahkan lebih, pada beberapa sumber  menyebutkan beberapa karakteristik dengan jumlah yang sama namun setiap  isi dari karakteristiknya berbeda beda  sehingga agak sulit untuk menentukan validitas sumber ini, namun untuk tujuan menambah wawasan artikel ini akan membahas karakteristik tersebut 

 

6v big data 

6v big data bertambah 1 yaitu Variability

6. Variability

Variability dalam big data ini adalah variabel yang digunakan yang akan berdampak ke seberapa jauh dan seberapa cepatnya perubahan yang terjadi pada struktur data serta seberapa sering meaning atau bentuk dari data perusahaan berubah

contohnya ada perusahaan yang memberikan layananan berlangganan novel berikut beberapa opsinya:

  • harga novel digital / versi apps seharga Rp 50.000 perbulan
  • harga novel dalam bentuk cetak seharga Rp 100.000 
  • harga berlangganan internet ke provider seharga Rp 50.000  

dari opsi tersebut perusahaan akan membuat kuesioner berikut simulasinya :

jika pelanggan disuruh memilih hanya salah satu opsi dari 3 opsi diatas maka akan terlihat tidak masuk akal karena kemungkinan besar pelanggan akan mengambil 2 opsi yaitu novel dalam bentuk cetak dan berlangganan internet karena lebih menguntungkan untuk pelanggan, tetapi jika pelanggan disuruh memilih antara berlangganan novel dalam bentuk cetak dan berlangganan internet tentu pelanggan akan memilih berlangganan internet

dari simulasi diatas akan terlihat komposisi pertanyaan dan aturan dalam kuesioner akan merubah pandangan orang dan juga akan merubah hasil dari kuesioner jika dalam bahasa teknis, jika anda merubah variable maka model big data juga akan berubah

 

7v big data

dalam big data 7 v bertambah Visualization

Visualization

Visualization adalah bagaimana cara kita memvisualisasi data yang besar dan kompleks menggunakan chart dan graphz ataupun bentuk visualisasi yang lain sehingga pembaca dapat lebih mudah mengerti data yang disajikan dibanding menggunakan beberapa file excel ataupun dokumen yang penuh dengan angka serta formula 

8v big data 

8 v big data terdapat ke dalam 17v Big data

10v big data

big data 10 v termasuk ke dalam 17v Big data

17V Big Data

Berdasarkan International Research Journal of Engineering and Technology (IRJET) dengan judul 17 V big Data 

terdapat 17 karakteristik yaitu 

No Big DataCharacteristics Elucidation Description
1 Volume Size of Data Quantity of collected and stored data. Data size is in TB
2 Velocity Speed of Data The transfer rate of data between source and destination
3 Value Importance of Data It represents the business value to be derived from big data
4 Variety Type of Data D Different type of data like pictures, videos and audio arrives at the receiving end
5 Veracity Data Quality Accurate analysis of captured data is virtually worthless if it’s not accurate
6 Validity Data Authenticity Correctness or accuracy of data used to extract result in the form of information
7 Volatility Duration of Usefulness Big data volatility means the stored data and how long
8 Visualization Data Act/ Data Process It is a process of representing abstract
9 Virality Spreading Speed It is defined as the rate at which the data is broadcast /spread by a user and received by different users for their use
10 Viscosity Lag of Event It is a time difference the event occurred and the event being described
11 Variability Data Differentiation Data arrives constantly from different sources and how efficiently it differentiates between noisy data or important data
12 Venue Different Platform Various types of data arrived from different sources via different platforms like personnel system and private & public cloud
13 Vocabulary Data Terminology Data terminology likes data model and data structures
14 Vagueness Indistinctness of existence in a Data Vagueness concern the reality in information that suggested little or no thought about what each might convey
15 Verbosity The redundancy The redundancy of the information available at different
sources because data can be classified into 2, good data and bad data, good data comes from secured,relevant, complete & trustworthy
16 Voluntariness The will full The will full availability of big data to be used according to the context
17 Versatility Flexible ability “The ability of big data to be flexible enough to be used differently for different context.”
18 Complexity Correlation of Data Data comes from different sources and it is necessary to figure out the changes whether small or large in data with respect to the previously arrived data so that information can get quickly

 

yang di translasikan ke dalam bahasa indonesia menjadi

No karakteristik Big Data penjelasan singkat Deskrpsi
1 Volume Size of Data Kualitas dari data yang dikumpulkan dan disimpan. besaran data yang digunakan dalam TB
2 Velocity Speed of Data Kecepatan transfer antara sumber dan tujuan data
3 Value Importance of Data Hal yang merepresentasikan nilai bisnis yang dihasilkan oleh big data
4 Variety Type of Data D beragai jenis data seperti gambar, video dan audio
5 Veracity Data Quality Keakuratan analisis dari data yang di ambil, hasil analisa akan tidak bernilai jika data tidak akurat
6 Validity Data Authenticity validitas, kebenaran dan akurasi dari data yang digunakan untuk membuat suatu informasi
7 Volatility Duration of Usefulness Seberapa lama data disimpan
8 Visualization Data Act/ Data Process Bagaimana cara melakukan visualisasi atau menyajikan data
9 Virality Spreading Speed seberapa cepat data di sebarkan oleh user dan seberapa cepat data diterima oleh user lainnya untuk dipergunakan
10 Viscosity Lag of Event perbedaan waktu antara saat suatu kejadian terjadi dan data atas kejadian tersebut dibuat
11 Variability Data Differentiation data datang secara konstan dari sumber yang berbeda
12 Venue Different Platform Berbagai jenis data datang dari sumber yang berbeda melalui platform yang berbeda seperti data pelanggan pada website pada internal perusahaan dan juga data datang dari platform eksternal seperti google analytic
13 Vocabulary Data Terminology Data terminologi seperti data model dan data structures
14 Vagueness Indistinctness of existence in a Data Ketidakjelasan yang antara data satu dengan yang lainnya
15 Verbosity The redundancy redudansi informasi yang tersedia dari berbagai sumber
16 Voluntariness The will full ketersediaan penuh akan big data yang digunakan sesuai dengan konteksnya
17 Versatility Flexible ability kemampuan big data untuk beradaptasi secara fleksible untuk dipergunakan untuk berbagai
18 Complexity Correlation of Data kolerasi antar satu data dengan data lainnya sehinga dapat menemukan informasi lebih cepat

 

42 V of Big Data 

berdasarkan Elder Research terdapat 42 v dari big data yaitu :

  1. Vagueness: The meaning of found data is often very unclear, regardless of how much data is available.
  2. Validity: Rigor in analysis (e.g., Target Shuffling) is essential for valid predictions.
  3. Valor: In the face of big data, we must gamely tackle the big problems.
  4. Value: Data science continues to provide ever-increasing value for users as more data becomes available and new techniques are developed.
  5. Vane: Data science can aid decision making by pointing in the correct direction.
  6. Vanilla: Even the simplest models, constructed with rigor, can provide value.
  7. Vantage: Big data allows us a privileged view of complex systems.
  8. Variability: Data science often models variable data sources. Models deployed into production can encounter especially wild data.
  9. Variety: In data science, we work with many data formats (flat files, relational databases, graph networks) and varying levels of data completeness.
  10. Varifocal: Big data and data science together allow us to see both the forest and the trees.
  11. Varmint: As big data gets bigger, so can software bugs!
  12. Varnish: How end-users interact with our work matters, and polish counts.
  13. Vastness: With the advent of the Internet of Things (IoT), the “bigness” of big data is accelerating.
  14. Vaticination: Predictive analytics provides the ability to forecast. (Of course, these forecasts can be more or less accurate depending on rigor and the complexity of the problem. The future is pesky and never conforms to our March Madness brackets.)
  15. Vault: With many data science applications based on large and often sensitive data sets, data security is increasingly important.
  16. Veer: With the rise of agile data science, we should be able to navigate the customer’s needs and change directions quickly when called upon.
  17. Veil: Data science provides the capability to peer behind the curtain and examine the effects of latent variables in the data.
  18. Velocity: Not only is the volume of data ever increasing, but the rate of data generation (from the Internet of Things, social media, etc.) is increasing as well.
  19. Venue: Data science work takes place in different locations and under different arrangements: Locally, on customer workstations, and in the cloud.
  20. Veracity: Reproducibility is essential for accurate analysis.
  21. Verdict: As an increasing number of people are affected by models’ decisions, Veracity and Validity become ever more important.
  22. Versed: Data scientists often need to know a little about a great many things: mathematics, statistics, programming, databases, etc.
  23. Version Control: You’re using it, right?
  24. Vet: Data science allows us to vet our assumptions, augmenting intuition with evidence.
  25. Vexed: Some of the excitement around data science is based on its potential to shed light on large, complicated problems.
  26. Viability: It is difficult to build robust models, and it’s harder still to build systems that will be viable in production.
  27. Vibrant: A thriving data science community is vital, and it provides insights, ideas, and support in all of our endeavors.
  28. Victual: Big data — the food that fuels data science.
  29. Viral: How does data spread among other users and applications?
  30. Virtuosity: If data scientists need to know a little about many things, we should also grow to know a lot about one thing.
  31. Viscosity: Related to Velocity; how difficult is the data to work with?
  32. Visibility: Data science provides visibility into complex big data problems.
  33. Visualization: Often the only way customers interact with models.
  34. Vivify: Data science has the potential to animate all manner of decision making and business processes, from marketing to fraud detection.
  35. Vocabulary: Data science provides a vocabulary for addressing a variety of problems. Different modeling approaches tackle different problem domains, and different validation techniques harden these approaches in different applications.
  36. Vogue: “Machine Learning” becomes “Artificial Intelligence”, which becomes…?
  37. Voice: Data science provides the ability to speak with knowledge (though not all knowledge, of course) on a diverse range of topics.
  38. Volatility: Especially in production systems, one has to prepare for data volatility. Data that should “never” be missing suddenly disappears, numbers suddenly contain characters!
  39. Volume: More people use data-collecting devices as more devices become internet-enabled. The volume of data is increasing at a staggering rate.
  40. Voodoo: Data science and big data aren’t voodoo, but how can we convince potential customers of data science’s value to deliver results with real-world impact?
  41. Voyage: May we always keep learning as we tackle the problems that data science provides.
  42. Vulpine: Nate Silver would like you to be a fox, please.

 

Pertanyaan terkait karakteristik big data

1. karakteristik big data yang menggambarkan data harus dapat dipercaya kebenarannya adalah veracity 

2. karakteristik big data yang menggambarkan data datang dengan kecepatan yang sangat cepat adalah velocity

3. karakteristik big data yang menggambarkan data datang dari banyak sumber yang berbeda adalah variety

variety,  jika karakteristik dalam pertanyaan ini hanya terbatas pada 5v big data karena pada karakteristik ini data bersumber dari data yang bervariasi yang berarti sumber data juga berbeda namun jika karakteristik ini boleh diluar dari 5v big data maka venue bisa dijadikan jawaban karena venue adalah jenis jenis platform sebagai sumber data yang didapatkan untuk big data

4. karakteristik dari big data adalah sifat sifat, keistimewaan ataupun ciri ciri yang mencerminkan bahwa data tersebut adalah data yang di kategorikan sebagai big data

5. karakteristik big data yang berkaitan dengan kecepatan memproses data yang dihasilkan dari berbagai sumber disebut velocity 

6. maksud dari karakteristik big data veracity adalah data yang ada pada big data dapat dipercaya kebenarannya, dapat diandalkan, berkualitas serta dapat dapat diakses dengan baik.

7. karakteristik big data terkait tipe data yang dapat diolah adalah variety

8. data harus dapat dipercaya kebenarannya adalah salah satu karakteristik big data veracity 

9. karakteristik big data yang menggambarkan data data dari banyak sumber yang berbeda adalah variety

Ingin lebih mengenal big data secara lebih lengkap? silahkan baca artikel lengkap mengenai Big Data

0 Comments

Leave a reply

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

*

Contact Us
ID : (021) 2708 8011
Outside the ID : +62 21 2708 8011

CONTACT US

We're not around right now. But you can send us an email and we'll get back to you, asap.

Sending

Log in with your credentials

or    

Forgot your details?

Create Account