Beberapa di antaranya termasuk: Apache Hadoop: Sebuah framework open-source yang memungkinkan penyimpanan dan pemrosesan data besar secara terdistribusi. Hadoop menggunakan sistem file terdistribusi (HDFS) untuk menyimpan data dan MapReduce untuk memprosesnya. Apache Spark: Sebuah engine pemrosesan ... data yang cepat dan umum digunakan untuk analisis big data. Spark mendukung pemrosesan batch dan streaming, serta memiliki API untuk berbagai bahasa pemrograman, termasuk Python. NoSQL Databases: Basis data yang dirancang untuk menyimpan dan mengelola data tidak terstruktur atau semi-terstruktur.
Spark
- Home
- Spark