Hệ thống xử lý dữ liệu luồng và kiến trúc

Hệ cơ sở dữ liệu (databases), hệ thống tập tin (file systems), hệ thống hàng đợi (message queues), các công cụ đánh giá kinh doanh (bussiness intelligence tools) là những phần trong một hệ sinh thái nhằm phục vụ những mục đích khác nhau trong một kiến trúc lớn hơn của hệ thống quản lý dữ liệu

Apache Spark là gì

Apache Spark in-memory clusters đang là tiêu điểm chú ý của nhiều doanh nghiệp trong việc ứng dụng công nghệ vào phân tích và xử lý dữ liệu nhanh chóng. Trong bài viết này, tôi sẽ trình bày một bức tranh tổng quan nhất về Apache Spark, một trong những gỉai pháp đòi hỏi phải có khi muốn xử lý Big data.