Tìm hiểu mô hình mapreduce trên nền tảng Hadoop và ứng dụng minh họa
Xử lý dữ liệu lớn là một trong những vấn đề mà các cá nhân, công ty, doanh nghiệp cũng như các tập đoàn lớn trên thế giới đặc biệt quan tâm trong những năm gần đây. Điển hình gã khổng lồ Google đã lập chỉ mục 10 tỷ hình ảnh, YouTube xử lý 35 giờ nội dung được tải lên mỗi phút, Twitter xử lý 600 triểu truy cập máy tính hàng ngày… Đó là những gì mà tôi muốn đưa ra khi nói về dữ liệu lớn. Đã có lúc dữ liệu trên một quy mô lớn như vậy chỉ được sử dụng trong các tập đoàn lớn có khả năng mua siêu máy tính đắt tiền và thuê nhân viên để duy trì. Ngày nay, với việc hạ thấp chi phí lưu trữ và sức mạnh xử lý trở nên thông dụng, các công ty nhỏ hơn và một số cá nhân, đã bắt đầu lưu trữ và khai phá dữ liệu tương tự như vậy lưu trữ dữ liệu lên trên nhiều đĩa cứng thay vì chỉ một.
Ý kiến bạn đọc
Những tin mới hơn
Những tin cũ hơn