Tìm hiểu mô hình mapreduce trên nền tảng Hadoop và ứng dụng minh họa

Thứ hai - 17/04/2017 03:23

Xử lý dữ liệu lớn là một trong những vấn đề mà các cá nhân, công ty, doanh nghiệp cũng như các tập đoàn lớn trên thế giới đặc biệt quan tâm trong những năm gần đây. Điển hình gã khổng lồ Google đã lập chỉ mục 10 tỷ hình ảnh, YouTube xử lý 35 giờ nội dung được tải lên mỗi phút, Twitter xử lý 600 triểu truy cập máy tính hàng ngày… Đó là những gì mà tôi muốn đưa ra khi nói về dữ liệu lớn. Đã có lúc dữ liệu trên một quy mô lớn như vậy chỉ được sử dụng trong các tập đoàn lớn có khả năng mua siêu máy tính đắt tiền và thuê nhân viên để duy trì. Ngày nay, với việc hạ thấp chi phí lưu trữ và sức mạnh xử lý trở nên thông dụng, các công ty nhỏ hơn và một số cá nhân, đã bắt đầu lưu trữ và khai phá dữ liệu tương tự như vậy lưu trữ dữ liệu lên trên nhiều đĩa cứng thay vì chỉ một.

Chi tiết download ở file đính kèm

Ý kiến bạn đọc

Những tin mới hơn

Những tin cũ hơn