[Course] Overview about Hadoop course

Effort: 5 Hours In this course you will learn about: The definition of Big Data The Hadoop architecture including MapReduce and HDFS How to use the Hadoop file system shell and the Ambari Console to work with HDFS Starting and stopping Hadoop components How to add/remove a node to/from a Hadoop Cluster Determining how much space is available on each node […]

Những kiến thức cơ bản về Apache Hive

Như đã biết thuật ngữ “big data” được sử dụng để nói đến tập dữ liệu lớn trong đó hàng ngày nó gia tăng về cả khối lượng, tốc độ và đa dạng về kiểu dữ liệu. Việc quản lý và xử lý đống dữ liệu này tạo ra một thách thức vô cùng lớn. […]

Bắt đầu với Hadoop

1- Tại sao cần Hadoop? Hay Hadoop ra đời để giải quyết vấn đề gì? Một hệ thống với dữ liệu lớn cỡ hàng Peta Bytes, thì rõ ràng việc vận hành, thực thi xử lý dữ liệu là rất khó khăn. Để giải quyết vấn đề đó, người ta chỉ có cách là làm […]