[Course] Overview about Hadoop course

Effort: 5 Hours In this course you will learn about: The definition of Big Data The Hadoop architecture including MapReduce and HDFS How to use the Hadoop file system shell and the Ambari Console to work with HDFS Starting and stopping Hadoop components How to add/remove a node to/from a Hadoop Cluster Determining how much space is available on each node […]

Những kiến thức cơ bản về Apache Hive

Như đã biết thuật ngữ “big data” được sử dụng để nói đến tập dữ liệu lớn trong đó hàng ngày nó gia tăng về cả khối lượng, tốc độ và đa dạng về kiểu dữ liệu. Việc quản lý và xử lý đống dữ liệu này tạo ra một thách thức vô cùng lớn. […]

Bắt đầu với Hadoop

1- Tại sao cần Hadoop? Hay Hadoop ra đời để giải quyết vấn đề gì? Một hệ thống với dữ liệu lớn cỡ hàng Peta Bytes, thì rõ ràng việc vận hành, thực thi xử lý dữ liệu là rất khó khăn. Để giải quyết vấn đề đó, người ta chỉ có cách là làm […]

Bắt đầu với Big Data

1) What: Big Data là gì? Khái niệm Big Data là gì theo mình không phải là quan trọng so với việc người ta có thể dùng Big Data vào việc gì và dùng nó như thế nào. Tuy nhiên, để bắt đầu với Big Data thì bạn cũng nên biết Big Data là gì […]

[Course] Overview about Big Data course

Effort: 3 Hours Lesson 1 – Big Data – Beyond the Hype Big Data Skills and Sources of Big Data Big Data Adoption Lesson 2 – What is Big Data? Characteristics of Big Data – The Four V’s Understanding Big Data with Examples Lesson 3 – The Big Data Platform Key aspects of a Big […]