Основные службы - Hadoop

  1. NameNode - работает на "главной" машине - распределяет задачи ввода-вывода для подчинённых - "знает" на какой из подчинённых машин что лежит
  2. DataNode - работает на подчинённых узлах непосредственно с блоками -периодически передаёт NameNode данные о своём состоянии и получает от последнего задания по считыванию и записи данных
  3. Secondary NameNode - следит за состояниям кластера периодически делая "снимки" метаданных HDFS - полезен при восстановлении работы.
  4. JobTracker (его логически заменили на ResourceManager в версии 2.0) - посредник между хадупом и приложением
  5. TaskTracker (замёнён на NodeManager в 2.0)- служба вычислений подчинённых машин работает по управлением JobTracker