Немного вопросов о Hadoop? - hadoop ВОПРОСЫ

  1. Тасовка - это процесс пересылки данных от разных мэпперов разным редукторам?
  2. Один мэппре работает с одним входным разбиением (InputSplit) -но может ли быть так что InputSplit настолько большой,что не умещается на одном узле (или их память столь мала) -сколько мэпперов запустится тогда?
  3. Эта загрузки входных данных в процессе выполнения задачи - это вообще что? Разве данные не лежат там, где они оказались после того как их загрузили в HDFS?