Задание

Вы обрабатываете следующий набор данных:
Rammstein|Mutter|2001
Rammstein|Sonne|2001
Rammstein|Du hast|1997
Madonna|Like a Prayer|1989

MR Job должна сохранить вывод в 2 Avro файлах: 1-й файл должен содержать все песни до1996, и 2-й с 1996.
Возможно ли достичь это и как?

  • Да, нужно будет предоставить пользовательский разделитель и запустить задание с двумя редюсерами
  • Нет, только один экземпляр Reducer разрешен в заданиях, которые передают выходные данные в формат Avro
  • Нет, год - это 3-й столбец ввода, а не 1-й, поэтому его нельзя использовать в качестве ключа
  • Да, нужно запустить MapReduce Job с 2-мя редюсерами и предоставьте пользовательский combiner