Задание
Вы обрабатываете следующий набор данных:
Rammstein|Mutter|2001
Rammstein|Sonne|2001
Rammstein|Du hast|1997
Madonna|Like a Prayer|1989
MR Job должна сохранить вывод в 2 Avro файлах: 1-й файл должен содержать все песни до1996, и 2-й с 1996.
Возможно ли достичь это и как?
- Да, нужно будет предоставить пользовательский разделитель и запустить задание с двумя редюсерами
- Нет, только один экземпляр Reducer разрешен в заданиях, которые передают выходные данные в формат Avro
- Нет, год - это 3-й столбец ввода, а не 1-й, поэтому его нельзя использовать в качестве ключа
- Да, нужно запустить MapReduce Job с 2-мя редюсерами и предоставьте пользовательский combiner