В задании Hadoop только для редукции входные файлы обрабатываются средством сопоставления удостоверений и отправляются редукторам без изменений. В какой-то своей работе я был очень удивлен, увидев, что задание не удалось на этапе карты с «Ошибкой нехватки памяти» и «Превышено ограничение накладных расходов GC».
В моем понимании, об утечке памяти на карте идентификации не может быть и речи. Что может быть причиной такой ошибки?