Чтение листа excel в hadoop с помощью mapreduce и фильтрация столбца в нем?
Например, позвольте мне объяснить это подробно.
https://i.stack.imgur.com/DIlIT.png
Как эти данные будут там в листе excel, как показано выше, с n количеством строк, как правило, огромные данные.
Теперь нам нужно отфильтровать состояние столбца с выводом как в разных листах excel, так и в одной книге, как показано ниже:
[1]: https://i.stack.imgur.com/ZSsfa.png
[2]: https://i.stack.imgur.com/Qy5Up.png
Может ли кто-нибудь помочь мне в этом? Написание кода mapreduce для вышеперечисленного.
Что я уже пробовал:
Я ничего не знаю о Mapreduce. Я просто знаю теоретически
Richard MacCutchan
Было бы гораздо больше пользы, если бы вы действительно объяснили подробно; эти фотографии не очень полезны.