Задание
Требуемые условия завершения
Срок сдачи: вторник, 27 мая 2025, 23:59
Пройдите курс Spark и прикрепите сюда архив, содержащий :
- скриншот главной страницы курса со значком 100% прохождения
- ноутбук с выполненными заданиями п.3.20
- ноутбук с выполненными заданиями п.3.25
- скриншоты отправки задания на кластер п.4.8 и результатов его выполнения
- ноутбук с выполненными заданиями п.6.9
- ноутбук с выполненными заданиями п.6.13
- ноутбук с выполненными заданиями п.6.9
- ноутбук с выполненными заданиями п.6.16
- ноутбук с выполненными заданиями п.6.21
- скриншоты запуска какого-нибудь из перечисленных выше ноутбуков на кластере так, чтобы данные брались из HDFS
Данные, используемые в курсе, можно скачать по ссылке
Не устанавливайте библиотеку pyspark у себя на хосте. Из-за различия в версиях java она не сможет подключиться к кластеру Spark. Пользуйтесь Jupyterlab из контейнера spark-master. Он доступен по ссылке. Рабочая папка - та же, что и в предыдущем курсе: share