Создадим инфраструктуру в Yandex.Cloud с помощью Terraform
- Сервисный аккаунт
- Сеть
- Объектное хранилище S3
- Dataproc кластер
- ВМ для доступа к кластеру
Посмотрим на автоматическую загрузку данных в S3 Зайдем на мастерноду Dataproc и загрузим данные в HDFS