Name		Name	Last commit message	Last commit date
parent directory ..
Dockerfile		Dockerfile
README.md		README.md
docker-setup.sh		docker-setup.sh
hadoop-setup.sh		hadoop-setup.sh
hadoop-start.sh		hadoop-start.sh
main.sh		main.sh

README.md

Instalação do Hadoop no Ubuntu

(motivação: essa imagem corresponde ao ambiente em que o TensorFlow é oficialmente suportado, diferente do ambiente de produção RedHat, ou seja, o comportamento nesse ambiente deve representar o "funcionamento correto")

A POC é a configuração mínima do Hadoop no Ubuntu para execução do treinamento com TensorFlow no YARN.

Na prática, consiste em rodar os servidores do HDFS (NameNode e DataNode) e do YARN (ResourceManager e NodeManager) para poder executar uma aplicação (ApplicationMaster) que instale o TensorFlow e rode o script Python de treinamento.

Essa POC é só a configuração do Hadoop no Ubuntu.

Esse procedimento é executado pelo comando:

./main.sh

Essa POC consiste em:

criar uma imagem Docker do Ubuntu com Java 8 e Hadoop 2.5.

Arquivos: Dockerfile, docker-setup.sh
configurar o Hadoop criando usuário, chaves SSH, XML de configuração e formatação do HDFS em um container

Arquivo: hadoop-setup.sh
iniciar os servidores do Hadoop no container (deve ser executado toda vez que o container for iniciado)

Arquivo: hadoop-start.sh

...

Para usar esse container:

docker start hadoop_ubuntu1604

docker exec hadoop_ubuntu1604 /hadoop-start.sh

echo "$(docker exec hadoop_ubuntu1604 hostname -i)"

> 172.17.0.2

(todos os serviços do Hadoop estarão disponíveis nesse endereço)

docker stop hadoop_ubuntu1604

Para acessar o container:

docker exec -i -t hadoop_ubuntu1604 /bin/bash --login

...

Cluster Setup

http://hadoop.apache.org/docs/r2.5.2/hadoop-project-dist/hadoop-common/ClusterSetup.html

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

hadoop_ubuntu1604

hadoop_ubuntu1604

README.md

Instalação do Hadoop no Ubuntu

Files

hadoop_ubuntu1604

Directory actions

More options

Directory actions

More options

Latest commit

History

hadoop_ubuntu1604

Folders and files

parent directory

README.md

Instalação do Hadoop no Ubuntu