O trabalho consistiu em identificar e resolver todos os requisitos para o desenvolvimento de uma Aplicação TensorFlow em uma infraestrutura de BigData.
Para esse trabalho, a "anatomia" de uma Aplicação TensorFlow que foi considerada consiste em dois componentes:
-
o treinamento (aprendizado): o código é em Python, precisa de acesso a dados e poder de processamento.
Esse programa deve ser empacotado para rodar no YARN (Hadoop, RedHat EL 6)
-
a API de consulta (inferência): o código é em C++, recebe requisições com dados "reais" e retorna o resultado a partir da versão mais recente de um "modelo treinado"
Esse programa deve ser empacotado para rodar no Tsuru (Ubuntu LTS 14.04)
...
Para integrar uma aplicação que usa essa "Inteligência Artificial", é necessário usar um Cliente que "faça requisições" ao servidor de inferência (2).
Essa funcionalidade pode ser implementada em qualquer linguagem e é feita com Python nos exemplos do TensorFlow.
Para esse trabalho, o interesse é integrar com Aplicações em Scala, logo um cliente Java satisfaz o requisito (Java 7).
Todas as POCs rodam dentro do Docker e foram testadas no Linux e no Mac (usando Docker on Mac).
Além do Docker, não precisa de mais nada instalado na máquina.
A POC tflearn_wide_n_deep foi o aquecimento rodando um exemplo do TensorFlow.
As POCs tfserving_basic, tfserving_advanced e skeleton_project correspondem ao trabalho de criar um projeto que consiste de algoritmo Python para treinamento e servidor C++ para servir o modelo (tem um cliente Python para validar o funcionamento).
As POCs yarn_training, tensorflow_centos6, tensorflow_installer, hadoop_centos6 e hadoop_ubuntu1604 correspondem ao trabalho de fazer o treinamento usando YARN (Hadoop) no RedHat EL 6 (produção).
A POC client_java corresponde ao trabalho de usar em uma aplicação Java/Scala um serviço do TensorFlow.
A POC server_tsuru corresponde ao trabalho de criar uma app no Tsuru para servir um modelo treinado do TensorFlow.
Usando TF Learn para criação de modelo.
Usando TF Serving para servidor de modelo sem versionamento.
Usando TF Serving para servidor de modelo com versionamento.
Usando Bazel para build de um projeto TensorFlow.
Usando YARN para treinar um modelo com TensorFlow.
Build do TensorFlow para CentOS 6.
Instalador para o TensorFlow usando shell script autocontido (sem download).
Instância do Hadoop rodando no CentOS 6 para rodar o treinamento do TensorFlow.
Instância do Hadoop rodando no Ubuntu 16.04 para rodar o treinamento do TensorFlow.
Usando gRPC para construir um Cliente Java que faz requisições em um servidor de modelo TensorFlow Serving.
Usando Tsuru para servir um modelo treinado do TensorFlow.