ETL – Extract Transform and Load ou Extração, Transformação e Carga dos dados

O que é, para que serve e como a extração e transformação de dados pode me ajudar.

ANÁLISE DE DADOS

Elias Roma Neto

6/17/20233 min read

Apresentação

Há muito tempo que se fala no avanço das tecnologias da informação e da comunicação, inicialmente conhecidas apenas como TI. Posteriormente ganhou o termo comunicação, possivelmente por causa da Internet. Passamos então a chamá-las de TICs (tecnologias da informação e da comunicação).

Nos últimos anos, talvez na última década, frequentemente temos nos deparado com a aplicação de dados nos negócios de diversos setores da economia. Sem repetir discussões já bastante difundidas, estamos nos acostumando e aprendendo a analisarmos os dados de forma adequada e em favor da solução de algum desafio ou problema que temos a tratar.

Tal situação coloca em destaque a ETL (Extração, Transformação e Carga dos dados), etapa muito importante dessa busca por uma solução ao nosso desafio ou problema.

Antes de avançarmos na caracterização da ETL, vale lembrar que se trata de uma etapa do processo de análise de dados que, por sua vez, faz parte da resolução de problemas e desafios cada vez mais complexos e com os quais nos deparamos continuamente. Em outras palavras, para que a análise de dados possa identificar perguntas e respostas que contribuirão para a solução desses desafios e problemas, precisamos da ETL.

O que é?

Quando visitamos uma construção qualquer, como um edifício histórico ou um prédio residencial, por exemplo, é comum dedicarmos nossa atenção para detalhes arquitetônicos, características da fachada ou aspectos de suas dependências, entre outras características daquela edificação.

No universo da análise de dados, ou melhor, em nossa jornada de utilizá-la para buscar soluções para os nossos desafios, nossa atenção é dedicada aos insights que gráficos, tabelas, indicadores e demais resultados nos apresentam.

Voltando àquela construção do início deste tópico, é muito menos comum, para não dizer raro, focarmos nossa atenção para os alicerces que sustentam aquele edifício. Menos comum ainda é dedicarmos alguns instantes da nossa atenção para pensarmos na preparação do terreno em que a construção foi erguida.

Nesta analogia com uma construção qualquer, a ETL seria o conjunto de ações de estudo e preparação do terreno e construção dos alicerces.

Os dados, antes de serem extraídos, precisam ser identificados e analisados com o propósito de avaliarmos se serão úteis ou não. Em seguida devem ser extraídos de fontes diversas, corrigidos, completados, excluídos, preenchidos e/ou transformados de modo que possam ser utilizados conjuntamente pelo modelo de dados que propiciará condições para a solução do nosso desafio. Por fim é preciso carregá-los para nossa plataforma final de modo que se tornem disponíveis para iniciarmos as análises exploratórias.

Análise exploratória

Para que serve: auxilia na compreensão dos dados e suas relações, criando condições para que você prossiga na busca por soluções para o seu desafio.

Como pode ser feita: geralmente utiliza-se dos recursos da estatística descritiva, com gráficos, mínimos, máximos, médias e valores atípicos/discrepantes (outliers), entre outros.

Para que serve e como pode me ajudar?

Indo direto ao ponto, serve para apoiar a tomada de decisões sobre como solucionar nosso desafio. Mas isso significa que nos dirá o que devemos fazer? Não, mas nos trará inúmeros insights do que podemos considerar na construção de uma solução.

Exemplificando, as informações resultantes nos guiarão por análises exploratórias que nos ajudarão a descobrir se serão ou não úteis para solucionar o problema em questão.

Enfim, a ETL prepara o terreno e os alicerces necessários para que eu possa construir soluções que atendam às minhas necessidades.

Saiba +

Consulte nos links a seguir mais detalhes sobre a ETL e outros temas correlatos: