Power Query – recurso excelente, interface nem tanto
Excelente recurso para realizar sua ETL, mesmo com uma interface que ainda precisa ser bastante melhorada.
EXCELANÁLISE DE DADOS
10/29/20233 min read


Apresentação
Power query é uma ferramenta de ETL (Extração, Transformação e Carga dos dados – veja post específico no blog DataRoma) que foi incluída no MS-Excel a partir de 2016. Criada em 2010, estava disponível para ser instalada como um complemento ao Excel. Atualmente também está integrada ao Microsoft Power BI. A figura 1 ilustra detalhes da barra de menus da interface gráfica.
Resgatando um trecho do post sobre a ETL, “Os dados, antes de serem extraídos, precisam ser identificados e analisados com o propósito de avaliarmos se serão úteis ou não. Em seguida devem ser extraídos de fontes diversas, corrigidos, completados, excluídos, preenchidos e/ou transformados de modo que possam ser utilizados conjuntamente pelo modelo de dados que propiciará condições para a solução do nosso desafio. Por fim é preciso carregá-los para nossa plataforma final de modo que se tornem disponíveis para iniciarmos as análises exploratórias...”.
Pois bem, o Power query agrega ao Excel recursos que possibilitam acesso a inúmeras e distintas fontes e bases de dados: planilhas do Excel, arquivos CSV, bancos de dados comerciais, sites da web e APIs, dentre outras várias possibilidades. A figura 2 ilustra algumas dessas várias alternativas de conexão – são apresentadas as opções.




O editor gráfico que hospeda a interface do Power Query é muito útil, mas bastante simples. Precisaria ser melhorado e muito para chegar próximo das facilidades que o Excel oferece. Ainda assim proporciona quase tudo o que necessitamos.
Entretanto, em alguns casos pode se fazer necessário algum tipo de ajuste específico que o editor não permite e, nessas situações, pode-se utilizar a linguagem de transformação de dados do Power Query, batizada de Power Query Formula Language, mas conhecida por todos e até mesmo pela Microsoft como linguagem M. A figura 4 ilustra um trecho de código em M que reflete as etapas do roteiro/script apresentado na figura 3.


Como funciona
Toda esta variedade de fontes de dados pode ser processada de forma independente e por meio de roteiros específicos que são gravados como scripts gerados à medida que as ações são realizadas sobre uma determinada fonte de dados. Uma vez que esses scripts tenham sido criados, sempre que for necessário, podem ser reexecutados de modo a atualizar o processamento com novos dados e informações que tenham sido recebidos e/ou acrescidos às fontes. A figura 3 ilustra um roteiro/script com três passos.


A figura 5 ilustra alguns dos recursos de transformação de dados disponíveis para cada coluna de dados do editor gráfico.
Concluindo
Este texto, embora simples e sem exemplos complexos apresentados passo a passo, fornece uma boa ideia das facilidades que o Power Query oferece, dentre as quais vale destacar: (1) a diversidade de tipos e fontes de informação, (2) as várias possibilidades de limpeza e transformação dos dados, (3) a capacidade da linguagem M de criar fórmulas específicas e (4) a agilidade que a reutilização dos roteiros/scripts gravados proporciona sempre que for preciso atualizar ou reprocessar os dados de entrada.
Para se aprofundar no assunto e aprender ou relembrar como se utilizam todos os seus recursos, consulte os links disponíveis em Saiba +. Se desejar mais informações ou dicas, entre em contato comigo, aqui mesmo pelo Dataroma.
Saiba +
Apresentação do Power Query fornecida pela Microsoft e com exemplo e link para maiores informações sobre a linguagem M: https://learn.microsoft.com/pt-br/power-query/power-query-what-is-power-query, acesso em outubro de 2023.
Documentação do Power Query fornecida pela Microsoft (textos em inglês) https://learn.microsoft.com/en-us/power-query/, acesso em outubro de 2023.

