5 dicas para otimizar datasets do Power BI para o recurso “Analisar no Excel”

A Microsoft facilitou o trabalho de quem gosta de usar o Excel e deseja realizar conexão aos datasets (modelos semânticos na nova nomenclatura definida pela Microsoft) do Power BI. Agora é possível acessar nossos conjuntos de dados conectando pelo próprio Excel na opção “Obter Dados” ou clicando no botão “Analisar no Excel” no dataset/relatório publicado dentro do serviço Power BI (imagens abaixo):

Conectando no dataset do Power BI pelo Excel
Botão “Analisar no Excel” no relatório do Power BI

Essa funcionalidade gerou uma oportunidade de evoluir nosso desenvolvimento no Power BI para simplificar a utilização pelos usuários de Excel. Abaixo listamos 5 dicas para otimizar nossos datasets!

1) Criar tabela de medidas no Power Query

Uma boa forma de organizar as métricas (cálculos) é criar uma tabela própria para elas no início do modelo. A forma mais simples de fazer isso é criando uma tabela vazia na opção “Enter Data” e colocando o nome de “Métricas”, por exemplo (imagem a seguir):

Tabela em branco com nome “Métricas”

Na sequência criamos uma nova métrica dentro dessa tabela e a exibição ficou conforme abaixo:

Tabela com uma nova métrica calculada

Para concluir a formatação vamos ocultar a coluna “Column1” que existia na tabela, para que assim ela se torne uma tabela apenas de medidas e fique no início do modelo, conforme a imagem a seguir:

Formatação final da tabela de métricas

2) Criar pastas de exibição das medidas

Outra prática recomendada para organização das métricas é separar em pastas por assunto ou finalidade. Para fazer isso no Power BI precisamos ir até a aba “Model”, selecionar a métrica que desejamos incluir em uma pasta e colocar o nome da pasta na opção “Display Folder”, conforme a seguir:

Opção “Display folder” após clicar na métrica

Após adicionar os nomes das pastas (“Unidades” e “Valor”) em cada uma das métricas, a exibição no modelo pode ficar conforme a imagem abaixo:

Tabela de métricas organizada por pastas

3) Modelar os dados com fatos e dimensões

Um padrão de modelagem de data warehouse importante por questões de performance e organização do modelo e que devemos aplicar no desenvolvimento do nosso Power BI é o que chamamos de “star schema”, onde temos tabelas fato que são as transações ou eventos e tabelas de dimensão, que são as descrições destes fatos. Para quem nunca ouviu falar disso e quiser entender um pouco mais, este link é um bom começo!

“Star schema” na modelagem de dados

4) Criar tabelas de tempo (calendário)

Praticamente todos os modelos de BI possuem análises em função do tempo (total por ano, mês, dia…), então é fundamental que o dataset tenha um tabela de calendário ou dimensão de tempo. Normalmente o ideal é que essa tabela já venha de alguma origem, como um data warehouse. Realizando a criação dentro do Power BI temos várias opções conforme este link da Microsoft mostra, porém pode ser uma vantagem criar a tabela de tempo dentro do Power Query através de uma função (esse link tem um bom exemplo disso).

Função que gera dimensão de tempo no PowerQuery

5) Ocultar colunas desnecessárias

Uma das principais dificuldades ao utilizar um dataset do Power BI é saber quais colunas e métricas utilizar. Por isso sempre oculte do seu modelo as colunas que não são úteis para fazer filtros ou análises, como códigos internos de banco de dados ou outras que não façam sentido para o usuário final. Por exemplo, tabelas fato que já tenham métricas criadas em uma tabela separada podem ser ocultas, já que as colunas de detalhamento utilizadas estarão nas tabelas de dimensão do modelo. Esconda as colunas indo na aba “Model” clicando no botão “Ocultar”:

Tabela fato oculta do modelo

Esperamos que estas dicas sejam úteis no desenvolvimento do seu dataset dentro do Power BI! Tem mais alguma dica importante para compartilhar? Comente!

Referências:

Deixe um comentário