A Microsoft facilitou o trabalho de quem gosta de usar o Excel e deseja realizar conexão aos datasets (modelos semânticos na nova nomenclatura definida pela Microsoft) do Power BI. Agora é possível acessar nossos conjuntos de dados conectando pelo próprio Excel na opção “Obter Dados” ou clicando no botão “Analisar no Excel” no dataset/relatório publicado dentro do serviço Power BI (imagens abaixo):
Essa funcionalidade gerou uma oportunidade de evoluir nosso desenvolvimento no Power BI para simplificar a utilização pelos usuários de Excel. Abaixo listamos 5 dicas para otimizar nossos datasets!
1) Criar tabela de medidas no Power Query
Uma boa forma de organizar as métricas (cálculos) é criar uma tabela própria para elas no início do modelo. A forma mais simples de fazer isso é criando uma tabela vazia na opção “Enter Data” e colocando o nome de “Métricas”, por exemplo (imagem a seguir):
Na sequência criamos uma nova métrica dentro dessa tabela e a exibição ficou conforme abaixo:
Para concluir a formatação vamos ocultar a coluna “Column1” que existia na tabela, para que assim ela se torne uma tabela apenas de medidas e fique no início do modelo, conforme a imagem a seguir:
2) Criar pastas de exibição das medidas
Outra prática recomendada para organização das métricas é separar em pastas por assunto ou finalidade. Para fazer isso no Power BI precisamos ir até a aba “Model”, selecionar a métrica que desejamos incluir em uma pasta e colocar o nome da pasta na opção “Display Folder”, conforme a seguir:
Após adicionar os nomes das pastas (“Unidades” e “Valor”) em cada uma das métricas, a exibição no modelo pode ficar conforme a imagem abaixo:
3) Modelar os dados com fatos e dimensões
Um padrão de modelagem de data warehouse importante por questões de performance e organização do modelo e que devemos aplicar no desenvolvimento do nosso Power BI é o que chamamos de “star schema”, onde temos tabelas fato que são as transações ou eventos e tabelas de dimensão, que são as descrições destes fatos. Para quem nunca ouviu falar disso e quiser entender um pouco mais, este link é um bom começo!
4) Criar tabelas de tempo (calendário)
Praticamente todos os modelos de BI possuem análises em função do tempo (total por ano, mês, dia…), então é fundamental que o dataset tenha um tabela de calendário ou dimensão de tempo. Normalmente o ideal é que essa tabela já venha de alguma origem, como um data warehouse. Realizando a criação dentro do Power BI temos várias opções conforme este link da Microsoft mostra, porém pode ser uma vantagem criar a tabela de tempo dentro do Power Query através de uma função (esse link tem um bom exemplo disso).
5) Ocultar colunas desnecessárias
Uma das principais dificuldades ao utilizar um dataset do Power BI é saber quais colunas e métricas utilizar. Por isso sempre oculte do seu modelo as colunas que não são úteis para fazer filtros ou análises, como códigos internos de banco de dados ou outras que não façam sentido para o usuário final. Por exemplo, tabelas fato que já tenham métricas criadas em uma tabela separada podem ser ocultas, já que as colunas de detalhamento utilizadas estarão nas tabelas de dimensão do modelo. Esconda as colunas indo na aba “Model” clicando no botão “Ocultar”:
Esperamos que estas dicas sejam úteis no desenvolvimento do seu dataset dentro do Power BI! Tem mais alguma dica importante para compartilhar? Comente!