domingo, 6 de outubro de 2013

O que é ETL?

CONCEITO

ETL (Extract, Transform, Load; pt: Extração, Transformação, Carga) é o processo de extração de dados de fontes transacionais(ambientes de produção), que irão alimentar o Data Warehouse.























O PROCESSO

Na imagem acima observamos em azul as fontes transacionais, que podem ser arquivos (texto, XML, planilhas e etc), sistemas de gestão da organização e etc. O processo de ETL faz a extração de dados do ambiente transacional, e dá um tratamento a esses dados, para depois alimentar o Data Warehouse com eles. Esse tratamento é o que chamamos de transformação. Esse processo de transformação consiste na padronização de dados vindos de fontes diferentes para que a informação chegue uniforme ao Data Warehouse. Por exemplo,  um sistema da organização armazena o sexo do cliente com apenas um caractere "M" ou "F", já o outro armazena "MASCULINO" ou "FEMININO", mas ao chegar ao  DW os dados tem que ter um padrão comum, essa padronização é definida pelo analista responsável pelo projeto de BI.

Abaixo segue um vídeo da Viviane Ribeiro, produzido didaticamente para ser usado em cursos Microsoft.









Nenhum comentário:

Postar um comentário