Nesta postagem irei falar da etapa de extração, etapa inicial do processo de ETL.
A extração é feita de ambientes OLTP, ou seja ambientes de produção, ambientes transacionais, que são alimentados a todo minuto, o processo de ETL não abstrai todos os dados do ambiente transacional, somente as informações relevantes para o negócio são extraídas, tratadas, e importadas para o ambiente OLAP, ou seja para o Data Warehouse para ser usado na analise de negócio.
O Processo
O primeiro passo é definir as fontes de extração, e os dados podem vir das mais diversas fontes, sistemas de gestão(SIG, ERP, CRM e etc), diversos SGBD's (Oracle, SQLSERVER, DB2 e etc), e até arquivos mais triviais como planilhas do excel, e documentos de texto.
Depois de definir as fontes, é necessário definir a ferramenta que irá fazer a extração. Um exemplo de ferramenta é a que vem acoplada ao SQLSERVER, o Integration Services, e existem outras diversas ferramentas como poderio variado como o Power Center da empresa Informática, e o DataStage da IBM, entre outras, cabe ao analista do projeto definir qual ferramenta será usada no seu projeto, avaliando a sua necessidade, custo e etc.
A maioria das ferramentas faz o processo completo de ETL, porém nesse post falamos apenas da etapa de extração de dados e suas fontes.
Então é isso pessoal, na semana que vem eu irei fazer um post sobre a etapa de transformação do processo de ETL.
Deixe seu feedback nos comentários.
Nenhum comentário:
Postar um comentário