Normalizador é uma transformação ativa, usada para converter uma única linha em várias linhas e vice-versa. É uma maneira inteligente de representar seus dados de maneira mais organizada.
Se em uma única linha houver dados repetidos em várias colunas, eles poderão ser divididos em várias linhas. Às vezes, temos dados em colunas de várias ocorrências. Por exemplo
Nome do aluno | Pontuação da classe 9 | Pontuação da classe 10 | Pontuação da classe 11 | Pontuação da classe 12 |
Aluno 1 | 50 | 60 | 65 | 80 |
Aluno 2 | 70 | 64 | 83 | 77 |
Nesse caso, a coluna de pontuação da turma se repete em quatro colunas. Usando o normalizador, podemos dividi-los no seguinte conjunto de dados.
Nome do aluno | Aula | Pontuação |
Aluno 1 | 9 | 50 |
Aluno 1 | 10 | 60 |
Aluno 1 | 11 | 65 |
Aluno 1 | 12 | 80 |
Aluno 2 | 9 | 70 |
Aluno 2 | 10 | 64 |
Aluno 2 | 11 | 83 |
Aluno 2 | 12 | 77 |
Etapa 1 - Crie a tabela de origem "sales_source" e a tabela de destino "sales_target" usando o script e importe-as na Informatica
Baixe o arquivo Sales_Source.txt acima
Etapa 2 - Crie um mapeamento tendo a origem "sales_source" e a tabela de destino "sales_target"
Etapa 3 - No menu de transformação, crie uma nova transformação
- Selecione normalizador como transformação
- Digite o nome, "nrm_sales"
- Selecione a opção de criação
Etapa 4 - A transformação será criada, selecione a opção concluída
Etapa 5 - Clique duas vezes na transformação do normalizador e, em seguida,
- Selecione a guia do normalizador
- Clique no ícone para criar duas colunas
- Insira os nomes das colunas
- Defina o número de ocorrência para 4 para vendas e 0 para o nome da loja
- Selecione o botão OK
As colunas serão geradas na transformação. Você verá a coluna de 4 números de vendas conforme definimos o número de ocorrências como 4.
Etapa 6 - Em seguida, no mapeamento
- Vincule as quatro colunas do qualificador de origem do quarto trimestre às colunas do normalizador, respectivamente.
- Vincular a coluna do nome da loja à coluna do normalizador
- Vincule as colunas store_name e vendas do normalizador à tabela de destino
- Vincular a coluna GK_sales do normalizador à tabela de destino
Salve o mapeamento e execute-o após criar a sessão e o fluxo de trabalho. Para cada trimestre de vendas de uma loja, uma linha separada será criada pela transformação do normalizador.
A saída do nosso mapeamento será como -
Nome da loja | Trimestre | Vendas |
DÉLHI | 1 | 150 |
DÉLHI | 2 | 240 |
DÉLHI | 3 | 455 |
DÉLHI | 4 | 100 |
MUMBAI | 1 | 100 |
MUMBAI | 2 | 500 |
MUMBAI | 3 | 350 |
MUMBAI | 4 | 340 |
Os dados de origem tinham colunas repetidas, nomeadamente QUARTER1, QUARTER2, QUARTER3 e QUARTER4. Com a ajuda do normalizador, reorganizamos os dados para caber em uma única coluna de QUARTER e, para um registro de origem, quatro registros são criados no destino.
Dessa forma, você pode normalizar os dados e criar vários registros para uma única fonte de dados.