Mapeamento é uma coleção de objetos de origem e destino vinculados por um conjunto de transformações. Essas transformações consistem em um conjunto de regras, que definem o fluxo de dados e como os dados são carregados nos destinos.
Um mapeamento consiste no seguinte conjunto de objetos
- Definição da fonte - a definição da fonte define a estrutura e as características da fonte, seus tipos de dados subjacentes, tipo de fonte de dados, etc.
- Transformação - os objetos de transformação definem como os dados de origem são transformados e várias funções podem ser aplicadas durante o processo
- Definição de destino - a definição de destino define o destino final onde os dados serão carregados.
- Links - os links conectam a definição de origem a diferentes transformações e tabelas de destino. Ele define como os dados fluem da origem para o destino e as transformações.
Neste tutorial, você aprenderá
- Por que você precisa de mapeamento?
- Componentes de Mapeamento
- O que é mapeamento de palco?
- Como criar um mapeamento
- Parâmetros e variáveis de mapeamento
- Como Criar Parâmetro de Mapeamento
- Como Criar Variável de Mapeamento
Por que você precisa de mapeamento?
Mapeamento é um objeto na Informatica com a ajuda do qual você pode definir como os dados de origem são modificados antes de chegarem ao destino ou ao objeto de destino. Como se você tivesse o nome do funcionário como "Bill Clinton" em seu sistema de origem e no sistema de destino, o requisito é ter o nome do funcionário no formato "Clinton Bill", essas operações podem ser projetadas no nível de mapeamento. Em termos básicos, o que você faz com os dados de origem é definido no nível de mapeamento.
Mapeamento é o objeto básico da Informatica com a ajuda do qual podemos definir os detalhes da transformação de dados e as características do objeto de origem / destino. Os mapeamentos nos ajudam a definir a transformação de dados nos níveis de colunas individuais para cada linha. Mesmo em um único mapeamento, você pode lidar com várias fontes e destinos.
Componentes de Mapeamento
Os componentes básicos de um mapeamento são
- Tabelas de origem
- Parâmetros e variáveis de mapeamento
- Objetos alvo
- Transformações de mapeamento
Existem vários objetos que constituem um mapeamento. Um mapeamento pode consistir em origens, destinos, parâmetro e variáveis de mapeamento, mapplets, várias transformações e funções definidas pelo usuário .
- Fonte de mapeamento : as fontes de mapeamento são os objetos de onde você busca os dados de origem. Pode ser uma tabela de banco de dados, arquivo simples, fonte XML ou fonte de arquivo COBOL
- Alvo de mapeamento: o alvo de mapeamento são nossos objetos de destino onde os dados processados finais são carregados. O destino do mapeamento pode ser uma tabela relacional de um banco de dados, um arquivo simples ou um arquivo XML. Fontes e destinos são obrigatórios em qualquer mapeamento, seus tipos podem ser diferentes
- Parâmetros e variáveis de mapeamento: Parâmetros e variáveis de mapeamento ajudam a criar objetos variáveis temporários que o ajudarão a definir e armazenar valores temporários enquanto mapea o processamento de dados. Os parâmetros e variáveis de mapeamento são tipos de dados opcionais definidos pelo usuário, que podem ser criados para um mapeamento e podem ser referenciados e atualizados para um requisito específico. Aprenderemos mais sobre mapeamento de parâmetros e variáveis nesta seção
- Mapplets : são objetos que consistem em um conjunto de transformação, origem ou destinos. Os mapplets geralmente são criados para reutilizar a funcionalidade existente de um conjunto de transformações. Pode ser usado em qualquer nenhum dos mapeamentos.
O que é mapeamento de palco?
Um mapeamento de estágio é um mapeamento em que criamos a réplica da tabela de origem. Por exemplo, em um sistema de produção, se você tiver uma tabela "funcionário", poderá criar uma tabela idêntica "funcionário_estágio" no esquema ETL.
Ter uma tabela de estágio local oferece várias vantagens, como tempo de inatividade de produção, não afetará seu sistema ETL porque você tem sua própria tabela "employee_stage", em vez de se referir à tabela de produção "funcionário". Em um sistema de Produção, pode haver outras operações e processos que afetam o desempenho. No entanto, quando você tem uma tabela de teste de réplica, apenas os processos ETL a acessam. Isso oferece benefícios de desempenho.
Em mapeamentos de palco,
- As tabelas de origem e destino têm estruturas idênticas
- Os dados na tabela de destino são uma réplica dos dados da tabela de origem ou
- Os dados na tabela de estágio (destino) são um subconjunto dos dados de origem.
Por exemplo, se sua tabela de origem contém detalhes de funcionários de deptno 10, 20, 30 e 40. A tabela de preparação pode ser uma tabela com registros de funcionários de deptno 10 e 30 apenas.
O objetivo de criar tabelas de estágio em Data warehouse é tornar o processo de transformação de dados eficiente, buscando apenas os dados que são relevantes para nós e também para minimizar a dependência de ETL / Data Warehouse do sistema operacional em tempo real.
Como criar um mapeamento
Neste exercício, criaremos um mapeamento de estágio, no qual a origem será "emp table" e o destino será "emptgt".
Convenção de nomenclatura - os nomes de mapeamento são prefixados com 'm_' seguido pelos nomes das tabelas de origem e destino separados por sublinhado.
Exemplo - se você estiver carregando a tabela emp_target da tabela emp, então o nome do mapeamento pode ser 'm_emp_emp_target'.
Etapa 1 - Iniciando o Mapping Designer
- Abra a ferramenta Informatica Designer
- Clique no ícone do Mapping Designer para iniciar o Mapping Designer
Etapa 2 - No Mapping Designer
- Clique no menu Mappings
- Selecione Criar Opção
Etapa 3 - Insira o nome do mapeamento como 'm_emp_emp_target' e selecione o botão OK.
O mapeamento será criado e listado na pasta de mapeamentos.
Um mapeamento deve ter pelo menos uma origem e um destino , você adicionará origens e destinos ao mapeamento.
Etapa 4 - Nesta etapa iremos,
- Selecione a tabela de origem "emp" na pasta de origens.
- Arraste e solte a tabela "emp" no designer de mapeamento.
No designer de mapeamento, a tabela de origem importada será exibida.
Observação - Ao importar qualquer tabela relacional (banco de dados) em um mapeamento, um objeto adicional do tipo de qualificador de origem também será criado. Essa transformação do qualificador de origem é necessária e ajuda o serviço de integração da Informatica a identificar a tabela do banco de dados de origem e suas propriedades. Sempre que você importar uma tabela de origem, a transformação do qualificador de origem também será criada. Você nunca deve excluir um objeto qualificador de origem em um mapeamento.
Etapa 5 - Nesta etapa iremos,
- Selecione a tabela de origem "emp_target" na pasta Destinos.
- Arraste e solte a tabela "emp_target" no designer de mapeamento
No designer de mapeamento, a "tabela de destino" será importada e exibida.
Para gerenciar o espaço de visualização, você pode iconizar esses objetos no mapeamento.
Etapa 6 - clique com o botão direito em qualquer lugar na área de trabalho vazia do designer de mapeamento e selecione a opção - Organizar todos os ícones.
Após selecionar a opção "Organizar todos os icônicos", a área de trabalho ficará assim.
Etapa 7 - Na Informatica, projetamos com o fluxo da esquerda para a direita. Portanto, as tabelas de origem devem estar no lado esquerdo e as tabelas de destino devem estar à direita. Para organizar as tabelas em nosso espaço de trabalho, selecione a tabela "emp_target" e arraste e solte-a no lado direito da tabela emp.
Após esse rearranjo, a área de trabalho ficará assim.
Nota - Use periodicamente o atalho "ctrl + s" para salvar as alterações no repositório.
Etapa 8 - Agora você tem tabelas de origem e destino em seu mapeamento, mas o mapeamento ainda não foi concluído. As tabelas de origem e destino devem ser vinculadas para concluir um mapeamento.
Para vincular a origem e os destinos
Clique duas vezes na tabela SQ_EMP e na tabela EMP_TARGET para alterar a visualização delas de icônica para gráfica.
Etapa 9 - Clique com o botão direito na área de trabalho do designer de mapeamento e selecione "Autolink" pela opção de nome.
Etapa 10 - Para vincular a origem à tabela de destino
- Selecione Colunas da tabela de origem.
- Arraste e solte as colunas na tabela de destino.
As tabelas de origem e de destino serão vinculadas e as setas de conexão aparecerão da tabela de origem até a de destino.
Observação - aqui você vinculou todas as colunas de origem à respectiva coluna da tabela de destino. Isso significa que, para cada registro de origem obtido, todas as colunas do destino serão carregadas. Se você deseja impedir que qualquer coluna específica seja carregada, clique no link dessa coluna e pressione a tecla delete no teclado. O link será removido e a coluna de destino não será carregada.
Etapa 11 - Use o atalho "ctrl + s" para salvar as alterações no seu mapeamento. Na janela de saída, você pode ver a mensagem de validação / análise de mapeamento. Ele confirma que seu mapeamento é válido. Além disso, haverá uma marca de seleção verde temporária ao lado do nome do mapeamento na árvore da pasta de mapeamento, indicando que o mapeamento foi feito com sucesso.
Em mapeamentos, pode haver um requisito, em que precisamos passar a variável para o mapeamento ou pode haver um cenário em que precisamos calcular variáveis temporárias e depois armazená-las para a próxima sessão de execução do mapeamento. Para isso, criamos parâmetros e variáveis de mapeamento.
Parâmetros e variáveis de mapeamento
Como toda linguagem de programação, a Informatica tem sua própria maneira de definir parâmetros e variáveis. Mas, ao contrário de outras linguagens de programação, a Informatica não é uma linguagem baseada em código. Para criar parâmetros e variáveis na Informatica, você deve seguir a sintaxe e a navegação predefinidas.
Diferença entre parâmetros e variáveis -
Parâmetros de mapeamento |
Variáveis de mapeamento |
Os parâmetros de mapeamento são aqueles tipos de dados cujo valor, uma vez atribuído, permanece constante durante a execução do mapeamento. Como se você tivesse criado um parâmetro de mapeamento deptno = 20, o valor 20 será constante para toda a execução do mapeamento. O parâmetro onde quer que seja referenciado sempre retornará o valor 20 para essa instância de execução de mapeamento. Para uma nova instância de mapeamento, o valor do parâmetro pode ser redefinido. |
Variáveis de mapeamento são objetos que podem ser referenciados durante a execução do mapeamento (para acessar seus valores) e seus valores podem ser reatribuídos. Por exemplo, uma variável de mapeamento de total_salary pode ser usada em um mapeamento e seu valor pode ser atualizado com base nos salários. |
Os parâmetros e variáveis de mapeamento são específicos apenas para um mapeamento. Eles não podem ser referenciados em outro mapeamento.
Como Criar Parâmetro de Mapeamento
Quando você cria um parâmetro de mapeamento, durante a execução do mapeamento, o Serviço de Integração procura seu valor atribuído. Esses valores podem ser atribuídos aos seguintes locais.
- Arquivo de parâmetro interno
- Na atribuição de variável pré-sessão
- Valor inicial no repositório
- Valor padrão atribuído durante a criação da variável
Etapa 1 - Para criar o parâmetro de mapeamento - No designer de mapeamento,
- Selecione o menu de mapeamentos
- Selecione o menu de parâmetros e variáveis
Etapa 2 - na próxima tela,
- Clique no menu Adicionar nova variável
- No menu suspenso, selecione o tipo como parâmetro
- Insira o nome do parâmetro como $$ Deptno
- Insira um valor inicial de 10
- Selecione o botão OK
Agora, você criou um parâmetro de mapeamento deptno, com valor inicialmente atribuído de 10, e esse parâmetro pode ser referenciado dentro do mapeamento.
Como Criar Variável de Mapeamento
Etapa 1 - No designer de mapeamento
- Selecione o menu de mapeamentos
- Selecione o menu de parâmetros e variáveis
Etapa 2 - na próxima tela
- Clique no menu Adicionar nova variável
- No menu suspenso, selecione o tipo como variável
- Insira o nome da variável como $$ TotalSalary
- Selecione DataType como decimal
- Insira um valor inicial de 0
- Selecione o botão OK
Isso criará uma variável de mapeamento.
Observação - os nomes de parâmetros e variáveis de mapeamento sempre começam com $$.
Resumo
Os mapeamentos são importantes na Informatica para combinar os dados de origem com o destino de acordo com os requisitos do projeto. Discutimos os mapeamentos de estágios e o conceito de variáveis e parâmetros de mapeamento.