As 50 principais perguntas da entrevista do Teradata & Respostas

Anonim

baixar PDF

1) Como você define o Teradata? Dê algumas das características principais do mesmo.

O Teradata é basicamente um RDMS que é usado para conduzir o Datamart, Datawarehouse, OLAP, OLTP, bem como os dispositivos DSS da empresa. Algumas das características principais do Teradata são fornecidas a seguir.

  • É capaz de funcionar em nós únicos, bem como em nós múltiplos.
  • O paralelismo está embutido no sistema.
  • Muito compatível com os padrões do ANSI.
  • Tende a agir da mesma forma que um servidor.
  • É um sistema aberto que basicamente executa para UNIX MR-RAS, Suse Linux ETC, WIN2K, etc.

2) Quais são os recursos recém-desenvolvidos do Teradata?

Alguns dos recursos desenvolvidos recentemente do Teradata são: -

  • Análise temporal automatizada
  • Extensão nas capacidades de compressão que permite compressão flexível de dados cerca de 20 vezes mais dados do que a versão anterior.
  • Inovação associada ao cliente como ponto de vista tetradata.

3) Destaque alguns dos componentes importantes do Teradata.

Alguns dos componentes importantes do Teradata são: -

  • Bynet
  • Processador de Módulo de Acesso (AMP)
  • Parsing Engine (PE)
  • Disco Virtual (vDisk)
  • Sistema de armazenamento virtual (VSS)

4) Mencione o procedimento pelo qual podemos executar jobs do Teradata em um ambiente UNIX.

Tudo o que você precisa fazer é executar a execução no UNIX da maneira mencionada abaixo.

$ Sh> BTEQ <[Script Path]> [Logfile Path]

ou

$ Sh> BTEQ <[Script Path] TEE [Logfile Path]

5) No Teradata, como geramos sequência?

No Teradata, geramos sequência usando a coluna de identidade

6) Durante o tempo de exibição, como a sequência é gerada pelo Teradata?

Tudo que você precisa fazer é usar o CSUM.

7) Uma certa carga está sendo imposta à mesa e isso também, a cada hora. O tráfego da manhã é relativamente baixo e o da noite muito alto. De acordo com esta situação, qual é o utilitário mais aconselhável e como esse utilitário deve ser carregado?

O utilitário mais sugestionável aqui é o Tpump. Fazendo uso da diminuição ou aumento do tamanho do pacote, o tráfego pode ser facilmente manipulado.

8) Se o Script de carregamento rápido falhar e apenas as tabelas de erros forem disponibilizadas para você, como você reiniciará?

Existem basicamente duas maneiras de reiniciar neste caso.

  • Fazendo com que o arquivo antigo seja executado - Certifique-se de não eliminar completamente as tabelas de erros. Em vez disso, tente retificar os erros presentes no script ou no arquivo e execute novamente.
  • Executando um novo arquivo - neste processo, o script é executado simplesmente usando as instruções de fim de carregamento e início. Isso ajudará a remover o bloqueio que foi colocado na tabela de destino e também pode remover o registro fornecido da tabela de log rápido. Feito isso, você está livre para executar todo o script novamente.

9) Mencione algumas das ferramentas ETL que vêm com o Teradata.

Algumas das ferramentas ETL comumente usadas no Teradata são DataStage, Informatica, SSIS, etc.

10) Destaque algumas das vantagens que as ferramentas ETL têm sobre o TD.

Algumas das vantagens que as ferramentas ETL têm sobre o TD são: -

  • Vários destinos heterogêneos, bem como fontes podem ser operados.
  • O processo de depuração é muito mais fácil com a ajuda de ferramentas ETL devido ao suporte completo da GUI.
  • Os componentes das ferramentas ETL podem ser facilmente reutilizados e, como resultado, se houver uma atualização no servidor principal, todos os aplicativos correspondentes conectados ao servidor serão atualizados automaticamente.
  • A remoção e a rotação podem ser feitas facilmente usando ferramentas ETL.

11) Qual é o significado de Caching no Teradata?

O armazenamento em cache é considerado uma vantagem adicional do uso do Teradata, pois funciona principalmente com a fonte que permanece na mesma ordem, ou seja, não muda com frequência. Às vezes, o Cache é geralmente compartilhado entre os aplicativos.

12) Como podemos verificar a versão do Teradata que estamos usando atualmente?

Basta dar o comando .SHOW VERSION.

13) Dê uma razão justificável pela qual o Multi-load suporta NUSI em vez de USI.

A linha da subtabela de índice está no mesmo Amp da mesma forma que a linha de dados no NUSI. Assim, cada Amp é operado separadamente e de maneira paralela.

14) Como o MLOAD Client System é reiniciado após a execução?

O script deve ser enviado manualmente para que possa carregar facilmente os dados do último ponto de verificação.

15) Como o MLOAD Teradata Server é reiniciado após a execução?

O processo é basicamente realizado a partir do último checkpoint conhecido, e uma vez que os dados tenham sido executados após a execução do script MLOAD, o servidor é reiniciado.

16) O que significa um nó?

Um nó é basicamente denominado como uma variedade de componentes de hardware e software. Normalmente, um servidor é conhecido como um nó.

17) Digamos que haja um arquivo que consiste em 100 registros, dos quais precisamos pular o primeiro e os últimos 20 registros. Qual será o trecho de código?

Precisamos usar o utilitário BTEQ para fazer esta tarefa. O salto 20, bem como a repetição 60 serão usados ​​no script.

18) Explique o PDE.

PDE basicamente significa Parallel Data Extension. O PDE basicamente é uma camada de interface de software presente acima do sistema operacional e dá ao banco de dados a chance de operar em um ambiente paralelo.

19) O que é TPD?

TPD basicamente significa Trusted Parallel Database e funciona basicamente no PDE. Acontece que o Teradata é um banco de dados que funciona principalmente no PDE. Esse é o motivo pelo qual o Teradata é geralmente conhecido como banco de dados Paralelo Confiável ou Paralelo Puro.

20) O que significa um driver de canal?

Um driver de canal é um software que atua como um meio de comunicação entre PEs e todos os aplicativos que estão sendo executados em canais que estão conectados aos clientes.

21) O que significa Teradata Gateway?

Assim como o driver de canal, o Teradata Gateway atua como um meio de comunicação entre o Parse Engine e os aplicativos que estão conectados aos clientes da rede. Apenas um Gateway é atribuído por nó.

22) O que significa disco virtual?

O disco virtual é basicamente uma compilação de uma série de cilindros que são discos físicos. Às vezes, é chamado de array de disco.

23) Explique o significado de Amp?

Amp significa basicamente Access Module Processor e passa a ser um processador que funciona virtualmente e é basicamente usado para gerenciar uma única parte do banco de dados. Esta parte específica do banco de dados não pode ser compartilhada por nenhum outro Amp. Portanto, essa forma de arquitetura é comumente referida como arquitetura sem compartilhamento.

24) O que o Amp contém e quais são todas as operações que ele realiza?

Amp consiste basicamente em um subsistema gerenciador de banco de dados e é capaz de realizar as operações mencionadas a seguir.

  • Executando DML
  • Executando DDL
  • Implementando agregações e associações.
  • Liberando e aplicando bloqueios, etc.

25) O que significa um mecanismo de análise?

PE passa a ser um tipo Vproc. Sua função principal é receber solicitações SQL e fornecer respostas em SQL. Ele consiste em uma ampla variedade de componentes de software que são usados ​​para dividir o SQL em várias etapas e, em seguida, enviar essas etapas para AMPs.

26) O que você quer dizer com análise?

Analisar é um processo relacionado à análise de símbolos de string que estão em linguagem de computador ou em linguagem natural.

27) Quais são as funções de um analisador?

Um analisador: -

  • Verifica erros de semântica
  • Verifica erros sintáticos
  • Verifica a existência do objeto

28) O que significa despachante?

O Dispatcher pega uma coleção inteira de solicitações e as mantém armazenadas em uma fila. A mesma fila é mantida durante todo o processo para fornecer vários conjuntos de respostas.

29) Quantas sessões de MAX o PE é capaz de lidar em um determinado momento?

PE pode lidar com um total de 120 sessões em um determinado momento.

30) Explique BYNET.

BYNET serve basicamente como meio de comunicação entre os componentes. Ele é o principal responsável por enviar mensagens e também por executar operações de mesclagem e classificação.

31) O que se entende por Clique?

Uma Clique é basicamente conhecida como uma variedade de nós que estão sendo compartilhados entre unidades de disco comuns. A presença de Clique é extremamente importante, pois ajuda a evitar falhas de nó.

32) O que acontece quando um nó sofre uma queda?

Sempre que há uma queda no nível de desempenho de um nó, todos os Vprocs correspondentes migram imediatamente para um novo nó do nó com falha, a fim de obter todos os dados de volta das unidades comuns.

33) Liste todas as formas de LOCKS disponíveis no Teradata.

Existem basicamente quatro tipos de LOCKS que se enquadram no Teradata. Esses são: -

  • Ler o cadeado
  • Bloqueio de acesso
  • Fechadura Exclusiva
  • Write Lock

34) Qual é o nível específico designado no qual um LOCK pode ser aplicado no Teradata?

  • Nível da Tabela - Todas as linhas que estão presentes dentro de uma tabela certamente estarão travadas.
  • Bloqueio de nível de banco de dados - Todos os objetos presentes no banco de dados serão bloqueados.
  • Bloqueio de nível de hash de linha - somente as linhas que corresponderem à linha específica serão bloqueadas.

35) No Índice primário, qual é a pontuação dos AMPs que estão ativamente envolvidos?

Apenas um AMP está ativamente envolvido em um índice primário.

36) No Teradata, qual é o significado do comando UPSERT?

UPSERT basicamente significa Update Else Insert. Essa opção está disponível apenas no Teradata.

37) Destaque as vantagens do PPI (Índice Primário de Partição).

PPI é basicamente usado para fins de armazenamento de dados com base em faixa ou categoria. Quando se trata de consultas de intervalo, não há necessidade de utilização da varredura de tabela completa, pois ela se move imediatamente para a partição consequente, pulando todas as outras partições.

38) Forneça os tamanhos de SMALLINT, BYTEINT e INTEGER.

SMALLINT - 2 bytes - 16 bits -> -32768 a 32767

BYTEINT - 1 Bytes - 8 Bits -> -128 a 127

INTEGER - 4 bytes - 32 bits -> -2.147.483.648 a 2.147.483.647

39) O que significa um Plano de Menor Custo?

Um Plano de Menor Custo basicamente é executado em menos tempo no caminho mais curto.

40) Destaque os pontos de diferença entre o banco de dados e o usuário no Teradata.

  • Um banco de dados é basicamente passivo, enquanto um usuário é ativo.
  • Um banco de dados armazena principalmente todos os objetos do banco de dados, enquanto um usuário pode armazenar qualquer objeto, seja uma macro, tabela, visão, etc.
  • O banco de dados não possui senha enquanto o usuário deve inserir a senha.

41) Destaque as diferenças entre a chave primária e o índice primário.

  • O índice primário é bastante obrigatório, enquanto a chave primária é opcional.
  • O índice primário tem um limite de 64 tabelas / colunas, enquanto a chave primária não tem nenhum limite.
  • O índice primário permite duplicatas e nulos, enquanto a chave primária não.
  • O índice primário é um mecanismo físico, enquanto a chave primária é um mecanismo puramente lógico.

42) Explique como o espaço do spool é usado.

O espaço de spool no Teradata é basicamente usado para executar consultas. Do espaço total disponível no Teradata, 20% do espaço é basicamente alocado para o espaço de spool.

43) Destaque a necessidade de ajuste de desempenho.

O ajuste de desempenho no Teradata é feito basicamente para identificar todos os gargalos e resolvê-los.

44) Comente se o gargalo é um erro ou não.

Tecnicamente, gargalo não é uma forma de erro, mas certamente causa certo atraso no sistema.

45) Como os gargalos podem ser identificados?

Existem basicamente quatro maneiras de identificar um gargalo. Esses são: -

  • Teradata Visual Explain
  • Explicar modificador de solicitação
  • Teradata Manager
  • Monitor de Desempenho

46) O que significa um plano de custo mais alto?

De acordo com o plano de custo mais alto, o tempo necessário para executar o processo é maior e é o caminho mais longo disponível.

47) Destaque todos os modos que estão presentes em Nível de confiança.

Baixo, Não, Alto e Juntar são os quatro modos que estão presentes no Nível de confiança.

48) Cite as cinco fases que vêm no Utilitário MultiLoad.

Fase preliminar, fase DML, fase de aquisição de dados, fase de aplicação e fase final.

49) Destaque as limitações do utilitário TPUMP.

A seguir estão as limitações do utilitário TPUMP: -

  • Não podemos usar a instrução SELECT.
  • Arquivos de dados não podem ser concatenados.
  • Operadores agregados e exponenciais não são suportados.
  • As funções aritméticas não podem ser suportadas.

50) No BTEQ, como os parâmetros do modo de sessão estão sendo configurados?

.set session transaction BTET -> Teradata transaction mode

.set sessão transação ANSI -> modo ANSI

Esses comandos funcionarão apenas quando forem inseridos antes do login na sessão.