baixar PDF
A seguir estão as perguntas mais frequentes em entrevistas para caloiros e desenvolvedores de HBase bem experientes.
1) Explique o que é Hbase?
Hbase é um sistema de gerenciamento de banco de dados orientado a colunas que é executado no HDFS (Hadoop Distribute File System). Hbase não é um armazenamento de dados relacional e não oferece suporte a linguagem de consulta estruturada como SQL.
No Hbase, um nó mestre regula os servidores de cluster e região para armazenar partes das tabelas e operar o trabalho nos dados.
2) Explique por que usar Hbase?
- Sistema de armazenamento de alta capacidade
- Design distribuído para atender grandes mesas
- Lojas Orientadas a Colunas
- Escalonável horizontalmente
- Alto desempenho e disponibilidade
- O objetivo básico do Hbase é milhões de colunas, milhares de versões e bilhões de linhas
- Ao contrário do HDFS (Hadoop Distribute File System), ele suporta operações CRUD aleatórias em tempo real
3) Mencione quais são os componentes principais da Hbase?
- Zookeeper: Faz o trabalho de coordenação entre o cliente e o Hbase Maser
- Hbase Master: Hbase Master monitora o servidor de região
- RegionServer: RegionServer monitora a região
- Região: contém no armazenamento de dados da memória (MemStore) e Hfile.
- Tabelas do catálogo: as tabelas do catálogo consistem em ROOT e META
4) Explique em que consiste a Hbase?
- Hbase consiste em um conjunto de tabelas
- E cada tabela contém linhas e colunas como banco de dados tradicional
- Cada tabela deve conter um elemento definido como uma chave primária
- A coluna Hbase denota um atributo de um objeto
5) Mencione quantos comandos operacionais em Hbase?
O comando operacional em Hbases é de cerca de cinco tipos
- Obter
- Por
- Excluir
- Varredura
- Incremento
6) Explique o que é WAL e Hlog em Hbase?
WAL (Write Ahead Log) é semelhante ao log BIN do MySQL; ele registra todas as mudanças ocorridas nos dados. É um arquivo de sequência padrão do Hadoop e armazena HLogkey's. Essas chaves consistem em um número sequencial e também em dados reais e são usadas para reproduzir dados ainda não persistentes após um travamento do servidor. Portanto, em caso de falha do servidor, o WAL funciona como uma linha de vida e recupera os dados perdidos.
7) Quando você deve usar o Hbase?
- O tamanho dos dados é enorme: quando você tem toneladas e milhões de registros para operar
- Reprojeto completo: quando você está movendo RDBMS para Hbase, você o considera como um redesenho completo, então apenas alterando as portas
- Comandos sem SQL: você tem vários recursos, como transações; junções internas, colunas digitadas, etc.
- Investimento em infraestrutura: você precisa ter cluster suficiente para que o Hbase seja realmente útil
8) Em Hbase, o que são famílias de colunas?
As famílias de colunas compreendem a unidade básica de armazenamento físico em Hbase à qual recursos como compressões são aplicados.
9) Explique o que é a chave de linha?
A chave de linha é definida pelo aplicativo. Como a chave combinada é pré-fixada pela chave de linha, ela permite que o aplicativo defina a ordem de classificação desejada. Ele também permite o agrupamento lógico de células e certifique-se de que todas as células com a mesma chave de linha estejam localizadas no mesmo servidor.
10) Explique a deleção em Hbase? Mencione quais são os três tipos de marcadores de marca para exclusão em Hbase?
Quando você exclui a célula em Hbase, os dados não são realmente excluídos, mas um marcador de marca para exclusão é definido, tornando as células excluídas invisíveis. Hbase deletada é realmente removida durante as compactações.
Existem três tipos de marcadores de marca de exclusão:
- Marcador de exclusão de versão: para exclusão, marca uma única versão de uma coluna
- Marcador de exclusão de coluna: para exclusão, marca todas as versões de uma coluna
- Marcador de exclusão de família: para exclusão, marca todas as colunas de um grupo de colunas
11) Explique como o Hbase realmente exclui uma linha?
No Hbase, tudo o que você escrever será armazenado da RAM para o disco; essas gravações em disco são imutáveis, impedindo a compactação. Durante o processo de exclusão em Hbase, o processo de compactação principal exclui o marcador, enquanto as compactações menores não. Em exclusões normais, isso resulta em um marcador de exclusão - esses dados de exclusão que eles representam são removidos durante a compactação.
Além disso, se você excluir dados e adicionar mais dados, mas com um carimbo de data / hora anterior ao carimbo de data / hora da marca para exclusão, Gets adicionais podem ser mascarados pelo marcador de exclusão / marca para exclusão e, portanto, você não receberá o valor inserido até depois da compactação principal.
12) Explique o que acontece se você alterar o tamanho do bloco de uma família de colunas em um banco de dados já ocupado?
Quando você altera o tamanho do bloco da família de colunas, os novos dados ocupam o novo tamanho do bloco, enquanto os dados antigos permanecem dentro do tamanho do bloco antigo. Durante a compactação de dados, os dados antigos assumirão o novo tamanho de bloco. Os novos arquivos, à medida que são liberados, têm um novo tamanho de bloco, enquanto os dados existentes continuarão a ser lidos corretamente. Todos os dados devem ser transformados para o novo tamanho de bloco, após a próxima grande compactação.
13) Mencionar a diferença entre Hbase e Banco de Dados Relacional?
Hbase | Banco de Dados Relacional |
|
|
14) O que é a classe HBaseFsck?
Há um nome de ferramenta chamado back disponível no HBase, que é implementado pela classe HBaseFsck. Ele oferece várias opções de linha de comando que influenciam seu comportamento.
15) Quais são as principais estruturas-chave do HBase?
Chave de linha e chave de coluna são as duas estruturas de chave mais importantes usando no HBase
16) Discuta como você pode usar filtros no Apache HBase
Filtros em HBase Shell. Ele foi introduzido no Apache HBase 0.92, que ajuda a conduzir a filtragem do lado do servidor para acessar o HBase no shell ou thrift do HBase.
17) Estrutura de sintaxe de suporte do HBase como SQL sim ou não?
Não, infelizmente, o suporte SQL para HBase não está disponível atualmente. No entanto, usando o Apache Phoenix, podemos recuperar dados do HBase por meio de consultas SQL.
18) Qual é o significado de compactação no HBase?
No momento de grandes gravações de entrada, é impossível obter um desempenho ideal tendo um arquivo por armazenamento. O HBase ajuda a combinar todos esses HFiles para reduzir o número de sementes de disco para cada leitura. Este processo é conhecido como Compactação em HBase.
19) Como você implementará joins no HBase?
HBase, não oferece suporte a junções diretamente, mas usa tarefas MapReduce. As consultas de junção podem ser implementadas recuperando dados com a ajuda de diferentes tabelas HBase.
20) Explique JMX sobre HBSE
Java Management Extensions ou JMX é um status de exportação de aplicativos Java é o padrão para eles.
21) Qual é a utilidade do MasterServer?
O servidor mestre também ajuda a atribuir uma região ao servidor da região. Também ajuda você a lidar com o balanceamento de carga que usamos no MasterServer.
22) Definir o termo Thrift
Apache Thrift é escrito em C ++. Ele fornece compiladores de esquema para várias linguagens de programação como C ++, Perl, PHP, Python, Ruby e muito mais.
23) Por que usar a classe HColumnDescriptor?
Os detalhes relativos à família de colunas, como configurações de compactação, Número de versões, são armazenados no HColumnDescriptor.
24) O que é uma célula no HBase?
Uma célula em HBase é a menor unidade de uma tabela de Hbase. Isso ajuda você a manter um pedaço de dados na forma de uma tupla {linha, coluna, versão}
25) O que é um filtro Bloom?
O HBase oferece suporte ao Filtro Bloom e ajuda a melhorar a taxa de transferência geral do cluster. Um filtro HBase Bloom é um mecanismo de espaço eficiente para testar se um HFile inclui determinada linha ou célula de coluna de linha.
26) Conte-me sobre os tipos de operações do HBase?
Resp. Dois tipos de operações HBase são:
- Leia a operação
- Operação de gravação
27) Qual é a utilidade do HBase HMaster?
As principais responsabilidades de um mestre são:
- Coordenando os servidores da região
- Funções administrativas
28) Qual técnica você pode usar no HBase para acessar o HFile diretamente sem a ajuda do HBase?
Para acessar o HFile diretamente sem usar o HBase, usamos o método HFile.main ().
29) O servidor de região pode ser localizado em todos os DataNodes?
Sim, os servidores regionais são executados nos mesmos servidores que um DataNodes
30) Nomeie o filtro que aceita o tamanho da página como o parâmetro no HBase
Um filtro denominado PageFilter aceita o tamanho da página como parâmetro.
Este documento foi composto com as ferramentas de conversão instantânea de HTML.
- Próximo