As 40 principais perguntas e respostas da entrevista do ElasticSearch

Anonim

Aqui estão as perguntas da entrevista da Elastic Search para candidatos mais novos e experientes.

1) O que é Elasticsearch?

Elasticsearch é um banco de dados NoSQL. Ele é baseado no mecanismo de pesquisa Lucene e é construído com RESTful APIS. Ele oferece implantação simples, confiabilidade máxima e gerenciamento fácil. Ele também fornece consultas avançadas para realizar análises detalhadas e armazena todos os dados centralmente. Ajuda a realizar uma pesquisa rápida dos documentos.

2) Quais são os recursos importantes do Elasticsearch?

Aqui estão recursos importantes do Elasticsearch:

  • Um servidor de pesquisa de código aberto escrito em Java.
  • Usado para indexar qualquer tipo de dados heterogêneos
  • Possui interface da web REST API com saída JSON
  • Pesquisa de Texto Completo
  • Pesquisa quase em tempo real (NRT)
  • Armazenamento de documentos JSON fragmentado, replicado e pesquisável.
  • Armazenamento de documentos distribuído baseado em REST e JSON sem esquemas
  • Suporte multilíngue e localização geográfica

3) O que é um cluster?

Um cluster é uma coleção de nós que, juntos, contém dados e fornece recursos de indexação e pesquisa combinados.

4) Índice de explicação

Um nó é uma instância de pesquisa elástica. Ele é criado quando uma instância de elasticsearch começa.

5) O que é um documento no Elastic Search?

Em uma pesquisa elástica, um documento é uma unidade básica de informação que pode ser indexada. É expresso no par JSON (chave: valor). '{"usuário": "nullcon"}'. Cada documento é associado a um tipo e id único.

6) Defina o fragmento do termo

Cada índice pode ser dividido em vários fragmentos para distribuir os dados. O fragmento é a parte atômica de um índice, que pode ser distribuído pelo cluster se você quiser adicionar mais nós.

7) Quais são as vantagens importantes do Elastic Search?

Aqui estão as vantagens importantes do Elasticsearch:

  • Armazena dados sem esquema e também cria um esquema para seus dados.
  • Manipule seus dados registro por registro com a ajuda de APIs de documentos múltiplos
  • Filtrar e consultar seus dados para insights
  • Baseado no Apache Lucene e fornece API RESTful
  • Ele fornece escalabilidade horizontal, confiabilidade e capacidade multilocatária para uso de indexação em tempo real.
  • Ajuda você a dimensionar vertical e horizontalmente

8) O que é a pilha ELK?

O ELK Stack é uma coleção de três produtos de código aberto - Elasticsearch, Logstash e Kibana. Todos eles são desenvolvidos, gerenciados e mantidos pela empresa Elastic.

  • E significa ElasticSearch : é usado para armazenar logs.
  • L significa LogStash: é usado tanto para envio quanto para processamento e armazenamento de logs.
  • K significa Kibana: é uma ferramenta de visualização (uma interface web) que é hospedada através do Nginx ou Apache.

9) Explicar a arquitetura da pilha ELK

ELK Stack foi projetado para permitir que os usuários acessem dados de qualquer fonte, em qualquer formato, e pesquisem, analisem e visualizem esses dados em tempo real.

  • Logs: os logs do servidor que precisam ser analisados ​​são identificados
  • Logstash: Colete dados de logs e eventos. Ele até analisa e transforma dados.
  • ElasticSearch: Os dados transformados de Logstash isStore, Search e indexados.
  • Kibana: Kibana usa Elasticsearch DB para explorar, visualizar e compartilhar

10) Quais são as razões para usar a pilha ELK?

Aqui estão as razões para usar a pilha ELK:

  • ELK funciona melhor quando os registros de vários aplicativos de uma empresa convergem em uma única instância ELK
  • Ele fornece insights incríveis para essa única instância e também elimina a necessidade de fazer logon em uma centena de fontes de dados de log diferentes.
  • Instalação rápida no local
  • Escalas fáceis de implantar vertical e horizontalmente
  • Elastic oferece uma série de clientes de linguagem, que inclui Ruby. Pitão. PHP, Perl, .NET, Java e JavaScript e muito mais
  • Disponibilidade de bibliotecas para diferentes linguagens de programação e script

11) Explique o Tokenizer no ElasticSearch

Uma divisão de tokenizer campos quais valores de um documento em um fluxo. Índices invertidos são criados e atualizados usando esses valores. Depois disso, esse fluxo de valores é armazenado no documento.

12) O que é uma réplica no ElasticSearch?

Cada fragmento no ElasticSearch possui 2 cópias, que são chamadas de réplicas. Eles o ajudam para alta disponibilidade e tolerância a falhas.

13) Quais são as principais operações que você pode realizar em um documento?

Aqui, estão as operações importantes realizadas em documentos:

  • Indexando um documento
  • Buscando documentos
  • Atualizando documentos
  • Excluindo documentos

14) O que é um cluster no Elasticsearch?

Cluster é uma coleção de nós únicos ou múltiplos que contém todos os seus dados e oferece indexação federada e capacidades de pesquisa em todos os nós.

15) Como você pode excluir um índice no Elastic search?

Para excluir um índice no Elasticsearch, você precisa escrever o comando:

 DELETE /index name. 

Por exemplo, DELETE / website.

16) Explique o método para adicionar um mapeamento em um índice

Elasticsearch permite que você crie o mapeamento de acordo com os dados fornecidos pelo usuário no corpo da solicitação. Seu recurso em massa pode ser usado para adicionar mais de um objeto JSON ao índice.

Por exemplo, POST website / _bulk.

17) Quais são as várias maneiras de pesquisar no Elasticsearch?

A seguir estão os métodos de pesquisa no Elasticsearch:

Pesquisa Multi-índice, Multitype: Você pode pesquisar APIs que podem ser aplicadas em todos os índices múltiplos usando o sistema de suporte multi-índice.

Na pesquisa Elastic, podemos criar determinadas tags em todos os índices, em todos os índices e todos os tipos.

  • Pesquisa de URI: uma solicitação de pesquisa é executada usando um URI, fornecendo os parâmetros solicitados.
  • Pesquisa de corpo de solicitação: uma solicitação de pesquisa precisa ser executada por um DSL de pesquisa. Inclui a consulta DSL dentro do corpo.

18) Qual é a versão mais recente do Elasticsearch?

Última versão do Elastic Search em janeiro de 2020, que é a versão mais recente e estável do Elasticsearch.

19) O que é mapeamento?

Mapeamento é um processo que ajuda a definir como um documento é mapeado para o mecanismo de pesquisa. Suas características pesquisáveis ​​são campos incluídos, são tokenizados e também pesquisáveis.

20) Onde o Elastic Search é armazenado?

Você pode armazenar Elasticsearch é um documento distribuído, que é uma loja com vários tipos de diretórios. Você também pode recuperar as estruturas de dados complexas que podem ser serializadas como documentos JSON.

21) O que é Apache Lucene?

Apache Lucene é uma biblioteca de software de recuperação de informações de código aberto. Ele foi originalmente escrito em linguagem Java.

22) Aqui estão importantes ferramentas de gerenciamento de configuração suportadas pelo Elasticsearch:

  • Marionete - pesquisa elástica de marionete
  • Chef - livro de receitas-pesquisa elástica
  • Ansible - busca elástica ansible

23) O que é NRT no Elasticsearch?

NRT é uma forma completa de plataforma (Near Real-Time Search). É uma plataforma de pesquisa quase em tempo real. Isso significa que há uma pequena latência (principalmente um segundo) desde o momento em que você indexa um documento até que ele se torne muito pesquisável.

24) Onde você define as configurações do X-Pack?

Você pode definir as configurações do X-Pack. Ele possui recursos nos arquivos de configuração elasticsearch, logstash e kibana.yml (pilha ELK).

25) O que é cat API no Elasticsearch?

Esses comandos aceitam um parâmetro de string de consulta. Isso ajuda a ver todas as informações, cabeçalhos e informações que eles fornecem e o comando / _cat, que permite listar todos os comandos disponíveis.

26) Quais são os vários comandos disponíveis na API Elasticsearch cat?

Os comandos usando cat API são:

  • Aliases de gato, alocação de gato, contagem de gato, dados de campo de gato
  • Saúde do gato, índices do gato, mestre do gato, tarefas pendentes, plug-ins do gato, recuperação do gato
  • repositórios de gatos, instantâneos de gatos, modelos de gatos

27) O que é o nó de ingestão?

O nó de ingestão é usado para documentos de pré-processamento antes que a indexação do documento real aconteça. Ajuda a interceptar solicitações em massa e de índice. Ele também aplica transformações e, em seguida, passa os documentos de volta para a API e o índice em massa.

28) Quais são as várias maneiras de usar os comandos X-Pack?

Aqui estão os comandos X-Pack que ajudam a configurar a segurança:

  • Certgen
  • migrar
  • syskeygen
  • certutil
  • saml-metadata
  • senhas de configuração
  • Comercial

29) O que são APIs de documento único no Elasticsearch?

  • Obter API
  • API de índice
  • Apagar API
  • API de atualização

30) Explique Explorar API no Elasticsearch

A API Graph explore permite que você extraia e resuma informações sobre os documentos.

31) Como você pode criar um índice no Elasticsearch?

Por exemplo:

PUT / cliente? Bonito

GET / _cat / índices? V

32) O que são agregações?

A estrutura de agregações ajuda a fornecer dados agregados com base em uma consulta de pesquisa. Baseia-se em blocos de construção simples conhecidos como agregações. Ele pode ser composto para construir resumos complexos dos dados.

33) Elasticsearch tem um esquema?

Mapeamentos ElasticSearch que podem ser usados ​​para impor um esquema em documentos.

34) O que é Query DSL no Elasticsearch?

Elasticsearch oferece Query DSL (Domain Specific Language) completo baseado em JSON para definir consultas.

35) O que é Elasticsearch Data Node?

Os nós de dados contêm fragmentos que manipulam documentos indexados. Eles ajudam você a executar CRUD relacionado a dados e operações de agregação de pesquisa, etc. No entanto, você precisa definir node.data = true para tornar o nó como um nó de dados.

36) O que é um documento no ElasticSearch?

O documento é muito semelhante a uma linha em bancos de dados relacionais. Cada documento no índice possui uma estrutura diferente, mas tem o mesmo tipo de dados para os respectivos campos.

  • MySQL => Bancos de dados => Tabelas => Colunas / Linhas
  • ElasticSearch => Índices => Tipos => Documentos com Propriedades

37) Explique o tipo em ElasticSearch

O tipo é uma partição de índice lógico cuja semântica depende do usuário.

38) Qual é a linguagem de consulta do Elasticsearch?

A linguagem de consulta Apache Lucene, também conhecida como Query DSL, é usada pelo Elasticsearch.

39) O que é mapeamento dinâmico no Elasticsearch?

O mapeamento dinâmico ajuda o usuário a indexar documentos sem configurações indesejadas para o nome do campo. Em vez disso, ele será adicionado automaticamente por meio do Elasticsearch com algumas regras personalizadas.

40) O que é Elasticsearch fuzzy search?

A pesquisa difusa é um processo no qual os locais dos documentos da página da web devem ser identificados. Isso se assemelha ao argumento de pesquisa. Também funciona quando o argumento não é relevante para o correspondente da pesquisa para obter informações específicas.