Antes da instalação do Apache Hive, exigimos uma instalação dedicada do Hadoop, instalada e funcionando com todos os daemons do Hadoop.
Para instalação do Hadoop, verifique este link
Quando todos os daemons do Hadoop estiverem funcionando bem, basta iniciar a parte de instalação do Apache Hive.
Processo de instalação
- Instalação do Hive
- Comandos do shell Hive
Como instalar o Hive
Etapa 1) Baixar e instalar o Hive
Para baixar a configuração estável do Hive, consulte a URL do Apache conforme mencionado abaixo
http://www.apache.org/dyn/closer.cgi/hive/. Vá para a URL e selecione o link de download do espelho do apache.
Selecione a versão mais recente do Hive. (No meu caso atual é colmeia - 3.1.2)
Clique no arquivo bin e o download começará.
Etapa 2) Extraindo o arquivo tar.
Vá para o local do arquivo Tar baixado -> extraia o arquivo tar usando o seguinte comando
tar -xvf apache-hive-3.1.2-bin.tar.gz
Etapa 3) Propriedades de configuração diferentes a serem colocadas no Apache Hive.
Nesta etapa, vamos fazer duas coisas
- Colocando o caminho do Hive Home no arquivo bashrc
- Colocando o local do caminho inicial do Hadoop em hive-config.sh
- Mencione Hive Pathin ~ / .bashrc
- Abra o arquivo bashrc como mostrado na imagem acima
- Mencione o caminho inicial do Hive, ou seja, o caminho HIVE_HOME no arquivo bashrc e exporte-o conforme mostrado abaixo
Código a ser colocado em bashrc
export HIVE_HOME="/home/guru99hive/apache-hive-1.2.0-bin"export PATH=$PATH:$HIVE_HOME/bin
- Exportando o caminho do Hadoop em Hive-config.sh (para se comunicar com o Hadoop ecossistema, estamos definindo o caminho inicial do Hadoop no campo de configuração do hive)
Abra o hive-config.sh conforme mostrado abaixo
Mention the HADOOP_HOME Path in hive-config.sh file as shown in below ( HADOOP_HOME Path)
Etapa 4) Criação de diretórios Hive no Hadoop:
Para nos comunicarmos com o Hadoop, precisamos criar diretórios no Hadoop conforme mostrado abaixo.
Conceder permissões de root para criar pastas Hive no Hadoop. Se não gerar nenhuma mensagem de erro, significa que o Hadoop concedeu permissões com êxito para as pastas Hive.
Etapa 5) Entrar no shell do Hive inserindo '. / hive ' como mostrado abaixo.
Comandos do shell Hive
Aqui, criaremos uma tabela de amostra usando o comando de shell do Hive "criar" com nomes de coluna.
Código de amostra para a criação de banco de dados no Hive
Na captura de tela acima, podemos observar o seguinte:
- Criação de Tabela de Amostra com nomes de coluna no Hive
- Aqui, o nome da tabela é "produto" com três nomes de coluna produto, pname e preço
- Os três nomes de coluna denotados por seus respectivos tipos de dados
- Todos os campos são encerrados por vírgulas ','
- Exibindo informações da Tabela Hive
- Usando o comando "descrever", podemos ver as informações da tabela presentes no Hive
- Aqui ele está exibindo os nomes das colunas com seus respectivos tipos de dados presentes no esquema da tabela
- No final, ele exibirá o tempo para executar este comando e o número de linhas que buscou
Código de amostra para a criação de banco de dados no Hive (para autoverificação)
1) Crie o produto da tabela (int do produto, string pname, flutuação de preço)
Row format delimitedFields terminated by ',';
2) descrever o produto: