O que é OLAP?
O Online Analytical Processing (OLAP) é uma categoria de software que permite aos usuários analisar informações de vários sistemas de banco de dados ao mesmo tempo. É uma tecnologia que permite aos analistas extrair e visualizar dados de negócios de diferentes pontos de vista.
Os analistas frequentemente precisam agrupar, agregar e juntar dados. Essas operações em bancos de dados relacionais consomem muitos recursos. Com o OLAP, os dados podem ser pré-calculados e pré-agregados, tornando a análise mais rápida.
Os bancos de dados OLAP são divididos em um ou mais cubos. Os cubos são projetados de forma que a criação e a visualização de relatórios sejam fáceis. OLAP significa Online Analytical Processing.
Neste tutorial, você aprenderá-
- Cubo OLAP
- Operações analíticas básicas de OLAP
- Tipos de sistemas OLAP
- ROLAP
- MOLAP
- OLAP híbrido
- Vantagens do OLAP
- Desvantagens do OLAP
Cubo OLAP:
No centro do conceito OLAP, está um Cubo OLAP. O cubo OLAP é uma estrutura de dados otimizada para uma análise de dados muito rápida.
O Cubo OLAP consiste em fatos numéricos chamados medidas que são categorizados por dimensões. O Cubo OLAP também é chamado de hipercubo .
Normalmente, as operações e análises de dados são realizadas usando uma planilha simples, onde os valores dos dados são organizados em formato de linha e coluna. Isso é ideal para dados bidimensionais. No entanto, OLAP contém dados multidimensionais, com dados geralmente obtidos de uma fonte diferente e não relacionada. Usar uma planilha não é uma opção ideal. O cubo pode armazenar e analisar dados multidimensionais de maneira lógica e ordenada.
Como funciona?
Um data warehouse iria extrair informações de várias fontes de dados e formatos, como arquivos de texto, planilhas do Excel, arquivos multimídia, etc.
Os dados extraídos são limpos e transformados. Os dados são carregados em um servidor OLAP (ou cubo OLAP) onde as informações são pré-calculadas com antecedência para análise posterior.
Operações analíticas básicas de OLAP
Quatro tipos de operações analíticas em OLAP são:
- Rolar
- Drill-down
- Fatiar e cortar
- Pivô (girar)
1) Roll-up:
O roll-up também é conhecido como "consolidação" ou "agregação". A operação de roll-up pode ser realizada de 2 maneiras
- Reduzindo dimensões
- Escalando a hierarquia de conceitos. Hierarquia de conceito é um sistema de agrupamento de coisas com base em sua ordem ou nível.
Considere o seguinte diagrama
- Neste exemplo, as cidades New jersey e Lost Angles e enroladas no país EUA
- O número de vendas de New Jersey e Los Angeles é de 440 e 1560, respectivamente. Eles se tornam 2.000 após o roll-up
- Nesse processo de agregação, a hierarquia de dados e localização sobe da cidade para o país.
- No processo de enrolamento, pelo menos uma ou mais dimensões precisam ser removidas. Neste exemplo, a dimensão Quater é removida.
2) Detalhamento
No detalhamento, os dados são fragmentados em partes menores. É o oposto do processo de rollup. Isso pode ser feito via
- Descendo na hierarquia de conceitos
- Aumentando uma dimensão
Considere o diagrama acima
- O quarto trimestre do primeiro trimestre é detalhado para os meses de janeiro, fevereiro e março. As vendas correspondentes também são registros.
- Neste exemplo, os meses de dimensão são adicionados.
3) Fatia:
Aqui, uma dimensão é selecionada e um novo subcubo é criado.
O diagrama a seguir explica como a operação de fatia foi realizada:
- O tempo de dimensão é dividido com Q1 como filtro.
- Um novo cubo é criado completamente.
Dados:
Esta operação é semelhante a uma fatia. A diferença nos dados é que você seleciona 2 ou mais dimensões que resultam na criação de um sub-cubo.
4) Pivô
No Pivot, você gira os eixos de dados para fornecer uma apresentação de dados substituta.
No exemplo a seguir, o pivô é baseado em tipos de itens.
Tipos de sistemas OLAP
Estrutura Hierárquica OLAP
Tipo de OLAP | Explicação |
OLAP relacional (ROLAP): | ROLAP é um RDBMS estendido junto com mapeamento de dados multidimensionais para executar a operação relacional padrão. |
OLAP multidimensional (MOLAP) | MOLAP Implementa operação em dados multidimensionais. |
Processamento Analítico Online Híbrido (HOLAP) | Na abordagem HOLAP, os totais agregados são armazenados em um banco de dados multidimensional, enquanto os dados detalhados são armazenados no banco de dados relacional. Isso oferece eficiência de dados do modelo ROLAP e o desempenho do modelo MOLAP. |
Desktop OLAP (DOLAP) | No Desktop OLAP, um usuário baixa uma parte dos dados do banco de dados localmente ou em seu desktop e os analisa. O DOLAP é relativamente mais barato de implantar, pois oferece muito poucas funcionalidades em comparação com outros sistemas OLAP. |
Web OLAP (WOLAP) | Web OLAP, que é um sistema OLAP acessível através do navegador da web. WOLAP é uma arquitetura de três camadas. Ele consiste em três componentes: cliente, middleware e um servidor de banco de dados. |
OLAP móvel: | OLAP móvel ajuda os usuários a acessar e analisar dados OLAP usando seus dispositivos móveis |
OLAP espacial: | SOLAP é criado para facilitar a gestão de dados espaciais e não espaciais em um sistema de informação geográfica (SIG) |
ROLAP
O ROLAP trabalha com dados que existem em um banco de dados relacional. Fatos e tabelas de dimensão são armazenados como tabelas relacionais. Ele também permite a análise multidimensional de dados e é o OLAP de crescimento mais rápido.
Vantagens do modelo ROLAP:
- Alta eficiência de dados. Ele oferece alta eficiência de dados porque o desempenho da consulta e a linguagem de acesso são otimizados principalmente para a análise de dados multidimensionais.
- Escalabilidade. Este tipo de sistema OLAP oferece escalabilidade para gerenciar grandes volumes de dados, e mesmo quando os dados estão aumentando continuamente.
Desvantagens do modelo ROLAP:
- Demanda por recursos superiores: ROLAP precisa de alta utilização de recursos humanos, software e hardware.
- Limitações de dados agregados. As ferramentas ROLAP usam SQL para todos os cálculos de dados agregados. No entanto, não há limites definidos para o processamento de cálculos.
- Desempenho de consulta lento. O desempenho da consulta neste modelo é lento quando comparado com MOLAP
MOLAP
O MOLAP usa mecanismos de armazenamento multidimensional baseados em array para exibir visualizações multidimensionais de dados. Basicamente, eles usam um cubo OLAP.
Saiba mais sobre OLAP aqui
OLAP híbrido
OLAP híbrido é uma mistura de ROLAP e MOLAP. Ele oferece computação rápida de MOLAP e maior escalabilidade de ROLAP. O HOLAP usa dois bancos de dados.
- Dados agregados ou computados são armazenados em um cubo OLAP multidimensional
- As informações detalhadas são armazenadas em um banco de dados relacional.
Benefícios do OLAP híbrido:
- Esse tipo de OLAP ajuda a economizar espaço em disco, além de permanecer compacto, o que ajuda a evitar problemas de velocidade e conveniência de acesso.
- O Hybrid HOLAP's usa tecnologia de cubo que permite um desempenho mais rápido para todos os tipos de dados.
- O ROLAP é atualizado instantaneamente e os usuários do HOLAP têm acesso a esses dados atualizados instantaneamente em tempo real. O MOLAP traz limpeza e conversão de dados, melhorando assim a relevância dos dados. Isso traz o melhor dos dois mundos.
Desvantagens do OLAP híbrido:
- Maior nível de complexidade : a principal desvantagem dos sistemas HOLAP é que eles oferecem suporte a ferramentas e aplicativos ROLAP e MOLAP. Portanto, é muito complicado.
- Sobreposições em potencial : Há maiores chances de sobreposição, especialmente em suas funcionalidades.
Vantagens do OLAP
- OLAP é uma plataforma para todos os tipos de negócios, incluindo planejamento, orçamento, relatórios e análises.
- As informações e os cálculos são consistentes em um cubo OLAP. Este é um benefício crucial.
- Crie e analise rapidamente cenários "e se"
- Pesquise facilmente o banco de dados OLAP para termos gerais ou específicos.
- OLAP fornece os blocos de construção para ferramentas de modelagem de negócios, ferramentas de mineração de dados, ferramentas de relatório de desempenho.
- Permite que os usuários façam fatias e dados de cubos de dados por várias dimensões, medidas e filtros.
- É bom para analisar séries temporais.
- Encontrar alguns clusters e outliers é fácil com OLAP.
- É um sistema de processo analítico online poderoso de visualização que fornece tempos de resposta mais rápidos
Desvantagens do OLAP
- OLAP requer a organização de dados em um esquema em estrela ou floco de neve. Esses esquemas são complicados de implementar e administrar
- Você não pode ter um grande número de dimensões em um único cubo OLAP
- Os dados transacionais não podem ser acessados com o sistema OLAP.
- Qualquer modificação em um cubo OLAP precisa de uma atualização completa do cubo. Este é um processo demorado
Resumo:
- OLAP é uma tecnologia que permite aos analistas extrair e visualizar dados de negócios de diferentes pontos de vista.
- No centro do conceito OLAP, está um Cubo OLAP.
- Vários aplicativos de negócios e outras operações de dados requerem o uso do OLAP Cube.
- Existem cinco tipos principais de operações analíticas em OLAP 1) Roll-up 2) Drill-down 3) Slice 4) Dice e 5) Pivot
- Três tipos de sistemas OLAP amplamente usados são MOLAP, ROLAP e Hybrid OLAP.
- Desktop OLAP, Web OLAP e Mobile OLAP são alguns outros tipos de sistemas OLAP.