Sexta, 22 Novembro 2024

Trata-se da construção arquitetônica de um sistema de informação, que fornece a seus usuários informações históricas de apoio a decisão, cujas quais são de difícil acesso ou apresentação quando se utiliza de meios tradicionais de armazenamento de dados operacionais. O Datawarehouse forma assim uma base de dados que permite efetuar um tratamento adequado a informação, o qual, pode habilitar a descoberta e exploração de tendências empresariais importantes. 

 

Veja Também

 

Conceitos Gerais

 

Datawarehouse é uma coleção de dados orientada por assuntos, integrada, variante no tempo e não volátil, que tem por objetivo dar suporte aos processos de tomada de decisão. O objetivo de um Datawarehouse é fornecer uma “imagem única da realidade do negócio”. De uma forma geral, sistemas de Datawarehouse compreendem um conjunto de programas que extraem dados do ambiente de dados operacionais da empresa, um banco de dados que os mantém, e sistemas que fornecem estes dados aos seus usuários.
O Datawarehouse é o epicentro da infra-estrutura estratégica da empresa. Ele suporta processamento informacional promovendo uma sólida plataforma de dados históricos integrados para serem analisados com visão corporativa.
O Datawarehouse é um banco de dados contendo dados extraídos do ambiente de produção da empresa, que foram selecionados e depurados tendo sido otimizados para processamento de consulta e não para processamento de transações. Em geral, um Datawarehouse requer a consolidação de outros recursos de dados além dos armazenados em banco de dados relacionais, incluindo informações provenientes de planilhas eletrônicas, documentos textuais, etc.
Sistemas de Datawarehouse revitalizam sistemas da empresa, pois:

  • Permitem que sistemas mais antigos continuem em operação;
  • Consolidam dados inconsistentes dos sistemas mais antigos em conjuntos coerentes;
  • Extraem benefícios de novas informações oriundas das operações correntes;
  • Provêm ambiente para planejamento de novos sistemas de cunho operacional.

É importante considerar, no entanto, que um Datawarehouse não contem apenas dados resumidos, podendo conter também dados primitivos. É desejável prover ao usuário a capacidade de aprofundar-se num determinado tópico, investigando níveis de agregação menores ou mesmo o data primitivo, permitindo também a geração de novas agregações ou correlações com outras variáveis. Além do mais, é extremamente difícil prever todos os possíveis dados resumidos que serão necessários: limitar o conteúdo de um Datawarehouse apenas a dados resumidos significa limitar os usuários apenas às consultas e análises que eles puderem antecipar frente a seus requisitos atuais, não deixando qualquer flexibilidade para novas necessidades.

 

Histórico

 

No início de 1980, começaram a aparecer novas tecnologias. Com o advento dos computadores e das linguagens de quarta geração os usuários finais passaram a controlar diretamente os sistemas e dados. Com isso surgiu a idéia de se utilizar estes dados para obter informações para tomada de decisões gerenciais. No início foram chamados de MIS (management information system ou sistemas de informações gerenciais). Atualmente são conhecidos como SADs (sistemas de apoio a decisão). Suporte a decisão é o processo de juntar, estruturar, manipular, armazenar, acessar, apresentar e distribuir informações de negócios de maneira oportuna.
Os SADs começaram com os programas de extração, que varrem um arquivo ou banco de dados, usando alguns critérios de seleção e ao encontrar os dados, transporta-os para outro arquivo ou banco de dados. Até a década de 90 haviam muitos programas de extração como o descrito. Se observarmos de forma coletiva estes programas formam uma “teia de aranha”, pois pode-se existir uma extração de uma extração, de outra extração e assim por diante.
Esta arquitetura também começou a apresentar problemas pois conforme a consulta ou solicitação da gerência, o projetista responsável pela tarefa teria que localizar e compilar os dados em vários arquivos além de ter pessoal disponível para esta tarefa, além de não ter dados confiáveis e integrados, por este motivo os sistemas operacionais atuais são simplesmente inadequados à tarefas de apoio a decisão. A maioria das organizações se encontra neste estágio a arquitetura de desenvolvimento espontâneo (teia de aranha) o que se faz necessário a mudança de arquitetura surgindo o ambiente projetado Datawarehouse.

 

Aplicações

 

As aplicações típicas podem ser classificadas em dois grandes conjuntos:

  • Aplicações do negócio: constituem as aplicações que dão suporte ao dia a dia do negócio da empresa, que garantem a operação da empresa, também chamadas de sistemas de produção;
  • Aplicações sobre o negócio: são as aplicações que analisam o negócio, ajudando a interpretar o que ocorreu e a decidir sobre estratégias futuras para a empresa - compreendem os sistemas de suporte à decisão e sistemas de informações executivas.

Uma arquitetura de dados adequada para dar suporte aos dois tipos de aplicações baseia-se em dois ambientes de bancos de dados: os bancos de dados operacionais – para dar suporte às aplicações do negócio - e os bancos de dados para suporte à decisão – para dar suporte às aplicações sobre o negócio.

 

Características

 

Primeiramente, deve-se frisar que o elemento primordial envolvendo o Datawarehouse é que os dados armazenados para análise do negócio devem ser separados dos dados do sistema operacional. Muitas razões para esta separação têm sido levantada no decorrer dos anos, a saber: (i) a performance do sistema de informação; (ii) a garantia da qualidade da informação obtida - completa e correta; (iii) a não perturbação dos sistemas operacionais através de requisições de consultas pesadas, etc.. Finalmente, os avanços tecnológicos e as mudanças na natureza dos negócios tornam a análise dos mesmos muito mais complexa e sofisticada.
O Datawarehouse fornece uma plataforma básica e uniforme à construção de sistemas de apoio a decisão.

 

Modelo e Implementação

 

Uma arquitetura de Datawarehouse é uma maneira de representar a estrutura completa de dados, comunicação, processamento, e resultados que são apresentados aos usuários finais dentro da empresa.
A arquitetura de um Datawarehouse é composta por algumas partes inter-conectadas:

  • Base de Dados Operacional / Camada de Base de Dados Externa
  • Camada de Acesso a Informações
  • Camada de Acesso aos Dados
  • Camada de Diretório de Dados (Meta Dados)
  • Camada de Gerenciamento de Processos
  • Camada de Troca de Mensagens entre Aplicações
  • Camada do Datawarehouse
  • Camada de Organização dos Dados.

Existem várias opções que podem ser consideradas na implementação de um Datawarehouse. Estas incluem as seguintes arquiteturas:

  • One-tier:  que consiste em uma arquitetura monolítica para o Datawarehouse, onde o próprio Datawarehouse, o motor de inferência do DSS (Decision Support System) e o cliente DSS residem sobre a mesma plataforma de hardware.
  • Two-tier: que consiste em uma arquitetura que inclui dois componentes: um cliente e um servidor. O cliente tem como principal objetivo esconder a complexidade dos sistemas mainframe existentes. Esta abordagem é atrativa porque ela utiliza sistemas existentes legados como servidores de base de dados e requer o mínimo de investimentos adicionais em hardware e software. Todavia, esta arquitetura não é escalonável e não pode suportar um grande número de usuários finais em linha sem modificações adicionais de software.
  • Three-tier: que consiste em uma arquitetura que define três distintos níveis - interface gráfica do usuário ou apresentação, lógica do negócio ou aplicação, e dados - e coloca cada um destes níveis sobre seu próprio processador. Esta abordagem não sobrecarrega a estação de trabalho cliente, permitindo o uso de "clientes magros" (ou seja, clientes com pouca capacidade de memória e poder de processamento). Obtém-se claramente uma melhora em termos de escalabilidade, porém em oposição tem-se um aumento no custo e na complexidade da solução.
  • Four-tier: que consiste em uma arquitetura que inclui a replicação de dados, sob a condição que esta transferência possa ser executada sem poluir a base local ou Warehouse central. Usualmente, o próprio usuário final assume a responsabilidade pela recuperação e manutenção destes dados sobre seu desktop.

É importante salientar que não existe uma arquitetura de Datawarehouse assumida como "correta". Ela pode ser escolhida a partir de alguns requisitos. Por exemplo, para uma certa empresa, a abordagem Two-tier é uma solução atraente porque minimiza o custo e a complexidade de construção do Datawarehouse. Para outra organização que requer maior desempenho e escalabilidade, a arquitetura Three-tier é mais apropriada.

 

Tipos de Datawarehouse

 

Os principais tipos de Datawarehouse são:

  • DW baseado em Servidor: Mainframe ou servidor de rede local (LAN).
  • DW Virtual: Reúne dados operacionais e dados históricos mantidos em BDs – não há um DW central
  • DW Distribuído: DW global reúne dados de vários DWs locais.
  • DW baseado na Web: Dados provenientes da World Wide Web.

 

Benefícios

 

Alguns dos benefícios que o datawarehouse traz às organizações são:

  • Sistema de informação focado no executivo
  • Agilidade na  extração
  • Possibilidade de análise cruzadas de dados
  • Possibilita acompanhar indicadores estratégicos de forma gráfica
  • Vários meios de comunicação da informação (internet, celular, notepad, etc)
  • Apoiar a avaliação das políticas públicas possibilitando o realinhamento ou ratificação dos programas e projetos/atividades (planejamento);
  • Disponibilizar informações aos gerentes visando a melhoria contínua das ações de Governo;
  • Conceder autonomia ao usuário das informações para que ele próprio obtenha seus relatórios analíticos, sem necessitar encomendá-los;
  • Permitir o desenvolvimento do hábito de efetuar análises informacionais e o aprimoramento das estratégias de busca pela exposição continuada e facilitada à informação;
  • Migrar do esforço de produção de relatórios impressos e pré-formatados para a produção de ambiente de consultas definidas pelo próprio usuário em tempo real;
  • Redução de custos e esforços, assim como a padronização das informações.
Curta, comente e compartilhe!
Pin It
0
0
0
s2sdefault
powered by social2s

topo oms2

Deixe sua opinião! Comente!