DB2 - Banco de dados - Conceito de Banco de Dados - www.cadcobol.com.br
Desenvolvido por DORNELLES Carlos Alberto - Analista de Sistemas - Brasília DF. - cad_cobol@hotmail.com
Conceito de Banco de Dados
A IMPORTÂNCIA DA INFORMAÇÃO
A informação é, para as empresas modernas, o principal recurso.
É um insumo decisivo para as tarefas gerenciais.
Uma vez que os gerentes precisam de informação de alta qualidade para administrar a mudança em ambiente global turbulento, muitas organizações estabeleceram sistemas de armazenagem e recuperação de dados - a matéria prima da informação.
CONCEITOS FUNDAMENTAIS DE BANCO DE DADOS
Os homens mais primitivos utilizavam as pinturas rupestres, ao passo que os egípcios utilizavam hieróglifos.
Anotações relacionadas às atividades de vendas diárias, tábuas de maré, variações de clima e temperatura, fatos do cotidiano e também fatos históricos.
Exemplo como esses evidenciam que, desde sempre, o armazenamento de dados acompanha a humanidade em todas suas fases de evolução.
O conceito de banco de dados
Dado pode ser definido como a matéria-prima ou o elemento básico para a geração de informações.
É um elemento básico para um banco de dados.
Talvez você possa ter presenciado a cena, ou então visto em algum filme, de salas de clínicas médicas ou hospitais com grandes armários que armazenavam pastas que, por sua vez, continham fichas referentes ao paciente, aos procedimentos realizados, às receitas médicas e a diversas outras informações pertinentes ao ambiente clínico.
Esse tipo de organização pode ser entendido como um banco de dados.
Banco de dados seria então uma coleção de dados persistentes referentes a um tema específico.
A função dessa coleção é atender às necessidades de informação de seus usuários, sendo elas a de uma simples consulta ou a de geração de informações ou conhecimento.
Sistemas de arquivos
O mesmo estilo de armazenamento representado por meio de armários, gavetas, pastas e fichas pode ser transportado para o mundo computacional.
Assim surgiu o primeiro modelo de estrutura de banco de dados.
O modelo baseado no gerenciamento de arquivos se utilizava da estrutura básica do sistema operacional, composta de diretórios e arquivos.
Para armazenar os dados nesse modelo, estes são mantidos em um único arquivo.
Por exemplo, os dados de clientes são armazenados sequencialmente em um arquivo distinto ao arquivo que armazena os dados sobre vendas realizadas.
Nesses arquivos existem linhas e colunas, tal qual uma planilha que você provavelmente já conhece.
Cada coluna é denominada campo, que é a menor unidade de informação existente em um banco de dados.
Uma linha que contém um conjunto de campos é denominada registro, devendo haver dados em cada um dos campos.
Um conjunto de campos e registros é denominado de tabela.
A facilidade e a simplicidade na estrutura correspondem a uma grande vantagem desse modelo, o que, em contrapartida, contrasta com sua dificuldade em relacionar os dados e com a grande chance de haver dados redundantes nesses arquivos.
Banco de dados com modelo hierárquico
Na década de 1960, foi desenvolvido pela IBM o IMS (Information Management System), que possui como base o modelo hierárquico.
Esse modelo representou um grande avanço nas técnicas de armazenamento de dados, utilizando como referência uma estrutura em árvore.
Essa estrutura possibilita a organização dos registros através de ligações, nas quais cada registro possui vários campos e cada campo possui somente um valor.
Cada um dos registros possui dois segmentos: o superior e o subordinado.
Eles são utilizados para a ligação com um outro registro, em um relacionamento pai-filho.
O registro pai pode possuir vários filhos, mas os registros filhos só podem possuir um registro pai, como demonstrado na figura abaixo que mostra um esquema de banco de dados hierárquico:
Houve grandes melhoras na forma que o armazenamento era feito, e, pela primeira vez, os dados de diferentes assuntos poderiam ser relacionados.
Banco de dados com modelo de rede
No entanto, essa estrutura começou a perder prestígio quando foi necessário armazenar uma grande quantidade de dados.
Além disso, houve problemas em razão de suas próprias premissas, em casos em que os relacionamentos necessitavam ser representados como vários registros pai para um único registro filho.
Na tentativa de melhorar o modelo hierárquico, foi criado o modelo de rede, representado por um diagrama similar ao hierárquico.
No entanto, este novo modelo poderia relacionar cada registro filho com vários pais diferentes.
Sua estrutura utilizava termos como entidades e atributos (registros e itens do registro, respectivamente).
As melhorias propostas acarretaram em um sistema com buscas mais rápidas e complexas, pois o modelo não dependia de um único registro para levar aos próximos.
No entanto, o modelo de rede apresentava os mesmos problemas de seu antecessor, ao se deparar com grandes quantidades de dados, ou então na difícil manutenção das estruturas quando alterações eram solicitadas.
Banco de dados com modelo relacional
O próximo modelo apresentou melhoras significativas quando comparado aos modelos hierárquico e de rede.
O modelo relacional se destaca pela simplicidade e flexibilidade, utilizando como base os mesmo conceitos dos arquivos de dados.
Os dados são armazenados em tabelas que, por sua vez, são compostas de campos e registros.
O banco de dados relacional foi criado com base na teoria matemática de conjuntos, e, por isso, seus componentes principais supracitados também podem ser conhecidos por seus correspondentes em linguagem matemática.
Os campos podem ser chamados de atributos, os registros são chamados de tuplas, e as tabelas são conhecidas como relação.
A estrutura pode se comparada a uma planilha eletrônica, com suas linhas (tuplas) e colunas (atributos).
O conteúdo de um conjunto linha-coluna específico é denominado célula, tanto para a planilha eletrônica como para o banco de dados relacional.
A célula é responsável por conter o valor do atributo que, por definição, deve ser um valor atômico.
Atomicidade de um dado
Entende-se por valor atômico um dado que está em uma forma que não consiga ser divisível.
Por exemplo, o registro de um telefone no padrão “+99 (99) 9999-9999” pode ser considerado um valor não atômico, visto que ele pode ser dividido em partes como código do país, código da localidade, prefixo e sufixo.
Domínio de um dado
Outro conceito importante para o banco de dados relacional é o domínio do atributo, representado pelo conjunto de valores possíveis de serem assumidos por um atributo.
Por exemplo, para o atributo “preço” da relação “produto”, o domínico do atributo é o conjunto de todos os valores possíveis para esse campo, sendo impossível a utilização de valores negativos.
Para o domínio do atributo “cor” da relação “produto”, deve ser considerado o conjunto de todas as cores possíveis.
Bancos de dados com modelo orientado a objetos
O modelo orientado a objetos surgiu com a missão de armazenar dados complexos, tais como sistemas de informações geográficas (SIG) ou ferramentas de Computer Aided Desing (CAD) e Computer Aided Manufacturing (CAM).
O banco de dados orientado a objetos busca agrupar os dados separados em objetos com tipos estruturados, tal como um tipo “endereço” que é composto pelos atributos “rua”, “número”, “bairro” e “cidade”.
Outros recursos como herança e aninhamentos estão disponíveis no modelo orientado a objetos.
Para modelar bancos de dados orientados a objetos utiliza-se a linguagem Unified Modeling Language (UML).
A utilização dos modelos apresentados foi possível por meio da utilização de sistemas que facilitassem o acesso aos dados e fossem capazes de manipular essas informações, implementando as regras de cada modelo.
Cada um desses sistemas é chamado de Sistema de Gerenciamento de Banco de Dados (SGBD).
SISTEMAS GERENCIADORES DE BANCO DE DADOS
Os SGBDs são um conjunto de serviços de software responsáveis por evitar problemas tais como redundância de dados, dificuldade nos acessos, isolamento de dados, problemas de integridade, problemas de atomicidade ou problemas com acesso concorrente.
Para que os dados e as estruturas do banco de dados sejam manipulados, os SGBDs apresentam linguagens específicas para essas tarefas sendo a Structured Query Language (SQL) a mais utilizada nos dias de hoje para os bancos de dados relacionais.
Alguns SGBD suportam o uso da linguagem java.
Linguagens de Bancos de dados
As linguagens podem ser divididas em duas partes diferentes: a linguagem de manipulação de dados e a linguagem de definição de dados.
A linguagem de manipulação de dados (DML) é a responsável por inserir, atualizar, excluir e recuperar os dados e as informações no banco de dados.
A linguagem de definição de dados (DDL) é utilizada para criar, modificar ou excluir a parte estrutural do banco de dados, incluindo as consistências necessárias para inserção de dados, permissões de acesso e implementação do esquema criado pelo projetista.
O esquema do banco de dados é apenas uma parte do projeto do banco de dados.
O Projeto de um Banco de dados
Um projeto de banco de dados é composto de vários documentos que determinam projetos em diferentes níveis de visão.
O primeiro modelo é baseado na visão descritiva do negócio, que é a mais próxima do mundo real.
Esse documento busca trazer o maior número de informações e características para que as necessidades relatadas durante o levantamento sejam satisfeitas.
O projeto de um banco de dados dependerá sempre da qualidade das informações resultantes da etapa de levantamento dos requisitos do sistema.
Após o levantamento dos requisitos e a definição de um modelo descritivo do negócio, o projeto do banco de dados segue para a elaboração do modelo conceitual, no qual o projetista começa a adequar o documento descritivo a um modelo de dados.
Assim é iniciada uma das fases mais críticas do projeto, na qual será definida uma visão macro de todo o banco de dados, descrevendo quais informações serão armazenadas e o relacionamento entre elas.
Um modelo bastante utilizado para essa etapa é o modelo entidade-relacionamento (MER).
O projeto do banco de dados segue então para o projeto lógico, no qual o modelo conceitual será transformado em um modelo de dados específico para a implementação estrutural do banco de dados de acordo com o modelo de dados utilizado pelo banco de dados ( hierarquivo, rede, relacional, orientado a objetos ).
Finalmente o projeto lógico é sucedido pelo projeto físico, que deve conter os detalhes da arquitetura que será utilizada no projeto e a implementação física do banco de dados onde são considerados, entre outros aspectos, o espaço necessário para o armazenamento, a distribuição do banco de dados, a segurança de acesso aos dados, a política de backup/recovery, etc.
MODELAGEM DE DADOS
Para quem não sabe, a modelagem de dados é um processo no qual você projeta ou planeja o modelo a ser utilizado para a construção da sua base de dados (BANCO DE DADOS), de forma que reflita os conceitos do negócio a ser atendido.
É muito importante que haja um perfeito entendimento e compreensão das necessidades de informação do negócio que está sendo atendido pelo projeto do banco de dados.
Para isso, é necessário um bom levantamento de requisitos, atividade que é feita pelo analista de requisitos que atua junto ao analista de negócios a fim de descobrir os requisitos de informação que devem ser atendidos no projeto do banco de dados.
Qual o objetivo da modelagem de dados? Por que modelar os dados do ambiente de negócios?
Representar os conceitos do ambiente de negócios observado
Documentar e normalizar os dados no modelo de dados
Fornecer processos de validação
Observar fatos no ambiente de negócios e identificar relacionamentos entre os objetos do ambiente de negócios.
Representar as regras de negócio que regulam os processos no ambiente de negócios
Além disso, para se obter uma boa modelagem dos dados, através de um projeto de banco de dados, faz-se necessário o conhecimento das regras de negócio, ou seja, das premissas e restrições inerentes ao negócio.
Para se conseguir isso é feita uma análise de todas as informações que fazem parte do negócio a fim de se determinar de que forma estas informações serão tratadas.
Administração de Dados
O objetivo principal da administração de dados é planejar, documentar, modelar, gerenciar e integrar os recursos de informação de uma empresa.
Esta integração pode ser alcançada através de uma combinação de perfis refinados e técnicas apropriadas, uso apropriado das ferramentas de Administração de Dados tais como um repositório de metadados e produtos de modelagem de dados, típicamente ferramentas CASE.
Duas abordagens são possíveis.
Em ambos os casos, entretanto, os administradores de dados e os administradores de banco de dados cooperam estritamente no gerenciamento da organização dos dados:
A primeira abordagem coloca a administração de dados e de banco de dados separadamente por serem funções freqüentemente executadas por áreas distintas, com atividades diferentes e perfis de profissionais diferentes.
A segunda, coloca a administração de banco de dados subordinada à administração de dados porque seus conceitos e princípios são um subconjunto daqueles definidos pela administração de dados, o que não necessariamente implica uma hierarquia organizacional.
© Copyright Professor Fernando De Siqueira - Banco de Dados I