Base di dati

In informatica, il termine base di dati o banca dati (a volte abbreviato con la sigla DB dall’inglese data base), indica un insieme di dati, omogeneo per contenuti e per formato, memorizzati in un elaboratore elettronico e interrogabili via terminale utilizzando le chiavi di accesso previste.
Le informazioni contenute in una base di dati sono strutturate e collegate tra loro secondo un particolare modello logico scelto dal progettista (ad es. relazionale, gerarchico, reticolare o a oggetti). Gli utenti si interfacciano con le base dati attraverso i cosiddetti query language (query di ricerca o interrogazione, inserimento, cancellazione, aggiornamento ecc.) e grazie a particolari applicazioni software dedicati (DBMS).
Descrizione
Generalità
Il termine “base di dati” può anche indicare contemporaneamente:
l’archivio a livello fisico (hardware) cioè il sistema con i supporti di memorizzazione (es. hard disk) che contengono i dati stessi e il processore per l’elaborazione di questi (database server);
l’archivio a livello logico cioè i dati strutturati e la parte software cioè il database management system (DBMS) ovvero quella vasta categoria di applicazioni che consentono la creazione, manipolazione (gestione) ed interrogazione efficiente dei dati.
Informalmente e impropriamente, la parola “base di dati” viene spesso usata per indicare il database management system (DBMS) riferendosi dunque alla sola parte software. Un client di database lato client interagisce con il DBMS e quindi anche con la base di dati in senso fisico.
Nelle basi di dati più moderne, ovvero quelle basati sul modello relazionale, i dati vengono suddivisi per argomenti (in apposite tabelle) e poi tali argomenti vengono suddivisi per categorie (campi) con tutte le possibili operazioni di cui sopra. Tale suddivisione e funzionalità rende le base di dati notevolmente più efficienti rispetto ad un archivio di dati creato ad esempio tramite file system di un sistema operativo su un computer almeno per la gestione di dati complessi.
La diffusione delle basi di dati, e dei relativi sistemi DBMS di gestione, nei sistemi informativi moderni è enorme e capillare essendo un componente base di un sistema informativo attraverso il rispettivo sistema informatico: si pensi a tutte le attività commerciali di gestione di magazzino, gestione clienti, a sistemi di immagazzinamento di dati personali o pubblici nella pubblica amministrazione e nelle imprese private (es. banche e aziende), contabilità ecc. Le basi dati sono presenti anche all’interno dell’architettura three-tier delle applicazioni web dove rappresenta il data layer ovvero la persistenza dei dati costituendo una parte della programmazione web. La gestione e lo sviluppo delle basi di dati attraverso DBMS è diventata nel tempo una branca a tutti gli effetti dell’informatica moderna.

Gestione delle informazioni
La base di dati deve contenere anche le informazioni sulle loro rappresentazioni e sulle relazioni che li legano. Spesso, ma non necessariamente, una base dati contiene le seguenti informazioni:

Strutture dati che velocizzano le operazioni frequenti, di solito a spese di operazioni meno frequenti.
Collegamenti con dati esterni, cioè riferimenti a file locali o remoti non facenti parte della base di dati.
Informazioni di sicurezza, che autorizzano solo alcuni profili utente ad eseguire alcune operazioni su alcuni tipi di dati.
Programmi che vengono eseguiti, automaticamente o su richiesta di utenti autorizzati, per eseguire elaborazioni sui dati. Un tipico automatismo consiste nell’eseguire un programma ogni volta che viene modificato un dato di un certo tipo.
In un sistema informatico, una base di dati può essere usata direttamente dai programmi applicativi, interfacciandosi con il supporto di memorizzazione (insomma, agendo direttamente sui file). Questa strategia era quella adottata universalmente fino agli anni sessanta, ed è tuttora impiegata quando i dati hanno una struttura molto semplice, o quando sono elaborati da un solo programma applicativo.
Dalla fine degli anni sessanta, tuttavia, per gestire basi di dati complesse condivise da più applicazioni si sono utilizzati appositi sistemi software, detti “sistemi per la gestione di basi di dati” (in inglese “Database Management System” o “DBMS”). Uno dei vantaggi di questi sistemi è la possibilità di non agire direttamente sui dati, ma di vederne una rappresentazione concettuale.

La ricerca nel campo delle basi di dati studia le seguenti problematiche:

Progettazione di basi di dati.
Progettazione e implementazione di DBMS.
Interpretazione (analisi) di dati contenuti in database.
Le basi di dati spesso fanno uso di tecnologie derivate da altre branche dell’informatica. È usuale utilizzare tecniche derivate dall’intelligenza artificiale, come ad esempio il data mining, per cercare di estrarre relazioni o più in generale informazioni presenti nelle banche dati ma non immediatamente visibili.

Struttura o modello logico
Le basi di dati possono avere varie strutture, di solito, in ordine cronologico:

gerarchico (rappresentabile tramite un albero – anni sessanta, ovvero con strutture simili ai file system gerarchici),
reticolare (rappresentabile tramite un grafo – anni sessanta),
relazionale (attualmente il più diffuso, rappresentabile mediante tabelle e relazioni tra esse – anni settanta),
ad oggetti (estensione alle basi di dati del paradigma “Object Oriented”, tipico della programmazione a oggetti – anni ottanta),
semantica (rappresentabile con un grafo relazionale – inizio anni duemila).
Il formato XML, oltre che per scambi di dati su web, si sta diffondendo per la definizione di vere e proprie basi di dati. XML ha una struttura gerarchica, pare quindi un “ritorno alle origini” dei modelli di dati.

Un requisito importante di una buona base dati consiste nel non duplicare inutilmente le informazioni in essa contenute: questo è reso possibile dai gestori di database relazionali (teorizzati da Edgar F. Codd), che consentono di salvare i dati in tabelle che possono essere collegate.

La funzionalità di una base di dati dipende in modo essenziale dalla sua progettazione: la corretta individuazione degli scopi della base di dati e quindi delle tabelle, da definire attraverso i loro campi e le relazioni che le legano, permette poi una estrazione dei dati più veloce e, in generale, una gestione più efficiente.

Linguaggi per basi di dati
Nell’ambito dell’utilizzo/amministrazione della base di dati, una qualunque operazione sulla base di dati da parte dell’utente/amministratore su DBMS è ottenibile tramite un opportuno linguaggio attraverso un DBMS manager ad interfaccia grafica o ad interfaccia a riga di comando. In generale è possibile distinguere più linguaggi per basi di dati (ciascuno con lessico e sintassi che definiscono tutte le istruzioni possibili) a seconda del loro utilizzo o finalità a partire dalla creazione/progettazione, gestione, ristrutturazione, sicurezza, fino all’interrogazione della base di dati stessa:

Device Media Control Language (DMCL) – permette di controllare i supporti (memoria di massa) dove vengono memorizzati i dati.
Data Definition Language (DDL) – consente di definire la struttura o organizzazione logica della base di dati (schema di database) e le autorizzazioni per l’accesso.
Data Manipulation Language (DML) – permette di inserire, modificare, cancellare i dati (transazione).
Data Control Language (DCL) – permette di gestire gli utenti e i permessi.
Query language (QL) – permette di interrogare il database, cioè di estrarre e leggere i dati.
La sintassi di questi linguaggi varia a seconda del particolare DBMS, mantenendo tra loro un’uniformità concettuale.

Inoltre è possibile suddividere i linguaggi come:

Linguaggi testuali interattivi, come l’SQL, di cui sono stati pubblicati diversi standard, che rappresenta attualmente il linguaggio più utilizzato.
Linguaggi testuali interattivi immersi in linguaggi di programmazione comuni, quali C, BASIC ecc.
Linguaggi testuali interattivi immersi in linguaggi di programmazione proprietari.
Linguaggi grafici e user-friendly, come QBE (Query By Example), che possono essere utilizzati anche dai meno esperti.
Server delle basi di dati
Il server è la parte del DBMS (e, per estensione, il server su cui il programma opera) che si occupa di fornire i servizi di utilizzo della base di dati ad altri programmi e ad altri computer secondo la modalità client/server. Il server memorizza i dati, riceve le richieste dei client ed elabora le risposte appropriate.

Tra i più diffusi DBMS open source troviamo:

MySQL
MariaDB
Firebird SQL
PostgreSQL
I più diffusi sistemi commerciali sono:

Oracle
IBM DB2
Microsoft SQL Server
Sybase
Microsoft Access
Teradata
I database server sono complessi sistemi software concepiti in un linguaggio binario, oltre che per memorizzare i dati, anche per fornire un accesso rapido ed efficace a una pluralità di utenti contemporaneamente e garantire protezione sia dai guasti che dagli accessi indebiti (sicurezza o protezione della base dati)

Sicurezza delle basi di dati[modifica | modifica wikitesto]
Exquisite-kfind.png Lo stesso argomento in dettaglio: Protezione del database.
Sicurezza significa impedire che la base dati venga danneggiata da interventi accidentali o non autorizzati e avere l’integrità che significa garantire che le operazioni effettuate sula base di dati da utenti autorizzati non provochino una perdita consistente di dati. La protezione da accessi non autorizzati è un tema importante nella gestione delle basi di dati, che si rivelano vulnerabili nei seguenti punti:

Sicurezza dei server
Connessioni tra database
Controllo sugli accessi al database.
Data warehouse
Data mining
Evoluzione delle architetture dati[modifica | modifica wikitesto]
Dagli anni settanta le basi di dati hanno subito un enorme sviluppo sia in fatto di quantità di dati memorizzati che in fatto di tipologie di architetture adottate. Queste sono le architetture dati che si sono sviluppate negli anni:

Architettura Centralizzata, DBMS;
Architettura Parallela;
Architettura Distribuita;
Architettura Federata;
Architettura Data Integration;
Architettura Data Warehouse.

fonte: it.wikipedia.org

Questo sito non rappresenta una testata giornalistica e viene aggiornato senza alcuna periodicità, esclusivamente sulla base della disponibilità del materiale. Pertanto, non è un prodotto editoriale sottoposto alla disciplina di cui all’art. 1, comma III della L. n. 62 del 7.03.2001.© Tutto il materiale è di proprietà e il copyright dei rispettivi proprietari.