Normalisation
Restructuration, Normalisation
L’établissement d’un schéma conceptuel de base de données par l’approche que nous avons vue au chapitre précédent permet d’établir la structure provisoire de la base. A ce stade, cette structure est rarement complètement optimale; l’application de quelques règles simples permet en général d’améliorer significativement le schéma.
Simplification
L’analyse minutieuse du schéma provisoire conduit généralement à la détection de structures qui peuvent faire l’objet de simplifications immédiates. Deux cas classiques sont à mentionner:
- Lorsqu’un type d’entités à attribut unique est associé à un seul type d’entités dans une relation 1-N, il est logique d’intégrer cet attribut au type d’entités associé (fig. 1).
- Lorsqu’un type d’entité sans attribut est en lien avec 2 autres, il est converti en association.
Lorsqu’un type d’entité sans attribut est en lien avec 2 autres, il est converti en association.
Elimination des redondances ou Normalisation
On distingue jusqu’à 8 formes normales (FN) mais seules les 3 premières sont régulièrement utilisées. Elles visent essentiellement à supprimer les redondances au sein de la base et donc à limiter l’espace occupé par la base. Il s’agit également de limiter les incohérences de données qui peuvent rendre la base inutilisable.
Evaluation de notre schéma par rapport aux définitions des formes normales 1, 2 et 3:
Première forme normale 1FN
On dit d’un schéma de base de données qu’il est en première forme normale lorsque les types d’entités qui le composent disposent d’attributs atomiques (non décomposables, fig. 2 et fig. 3).
Référence
est visiblement décomposable en id
, journal
, éditeur
et année
. L’attribut Auteur
est multi-valué
Deuxième et troisième forme normale 2FN, 3FN
Les deuxième et troisième formes normales concernent les types d’entités dont les clés sont composées de plusieurs attributs. Pour être en deuxième forme normale, le schéma doit être en 1FN et tous les attributs non-clés doivent dépendre de la clé entière (fig. 4 et fig. 5).
Auteurs
pourrait être composé des attributs Nom
et Institution
. Dans le cas représenté, les attributs Prénom de l'auteur
et Pays de l'institution
ne sont alors dépendant chacun que d’une partie de la clé: Prénom
est dépendant de Nom
tandis que Pays
est dépendant de Institution
.
Pour être en troisième forme normale, le schéma doit être en 2FN et tous les attributs doivent être en dépendance directe avec la clé. Cela signifie qu’aucun attribut ne peut dépendre d’un attribut non clé.
éditeur
n’est pas relié directement à la clé puisque que, fonctionnellement, il dépend en premier chef de l’attribut journal
.