Modèle relationnel
Du modèle E-A au modèle relationnel
Elaboration d’un schéma conceptuel
Cette partie du développement d’une base de données se base uniquement sur la description ou formulation du contexte (domaine d’application). Bien que cela puisse paraître simpliste, c’est une étape essentielle qui permet généralement d’éviter bon nombre d’erreurs. En outre, elle a le mérite d’être peu technique: c’est donc cette approche que l’on peut recommander au novice. La conceptualisation du contexte passe par 3 étapes:
Traduction du contexte en propositions élémentaires
Dans les exemples rencontrés précédemment, nous avons déjà rencontré des propositions élémentaires telles que un organisme possède un gène ou un mRNA code pour une protéine. Ces propositions sont qualifiées de binaires car elles sont constituées de 2 éléments (sujet et objet) reliés entre eux par un verbe (sujet verbe objet)
On comprend aisément que la traduction de ces propositions binaires dans un schéma de type E-A sera facilement réalisée en convertissant le sujet et l’objet en types d’entités et le verbe en un type d’associations. Pour que cela soit réalisable, il faut cependant s’assurer que le propositions soient générales et non particulières: un organisme possède un gène est une proposition générale tandis que Arabidopsis thaliana possède le gène AtFT est une proposition particulière qui ne sera pas en mesure de rendre du caractère générique que doivent prendre les types d’entités et les types d’associations sous-jacents.
Traduction des cardinalités
Les cardinalités qui régissent des types d’association peuvent être déduites en posant les 2 question:
- Pour un sujet, combien trouve-t-on d’exemplaires d’objets, au minimum et au maximum.
- Pour un objet, combien trouve-t-on d’exemplaires de sujets, au minimum et au maximum.
Tout organisme possède au minimum 1 gène; Tout gène appartient à un seul organisme
Traduction des attributs
Les attributs peuvent être déduits de manière tout aussi simple en définissant ce que possède (verbe avoir) les entités:
- sujet a objet >> entité a attribut
Dessiner un schéma conceptuel
Outils
- La distribution Ubuntu/Bio-Linux dispose, dans son catalogue de logiciels, d’un petit utilitaire permettant de concevoir différentes sortes de schémas:
Dia
. Il contient un module d’aide à la conception d’organigrammes de typeUML
(Unified Modeling Language) qui s’adapte très bien à la réalisation d’un schéma Entités-Associations.
Exercices
- Traduisez le descriptif suivant en propositions binaires, puis réalisez-en le schéma:
- Des individus appartenant à une espèce d’oiseaux invasive ont été bagués afin d’en étudier le comportement. Lorsqu’un oiseau est bagué, les données suivantes sont enregistrées: le code de sa bague, son sexe, son année de naissance lorsqu’elle est connue et l’identité de son partenaire s’il est connu.
- Plusieurs personnes de différents pays composent l’équipe en charge de leur observation.
- Celle-ci s’étendra sur plusieurs années afin de pouvoir multiplier les observations concernant les mêmes individus en différents lieux.
- Lorsqu’un oiseau est observé, l’identité de l’observateur, le lieu (localité, pays) et la date de l’observation sont enregistrées.
- Sur base des énoncés suivants, produisez le schéma de la base de données.
- Les gènes appartiennent à un organisme
- Les gènes sont référencés par des publications
- Un gène peut être transcrit en différents RNAs
- Chaque RNA est éventuellement traduit en protéine.
- Les gènes possèdent un numéro d’accession unique
- Les gènes ont une séquence qui peut être de type génomique ou mRNA
- Les organismes disposent d’un numéro de taxon, d’un nom et d’un nom commun uniques
- Les organismes possèdent un parent direct dans la classification taxonomique
- Les publications sont référencées par un numéro pubmed unique
- Les publications ont une source (journal), une date, un auteur (premier auteur) et une url
- Les auteurs ont un nom
- Les protéines ont un nom, un numéro d’accession et une séquence uniques