Lorsqu'on souhaite constituer un fond documentaire ou une base de connaissance, on se pose très rapidement la question de l’optimisation et de l’organisation du contenu.
Comment structurer les répertoires, comment classifier les documents de façon « intelligente » (si forme d’intelligence il y a) pour que tous les utilisateurs puissent s’y retrouver facilement ? S’y retrouver, certes… mais surtout lorsque l’on en a le plus besoins.
L'explosion du web et de la diffusion de contenu génère des masses toujours plus importantes de données et de connaissances. De toute façon, même si il est impossible d’accéder à tout, pouvoir s’y retrouver sur la partie émergée de l’iceberg serait déjà « cool » (sans jeu de mot). Face à cette problématique, il est devenu nécessaire d’organiser et de structurer les contenus disponibles sur les autoroutes de l’information qui ressemble de plus en plus à un gigantesque plat de spaghettis.
Je vous propose de survoler 3 notions importantes liées à "l'indexation intelligente" des bases documentaires et des bases de connaissances : les taxinomies , les thesaurus et les ontologies.
Commentaires
Le thésaurus est une taxinomie sur laquelle on ajoute des relations « horizontales » en plus de la relation verticale qui structure la taxinomie originale. Ces relations expriment une « connexité » (dépendance, annexe à ) entre sujets, par des liens du type « relatif à », « voir aussi » ou « synonyme de », ... et permettent d'élargir le champ d'étude ou de recherche.
Le terme ontologie appartient d'abord à la philosophie, et plus particulièrement à la métaphysique. Rien à voir donc,à l'origine, avec les « vocabulaires contrôlés ».
Ce terme en est venu à désigner, dans le monde des sciences de l'information, la forme la plus sophistiquée des vocabulaires contrôlés.
Dans une ontologie, non seulement on normalise un ensemble de termes dans un lexique, mais on formalise et explicite aussi les relations qui les lient. On défini donc ainsi une grammaire (et donc un langage formel) sur ces termes et relations.
Les taxinomies et les thésaurus peuvent être considérés comme des ontologies dont les relations seraient restées implicites (inexprimées ou sous entendu) car « évidentes » pour le lecteur (mais pas pour l'ordinateur). Vous pouvez maintenant (re)prendre un peu daspirine ;-)
Trackbacks
Aucun trackback pour cet article



La taxinomie est la forme la plus simple, la plus intuitive et la plus utilisée des vocabulaires dit « contrôlés ». Elle se présente sous la forme d'une hiérarchie de termes généralement organisés dans le sens de la spécialisation (du général au particulier) bien que d'autres organisations soient possible (imbrication, composition, ...). Bref, ce qui est important cest quon y représente qu'un seul type de relation à la fois : par exemple, si vous classez selon une règle de spécialisation, vous ne pouvez changer en cours de route et classer selon la taille. Sinon comment sy retrouver ?