Élément de perception ; ce qui est donné dans la perception
Introduction de la notion
Étymologie : du verbe donner.
En anglais, “data”, pluriel du Latin datum = ce qui est donné. Du verbe : dari = il y a (cf. notes de Rolland Caillois, p. 1420 dans Spinoza, Œuvres complètes, éd. Bibliothèque de la Pléiade).
Cette notion, centrale en informatique, a une longue histoire et un arrière-plan dont on ne soupçonne généralement pas la richesse.
Avant la donnée, le donné
« Ce qui est immédiatement présenté à l’esprit avant que celui-ci y applique ses procédés d’élaboration. », nous dit André Lalande, dans son Vocabulaire technique et critique de la philosophie (1926). Son collègue, Jules Lachelier, ajoute : « Il est probable que le premier sens de ce mot a été celui de quantités données… » (ib.). Le mot apparaît dans le vocabulaire philosophique, tantôt sous sa forme masculine, tantôt sous sa forme féminine comme dans le titre Essai sur les données immédiates de la conscience, d’Henri Bergson (1889).
Dans ce sens originel, le donné s’assimile au percept, « objet de la perception (sans référence ontologique à une chose en soi) » (Le Grand Robert). La nuance entre la notion de donnée et celle d’information reflète l’opposition entre le percept et le concept.
Dans l’exploitation systématique des données – des tombereaux de données sous lesquelles nous croulons désormais -, toute la difficulté réside dans le passage de la donnée à l’information, c’est-à-dire dans l’interprétation. L’espace entre les deux est comblé par la “sémantisation”, si l’on peut nommer ainsi le rapprochement d’une donnée (un fait brut) et d’une forme. Ce rapprochement doit être préparé par la modélisation sémantique qui construit l’armature conceptuelle dans lesquelles les perceptions vont se couler. L’accès au sens résulte de ces deux opérations : d’abord, tenir prêt le réseau des concepts ; ensuite, rapporter le percept au concept. Ce processus complexe se réalise instantanément dans l’esprit humain, supposé un investissement préalable qui n’est autre que l’éducation. Dans l’entreprise, ce même processus réclame aussi un investissement : l’élaboration du modèle sémantique.
Ces réflexions, aussi anciennes que la philosophie, trouvent une application nouvelle avec les techniques associées aux données massives (big data).
Termes connexes : donnée informatique, politique de la donnée, facette de l’aspect logique, persistance, architecture des données.