{"id":66864,"date":"2010-02-22T09:30:01","date_gmt":"2010-02-22T08:30:01","guid":{"rendered":"https:\/\/cms.galaxiemedia.fr\/tomshardware\/2010\/02\/22\/web-semantique-quand-le-web-devient-donnees\/"},"modified":"2023-06-23T11:45:15","modified_gmt":"2023-06-23T09:45:15","slug":"web-semantique-quand-le-web-devient-donnees","status":"publish","type":"post","link":"https:\/\/www.tomshardware.fr\/web-semantique-quand-le-web-devient-donnees\/","title":{"rendered":"Web s\u00e9mantique : quand le Web devient donn\u00e9es"},"content":{"rendered":"

Introduction<\/h2>\n

\"Image<\/a><\/span><\/span><\/p>\n\n\n\n\n\n

<\/p>\n\n

Quand la donn\u00e9e prend le dessus. C\u2019est ainsi que pourrait \u00eatre, tr\u00e8s vulgairement, r\u00e9sum\u00e9 le Web s\u00e9mantique. Un vaste projet qui a \u00e9clat\u00e9 aux yeux de tous suite \u00e0 l\u2018intervention de Tim Berners-Lee, patron du W3C – et \u00e9galement p\u00e8re du Web -, le consortium en charge de d\u00e9finir les standards du Web. Dans un entretien r\u00e9alis\u00e9 par le Courrier Unesco en 2000, il est parvenu \u00e0 transmettre sa vision d\u2019un autre web. Non pas le web 2.0, qui aujourd\u2019hui bouleverse les usages du Web en donnant la parole aux internautes, en rendant le web plus participatif, non pas le Web 3.0 dont les contours restent encore aujourd\u2019hui \u00e0 g\u00e9om\u00e9trie variable – on parle notamment d\u2019Internet des objets. Mais, bien un principe qui doit doter le Web d\u2019une part d\u2019intelligence qui lui fait d\u00e9faut aujourd\u2019hui.\u00a0 <\/p>\n\n\n\n\n\n

<\/p>\n\n

\u201cJ\u2019ai un double r\u00eave pour le Web. D\u2019une part, je le vois devenir un moyen tr\u00e8s puissant de coop\u00e9ration entre les \u00eatres humains. Et dans un second temps, j\u2019aimerais que ce soit les ordinateurs qui coop\u00e8rent. […] Quand mon r\u00eave sera r\u00e9alis\u00e9, le Web sera un univers o\u00f9 la fantaisie de l\u2019\u00eatre humain et la logique de la machine pourront coexister pour former un m\u00e9lange id\u00e9al et puissant.<\/em>\u201d<\/p>\n\n\n\n\n\n

<\/p>\n\n

Une vision un peu magique d\u2019un environnement connect\u00e9 o\u00f9 seul le sens de l\u2019information, de la donn\u00e9e serait pris en compte pour livrer \u00e0 l\u2019internaute une information riche, contextualis\u00e9e et fortement qualifi\u00e9e. Bref logique. Une logique d\u00e9crite informatiquement par des technologies, des standards qui cr\u00e9ent des liaisons entre chaque donn\u00e9e et chaque information pour lui donner du sens. Autrement dit, pousser beaucoup plus loin le concept de l\u2019information comme on le con\u00e7oit aujourd\u2019hui, pour d\u00e9barquer dans un monde contr\u00f4l\u00e9 par des vocabulaires, des th\u00e9saurus. Un monde o\u00f9 la donn\u00e9e n\u2019est pas consid\u00e9r\u00e9e uniquement comme une donn\u00e9e, mais comme une bulle s\u00e9mantique.<\/p>\n\n\n\n\n\n

<\/p>\n\n

Les activit\u00e9s li\u00e9es au Web s\u00e9mantique existent depuis 1998 au sein du W3C, et ont d\u00e9bouch\u00e9 depuis sur l\u2019\u00e9closion d\u2019une s\u00e9rie de technologies qui forment l\u2019ossature de l\u2019ensemble. D\u00e9sormais presque matures, ces standards restent malgr\u00e9 tout peu utilis\u00e9s, tout simplement car les principes du Web s\u00e9mantique demeurent, eux aussi, un peu flous dans l\u2019esprit des internautes et dans celui des entreprises. <\/p>\n\n\n\n\n\n

<\/p>\n\n

Ce dossier vise \u00e0 d\u00e9crypter les m\u00e9canismes du Web s\u00e9mantique, en tentant de livrer une d\u00e9finition aussi claire que possible, de faire un \u00e9tat des lieux des technologies qui orchestrent ce beau concept. Avant de faire un focus sur les usages, puis sur les ouvertures qu\u2019apporte l\u2019approche s\u00e9mantique, notamment au niveau du poste de travail. En route vers le web des donn\u00e9es.<\/p>\n

Structurer et qualifier la donn\u00e9e…<\/h2>\n

\"Image<\/a><\/span><\/span>Donner de l\u2019intelligence aux donn\u00e9es. Si nous avions \u00e0 d\u00e9finir de fa\u00e7on imag\u00e9e ce que peut \u00eatre le Web s\u00e9mantique, c\u2019est ainsi que nous pourrions nous y prendre. Une approche qui pousse alors beaucoup plus loin la conception ainsi que les usages du Web, y compris 2.0.<\/p>\n\n\n\n\n\n

<\/p>\n\n

Pour assimiler le concept du web s\u00e9mantique, il convient d\u2019abord de rappeler comment fonctionne, de fa\u00e7on succincte, le web classique. Le web, comme l\u2019a cr\u00e9\u00e9 Tim Berners-Lee, repose sur deux id\u00e9es fondamentales : fournir un moyen d\u2019\u00e9change de documents pour permettre aux chercheurs – \u00e0 l\u2019\u00e9poque ceux du Cern – de concentrer les r\u00e9sultats de leurs travaux au sein d\u2019un m\u00eame lieu consultable par tous. Tim Berners-Lee cr\u00e9e alors une couche normalis\u00e9e sur TCP\/IP, qu\u2019il baptise HTTP, pour partager des requ\u00eates. Restait ensuite \u00e0 cr\u00e9er un langage structurant, HTML, ind\u00e9pendant du reste, avec une particularit\u00e9 qui aujourd\u2019hui fait la force du Web : le lien hypertexte. Ici, donc, le web prend une couleur tr\u00e8s \u201cdocument\u201d. <\/p>\n\n\n\n\n\n

<\/p>\n\n

Les technologies du Web s\u00e9mantique poussent le concept beaucoup plus loin. Leur objectif : structurer de l\u2019information pour cr\u00e9er informatiquement du sens qui serait compr\u00e9hensible par les machines. On parle alors d\u2019automatisation de la gestion de la connaissance. En structurant et qualifiant tr\u00e8s fortement l\u2019information et donc les donn\u00e9es – par le biais de m\u00e9ta-donn\u00e9es et d\u2019annotations -, on parvient \u00e0 enrichir le p\u00e9rim\u00e8tre d\u2019une donn\u00e9e et de cr\u00e9er ainsi un champ s\u00e9mantique. C\u2019est la premi\u00e8re \u00e9tape. Suit ensuite celle qui va illustrer la puissance du Web s\u00e9mantique : donner de la logique entre toutes ces donn\u00e9es, et ce encore une fois de fa\u00e7on informatique, pour que l\u2019ordinateur puisse livrer une repr\u00e9sentation de la connaissance. <\/p>\n\n\n\n\n\n

<\/p>\n\n

Nous entrons, si on se r\u00e9f\u00e8re \u00e0 la vision de Tim Berners-Lee – bien qu\u2019un peu utopique aujourd\u2019hui -, dans un monde de dictionnaires, th\u00e9saurus, vocabulaires qui connectent et relient ensemble les donn\u00e9es. La valeur s\u00e9mantique de ces derni\u00e8res prime avant tout.<\/p>\n\n\n\n\n\n

<\/p>\n\n

Autre atout du web s\u00e9mantique, les donn\u00e9es, ainsi que le champ s\u00e9mantique qu\u2019on y attribue, sont par d\u00e9finition int\u00e9rop\u00e9rables. Selon le W3C, il s\u2019agit de transformer le Web en une gigantesque base de donn\u00e9es o\u00f9 tout serait partag\u00e9 par tous et chaque bout d\u2019information pourrait dialoguer avec un autre. Le web s\u00e9mantique est donc bien un web de donn\u00e9es – et non pas un web orient\u00e9 document, comme nous le mentionnions pr\u00e9c\u00e9demment. Ce sont les donn\u00e9es qui, qualifi\u00e9es, structur\u00e9es et reli\u00e9es en de multiples endroits puis plac\u00e9es dans un environnement distribu\u00e9 – le Web – forment la logique d\u2019ensemble du web s\u00e9mantique.<\/p>\n

… pour la rendre \u201dintelligente\u201d<\/h2>\n

Plut\u00f4t que de termes informatiques, le Web s\u00e9mantique emprunte ses termes au domaine de la logique, c\u2019est-\u00e0-dire aux logiciens. Un point \u00e9vident car rappelons le, le Web s\u00e9mantique vise \u00e0 traduire informatiquement une repr\u00e9sentation de la connaissance. L\u2019exemple le plus probrant est le terme \u201cOntologie\u201d, qui constitue une brique fondamentale de l\u2019approche s\u00e9mantique. L\u2019ontologie, dans le cadre du Web s\u00e9mantique, fournit les r\u00e8gles de logiques qui unissent et connectent les donn\u00e9es, qui ont \u00e9t\u00e9 au pr\u00e9alable d\u00e9finies. On parle \u00e9galement de r\u00e8gles d\u2019inf\u00e9rence<\/a>, autre terme \u00e9galement emprunt\u00e9 aux logiciens.

\"Image<\/a><\/span><\/span><\/span><\/span><\/p>\n\n\n\n\n\n

<\/p>\n\n

Un exemple ? Imaginons les technologies du web s\u00e9mantique appliqu\u00e9es \u00e0 un vaste catalogue d\u2019un site de commerce \u00e9lectronique. En d\u00e9crivant minutieusement chaque produit (en y ajoutant des m\u00e9ta-donn\u00e9es), l\u2019utilisateur dispose d\u2019une vaste somme d\u2019informations riches et logiques, auxquelles il a acc\u00e8s en fonction de sa recherche. Au produit est associ\u00e9 un nombre de donn\u00e9es qui, elles-m\u00eame, sont connect\u00e9es \u00e0 d\u2019autres\u00a0 gr\u00e2ce \u00e0 des r\u00e8gles pr\u00e9-d\u00e9finies. Je recherche une cafeti\u00e8re, l\u2019application m\u2019affichera pour r\u00e9sultat, sa nature, son mat\u00e9riau, un comparatif de prix, sa provenance, mais \u00e9galement des informations sur le caf\u00e9. A chaque information, une autre se d\u00e9clenche, logiquement.

Dans un contexte de recherche d\u2019information, l\u00e0 encore, l\u2019avantage du web s\u00e9mantique est \u00e9vident. Gr\u00e2ce \u00e0 une somme de donn\u00e9es connect\u00e9es entre elles par des liaisons structurantes, les r\u00e9sultats d\u2019une requ\u00eate livre, non plus de seuls documents HTML contenant les termes de la recherche, mais un ensemble d\u2019informations pertinentes et logiques. Les r\u00e9sultats de la recherche ne reposent plus sur les termes que renferment une page Web (comme pourrait le faire Google), mais sur des informations fournies par des donn\u00e9es entrela\u00e7\u00e9es.

Reste alors \u00e0 d\u00e9finir tr\u00e8s pr\u00e9cis\u00e9ment les donn\u00e9es et \u00e0 y ajouter ces logiques qualifiantes qui permettent de cr\u00e9er ce vaste r\u00e9seau de liaisons. C\u2019est ce que nous allons aborder dans la deuxi\u00e8me partie, consacr\u00e9e aux technologies qui soutiennent le m\u00e9canisme du Web s\u00e9mantique. <\/p>\n

Une fus\u00e9e Web \u00e0 plusieurs \u00e9tages<\/h2>\n

Comment \u00e7a marche ? Apr\u00e8s une tentative de d\u00e9finition du web s\u00e9mantique, entrons de plain pied dans les technologies qui coordonnent le concept. <\/p>\n\n\n\n\n\n

<\/p>\n\n

Le web s\u00e9mantique est une fus\u00e9e \u00e0 plusieurs \u00e9tages, dont les premiers (qui servent de socle \u00e0 l\u2019ensemble) ne sont ni plus ni moins que des technologies 100% web, et normalis\u00e9es par le W3C. Et donc consid\u00e9r\u00e9es comme stables. Voici comment le W3C repr\u00e9sente l\u2019architecture du Web s\u00e9mantique. Nous nous contenterons de notre c\u00f4t\u00e9 de n\u2019aborder que les pi\u00e8ces ma\u00eetresses de ce puzzle. Voici le \u201clayercake\u201d du Web S\u00e9mantique, comme le voit le W3C.<\/p>\n\n\n\n\n\n

<\/p>\n\n

\"Image<\/a><\/span><\/span><\/span><\/span><\/p>\n\n\n\n\n\n

<\/p>\n\n

URI : localiser la ressource
<\/strong>
C\u2019est le premier pilier de l\u2019\u00e9difice. Et un premier \u00e9lement qui donne la couleur \u00e0 l\u2019ensemble. L\u2019URI (Universal Resource Identifier) permet, comme son nom l\u2019indique, d\u2019identifier la localisation de la donn\u00e9e et la m\u00e9thode pour y parvenir (via HTTP, donc). L\u2019application la plus connue de l\u2019URI est l\u2019URL (Uniform Resource Locator). Dans le web s\u00e9mantique, les donn\u00e9es sont identifi\u00e9es gr\u00e2ce \u00e0 ce processus, qui permet \u00e0 l\u2019agent intelligent qui scanne les donn\u00e9es, d\u2019aller rechercher la donn\u00e9e – et l\u2019information donc – l\u00e0 o\u00f9 elle est stock\u00e9e.<\/p>\n\n\n\n\n\n

<\/p>\n\n

RDF : la description des relations<\/strong>

Si XML sert \u00e9galement de fondation au web s\u00e9mantique, en apportant la s\u00e9rialisation – il structure l\u2019information qui doit s\u2019afficher -, le langage ne permet pas de d\u00e9finir les structures de donn\u00e9es. C\u2019est le r\u00f4le de RDF (Resource Definition Framework), qui constitue le pilier central ind\u00e9boulonnable du web s\u00e9mantique, en formant notamment une cartographie par graphe de l\u2019information et de ses m\u00e9ta-donn\u00e9es. C\u2019est le langage qui permet de formuler les d\u00e9finitions propres aux donn\u00e9es, de d\u00e9finir la structure des donn\u00e9es.

Par exemple, pour traduire l\u2019information \u201cle tigre appartient \u00e0 la familles des mammif\u00e8res\u201d, il faut d\u00e9finir comment est connect\u00e9e la donn\u00e9e \u201ctigre\u201d avec la donn\u00e9e \u201cmammif\u00e8res\u201d, et ce via la cr\u00e9ation de cat\u00e9gories et de sous-ensembles dans lesquels sont \u00e9tiquet\u00e9es les informations par propri\u00e9t\u00e9. Comme un th\u00e9saurus (dictionnaire hi\u00e9rarchis\u00e9). C\u2019est la notion de graphe RDF, qui illustre ainsi le classement entre les donn\u00e9es.

Pour formaliser ces d\u00e9finitions, RDF s\u2019appuie sur un sch\u00e9ma que l\u2019on nomme \u201ctriplet\u201d, sur le mod\u00e8le\u00a0 \u201csujet – verbe – compl\u00e9ment\u201d. Chaque donn\u00e9e est d\u00e9crite sur ce type de d\u00e9finition – que l\u2019on nomme pr\u00e9dicat de premier ordre (sujet – pr\u00e9dicat – objet).


\"Image<\/a><\/span><\/span><\/span><\/span>
En reprenant notre exemple pr\u00e9c\u00e9dent, \u201cle tigre appartient \u00e0 la famille des mammif\u00e8res\u201d, cela donne : “Le tigre” = sujet ; “mammif\u00e8res” = objet ; “appartient \u00e0 la famille des”\u00a0 = pr\u00e9dicat. Si par exemple, des relations sont partag\u00e9es, on parle de noeuds. Exemple :\u00a0 <\/p>\n\n\n\n\n\n

<\/p>\n\n