Mesurer l’information et la connaissance, rêve scientiste ou possibilité ?

Dossier : ExpressionsMagazine N°600 Décembre 2004Par Jean-Noël LHUILLIER (58)

L’insaisissable information contenue

Depuis de longues années la plu­part des per­sonnes, des entre­prises, et des groupes humains, au moins dans les socié­tés déve­lop­pées, mani­pulent en prio­ri­té de » l’in­for­ma­tion « , et acces­soi­re­ment des pro­duits. Cela donne lieu à d’in­nom­brables efforts et contrats pour la maî­tri­ser, c’est-à-dire pour la créer, l’ac­qué­rir, la sto­cker, la mettre en forme, la trans­mettre, la vendre, l’a­che­ter, l’utiliser… 

Mais l’in­for­ma­tion des uns n’est pas l’in­for­ma­tion des autres. Autant l’in­for­ma­tion des infor­ma­ti­ciens et spé­cia­listes des télé­com­mu­ni­ca­tions est bien défi­nie et mesu­rable, depuis en par­ti­cu­lier les tra­vaux de C. E. Shan­non1, autant celle des pro­fes­sion­nels d’autres domaines, par exemple des médias, des com­mu­ni­ca­teurs, de mon­sieur Tout-le-monde, l’est mal, et ne peut que cari­ca­tu­ra­le­ment être mesu­rée en bits. Ceci parce que leur inté­rêt est bien sûr ailleurs, dans le conte­nu infor­ma­tion­nel. . Nous pou­vons sou­vent connaître le nombre de bits d’un mes­sage, mais pour beau­coup de créa­teurs et uti­li­sa­teurs de l’in­for­ma­tion il repré­sente très mal la quan­ti­té d’informations. 

Y a‑t-il vrai­ment la même quan­ti­té d’in­for­ma­tions dans ces 5 images que dans ces 50 pages de texte ou dans cette base de don­nées de 500 enre­gis­tre­ments, qui nous ren­seignent sur le même sujet ? Un des­sin ou une pho­to contiennent-ils plus ou moins qu’un long dis­cours ? Ce pro­gramme de fran­çais des classes de seconde est-il trois fois plus copieux que celui des cin­quièmes ? Ce jour­nal télé­vi­sé en dit-il plus que ce jour­nal quo­ti­dien impri­mé ? Les connais­sances de cette entre­prise valent-elles deux, ou cent fois, celles de telle autre ? 

Dans tous ces cas et bien d’autres, on ne sait en fait pas défi­nir ce qu’est l’in­for­ma­tion conte­nue en jeu, et on sait donc encore moins en esti­mer la quan­ti­té. Des esti­ma­tions même à 10 % près seraient un pro­grès consi­dé­rable. Il n’est de science et d’é­co­no­mie que du mesu­rable, peut-on mesu­rer l’in­for­ma­tion conte­nue ? Pas le nombre de bits, mais la connais­sance trans­mise qui est propre aux humains uti­li­sa­teurs de l’in­for­ma­tion, par oppo­si­tion aux machines cou­rantes et même peut-être aux sys­tèmes experts. 

Mon ambi­tion est de pro­po­ser une approche de solu­tion, de méthode d’es­ti­ma­tion. Elle peut appa­raître insen­sée, scien­tiste, voire sacri­lège – si j’en juge par l’ac­cueil fait à ma pro­po­si­tion par divers inter­lo­cu­teurs. La connais­sance est dite insai­sis­sable, c’est le propre des cer­veaux humains, voire des dieux, et l’in­tel­li­gence arti­fi­cielle échoue à vou­loir la codifier. 

C’est bien vrai. Je ne pré­tends donc pas théo­ri­ser et décom­po­ser l’in­for­ma­tion conte­nue ou la connais­sance en élé­ments dénom­brables, inal­té­rables, objec­tifs, et abso­lu­ment mesu­rables. La connais­sance reçue est en par­tie propre à la per­sonne qui la reçoit, elle est donc sub­jec­tive, dépend de ce que cette per­sonne sait déjà, de son état phy­sique et men­tal, et même de ses affects et sen­ti­ments. Mais je pro­pose de réduire nos ambi­tions. Dans beau­coup de cas pra­tiques de trans­mis­sion d’in­for­ma­tions et connais­sances, on peut jugu­ler cette diver­si­té, sché­ma­ti­ser l’en­semble des récep­teurs et les condi­tions de trans­mis­sion du mes­sage, défi­nir des res­tric­tions d’u­sage, qui per­met­tront de rendre objec­tives sous condi­tions les infor­ma­tions conte­nues et d’en esti­mer les quan­ti­tés. Cela tout en lais­sant au cas infor­ma­tion­nel (cas pra­tique ain­si sché­ma­ti­sé) suf­fi­sam­ment de repré­sen­ta­ti­vi­té pour que la mesure de ces quan­ti­tés d’in­for­ma­tions soit utile et assez fiable pour satis­faire les inté­res­sés à ce cas pratique. 

Quelques conditions de la transmission de l’information numérisée

Par volon­té déli­bé­rée, Shan­non ne se pré­oc­cupe pas du conte­nu séman­tique des mes­sages, sa théo­rie traite de ce que nous appel­le­rons le niveau 1, niveau numé­ri­sé de l’in­for­ma­tion.

Rap­pe­lons que cette théo­rie, que la tra­di­tion a rete­nue sous le nom de » théo­rie de l’in­for­ma­tion « , consi­dère l’in­for­ma­tion comme ce qui ren­seigne un récep­teur au sujet d’un émet­teur-source2. Dis­tin­guons-en cer­tains prin­cipes ou condi­tions que nous allons pou­voir réuti­li­ser ensuite pour l’in­for­ma­tion contenue. 

Shan­non a signa­lé que la quan­ti­té d’in­for­ma­tions reçues dépend certes beau­coup du mes­sage que l’é­met­teur a envoyé vers le récep­teur, mais aus­si des per­for­mances du canal de trans­mis­sion qui les relie, et de ce que le récep­teur sait déjà avant que la trans­mis­sion ne com­mence. Il sait peut-être déjà le mes­sage (auquel cas il n’y a pas d’in­for­ma­tion trans­mise car il n’ap­prend rien sur la source). Il doit aus­si connaître cer­tains des codes que l’é­met­teur et le canal de trans­mis­sion ont employés pour coder le mes­sage (s’il ne les sait pas, le mes­sage est pour lui incom­pré­hen­sible ou irre­ce­vable, il n’y pas non plus d’in­for­ma­tion transmise). 

Ces trois condi­tions de la trans­mis­sion (codes par­ta­gés, niveau d’i­gno­rance préa­lable du mes­sage par le récep­teur, per­for­mances du canal) nous gui­de­ront dans notre ana­lyse aux niveaux de sens plus éle­vés que le niveau 1 trai­té par Shannon. 

Le contenu et l’échelle du sens

L’in­for­ma­tion numé­ri­sée est tout à fait insuf­fi­sante pour la plu­part de nos pro­blèmes pra­tiques, non essen­tiel­le­ment techniques. 

Ce qui compte pour M. Dupont au tra­vail, c’est ce qu’il lit et com­prend du tableau de ges­tion qu’il reçoit, pas les bits qui ont per­mis de le coder, trans­mettre et rece­voir. Si on veut com­pa­rer les quan­ti­tés d’in­for­ma­tions d’un jour­nal impri­mé et du jour­nal télé­vi­sé, il est tout à fait insuf­fi­sant de com­pa­rer le nombre de bits du fichier du jour­nal tel qu’il peut exis­ter chez l’im­pri­meur, et le nombre de bits du fichier de la bande vidéo numé­rique du 20 heures de TF N. Le fichier vidéo est beau­coup plus lourd en bits et pour­tant M. Dupont sait peut-être déjà tout ce que le jour­nal télé­vi­sé montre ou dit, par contre le jour­nal impri­mé est éven­tuel­le­ment plein pour lui d’autres révé­la­tions sur le moral de l’é­quipe de foot. 

Mais com­ment défi­nir le conte­nu ? Les bits sont bien un genre de conte­nu, mais de niveau de sens élé­men­taire, le niveau numé­ri­sé. Le moral de l’é­quipe de foot ne peut être appré­cié que si on uti­lise des codes, des réfé­ren­tiels, beau­coup plus sub­tils. Cela va être la base de notre méthode : le conte­nu infor­ma­tion­nel d’un mes­sage doit être appré­cié par nous, qui cher­chons à mesu­rer la quan­ti­té d’in­for­ma­tions, simul­ta­né­ment à divers niveaux de sens, du plus simple (le 1er niveau, niveau numé­ri­sé) aux plus com­plexes (que nous appel­le­rons niveau 4, des connais­sances, et niveau 5, des savoirs). À chaque niveau cor­res­pondent des codes par­ta­gés entre récep­teur et émet­teur, ou par­fois avec le canal. 

Les trois condi­tions de Shan­non, citées plus haut pour le niveau numé­ri­sé, sont si riches que nous allons pou­voir les trans­po­ser à des niveaux de sens qu’il s’é­tait inter­dit de trai­ter3, mais notre but est pra­tique. Notre échelle du sens et une vision d’in­gé­nieur, habi­tué aux approxi­ma­tions, vont nous per­mettre de l’approcher. 

Un mes­sage sera por­teur simul­ta­né­ment d’in­for­ma­tions de plu­sieurs niveaux de sens, et donc de plu­sieurs quan­ti­tés d’in­for­ma­tions, une par niveau. Mais nous n’es­saie­rons pas de mesu­rer la quan­ti­té d’in­for­ma­tions glo­bale ou de sens4 d’un mes­sage (ou d’un sup­port) sur une sorte d’é­chelle uni­ver­selle. Il fau­drait pour cela dis­po­ser d’une équi­va­lence entre nos uni­tés de mesure à chaque niveau (une infor­ma­tion de niveau éle­vé vaut n infor­ma­tions de niveau plus faible), ce qui n’a aucun sens, c’est le cas de le dire. 

Pour défi­nir ces niveaux de sens, pour­sui­vons dans l’exemple du jour­nal imprimé.

Nombre d’informations de l’article lu par M. Dupont

Déjà, pour lire le jour­nal, il faut savoir lire. M. Dupont uti­lise donc les codes de la langue fran­çaise écrite, et en pre­mier l’al­pha­bet des lettres fran­çaises (avec des accents), en majus­cules, minus­cules, italiques… 

Mais les carac­tères sont des signes qui n’ap­portent par eux-mêmes guère de sens à M. Dupont. Il faut mon­ter un peu plus haut en sens pour défi­nir un niveau 2 utile. M. Dupont uti­lise aus­si le voca­bu­laire des mots fran­çais, tels que lis­tés dans le dic­tion­naire (ou une par­tie de celui-ci, et il fait des erreurs) ; et un peu de voca­bu­laire anglo-amé­ri­cain car le jour­nal en uti­lise, et pas mal de jar­gon spor­tif. Ce sera notre deuxième niveau, que nous bap­ti­se­rons niveau des don­nées. Pour déter­mi­ner com­bien un texte contient de don­nées, nous comp­tons ses mots. Les nombres, si nom­breux dans les bases de don­nées de ges­tion par exemple, sont des sortes de mots. 

C’est un niveau faci­le­ment mesu­rable, car on compte faci­le­ment les mots, à condi­tion que les conven­tions soient claires (par exemple, un mot com­po­sé compte-t-il pour deux ou pour un ?). 

Remar­quons que M. Dupont ne reçoit comme infor­ma­tions ces mots5 que s’ils lui évoquent quelque chose. Et s’il ne savait pas déjà qu’il allait les trou­ver là : si par erreur un article répète deux fois de suite le même mot ou la même phrase, la deuxième occur­rence ne lui apporte rien (sauf un éven­tuel ren­for­ce­ment). Et il ne reçoit les mots que si le canal est bon, ce qu’il ne serait pas si des mots étaient mal impri­més, ou si M. Dupont per­dait une page avant de la lire. Les trois condi­tions nous servent donc aus­si à ce niveau de sens, comme à tous les niveaux, pour ana­ly­ser la quan­ti­té d’informations. 

Au-delà des carac­tères et des mots, la langue fran­çaise sup­pose encore l’emploi de sa gram­maire, que M. Dupont doit par­ta­ger au moins en par­tie avec l’é­met­teur et le canal (en par­ti­cu­lier le jour­na­liste et l’im­pri­meur). Ils n’en n’ont sûre­ment pas la même connais­sance, et ils font cha­cun des erreurs, mais pas les mêmes. La gram­maire concerne un peu le niveau 2 et beau­coup le niveau 3. 

Il faut en effet qu’é­met­teur et récep­teur par­tagent aus­si la séman­tique du texte, au sens de la lin­guis­tique6. Nous appel­le­rons ce 3e niveau (de la séman­tique) celui des infor­ma­tions élé­men­taires7 (i. e.). Dans cet exemple, c’est ce qu’une phrase8 lue com­mu­nique à un lec­teur par­lant bien le fran­çais journalistique. 

Ces quan­ti­tés d’in­for­ma­tions élé­men­taires auront un cer­tain carac­tère objec­tif, si nous sché­ma­ti­sons le cas et restrei­gnons suf­fi­sam­ment les condi­tions de leur décompte :

  • d’a­bord en sim­pli­fiant la grande diver­si­té des récepteurs/lecteurs poten­tiels. Dans le cas pra­tique du jour­nal, nous ne nous inté­res­se­rons sou­vent qu’au lec­teur moyen, ou en tout cas à des types de lec­teurs assez fré­quents. On va faire des hypo­thèses en par­ti­cu­lier sur ce que les lec­teurs-types savent ou pas. Pour les cas infor­ma­tion­nels dits par­faits au niveau N, ils sont répu­tés savoir les codes de ce niveau (ici au niveau 3, par exemple la gram­maire), mais pas à l’a­vance le conte­nu du mes­sage à ce niveau ;
  • ensuite en fai­sant des hypo­thèses sim­pli­fi­ca­trices sur la diver­si­té des mes­sages et des canaux : nous igno­re­rons sans doute – à moins que cela ne soit essen­tiel pour le cas – le numé­ro spé­cial annuel, le cas de grève de l’im­pri­me­rie qui force à réduire la taille du jour­nal, la pho­to qui a été tron­quée par erreur, etc. ; 
  • enfin en conve­nant, nous les mesu­reurs, ou plu­tôt les esti­ma­teurs de quan­ti­tés d’in­for­ma­tions pour ce cas, de cer­taines façons de les décomp­ter qui sim­pli­fient l’es­ti­ma­tion sans trop ris­quer de déna­tu­rer le cas. 


Les trois fina­le­ment sont des conven­tions de modé­li­sa­tion. Tout notre art va être de défi­nir et adop­ter celles qu’il faut pour sim­pli­fier sans déna­tu­rer le cas pra­tique, le modé­li­sant ain­si en cas infor­ma­tion­nel pour lequel nous par­ve­nons à des quan­ti­tés d’in­for­ma­tions utiles et fiables pour le cas pratique. 

On ne peut pas sou­vent expri­mer sim­ple­ment les conven­tions de décompte par des règles écrites, il vau­dra mieux en don­ner des exemples pour des phrases typiques ren­con­trées dans le cor­pus à considérer. 

Par exemple une phrase telle que » Le ministre de l’In­té­rieur, qui por­tait un cos­tume noir, a déco­ré Zanut­ti de l’Ordre du Mérite spor­tif » comp­te­ra (en cas par­fait) pour trois infor­ma­tions élé­men­taires plu­tôt qu’une. Les trois rai­son­na­ble­ment pos­sibles sont : 

  • le ministre de l’In­té­rieur por­tait un cos­tume noir, 
  • il a déco­ré Zanutti, 
  • la déco­ra­tion était le Mérite sportif. 


On pour­rait en comp­ter beau­coup plus (le ministre était celui de l’In­té­rieur. Il a agi. L’acte était de remettre quelque chose. Ce quelque chose était une déco­ra­tion. Il n’y a qu’un ministre de l’In­té­rieur en France. Il a le pou­voir de déco­rer, etc.), mais ce serait contraire au bon sens, et notre M. Dupont moyen en fait ne les reçoit pas. 

Ce niveau 3 sera sou­vent celui qui per­met une ana­lyse effi­cace du cas infor­ma­tion­nel pra­tique : il est déjà bien séman­tique (niveau de sens assez éle­vé), tout en per­met­tant des éva­lua­tions assez repro­duc­tibles et pas trop com­plexes de quan­ti­tés d’informations. 

Mais on ne lit pas les phrases indé­pen­dam­ment les unes des autres, et l’en­semble d’un article com­mu­nique un ou quelques mes­sages prin­ci­paux, inten­tion­nels ou par­fois non recher­chés. Pour les émettre et les rece­voir, on uti­lise des codes sub­tils, por­tant par exemple sur le monde du foot­ball. Le moral de l’é­quipe de foot est à zéro, et on va perdre le pro­chain match, ce sont les deux infor­ma­tions de haut niveau de sens que M. Dupont va infé­rer, faire émer­ger, reti­rer de l’en­semble de l’ar­ticle, même si ce n’est pas lit­té­ra­le­ment expri­mé ain­si. Appe­lons ce 4e niveau le niveau des connais­sances. Pour com­mu­ni­quer ce mes­sage, il a fal­lu que le jour­na­liste et M. Dupont par­tagent des connais­sances géné­rales sur le foot, et d’autres, par exemple la logique (si le jour­na­liste a fait un syl­lo­gisme, il faut que M. Dupont ait com­pris), etc. 

Au fur et à mesure que le niveau de sens consi­dé­ré monte, il est évi­dem­ment de plus en plus dif­fi­cile d’i­den­ti­fier les codes mis en jeu et de mesu­rer » objec­ti­ve­ment » la quan­ti­té d’in­for­ma­tions de ce niveau. L’art d’ex­traire les infor­ma­tions de niveau 4 d’un texte s’ap­pa­rente à celui de faire des résu­més. Pour pou­voir mesu­rer les quan­ti­tés d’in­for­ma­tions de ce niveau, nous devrons sché­ma­ti­ser le cas et avoir recours à des esti­ma­teurs repré­sen­ta­tifs de la popu­la­tion de récep­teurs. Mais si nous arri­vons à des esti­ma­tions plau­sibles par­ta­geables par les divers esti­ma­teurs et uti­li­sa­teurs de cette esti­ma­tion, per­met­tant d’é­clai­rer des déci­sions à prendre avec un degré de confiance cor­rect, cela nous suffira. 

Alors, un mes­sage éla­bo­ré tel un article de jour­nal impri­mé peut être ana­ly­sé dans un cas infor­ma­tion­nel par­fait sur 4 niveaux de sens, pour les­quels il pré­sente un » Pro­fil infor­ma­tion­nel « . À chaque niveau de sens cor­res­pond une quan­ti­té d’in­for­ma­tions dans des condi­tions modé­li­sées d’é­met­teur, canal et récep­teur. Un infor­ma­ti­cien ou un télé­com­mu­ni­ca­teur qui vou­drait dimen­sion­ner les réseaux per­met­tant de trans­mettre des articles s’in­té­res­se­ra aux niveaux 1 et 2. Un patron de média qui cherche pour­quoi son jour­nal est en perte de vitesse s’in­té­res­se­ra sur­tout aux niveaux 3 et 4 (voir gra­phique ci-dessus). 

Cette ana­lyse par niveau de sens per­met d’i­den­ti­fier des carac­té­ris­tiques inté­res­santes d’un texte. Sa den­si­té infor­ma­tion­nelle, sa conci­sion peuvent être repé­rées par le rap­port nombre d’in­for­ma­tions élémentaires/nombre de mots ou par le nombre de connaissances/nombre de mots (ou d’in­for­ma­tions élé­men­taires). Pour une trans­mis­sion effi­cace, par exemple pour un ensei­gne­ment, on a inté­rêt à ce que les débits de mots, d’in­for­ma­tions élé­men­taires et de connais­sances (mesu­rés par exemple sur chaque para­graphe en divi­sant la quan­ti­té par le temps que prend sa lec­ture ou pré­sen­ta­tion orale) soient à peu près constants au cours de la trans­mis­sion9, avec peut-être une dimi­nu­tion en début d’a­près-midi et fin de jour­née car les récep­teurs deviennent alors moins récep­tifs, ce qu’on peut essayer de contre­ba­lan­cer en dimi­nuant la conci­sion, etc. 

Pour faire cette ana­lyse, nous avons uti­li­sé une struc­ture d’a­na­lyse du mes­sage, sur les élé­ments de laquelle à chaque niveau nous avons décomp­té les infor­ma­tions : posi­tions binaires, empla­ce­ments de mots, phrases, article entier. On devra ain­si pour chaque cas et chaque niveau non seule­ment défi­nir l’u­ni­té employée, mais aus­si l’élé­ment de la struc­ture d’a­na­lyse sur lequel on va comp­ter élé­ment par élé­ment les infor­ma­tions, c’est-à-dire la gra­nu­lo­mé­trie de l’analyse. 

Exa­mi­nons la suite de l’his­toire du jour­nal lu par M. Dupont. Au cours de cette lec­ture, celui-ci s’ap­pro­prie les connais­sances, en les défor­mant peut-être, et elles rejoignent et aug­mentent ses savoirs (ensembles de connais­sances sur un domaine sans trou impor­tant), sa culture, elles contri­buent à ses com­pé­tences (savoirs orga­ni­sés en vue de l’ac­tion). Nous sommes là au 5e niveau de l’in­for­ma­tion, celui des savoirs.

Ce niveau pose des pro­blèmes déli­cats. L’in­te­rac­tion avec le cer­veau de M. Dupont y est domi­nante. L’ap­port de savoir que lui pro­cure un mes­sage ne peut plus être mesu­ré sur le mes­sage, c’est une modi­fi­ca­tion du récep­teur qui se pro­duit, et celui-ci est très com­plexe et unique. On ne peut guère défi­nir et esti­mer cet apport que par dif­fé­rence entre les savoirs de M. Dupont avant et après arri­vée du mes­sage. De nom­breux tests cherchent à mesu­rer les savoirs d’une per­sonne dans un domaine, et si pour des cas pra­tiques on a besoin de mesu­rer ce niveau, on ne pour­ra qu’a­voir recours à de tels tests. Pour les com­pé­tences, l’es­ti­ma­tion est basée en géné­ral sur le cur­sus de l’in­di­vi­du : il a fait telles études, il a telle expé­rience pro­fes­sion­nelle et on en connaît telles preuves par ses réalisations… 

L’é­chelle du sens que nous venons d’es­quis­ser pour un article de jour­nal peut être défi­nie pour d’autres cas infor­ma­tion­nels. On peut presque tou­jours modé­li­ser le cas, défi­nir les conven­tions, iden­ti­fier les quatre pre­miers niveaux de sens, des uni­tés de mesure de quan­ti­tés d’in­for­ma­tions pour cha­cun, et la struc­ture d’a­na­lyse pour les estimer. 

Par exemple, un cas inté­res­sant est celui du jour­nal télé­vi­sé regar­dé par le même M. Dupont. 

Son niveau 1 (numé­ri­sé) peut être défi­ni comme celui des bits de la bande son, et celui des pixels por­tés par les bandes des vidéos, qui arrivent plus ou moins dans le poste de télé­vi­sion de M. Dupont. Son niveau 2 (don­nées) pour­rait être celui des pho­nèmes ou plus sim­ple­ment des mots de la parole, et des images (assez faciles à comp­ter) ou des formes mon­trées par la vidéo. Par exemple, il voit une forme humaine qui pose un objet sur une autre forme humaine. Au niveau 3 (infor­ma­tions élé­men­taires), celui por­té par les phrases dites et les plans fil­més, la même séquence visuelle lui montre le ministre de l’In­té­rieur qui décore le joueur Zanut­ti que M. Dupont reconnaît. 

Ce niveau 3 per­met­tra des com­pa­rai­sons de cas assez dif­fé­rents, en par­ti­cu­lier des com­pa­rai­sons des nombres d’in­for­ma­tions élé­men­taires por­tées par une image ou une séquence fil­mée et par un texte. 

Le niveau 4 (connais­sances) du jour­nal télé­vi­sé est celui des ensei­gne­ments et conclu­sions que M. Dupont en tire : Zanut­ti est vrai­ment bon, donc il a été déco­ré. Il per­met­tra des com­pa­rai­sons de cas très dif­fé­rents, mais les éva­lua­tions de quan­ti­tés seront moins fiables. 

Autre exemple, les for­ma­tions pro­di­guées à des élèves et appre­nants sont des cas dont l’a­na­lyse par niveau de sens est spé­cia­le­ment intéressante. 

Le for­ma­teur veut en géné­ral trans­mettre des infor­ma­tions de niveaux 3, 4 et 5. Il envoie pour ce faire des mes­sages et sup­ports riches en niveaux 2 et 3 (textes, sché­mas, expo­sés). L’ap­pre­nant manque un cer­tain nombre de ces infor­ma­tions, et recons­ti­tue plus ou moins bien les infor­ma­tions de niveau éle­vé. Le for­ma­teur s’en aper­çoit, et pro­digue des mes­sages com­plé­men­taires qui tentent d’ex­pli­ci­ter au niveau 3 des infor­ma­tions de niveau 4, etc.

Bien sûr, les pré­sen­ta­tions de cas ci-des­sus sont sim­pli­fi­ca­trices, de nom­breuses ques­tions vont se poser à chaque étape. Sou­vent les cas ne sont pas par­faits : les codes ne sont qu’in­com­plè­te­ment par­ta­gés, le récep­teur n’i­gnore pas tota­le­ment les infor­ma­tions d’un cer­tain niveau avant de les rece­voir, le canal déforme.

La place manque pour en dis­cu­ter ici. Mais je serai heu­reux d’en­voyer des com­plé­ments et de dis­cu­ter de cette méthode avec tout lec­teur inté­res­sé. Un tra­vail consi­dé­rable reste à faire pour l’a­dap­ter à des cas infor­ma­tion­nels variés. Mais le jeu ne vaut-il pas la chandelle ?

_____________________________________________
1. Claude E. Shan­non » The mathe­ma­ti­cal Theo­ry of Com­mu­ni­ca­tion » (Univ. of Illi­nois Press, 1949) (réédi­tion d’ar­ticles parus dans Bell Sys­tem Tech­ni­cal Jour­nal, 1948). Tra­duc­tion fran­çaise : » Théo­rie mathé­ma­tique de la com­mu­ni­ca­tion « , par W. Wea­ver et C. E. Shan­non (Retz-CEPL, 1975).
2. L’in­for­ma­tion est une notion pre­mière, que la théo­rie de l’in­for­ma­tion ne défi­nit pas rigou­reu­se­ment. Elle défi­nit plu­tôt la quan­ti­té d’in­for­ma­tions, comme la réduc­tion du nombre de pos­si­bi­li­tés d’é­tats de la source que le mes­sage per­met au récep­teur de décomp­ter en bits. Le mes­sage peut être tout à fait invo­lon­taire. Par exemple, nous voyons la lumière réflé­chie sur un objet, ce qui nous informe sur lui.
3. Shan­non a dit que les aspects séman­tiques de la com­mu­ni­ca­tion ne concer­naient pas le pro­blème trai­té par sa théo­rie de l’information.
4. Fred I. Dretske (Know­ledge and the flow of infor­ma­tion, MIT Press 1981, réédi­té CSLI Publi­ca­tions, 1999) pré­sente une exten­sion des idées de Shan­non en vue de mesu­rer la quan­ti­té d’in­for­ma­tions et de connais­sances à par­tir des pro­ba­bi­li­tés de mes­sages. Mais il montre que le sens d’un mes­sage ne peut être mesu­ré par sa pro­ba­bi­li­té a prio­ri. Si votre voi­sin en région pari­sienne vous dit » il y a un gnou dans mon jar­din » vous serez plus sur­pris que s’il vous dit » il y a un chat dans mon jar­din « , les pro­ba­bi­li­tés a prio­ri sont très dif­fé­rentes, et pour­tant ces phrases n’ont pas plus de sens l’une que l’autre – à condi­tion que vous sachiez ce qu’est un gnou.
5. M. Dupont sait déjà les mots du dic­tion­naire, mais le mes­sage au niveau 2 est dans leur sélection.
6. La lin­guis­tique dis­tingue sou­vent 4 niveaux d’a­na­lyse du dis­cours : lexi­cal (ou mor­pho­lo­gique, qui n’est pas équi­valent), syn­taxique, séman­tique, prag­ma­tique. Le prag­ma­tique, qui s’in­té­resse au sens de l’en­semble d’un texte, sera proche de notre niveau 4, alors que le séman­tique est proche de notre niveau 3, et le lexi­cal de notre niveau 2. » Séman­tique » a aus­si assez sou­vent une accep­tion plus large qui relève à la fois de nos niveaux 2, 3, 4 et 5.
7. Ce niveau peut être appe­lé celui de la signi­fi­ca­tion, du sens lit­té­ral, du sens lin­guis­tique, réser­vant alors le » sens » pour dési­gner le 4e niveau, » inter­pré­ta­tion faite par un sujet don­né dans un contexte » (Jean-Marie Pier­rel, Ingé­nie­rie des langues, Her­mès, 2000). Nous uti­li­sons plu­tôt » sens » pour dési­gner toute l’é­chelle des sens crois­sants, de tous niveaux.
8. On pour­rait choi­sir d’autres élé­ments sup­ports de notre ana­lyse d’in­for­ma­tion pour ce niveau que les phrases ; par exemple les pro­po­si­tions qui les consti­tuent. Ou des élé­ments signi­fiants de types variés, tels les pré­di­cats. La phrase a le mérite d’être une struc­ture évi­dente du texte. Il y a certes des infor­ma­tions élé­men­taires qui sont por­tées par plu­sieurs phrases à la fois, on pour­ra les décomp­ter aus­si, ou les négli­ger. Notre comp­tage peut en effet res­ter approximatif.
9. On retrouve ain­si aux niveaux de sens éle­vés des carac­té­ris­tiques bien connues au niveau numérisé.

Poster un commentaire