Analogique et Digital

Pierre BERGER. Club de l'Hypermonde

1. Chiffrement et non " numérisation "

Les autorités linguistiques françaises ont imposé " numérique " pour traduire l'anglais " digital ". Il s'agit d'un malentendu. En effet, les codes binaires que nous utilisons pour stocker, traiter et transmettre le texte, l'image et plus généralement toute l'information, ne sont pas des nombres. Ils n'acceptent ni les structures ni a fortiori les opérations des nombres. Il s'agit de codes, de chiffres. Et finalement, le terme anglais digital convient mieux que tout autre. D'autant qu'il est parfaitement construit sur la racine latine digitus, doigt. Avec une bonne correspondance étymologique pour le sens qu'on entend lui donner.

Ce malentendu est fâcheux, car il bloque la réflexion sur le processus de digitalisation à une opposition binaire entre analogique et numérique, alors que le processus de digitalisation a un caractère plus progressif, j'allais dire plus analogique, qu'on ne le laisse généralement entendre.

Bien sûr, il y a le passage fondamental de l'analogique au digital, quand on remplace un signal considéré comme continu (mais les atomes le sont-ils...) par un signal composé d'un nombre fini de valeurs. Et, de manière quasi universelle pour des raisons qui sont sans doute profondes, par des bits.

2. La digitalisation peut être plus ou moins profonde

Montrons le sur quelques exemples:

En musique: la digitalisation la plus simple consiste à échantillonner le signal analogique à intevalles réguliers, et à représenter la valeur par un groupe de quelques bits (8 ou 16 par exemple). Cela surfit pour les principales formes de traitement.

On peut aller plus loin en alignant le signal sur une gamme de notes, et sur un timbre ou une série de timbres. C'est ce que fait le standard Midi, destiné au pilotage des synthétiseurs.

On peut aller encore plus loin en " multipliant " un thème musical par une structure de composition définié. Il devient alors possible de composer " automatiquement " de nouveaux morceaux.

En traitement de texte. A partir d'un texte sur papier, la digitalisation de base, obtenue sur un scanner, est une image " bitmap " du document. Cela suffit pour afficher le texte à l'écran ou l'imprimer.

On va plus loin, quand l'image s'y prête et en particulier s'il s'agit d'un texte, en remplaçant les images de caractères dans leur disposition spatiale par une série de codes ASCII ou les différents formats de fichiers textuels, incluant plus ou moins richement leur typographie. Outre un grand gain de volume sur les documents, on accède ainsi à tous les traitements basés sur le vacabulaire et les fonctions syntaxiques. D'une manière générale, on recourt aux " métafichiers ".

En programmation, le code binaire compilé est bien plus digital que le code source, bien qu'il lui soit fonctionnelement identique.

En codification des identifiants, par exemple pour les personnes physiques. Le RNIPP (numéro " de sécurité sociale ") comporte treize chiffres décimaux. Il suffirait théoriquement de huit, puisque nous sommes moins de cent millions, soit un gain d'un bon tiers. Et si l'on exploitait directement des codes binaires, l'avantage serait encore plus grand puisqu'il suffirait de 26 bits, contre 104 (13 fois 8) dans le système actuel.

3. Jusqu'où peut-on aller ?

Le dernier exemple montre un cas limite. Il y a un optimum du point de vue de l'économie de la codification. Dans d'autres cas, on puet penser à des structures plus délicatest, et sans doute plus intéressantes.

L'idée serait ici, au moins à titre de recherche, à tenter de se débararsser méthodiquement des restes d'analogismes qui subsistent dans nos lganges.

Par exemple, à partir d'un texte codé de manière classique en HTML, on pourrait :

- réduire fortement le texte " normal " en le remplaçant par l'appel de paragraphes pré-enregistrés

- supprimer toute partie résiduellement textuelle en codant tous les mots et en les appelant par des liens HTML appropriés

- réréfence à structures types (lettre, dossier, DTD, message Edifact) de manière à supprimer jusqu'au caractère linéaire d'un texte HTML, analogie d'un texte traditionnel.

Il resterait bien sûr, à un plus bas niveau, à remplacer les balises HTML très" analogique s " dans leur graphie par des codes plus digitaux.

Dans l'idéal, il faudrait arriver jusqu'à faire disparaître l'odre encore très analogique de la succession des bits, en raisonnant par exemple à la manière de Lisp sur les séquences et de la machine de Türing.

4. Toute codification suppose recopie ou référence externe

Un texte codé , et plus généralement tout message digital, n'est compréhensible qu'avec une clé de déchiffrement. L'émetteeur comme le récepteur du message doivent en disposer. Soit qu'ils l'aient en mémoire, soit qu'ils y accèdent sur un tiers-système.

Tout progrès de la digitalisation se traduit donc par une " externalisation " des codes, qui sont séparés des messages eux-mêmes, sinon même des participants à l'échange.

A la limite, il ne resterait plus rien dans les messages et dans les participants, sinon le bit fondamental qui engendre le dialogue ou l'action. Le " va " du Centurion de l'évangile... Ou la pression sur le bouton atomique que nous montre chaque soir Canal Plus.

Dans la pratique, le degré de digitalisation optimal se déduit du niveau de culture des personnes comme de l'environnement technoloqique où elles opèrent.

5. Les machines sont plus ou moins digitales

L'utilité du versant analogique de tout code, si digital soit-il, c'est de rendre son utilisation possible dans des conditions raisonnables.

Prenons l'exemple du RNIPP: un code binaire pur obligerait à disposer, dans toute machines utilisatrice, d'une table de renvoi aux caractéristiques de chaque français, au moins des significations portées par le code actuel (sexe, date et lieu de naissance). Avec le code actuel, même des machines très simples peuvent faire un certain nombre d'opérations sans autre référence externe.

Et, bien sûr, le versant analogique des codes sert aussi aux être humains à utiliser les documents. Plus ils sont digitalisés, moins ils deviennent accessibles directement aux utilisateurs. Citons notamment le cas de la programmation, depuis le code source jusqu'au fichier bianire compilé. Mais s'y ajoute aujourd'hui tout ce qui relèvede l'interface garhpique, et qui n'est donc plus textuel.

6. Une recherche " combinatoire " d'optimum. La granularité.

On peut considérer qu'une certaine forme d'optimum s'obtient à la " racine carrée " du nombre de bits. On définit d'une part un certain nombre d'objets typiques, qu'on appelle chacun par leur code pour les assembler.

Pour un objet binaire donné, l'optimum est à chercher entre deux extrêmes:

- un seul bit appelle une image complète de l'objet préalablement stocké

- il n'y a aucun stockage préalable, on appelle les bits les uns après les autres.

L'optimum est quelque part entre les deux. Et il pourrait être intéressant de le chercher plus méthodiquement qu'aujourd'hui. On peut considrérer par exemple que l'alphabet de 26 lettres (ou à peu près) correspond à un optimum de ce type, puisque le nombre de lettres n'a pas signficativement changé depuis l'antiquité. On peut se poser la question pour les langues à idéogrammes.

En programmation, l'objet, intéressant. Il est plus gros que l'instruction. Vaut-il mieux un petit nombre de " grosses " classes ou un grand nombre de " petites " ? C'est un problème concret pour les responsbles actuels d'équipes de développement.

En applicatifs de gestion, le " spécifique " a une grain trop petit (l'instructino de programme). Le progiciel intégré (à la SAP) a sans doutge un grain trop gros. Et SAP a d'ailleurs fait des efforts significatifs dans les dernières versions.

7. Analogique et digital dans les relations entre les hommes.

L'analogique a beaucoup de charmes: l'exemple convainct mieux que la théorie. Mais il ne fonctionne que assez localisé, après quoi les analogies deviennent trop floues.

Le digital est raide. Mais il permet le progrès. Le droit commence par formaliser des coutumes, puis les organise en lois et enfin en codes. Comme nous l'a montér Danièle Bourcier, on ira sans doute plus loin dans la digitalisation.

Ou allons-nous ? Je n'ai pas la réponse.Mais la démarche reste passionnante, et utile.


NOTES DIVERSES

Analogique et Digital

Pierre BERGER. Club de l'Hypermonde

1. Chiffrement et non " numérisation "

Les autorités linguistiques françaises ont imposé " numérique " pour traduire l'anglais " digital ". Il s'agit d'un malentendu. En effet, les codes binaires que nous utilisons pour stocker, traiter et transmettre le texte, l'image et plus généralement toute l'information, ne sont pas des nombres. Ils n'acceptent ni les structures ni a fortiori les opérations des nombres. Il s'agit de codes, de chiffres. Et finalement, le terme anglais digital convient mieux que tout autre. D'autant qu'il est parfaitement construit sur la racine latine digitus, doigt. Avec une bonne correspondance étymologique pour le sens qu'on entend lui donner.

Ce malentendu est fâcheux, car il bloque la réflexion sur le processus de digitalisation à une opposition binaire entre analogique et numérique, alors que le processus de digitalisation a un caractère plus progressif, j'allais dire plus analogique, qu'on ne le laisse généralement entendre.

Bien sûr, il y a le passage fondamental de l'analogique au digital, quand on remplace un signal considéré comme continu (mais les atomes le sont-ils...) par un signal composé d'un nombre fini de valeurs. Et, de manière quasi universelle pour des raisons qui sont sans doute profondes, par des bits.

Chiffrement et non numérisaion

Il faut partir du bit

Délinéariser HTML

- réréfence à structures types : lettre, dossier, DTD

- possibilité de stocker des paragraphes numérotés (bibles de paragrphes

paragraphes significatifs, formules de politesse, date, référence société), stockés dans un ordre quelconque

- génération de la structure à partir des paragraphes à partir de contenus ytpes, etc.

en externalisant spécifiquement la structure linéaire du texte

On pourrait imaginer un texte " 100% HTML ", à condition d'avoir un dictionnaire <A TEXT SPC

" ... " ...> pour coder les mots...

Pour aller plus loin ensuite il faudrait

1. perdre la structure linéaire du texte HTML par des jeux de multiplateurs

2. remplacer les balises HTML trè " analogique s " dans leur graphie par des codes plus digitaux.

Message Edifact

succession temporelle " ordre " entre les bits

anticipation. : acquisition préalable par la machine réceptrice du code " externe "

Externalisation:

codes externes. Un texte codé n'est compréhensible qu'avec une clé externe, publique ou non

tout ce qui eset compréhensible sans clé est analogique

ou alors c'est que nous utilisons nos clés innées (" naturelles ")

un hypercode est un code totalement externalisé

cependant au moment de l'usage, il faut bien que les machines communicantes ré-intègrent le code pour comprendre

code externe peut être

- un code vraiment externe auquel on accède (que l'on charge, que l'on s'adjoint...) quand on veut émettre ou recevoir un message

- si code totalement externalisé, alors les machines émettrices et réceptrices sont " blanches ", au moint jusqu'au moment où elles se mettent à communiquer

L'externalisation comme forme de prothèse.

La norme comme référence externe

Programmation

L'objet, intéressant. Une référence externe aussi bien pour l'action (méthode) que pour la mémoire

La machine de Turing, un hypercode ?

La programmation en général. une analogue du programme avec l'action,

mais aussi une rupture, justement par les structures de contrôle.

avec un maximum en quelque sorte si était aussi décomposé qu'en Lisp.

La compilation est plus digitale que l'interprétation

Ici aussi, se pose le problème de granularité optimale: taille/nombre des classes par rapport à une taille gloable déterminée (SAP Vs spécifique, etc).

Exemples de choses plus ou moins digitales

son d'origine/son enregistré analogiquemdent/enregistrement numérique/fichier wav/ficiher Midi/partition

objet d'origine (3D)/image analogiue/fichier bmp/

soit : compressino jpeg

soit : metafile. catalogue de parties d'images, macro-opérateurs, HTML

répertroires d'images

Exemple de phases successifs de codification/décodification

chaque bit qui arrive dans la machine trouve une succession de systèmes qui le font monter de niveu

- nettoyage des trames, headers,

- assemblage en octets, bitmaps

Emission (synthèse) texte Ascii /générateur de caractères/feuille de style/postcrit/ modulation d'émission

compression/linéarisation/modulation (transition par l'analogique...)

chiffrement

Réception (analyse)démodulation, OCR

délinéarision/décompression

déchiffrement

Sur l'ordinateur.

Codages de l'OS, de l'implantation sur disques (une forme de linéarisation, d'ailleurs, sauf la structuration en pistes et secteurs).

Sur la bande magnétique. Un stream aussi.

En quelque sorte, les structure " organisques " sont l'analogue du support externe. Mais montre aussi que le hardware lui-même devient de plus en plus digital. Le passage aux mémoires sur circuit intégré serait encore mieux que la disqueette, sans doute.

Optimum: en quelque sorte la racine carré'

mais d'une part la multiplication a un caractère anlogique

ensuite, aller plus plus loin que deux facteurs/

En outre, dans la synthèse en général, la multiplication ne donne pas de résultats satisfaisants (cas de contrats qu'il faut refaire..., il faut un effort de création

article ... Maquette, assemblage journal

donnée x programme = assemblage dans une chaîne efficace

phase de normalisation/dénormalisation (bases de donnée)

Granularité des articles/journaux/livres/bibliothèques

image (certaines avec leur son) /reportage /chaîne spécialisée

le degré de granularité optimal d'épend du degré d'interactivité que souhaite l'utilisateur

étudier langage de machine à machine: EDI et au delà

et ensuite la nécessité de compréhension par l'homme

Analogies:

- la motivation, l'exemple pour convaincre, faire passer les messages

- le mythe

-anthropomorphisme

- la déducion, image analogique du déroulement d'un processus...

- itération, image de la roue

calcul analogique