Principe de la numérisation

Dans son sens le plus général, la numérisation est la transformation d'un élément réel en une suite de nombres permettant de le traiter informatiquement.
Dans un cadre d'entreprise, la numérisation est souvent entendue comme la transformation d'un document papier (texte ou image) en document électronique.

Objectifs de la numérisation

La numérisation ne peut pas être la copie exacte du document physique d'origine. Certaines des caractéristiques de ce document sont nécessairement perdues.
Il faut plutôt considérer la numérisation comme l'extraction de la substantifique moelle d'un document. L'objectif final est de faciliter le traitement du contenu :

  • reconnaissance,
  • copie,
  • stockage,
  • indexation,
  • recherche.

Types d'éléments et procédés

Il est possible de numériser à peu près tous les éléments du monde réel, avec plus ou moins de précision et de possibilités de rematérialisation :

  • les textes et images peuvent être numérisés grâce à un scanner ou un appareil photo numérique,
  • les sons et vidéos peuvent être enregistrés à l'aide du matériel et des logiciels d'acquisition adéquats,
  • il existe même des scanners 3D qui permettent d'obtenir un modèle 3D d'un objet physique.

Formats d'enregistrement

Une fois numérisées, les données doivent être stockées pour pouvoir être utilisées. Les approches suivantes peuvent être considérées :

  • le stockage des données numérisées brutes : cela permet de différer leur traitement, mais peut demander énormément d'espace de stockage. On privilégie ici les formats d'enregistrement sans perte (TIFF, WAV…),
  • le stockage des données traitées : on stocke par exemple le document PDF obtenu après traitement par reconnaissance de caractères. Si on souhaite effectuer d'autres traitements, il peut être nécessaire de renumériser l'élément physique,
  • le stockage de données numérisées compressées : on considère qu'une faible perte de données est acceptable pour économiser l'espace de stockage (formats JPEG, MP3…).
    Quels que soient les fichiers considérés, il est recommandé d'opter pour des formats ouverts afin d'en assurer la pérennité.

Récupération des informations

Les données numérisées ne sont souvent pas exploitables telles quelles.
Les documents texte sont souvent traités par un logiciel de reconnaissance de caractères.
On peut également utiliser de la reconnaissance d'images. Certains logiciels de gestion de photographies permettent par exemple d'identifier les personnes présentes sur les photos avant leur stockage dans une banque d'images.
Les sons peuvent passer par une étape de reconnaissance vocale.

Matériel nécessaire

Le matériel de numérisation est disponible dans toutes les gammes. Ainsi, les scanners vont du scanner à plat classique pour 50 € à des scanners ultra-rapides ou grand format dont le prix peut atteindre plusieurs milliers d'euros.
Les besoins de l'organisation doivent donc être clairement définis pour dimensionner au mieux les investissements.
Il faut parfois ajouter au matériel de numérisation pure, les logiciels de traitement des données numérisées.

Externalisation de la numérisation

La numérisation utilise du matériel et des logiciels coûteux. Elle nécessite aussi des procédures de vérification des documents numérisés. Les entreprises de taille réduite qui n'ont pas les ressources ou les moyens d'investir dans une solution de numérisation en interne peuvent préférer l'externalisation.
Même si l'entreprise choisit d'opérer en interne, l'externalisation de la numérisation peut être intéressante lors de la mise en place d'une GED. Un prestataire dédié peut reprendre toutes les archives et les intégrer au système.

Comparez 5 devis GED