Les outils de reconnaissance optique de caractères (OCR) vous permettent de convertir rapidement du texte imprimé ou manuscrit en texte numérique. Supposons que vous souhaitiez copier et modifier rapidement le texte d'une image sur Instagram ou d'une photo numérisée. Vous pouvez le faire en un rien de temps avec un outil OCR !
Internet nous a bénis avec des tonnes d'options OCR gratuites, mais les options payantes existent bien. Voici donc ce que je veux savoir :Est-ce que payer pour un outil OCR en vaut la peine, alors que vous pourriez simplement en utiliser un gratuit ?
Dans cet article, je vais tester l'un des meilleurs outils OCR gratuits contre l'une des options OCR les mieux payées.
Préparez-vous pour OneNote de Microsoft (gratuit) contre OmniPage 18 de Nuance (60 $).
Dans l'ensemble, la plupart des outils OCR fonctionnent à peu près de la même manière :
Cette même routine générale s'applique à la fois à OneNote et à OmniPage.
Pour évaluer quel outil (le cas échéant) est vraiment le meilleur, je vais noter chacun sur plusieurs tests. Et, avant d'aller plus loin, permettez-moi de clarifier :
Si vous envisagez d'utiliser OneNote pour l'OCR, utilisez uniquement la version du logiciel de bureau OneNote 2016 du programme.
L'application Web, qui est probablement celle que vous avez sur votre ordinateur si vous utilisez Windows 10, n'a pas les mêmes fonctionnalités que le logiciel de bureau 2016.
Si vous essayez d'utiliser l'OCR sur n'importe quel type d'application OneNote qui n'est pas le logiciel de bureau 2016, cela ne fonctionnera pas. Croyez-moi, j'ai essayé.
Allez ici pour télécharger OneNote 2016 gratuitement. Assurez-vous de cliquer sur le lien "Windows Desktop" !
Pour mesurer à quel point chaque outil remplissait des fonctions spécifiques, j'ai décidé d'évaluer la précision de chaque outil sur une échelle de 1 à 5. Une note de 5 signifierait que l'outil a transcrit le texte avec précision, sans fautes d'orthographe ou de syntaxe.
Pour déterminer clairement quel outil était le plus utile, j'ai décidé d'essayer de convertir les fichiers suivants en texte :
En ce qui concerne les attentes, je m'attends à voir ces deux outils s'empiler assez uniformément l'un contre l'autre. D'après mon expérience, les outils payants et les outils gratuits sont souvent relativement égaux, moins peut-être quelques fonctionnalités flashy de la part de l'outil payant. (Regardez simplement Google Docs et Microsoft Word.)
Je n'utilise pas souvent OneNote et je ne l'ai certainement jamais utilisé pour autre chose que la saisie de simples notes. Donc, je pense que ces tests seront une représentation précise non seulement des fonctionnalités OCR des deux outils, mais aussi de leur intuitivité.
Ci-dessous, vous pouvez voir à quel point chacun de ces tests a fonctionné dans OneNote et OmniPage.
Pour tester cette fonctionnalité à l'aide des deux outils OCR, j'ai téléchargé ce PDF à partir de Lakeshore Learning.
Voici les performances de chaque outil :
Pour obtenir le PDF dans OneNote, j'ai utilisé l'impression de fichier possibilité d'ajouter le PDF dans l'une de mes pages Notebook :
En suivant les instructions de cet article Microsoft, j'ai cliqué avec le bouton droit sur l'image PDF et sélectionné Copier le texte de cette page de l'impression .
J'ai dû passer du temps à chercher sur Google pour comprendre comment faire cela, mais après quelques recherches, le processus était relativement simple.
Dans une nouvelle page, j'ai collé le texte. OneNote a réussi à copier le texte de la première page du document PDF. Il n'a pas fait un très bon travail pour conserver la mise en forme du PDF, mais le texte était modifiable et consultable et rien ne semblait être mal orthographié.
Note OneNote :5
OmniPage dispose d'un menu de boutons étape par étape en haut de son écran principal qui vous indique quoi faire. En utilisant cela, j'ai téléchargé le fichier PDF sur le logiciel.
Ensuite, j'ai cliqué sur Suivant bouton pour effectuer l'OCR.
Ensuite, j'ai cliqué sur Enregistrer dans les fichiers et nommé mon nouveau document.
Et lorsque j'ai ouvert le fichier, le texte a été soigneusement converti en un document Microsoft Word avec toutes les images originales du PDF et un texte modifiable à 100 %. La mise en forme était toujours intacte et je n'ai pas remarqué de mots mal orthographiés ni de lignes de texte saccadées.
La seule chose étrange à propos de l'OCR OmniPage était qu'aucune image ne s'ouvrait lorsque j'ai téléchargé et converti le fichier PDF.
Vous penseriez voir un aperçu du document ou quelque chose comme ça, mais cela ne s'est pas produit. J'ai plutôt aimé cela, car vous pouvez simplement cliquer d'une étape à l'autre et terminer l'OCR en un rien de temps.
Score OmniPage :5
Quelle meilleure façon de tester ces outils OCR qu'en les essayant sur quelques citations Pinterest ?
Pour ce test, j'ai téléchargé une photo JPG du compte Pinterest de Down To Health. [N'est plus disponible]
Voici comment les résultats se sont accumulés pour ce test :
À partir d'une nouvelle page dans OneNote, j'ai inséré l'image. (Vous faites cela de la même manière que vous insérez une image dans Microsoft Word ou tout autre programme Office.)
Comme pour l'exemple PDF, j'ai cliqué avec le bouton droit sur l'image et sélectionné Copier le texte de l'image .
Cependant, lorsque j'ai essayé de coller le texte copié sous l'image, OneNote n'a rien pu coller.
J'ai essayé de le coller en texte brut, de conserver la mise en forme source et de fusionner la mise en forme, mais rien n'a fonctionné.
Il est possible que OneNote n'ait pas pu copier le texte en raison de l'arrière-plan texturé de l'image. Cependant, le texte de cette image est assez sombre en contraste, et je pense qu'un bon outil OCR devrait être capable de l'extraire.
Note OneNote :1
En suivant les mêmes étapes que le test précédent, j'ai téléchargé la photo sur OmniPage. Cette fois, cependant, le programme n'était pas sûr de la texture d'arrière-plan de la photo.
Il était assez proche pour reconnaître les mots "GO DO", mais était loin d'essayer de transcrire "WHAT".
En utilisant le champ fourni, j'ai corrigé les quelques erreurs manuellement et j'ai dit au programme de terminer l'exécution de l'OCR. C'est fait, et j'ai enregistré le document résultant comme je l'ai fait lors du dernier test.
Ce test a été pratiquement un échec, car le programme ne pouvait vraiment reconnaître que les mots que j'avais corrigés manuellement.
J'ai essayé de cliquer et j'ai testé d'autres options comme Camera Image to Word , mais sans succès non plus.
Score OmniPage :2
J'aime vraiment boire du thé. Donc, pour ce texte suivant, j'ai rapidement pris l'image d'une boîte de thé chai à portée de main de mon ordinateur.
Voyons si nos outils OCR s'en sortent mieux avec ce format de fichier.
En utilisant à nouveau l'option d'insertion de photo, j'ai ajouté la photo à une nouvelle page OneNote.
J'ai fait un clic droit sur l'image et sélectionné Copier le texte de l'image .
Ensuite, j'ai cliqué sous l'image et collé le texte, que OneNote a fait un travail de capture étonnamment précis !
OneNote a légèrement ajusté certaines lignes de texte, mais j'ai été agréablement surpris par la réussite de ce test.
Le texte était entièrement modifiable et ce test n'a pris aucun temps.
Note OneNote :5
Mes espoirs n'étaient pas grands pour ce test après l'échec majeur avec l'image JPG téléchargée. Cependant, OmniPage a également fait un travail très précis avec ce test !
Accéder à l'assistant de flux de travail fonctionnalité, j'ai sélectionné la fonction Charger les fichiers de l'appareil photo numérique option et téléchargé la photo depuis mon smartphone.
Le logiciel a zoomé sur une partie de ce que je pense être le logo de la marque sur ma boîte à thé. J'ai simplement ignoré l'option permettant d'apporter des modifications.
Étonnamment, le fichier Word produit par OmniPage était précis à 100 % et modifiable, avec quelques gouttes de texte supplémentaires étranges.
Score OmniPage : 4
Pour ce prochain test, j'ai écrit une note rapide et l'ai scannée dans le cloud.
Comme vous pouvez le deviner, je n'ai pas qu'un scanner qui traîne chez moi. Pour numériser cette image, j'ai utilisé CamScanner, une application gratuite disponible pour iOS et Android, qui vous permet de numériser des documents à l'aide de votre téléphone.
Étant donné que CamScanner vous offre la possibilité de télécharger vos fichiers numérisés au format PDF ou JPG, j'ai décidé d'essayer les deux.
Avec les deux formats de fichier, j'avais toujours la possibilité de copier le texte de cette image lorsque je l'ai insérée dans OneNote.
Cependant, le logiciel n'a pas pu utiliser l'OCR pour copier avec succès le texte de l'image JPG.
Il a pu copier une petite partie du texte de la version PDF de la note, mais sans grand succès.
Note OneNote :1
Pour l'image JPG de l'écriture imprimée, OmniPage n'a pas fait un si bon travail de transcription du texte.
Lorsque j'ai essayé ce test avec le format de fichier PDF, le résultat était à peu près le même.
Score OmniPage :2
Tout comme pour la note imprimée, j'ai numérisé ma note manuscrite à l'aide de CamScanner.
Bien qu'il ne puisse détecter aucune lettre de ma note imprimée, OneNote a pu copier une sorte de texte à partir d'une note manuscrite. Cependant, il était extrêmement inexact.
Avec le fichier PDF, le résultat était encore pire.
Note OneNote :1
Étant donné qu'OmniPage ne pouvait même pas reconnaître mon texte imprimé, je n'avais pas d'attentes élevées pour une écriture manuscrite plus élaborée.
D'une manière ou d'une autre, cependant, le logiciel a pu importer mon écriture. Cependant, il ne semblait pas capable de le rendre modifiable, même lorsque j'essayais de l'importer en texte brut. Il en était de même lors du téléchargement de la version PDF de mon écriture.
Score OmniPage :1
Avec un score incroyablement proche de 13 à 14, OmniPage a à peine battu OneNote. OmniPage était capable de reconnaître plus de caractères que OneNote mais, en fin de compte, les deux étaient tout aussi utiles (ou inutiles). Les tests d'écriture manuscrite, d'écriture imprimée et de fichiers JPG téléchargés ont donné du fil à retordre aux deux programmes, mais chacun s'est bien comporté avec la reconnaissance de PDF en texte et d'image de smartphone en texte.
Mais vaut-il la peine d'investir dans un outil OCR payant ? A mon avis, non. Si OneNote peut réussir et échouer dans les mêmes domaines qu'OmniPage, pourquoi dépenser 60 $ ?
Si vous ne souhaitez installer aucun logiciel, vous devez essayer l'un de ces outils OCR en ligne gratuits.
Qu'en pensez-vous ? Y a-t-il une fonctionnalité sous-jacente que nous avons manquée avec OmniPage ? Connaissez-vous des outils OCR mieux payés ou gratuits ? Dites-le nous dans la section des commentaires ci-dessous !