fichiers_pdf
Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédente | ||
fichiers_pdf [2025/03/14 21:30] – [obtenir un texte pouvant être repris] Christian Renaudin | fichiers_pdf [2025/04/26 11:17] (Version actuelle) – [Obtenir un texte pouvant être repris] Christian Renaudin | ||
---|---|---|---|
Ligne 130: | Ligne 130: | ||
{{ :: | {{ :: | ||
Le résultat est globalement excellent quand le but est de reprendre le texte. Cela peut aussi être utile quand on souhaite demande une traduction automatique d’un texte imprimé en langue étrangère. Evidemment il faudra au préalable charger la version de tesseract adaptée à cette langue. | Le résultat est globalement excellent quand le but est de reprendre le texte. Cela peut aussi être utile quand on souhaite demande une traduction automatique d’un texte imprimé en langue étrangère. Evidemment il faudra au préalable charger la version de tesseract adaptée à cette langue. | ||
+ | |||
+ | Exemple d'un document ancien numérisé comme ci-dessus : [[https:// | ||
- | ===Note importante sur la reconnaissance de texte === | + | ====Note importante sur la reconnaissance de texte ==== |
Ces 2 méthodes de reconnaissance de caractère ont pour point commun de s’appuyer sur Tesseract. Il est donc indispensable que l’articulation entre Tesseract et gimagereader ou gscan2pdf se fasse correctement. Sinon un message d’erreur apparaît. | Ces 2 méthodes de reconnaissance de caractère ont pour point commun de s’appuyer sur Tesseract. Il est donc indispensable que l’articulation entre Tesseract et gimagereader ou gscan2pdf se fasse correctement. Sinon un message d’erreur apparaît. | ||
Avec gimagereader, | Avec gimagereader, |
fichiers_pdf.1741984228.txt.gz · Dernière modification : 2025/03/14 21:30 de Christian Renaudin