Libre en Fête

Outils pour utilisateurs

Outils du site


fichiers_pdf

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentesRévision précédente
Prochaine révision
Révision précédente
fichiers_pdf [2025/01/15 23:05] – [Procéder à la reconnaissance de texte] Christian Renaudinfichiers_pdf [2025/02/20 13:58] (Version actuelle) – [LES PDF SOUS LINUX] Antoine Petit
Ligne 1: Ligne 1:
-====== Les pdf sous linux ======+====== LES PDF SOUS LINUX ====== 
  
  
Ligne 63: Ligne 64:
 ===== Avec GIMP ===== ===== Avec GIMP =====
 si le contenu est principalement une image, il peut être adapté de  l’ouvrir avec Gimp. Ce sera par exemple le cas pour un schéma ou un dessin dont les légendes ne sont pas en français et que l’on veut traduire. si le contenu est principalement une image, il peut être adapté de  l’ouvrir avec Gimp. Ce sera par exemple le cas pour un schéma ou un dessin dont les légendes ne sont pas en français et que l’on veut traduire.
-==== Avec libre office Draw ====+===== Avec libre office Draw =====
 si le contenu est principalement du texte, on l’ouvrira avec draw dans la suite libre office. Toutefois on ne peut pas s’attendre à un résultat parfait car on perd l’avantage du format pdf qui sauvegarde à la fois le texte et les polices. A moins que le document n’ait été produit avec la même application et le même jeu de polices, il est probable que des problèmes de présentation vont se poser. si le contenu est principalement du texte, on l’ouvrira avec draw dans la suite libre office. Toutefois on ne peut pas s’attendre à un résultat parfait car on perd l’avantage du format pdf qui sauvegarde à la fois le texte et les polices. A moins que le document n’ait été produit avec la même application et le même jeu de polices, il est probable que des problèmes de présentation vont se poser.
 Dans l’exemple ci-dessous, on voit que le rendu est acceptable pour le corps du texte mais que la taille de la police est inadaptée pour la note de bas de page et que du coup le texte déborde. Par ailleurs, chaque ligne de texte est comprise dans une zone de texte spécifique ce qui empêche de sélectionner tout le  texte dont on veut modifier la taille de la police. Dans l’exemple ci-dessous, on voit que le rendu est acceptable pour le corps du texte mais que la taille de la police est inadaptée pour la note de bas de page et que du coup le texte déborde. Par ailleurs, chaque ligne de texte est comprise dans une zone de texte spécifique ce qui empêche de sélectionner tout le  texte dont on veut modifier la taille de la police.
Ligne 120: Ligne 121:
 oire avec les fichiers images scannés et de charger ce sous répertoire dans gimagereader (2e icône). oire avec les fichiers images scannés et de charger ce sous répertoire dans gimagereader (2e icône).
 {{ ::gimagereader.png?direct |}} {{ ::gimagereader.png?direct |}}
 +La reconnaissance est relativement longue, avec une barre d’avancement en bas à drroite.
 +Le texte reconnu figure dans la fenêtre de droite :
 +{{ ::gimagereader3.png?direct |}}
 +La cinquième icône permet de supprimer les sauts de ligne, elle est précieuse pour pouvoir reprendre le texte.
 +{{ ::gimagereader4.png?direct |}}
 +{{ ::gimagereader5.png?direct |}}
 +Ensuite on peut récupérer le texte soit en le copiant, soit en enregistrant un fichier texte (3e icône)
 +{{ ::gimagereader6.png?direct |}}
 +Le résultat est globalement excellent quand le but est de reprendre le texte. Cela peut aussi être utile quand on souhaite demande une traduction automatique d’un texte imprimé en langue étrangère. Evidemment il faudra au préalable charger la version de tesseract adaptée à cette langue.
 + 
 +===Note importante sur la reconnaissance de texte ===
 +Ces 2 méthodes de reconnaissance de caractère ont pour point commun de s’appuyer sur Tesseract. Il est donc indispensable que l’articulation entre Tesseract et gimagereader ou gscan2pdf se fasse correctement. Sinon un message d’erreur apparaît.
 +Avec gimagereader, le chemin attendu peut être affiché :
 +{{ ::gimagereader7.png?direct |}}
 +{{ ::gimagereader8.png?direct |}}
 +Il est donc possible de vérifier avec l’explorateur de fichier si les fichiers se trouvent au bon endroit.
 +Exemple de fichiers présents : 
 +{{ ::gimagereader9.png?direct |}}
 +Avec gscan2pdf les chemins n’apparaissent que dans un message d’erreur quand la reconnaissance de caractères ne peut se faire. Dans  un cas comme dans l’autre, vérifier que les fichiers et les chemins correspondent.
 +Dans le cas contraire, il est possible d’y remédier. Mais ce n’est pas possible avec l’explorateur de fichiers, il faut procéder avec le terminal en faisant précéder l’instruction par sudo. Cela suppose donc un minimum de  maîtrise de l’utilisation du terminal.
 +
 +===== Produire un pdf à partir d’un nouveau document : =====
 +Dans le plupart des cas on va partir de libre office. La fonction export en format pdf fonctionne bien avec toutes les fonctionnalités de libre office .
 +{{ ::libre_office.png?direct |}}
 +Une autre possibilité est de passer par la fonction impression en choisissant « imprimer dans un fichier ». Mais généralement cela aboutit à un pdf moins bien optimisé et ce n’est donc à faire que dans des cas particuliers.
 +En cas de besoin, on peut protéger le document par un mot de passe :
 +{{ ::libre_office2.png?direct |}}
fichiers_pdf.1736978743.txt.gz · Dernière modification : 2025/01/15 23:05 de Christian Renaudin