[prev in list] [next in list] [prev in thread] [next in thread] 

List:       mandrake-confirme
Subject:    Re: [Confirme] PS ou PDF > HTML en gardant les images ....
From:       clansco <falsetti () clansco ! org>
Date:       2002-03-29 11:31:31
[Download RAW message or body]

le Thu, 28 Mar 2002 14:58:10 +0100
EPenove <nsl@free.fr> vous avez écrit :

Sujet: [Confirme] PS ou PDF > HTML en gardant les images ....


> Hello , 
> 
> je cherche un prog qui permet de passer les fichiers PS et PDF au format HTML 
> en gardant les images et leur position ds la page ....
> 
> J'ai déjà trouvé des progs mais ceux ci ne gardent que le texte :o(((
> > pdf2html par exemple ....
>
salut,

par expérience il est plus rapide de faire à la main!
compter une heure de travail pour cent pages et un résultat de qualité.

pdf2html produit en général un énorme fichier horrible, 
et fait d'une joli page un affreux machin. 
il faut alors corriger à la main et c'est long,
pour pas grand chose.
normal, html n'est pas un langage de mise en page,
il se contente de fournir quelques indications au navigateur et...
hope for the best !

à mon avis voici la bonne méthode :
pstotext mesfichiers.ps

ensuite avec un simple éditeur genre gedit ou mieux bluefish :
on remplace tous les sauts de ligne par <br> plus saut de ligne.

ensuite on sélectionne le titre, on le remplace par coller entouré des
balises <p class=titre> </p> même chose pour les sous-titres, les
sous-sous etc pour les gras, les soulignés .. on utilise <span
class=souligne> </span> si on a des tabulations on fait une liste. et
enfin si on a des images on découpe la page en morceaux et on place des
<div id=haut> </div> il faut alors rajouter les definitions css pour
haut, image, bas etc.
(bien sûr on a une fenêtre gv ouverte sur l'original pour comparer)

on insére le résultat entre <body> et </body> d'une page de base 
et le tour est joué. 

dix minutes pour une page. une heure pour cent
pages ? oui en rajoutant les pages boût à boût et en traitant tout en
une seule fois. 

enfin si on a souvent ce genre d'exercice à faire, on a avantage à se faire un 
petit script perl.
convenons de ¤t pour ouvrire une balise titre, ¤s pour une balise sous-titre etc. 
µ pourra servir à marquer toute fin de balise. ¤¤ serait mis pour un ¤ 
qui par extraordinaire existerait déjà dans le texte
et µµ pour un éventuel µ.

alternative au script perl, un éditeur que l'on paramêtre pour écrire 
directement les tags par une combinaison de touches.

une heure de travail pour un vrai beau résultat.

s'il existe un logiciel qui fasse ce boulot correctement ...
je mange mon chapeau.


["message.footer" (text/plain)]

Vous souhaitez acquerir votre Pack ou des Services MandrakeSoft?
Rendez-vous sur "http://www.mandrakestore.com"


[prev in list] [next in list] [prev in thread] [next in thread] 

Configure | About | News | Add a list | Sponsored by KoreLogic