Convertir PDF en HTML

classic Classic list List threaded Threaded
4 messages Options
isaric isaric
Reply | Threaded
Open this post in threaded view
|

Convertir PDF en HTML

Bonjour,

Je suis ubuntu 11.10 et j'ai testé libreoffice-pdfimport
(1.0.5+LibO3.4.3-3ubuntu2) pour importer un .pdf dans draw, mais le
résultat d'importation semble bien plus prés de la réalité avec
http://www.zamzar.com/ qui m'a modifié le .pdf en fichier.odt.

Ensuite j'ai demandé l'exportation en xhtml est cela n'est pas super.

Avez-vous une procédure plus efficace ?

D'avance merci.

isaric






--
Envoyez un mail à [hidden email] pour savoir comment vous désinscrire
Les archives de la liste sont disponibles à http://listarchives.libreoffice.org/fr/users/
Tous les messages envoyés sur cette liste seront archivés publiquement et ne pourront pas être supprimés

Utilise Libreoffice avec Ubuntu
Landron Gérard Landron Gérard
Reply | Threaded
Open this post in threaded view
|

Re: Convertir PDF en HTML

Le dimanche 16 octobre 2011 11:53:19, isaric a écrit :

> Bonjour,
>
> Je suis ubuntu 11.10 et j'ai testé libreoffice-pdfimport
> (1.0.5+LibO3.4.3-3ubuntu2) pour importer un .pdf dans draw, mais le
> résultat d'importation semble bien plus prés de la réalité avec
> http://www.zamzar.com/ qui m'a modifié le .pdf en fichier.odt.
>
> Ensuite j'ai demandé l'exportation en xhtml est cela n'est pas super.
>
> Avez-vous une procédure plus efficace ?
le pdf un encapsuleur donc cela dépend beaucoup du contenu !
si vous avez un pdf contenant un scan de page (image), il ne faut pas compter
en sortir du texte sinon par ocr.
il y a pdf2html qui est intégré dans toute distribution linux mais si l'ffichage
est bien respecté tous les espaces sont remplacés par l'espace insécable html
http://www.pdf2html.org/
> D'avance merci.
>
> isaric
Gérard

--
Envoyez un mail à [hidden email] pour savoir comment vous désinscrire
Les archives de la liste sont disponibles à http://listarchives.libreoffice.org/fr/users/
Tous les messages envoyés sur cette liste seront archivés publiquement et ne pourront pas être supprimés

isaric isaric
Reply | Threaded
Open this post in threaded view
|

Re: Convertir PDF en. HTML et .odt

Merci Gérard, le est déjà pas mal.
Au départ, j'ai :
isaric.cof.free.fr/PDFtoHTML/urssaf.pdf

avec la commande pdftohtml urssaf.pdf j'obtiens :
http://isaric.cof.free.fr/PDFtoHTML/pdftohtml/urssaf.html

http://www.zamzar.com/ donne à partir .pdf
isaric.cof.free.fr/PDFtoHTML/urssaf.odt

y a t-il un équivalent pour .odt ?

D'avance merci
Eric



Le 16/10/2011 12:34, Landron Gérard a écrit :

> Le dimanche 16 octobre 2011 11:53:19, isaric a écrit :
>> Bonjour,
>>
>> Je suis ubuntu 11.10 et j'ai testé libreoffice-pdfimport
>> (1.0.5+LibO3.4.3-3ubuntu2) pour importer un .pdf dans draw, mais le
>> résultat d'importation semble bien plus prés de la réalité avec
>> http://www.zamzar.com/ qui m'a modifié le .pdf en fichier.odt.
>>
>> Ensuite j'ai demandé l'exportation en xhtml est cela n'est pas super.
>>
>> Avez-vous une procédure plus efficace ?
> le pdf un encapsuleur donc cela dépend beaucoup du contenu !
> si vous avez un pdf contenant un scan de page (image), il ne faut pas compter
> en sortir du texte sinon par ocr.
> il y a pdf2html qui est intégré dans toute distribution linux mais si l'ffichage
> est bien respecté tous les espaces sont remplacés par l'espace insécable html
> http://www.pdf2html.org/
>> D'avance merci.
>>
>> isaric
> Gérard
>


--
Envoyez un mail à [hidden email] pour savoir comment vous désinscrire
Les archives de la liste sont disponibles à http://listarchives.libreoffice.org/fr/users/
Tous les messages envoyés sur cette liste seront archivés publiquement et ne pourront pas être supprimés

Utilise Libreoffice avec Ubuntu
isaric isaric
Reply | Threaded
Open this post in threaded view
|

Re: Convertir PDF en .odt

Je recherche toujours un équivalent à http://www.zamzar.com/ s'il existe
pour convertir un pdf en .odt
D'avance merci.

Le 16/10/2011 14:37, isaric a écrit :

> Merci Gérard, le est déjà pas mal.
> Au départ, j'ai :
> isaric.cof.free.fr/PDFtoHTML/urssaf.pdf
>
> avec la commande pdftohtml urssaf.pdf j'obtiens :
> http://isaric.cof.free.fr/PDFtoHTML/pdftohtml/urssaf.html
>
> http://www.zamzar.com/ donne à partir .pdf
> isaric.cof.free.fr/PDFtoHTML/urssaf.odt
>
> y a t-il un équivalent pour .odt ?
>
> D'avance merci
> Eric
>
>
>
> Le 16/10/2011 12:34, Landron Gérard a écrit :
>> Le dimanche 16 octobre 2011 11:53:19, isaric a écrit :
>>> Bonjour,
>>>
>>> Je suis ubuntu 11.10 et j'ai testé libreoffice-pdfimport
>>> (1.0.5+LibO3.4.3-3ubuntu2) pour importer un .pdf dans draw, mais le
>>> résultat d'importation semble bien plus prés de la réalité avec
>>> http://www.zamzar.com/ qui m'a modifié le .pdf en fichier.odt.
>>>
>>> Ensuite j'ai demandé l'exportation en xhtml est cela n'est pas super.
>>>
>>> Avez-vous une procédure plus efficace ?
>> le pdf un encapsuleur donc cela dépend beaucoup du contenu !
>> si vous avez un pdf contenant un scan de page (image), il ne faut pas
>> compter
>> en sortir du texte sinon par ocr.
>> il y a pdf2html qui est intégré dans toute distribution linux mais si
>> l'ffichage
>> est bien respecté tous les espaces sont remplacés par l'espace
>> insécable html
>> http://www.pdf2html.org/
>>> D'avance merci.
>>>
>>> isaric
>> Gérard
>>
>
>


--
Envoyez un mail à [hidden email] pour savoir comment vous désinscrire
Les archives de la liste sont disponibles à http://listarchives.libreoffice.org/fr/users/
Tous les messages envoyés sur cette liste seront archivés publiquement et ne pourront pas être supprimés

Utilise Libreoffice avec Ubuntu