XHTML2ODT est annoncé sur LinuxFR
Le lundi 12 avril 2010, 08:08 - Lien permanent
Pour essayer de faire connaître XHTML2ODT, j’ai écrit un article sur LinuxFR qui en fait la promotion, ou du moins qui annonce à tout le monde que ça existe. Oui oui, écrire un article sur LinuxFR, c’est parler au monde. Rien que ça 
Je rappelle brièvement de quoi il s’agit : XHTML2ODT a pour objectif de convertir une page web (HTML) en document ODT, éditable ensuite par tous les traitements de texte qui utilisent ce format, notamment OpenOffice. Pour ce faire, il s’appuie sur un document OpenOffice “modèle”, dans lequel on peut définir les styles que l’on veut.
Comme il n’y a pas de gestionnaire de bugs pour l’instant, vous pouvez éventuellement utiliser les commentaires de cet article pour ça. Mais bon, il faudrait que j’en installe un quand même, ce serait plus propre. Je pencherais bien pour un Trac, mais maintenant faut voir si mon gentil hébergeur sera d’accord…
Mise à jour : Finalement j’ai fait un site dédié pour XHTML2ODT, avec Trac. Le code reste hébergé par Gitorious pour l’instant.















Commentaires
lundi 12 avril 2010, 13:15
Le début d’une gloire bien méritée !
Félicitations \o/
lundi 12 avril 2010, 13:19
@Xavier : Ouh, Xavier ! Tu tombes bien.
Question : comment et combien faudrait-il te soudoyer pour que tu fasses un plugin d’export ODT pour Wordpress
Avec bien sûr, l’assurance d’avoir un support technique de qualité sur la bibliothèque de conversion XHTML vers ODT…
(et merci au passage
)
lundi 12 avril 2010, 13:29
@Aurélien : Ma foi tu tombes bien également (attention à ne pas te fouler un muscle) : je suis en pleine mise à jour de la section “Ecrire un widget” de mon co-bouquin sur WP. Gageons que d’ici quelques jours/semaines, je serai en mesure de le faire proprement.
Mais si tu insistes pour monnayer cela, restons dans l’esprit “free as in beer” !
lundi 12 avril 2010, 13:36
@Xavier : “free as in beer” qui, comme tout le monde le sait, se traduit en français par “libre comme la bière”. Oui, c’est tout à fait l’esprit
lundi 12 avril 2010, 13:49
@Aurélien : Je garde ça en RAM, et te tiens au jus dès qu’il a lieu.
lundi 12 avril 2010, 15:37
Bonjour,
D’abord merci pour cette contribution super intéressante !
Je viens de tester le script “xhtml2odt.php” en cli sur Debian Etch (Php 5.2).
J’ai préalablement installé “php5-xsl”.
J’ai eu un petit soucis avec getopt dont le 2e paramètre ne fonctionne qu’à partir de Php 5.3 mais ça ne semble pas bloquant.
Maintenant tout semble ok sauf que le fichier odt est vide à l’affichage avec OpenOffice 3.1. Pourtant le fichier content.xml dans l’archive contient bien le contenu de mon fichier xhtml. Je peux éventuellement fournir l’odt généré.
Stéphane.
lundi 12 avril 2010, 15:53
@Anonyme : Bonjour Stéphane,
Pour le getopt et PHP 5.3, c’est une erreur de ma part, je vais corriger.
Quelques questions :
Merci, il faut d’abord que j’arrive à reproduire le bug. Merci pour le rapport !
lundi 12 avril 2010, 16:55
@Aurélien : Je viens juste de tester avec Python mais je ne suis vraiment pas expert et le script plante chez moi avec le trace suivant :
Traceback (most recent call last):
AttributeError: type object ‘etree.XSLT’ has no attribute ‘strparam’
Pour en arriver là j’ai installé les dépendances suivantes : python-utidylib, python-lxml, python-imaging
En ce qui concerne la version PHP, voici le fichier XHTML de test et le fichier ODT généré (dans le zip) : http://dl.free.fr/cWYDkpSVo
lundi 12 avril 2010, 17:09
@Anonyme : L’erreur Python vient d’une version de python-lxml qui est un peu vieillotte (la fonction strparam n’existait pas encore). Il faudrait que je me débrouille pour faire autrement. Je pense que je vais finir par devoir installer une Etch dans une machine virtuelle pour bien tester tout ça…
Pour le PHP, je vais regarder, je te tiens au courant. Si tu veux m’envoyer un mail on peut faire ça par ce biais, le lien pour me contacter est en haut de la colonne de droite sur ce site.
lundi 12 avril 2010, 17:20
@Anonyme : Le fichier zip que j’ai téléchargé ne contient que le contenu du document ODT, est-ce que tu pourrais me passer le document HTML ?
Au passage, il faut que ton document HTML soit valide et bien formé. Si ce n’est pas le cas, il faut que tu installes l’extension PHP “tidy” qui fera le nettoyage pour toi.
dimanche 18 avril 2010, 23:55
C’est une super idée , à l’heure actuelle le seul vrai export d’une page web c’est en format pdf , la on peut l’exploiter direct.
Bravo pour ce projet et félicitations.