Bienvenue sur IndexError.

Ici vous pouvez poser des questions sur Python et le Framework Django.

Consultez la FAQ pour améliorer vos chances d'avoir des réponses à vos questions.

scrape et fusion de css pour produire un pdf propre via pypandoc

0 votes

je viens de decouvrir les conversions entre html / css , markdown et pdf .
Je fais cela avec pypandoc.
Mais parfois c'est crade à cause du css qui n'est pas "rendu" dans le pdf.

comment aspirer facilement les diverses sources de css pour les "reinjecter" ensuite.

exemple d'une page avec du css dans tous les sens:
http://sametmax.com/la-course-du-bus-de-linnovation-sur-le-chemin-de-la-croissance/

exemples de commande:

curl --silent https://pandoc.org/installing.html | pandoc --from html --to markdown_strict -o installing.md

output = pypandoc.convert_file('installing.md', 'pdf', outputfile='installing.pdf', extra_args=['--latex-engine=xelatex','-V', 'geometry:margin=1.5cm'])

un lien qui peut aider ? :
http://benjam.info/panam/

demandé 2-Sep-2019 par buffalo974 (2,952 points)

1 Réponse

+1 vote
 
Meilleure réponse

Utiliser weasyprint, un package python qui fait un rendu intermédiaire, puis envoie la page rendue dans un PDF.

Je l'utilise pour générer des rapports, des carte professionnelles... ça arche très bien et c'est utilisable en ligne de commande.

$ pip3 install --user weasyprint
répondu 8-Sep-2019 par frague (692 points)
sélectionné 9-Sep-2019 par buffalo974
...