Bienvenue sur IndexError.

Ici vous pouvez poser des questions sur Python et le Framework Django.

Mais aussi sur les technos front comme React, Angular, Typescript et Javascript en général.

Consultez la FAQ pour améliorer vos chances d'avoir des réponses à vos questions.

scrape et fusion de css pour produire un pdf propre via pypandoc

0 votes

je viens de decouvrir les conversions entre html / css , markdown et pdf .
Je fais cela avec pypandoc.
Mais parfois c'est crade à cause du css qui n'est pas "rendu" dans le pdf.

comment aspirer facilement les diverses sources de css pour les "reinjecter" ensuite.

exemple d'une page avec du css dans tous les sens:
http://sametmax.com/la-course-du-bus-de-linnovation-sur-le-chemin-de-la-croissance/

exemples de commande:

curl --silent https://pandoc.org/installing.html | pandoc --from html --to markdown_strict -o installing.md

output = pypandoc.convert_file('installing.md', 'pdf', outputfile='installing.pdf', extra_args=['--latex-engine=xelatex','-V', 'geometry:margin=1.5cm'])

un lien qui peut aider ? :
http://benjam.info/panam/

demandé 2-Sep par buffalo974 (2,886 points)

1 Réponse

+1 vote
 
Meilleure réponse

Utiliser weasyprint, un package python qui fait un rendu intermédiaire, puis envoie la page rendue dans un PDF.

Je l'utilise pour générer des rapports, des carte professionnelles... ça arche très bien et c'est utilisable en ligne de commande.

$ pip3 install --user weasyprint
répondu 8-Sep par frague (662 points)
sélectionné 9-Sep par buffalo974
...