je viens de decouvrir les conversions entre html / css , markdown et pdf .
Je fais cela avec pypandoc.
Mais parfois c'est crade à cause du css qui n'est pas "rendu" dans le pdf.
comment aspirer facilement les diverses sources de css pour les "reinjecter" ensuite.
exemple d'une page avec du css dans tous les sens:
http://sametmax.com/la-course-du-bus-de-linnovation-sur-le-chemin-de-la-croissance/
exemples de commande:
curl --silent https://pandoc.org/installing.html | pandoc --from html --to markdown_strict -o installing.md
output = pypandoc.convert_file('installing.md', 'pdf', outputfile='installing.pdf', extra_args=['--latex-engine=xelatex','-V', 'geometry:margin=1.5cm'])
un lien qui peut aider ? :
http://benjam.info/panam/