SingleFile, su bifurcación SingleFileZ y Save Page WE son excelentes opciones para guardar páginas web enteras como una sola página HTML. Pero a veces, es posible que desee que la página web sea de fácil acceso. Por ejemplo, es posible que desee tener sus materiales de estudio, trabajos de investigación en su teléfono y computadora. Convertir el HTML a PDF es una buena forma de garantizar la compatibilidad entre dispositivos,
Wkhtmltopdf es una herramienta multiplataforma y de código abierto que puede convertir páginas HTML a PDF. Esta es una utilidad de línea de comandos, pero no se preocupe, es bastante fácil de usar.
Instale la aplicación o extraiga el archivo portátil a una carpeta. Abra una ventana de símbolo del sistema.
La sintaxis para usar la herramienta es bastante simple, ingrese el nombre wkhtmltopdf, seguido de la URL de la página web y el nombre del PDF que desea crear, así.
wkhtmltopdf URL filename.pdf
Supongamos que desea guardar una copia de un sitio web, así es como se verá el comando.
wkhtmltopdf https://www.example.com/page example.pdf
Eso no era difícil ahora, ¿verdad? Pero recomendaría usar un comando ligeramente diferente.
wkhtmltopdf -n https://www.example.com/page example.pdf
La única diferencia aquí es el modificador -n, que deshabilita la carga de Javascript. También acelera el proceso de creación de PDF. También puede usar –disable-javascript para el mismo efecto, pero usar -n es mucho más simple. Si una página tiene muchas secuencias de comandos, el proceso de conversión puede atascarse y, en ocasiones, la apariencia del archivo de salida también puede verse afectada, pero si desea un procesamiento rápido, -n es su mejor opción. Puede ejecutarlo sin el parámetro si la salida está distorsionada.
Cuando el comando se pasa al programa, carga la página web en segundo plano (sin abrir su navegador) y comienza el proceso de conversión. Esto puede llevar uno o dos minutos dependiendo del contenido de la página web, pero no requiere ninguna interacción. Por lo tanto, espere a que se complete y su PDF esté listo para usar. wkhtmltopdf guarda el PDF en su propia carpeta. Debe prestar atención al nombre del PDF que está usando, porque el programa sobrescribirá cualquier archivo existente en la carpeta sin advertirle al respecto.
Aquí hay una captura de pantalla de una página web abierta en Firefox.
Usemos la herramienta. wkhtmltopdf https://en.wikipedia.org/wiki/Computer wiki.pdf
Y así es como se ve la versión en PDF (creada con wkhtmltopdf).
Como puede ver en la imagen, wkhtmltopdf extrajo la página perfectamente. También conserva los enlaces en las páginas.
Hay un montón de otras opciones que puede usar, puede verlas usando el comando de ayuda incorporado.
wkhtmltopdf -h
Si solo desea el texto de la página web, puede agregar –no-images al comando. ¿No desea que se incluyan enlaces (a otras páginas)? Utilice –disable-internal-links
¿Qué pasa si quieres guardar el archivo HTML como una imagen? Por qué no, puede hacerlo con la ayuda de wkhtmltoimage. Esta utilidad se incluye como parte del paquete wkhtmltox. Puede usar los mismos comandos que usó para el PDF, con la herramienta de imagen.
wkhtmltoimage https://en.wikipedia.org/wiki/Computer wiki.jpg
También es compatible con otros formatos de imagen, como PNG, BMP, pero estos terminan con tamaños de archivo realmente grandes (más de 100 MB), JPG tiene el mejor nivel de compresión.
Wkhtmltopdf y wkhtmltoimage están disponibles para Windows, Mac, Linux. La herramienta viene en versiones portátiles para sistemas de 32 y 64 bits.
Danos tu opinión