¿Cómo hacer una conversión de HTML a XML para generar tags cerradas?

Cómo hacer la conversión de xml a html para generar tags cerradas.

El contexto se explica aquí: Error al generar pdf desde un archivo Html en Java usando iText

Cuando bash convertir html a pdf usando iText y XML Worker, me piden que proporcione la etiqueta de cierre para las tags


y
. Funciona si lo hago de forma manual: ¡la conversión a PDF funcionó! Pero no quiero agregar cada etiqueta de cierre manualmente. ¿Cómo puedo hacer esto de forma automatizada?

Está experimentando este problema porque está alimentando HTML al Trabajador XML de iText. XML Worker requiere XML, por lo que debe convertir su HTML en XHTML.

Hay un ejemplo sobre cómo hacer esto en el sitio oficial de iText: D00_XHTML

 public static void tidyUp(String path) throws IOException { File html = new File(path); byte[] xhtml = Jsoup.parse(html, "US-ASCII").html().getBytes(); File dir = new File("results/xml"); dir.mkdirs(); FileOutputStream fos = new FileOutputStream(new File(dir, html.getName())); fos.write(xhtml); fos.close(); } 

En este ejemplo, obtenemos una ruta a un archivo HTML ordinario (similar a lo que tiene). Luego usamos la biblioteca Jsoup para analizar el HTML en una matriz de bytes XHTML. En este ejemplo, usamos esa matriz de bytes para escribir un archivo XHTML en el disco. Puede usar la matriz de bytes directamente como entrada para XML Worker.