Articles of regex

Regex reemplaza el espacio en blanco en un documento HTML

Vi muchas preguntas similares, pero aún no encontré la respuesta. ¿Cómo debería verse la expresión regular, que debe reemplazar todos los espacios en blanco (incluir nueva línea) en HTML, pero ignorar la etiqueta? Actualmente uso Regex.Replace(content, @”\s+”, “”); pero elimina espacios en JavaScript que existen en la página y que la página no funciona. Gracias. […]

Rewrite Engine .htaccess Error de tipo MIME

Tengo un script que hace la búsqueda y quiero que los resultados también sean accesibles con la consulta mysite.com/searchfor/”myword” Agregué las siguientes líneas a .htaccess: RewriteEngine on RewriteRule ^/?searchfor/(.*)$ search.php?search=$1 [L] Funciona (la página se está cargando), pero cada recurso vinculado (css / js) no se pudo cargar con el próximo error: Resource interpreted as […]

Pelar tags HTML sin usar HtmlAgilityPack

Necesito una manera eficiente y (razonablemente) confiable para quitar las tags HTML de los documentos. Necesita poder manejar algunas circunstancias bastante adversas: No se sabe de antemano si un documento contiene HTML en absoluto. Lo más probable es que cualquier HTML tenga un formato muy pobre. Los documentos individuales pueden ser muy grandes, quizás cientos […]

Obtener el atributo href y el texto de cierto tipo de enlaces

De estos cuatro enlaces: Albano Y Romina Power Armando Manzanero Banda Cuisillos Baladas Alternativas Intento capturar el valor href y el texto del enlace de los tres primeros, dejando fuera el cuarto enlace, en otras palabras, estoy tratando de obtener esto: https://stackoverflow.com/questions/23305739/getting-the-href-attribute-and-text-of-certain-kind-of-links/escuchar-baladas-de-Albano_Y_Romina_Power.html Albano Y Romina Power https://stackoverflow.com/questions/23305739/getting-the-href-attribute-and-text-of-certain-kind-of-links/escuchar-baladas-de-Armando_Manzanero.html Armando Manzanero https://stackoverflow.com/questions/23305739/getting-the-href-attribute-and-text-of-certain-kind-of-links/musica-Merengue-de-Banda_Cuisillos.html Banda Cuisillos Estaba tratando de […]

Cómo analizar los atributos de un nodo HTML

Uso C # y necesito analizar un HTML para leer los atributos en pares de valores clave. por ejemplo, dado el siguiente fragmento de HTML Tenga en cuenta que los atributos pueden ser 1. key = “value” pares, por ejemplo, class=”someclass” 2. pares clave = valor, por ejemplo, id=my_ID (sin comillas para los valores) 3. […]

Mover el valor de atributo de título al valor de atributo de clase en el código HTML

Tenemos $menu variable con HTML dentro (no hay bucle, viene de una función). En echo , da el código así: text text text Lo que quiero hacer: obtener el valor del title=”” de cada enlace, y moverlo al final de la clase padre . eliminar title=”” de cada enlace. El código dentro del $menu variable […]

Regex para encontrar html div class content y data-attr? (preg_match_all)

Con preg_match_all quiero obtener clases y atributos de datos en html. El siguiente ejemplo funciona, pero solo devuelve nombres de clase o solo contenido de identificación de datos . Quiero que el patrón de ejemplo encuentre tanto el contenido de clase como el de identificación de datos. ¿Qué patrón de expresiones regulares debería usar? Contenido […]

¿Separar cadena por entidades HTML?

Mi cadena contiene muchas entidades HTML, como esta & # x22; Hola & nbsp; & lt; everyone & gt; & nbsp; allí & # x22; Y quiero dividirlo por entidades HTML en esto: Hola todos ahí ¿Alguien puede sugerirme una forma de hacer esto, por favor? Puede estar usando Regex?

carácter de espacio de eliminación (sin interrupción) en cadena en R en Linux

Esta pregunta parece facilitar la eliminación de caracteres espaciales en una cadena en R. Sin embargo, cuando cargo la siguiente tabla, no puedo eliminar un espacio entre dos números (por ejemplo, 11 846.4 ): require(XML) library(RCurl) link2fetch = ‘https://www.destatis.de/DE/ZahlenFakten/Wirtschaftsbereiche/LandForstwirtschaftFischerei/FeldfruechteGruenland/Tabellen/AckerlandHauptfruchtgruppenFruchtarten.html’ theurl = getURL(link2fetch, .opts = list(ssl.verifypeer = FALSE) ) # important! area_cult10 = readHTMLTable(theurl, stringsAsFactors = […]

php preg match – cómo obtener la etiqueta html?

hubo muchos hilos al respecto, pero aún necesito ayuda. Necesito usar preg_match para obtener el texto que necesito de las tags HTML. el HTML es: (I need this content) (por cierto, resolví mi problema con domdocument, pero necesito usar preg_match) Por favor ayuda. Saludos.