Articles of regex

Expresión regular para encontrar URL que no estén dentro de un hipervínculo

Hay muchas expresiones regulares para que coincida con una URL. Sin embargo, trato de hacer coincidir las URL que no aparecen en ninguna parte dentro de una etiqueta de hipervínculo ( HREF , valor interno, etc.). Así que NINGUNA de las URL en estos debe coincidir: algo http://www.example2.com algo http://www.example.com/ prueba Cualquier URL fuera de […]

¿Puedes proponer una forma más elegante de ‘tokenizar’ el código c # para el formato html?

( Esta pregunta sobre la refactorización del código F # me dio un voto negativo, pero también algunas respuestas interesantes y útiles. Y 62 preguntas F # de las más de 32,000 sobre SO parecen lamentables, ¡así que voy a correr el riesgo de más desaprobación!) Intenté publicar un poco de código en un blog […]

Enlace automático URL con javascript Regex

Tengo un párrafo de texto que puede contener algunos enlaces en texto sin formato, o algunos enlaces que en realidad son enlaces. Por ejemplo: Posting a link: http://test.com, posting an image . Posting an actual A tag: http://test.com/test.html Necesito pescar los enlaces sin formato de este texto. Por lo tanto, cualquier expresión regular que coincida […]

Regex para extraer el contenido de una etiqueta

Con un poco de congelación cerebral aquí, así que esperaba algunas indicaciones, esencialmente necesito extraer el contenido de una etiqueta div específica, sí, sé que la expresión regular generalmente no está aprobada para esto, pero es una aplicación simple de web scraping donde no hay divs nesteds. Estoy tratando de hacer coincidir esto: Some company […]

regex para analizar html (en c #)

Estoy tratando de analizar una página html y extraer 2 valores de una fila de la tabla. El html para la fila de la tabla es el siguiente: Max Temperature (ºC) 6 13:41:30 y la expresión que tengo en este momento es: [\s]<td[^Max Temperature[\w\s]*[\s] <td[^(?([\d]+))[\s] <td[^(?([\d\:]+))[\s] Sin embargo, parece que no puedo extraer ninguna coincidencia. […]

Cómo analizar tags HTML en Matlab usando regexp?

Tengo poco tiempo y específicamente quería extraer una cadena como la de abajo. El problema es que la etiqueta no es de la forma data . Dado, s = 5,888 cómo extraer solo 5.888 en matlab?

Regex para extraer la URL de Favicon de una página web

Ayúdenme a encontrar la URL de Favicon del html de muestra a continuación usando la expresión Regular. También debe verificar la extensión de archivo “.ico”. Estoy desarrollando un sitio de marcadores personales y quiero guardar los icons de enlaces que marque. Ya he escrito el código c # para convertir el icono en gif y […]

RegEx DotAll y multiline

Me costó un poco usar Rexex en Powershell. Parece que hay un error de imlementación o algo así. El texto con el que quiero trabajar es un archivo html, que se ve así (Ejemplo1): [Mobile: %mobile% |] Phone: %telephone% [| Fax: %faxNumber%] El problema es que, causado por editores html, también puedo obtener algo como […]

Cómo reemplazar los comentarios HTML con elementos personalizados de

Estoy trabajando en la conversión masiva de varios archivos HTML a XML utilizando BeautifulSoup en Python. Un archivo HTML de muestra se ve así: … … Descubrí cómo encontrar el doctype y reemplazarlo con la etiqueta … , pero el comentario me … mucha frustración. Quiero reemplazar los comentarios HTML con … . En este […]

Cómo resaltar una parte del texto en textarea

¿Hay alguna manera de resaltar una parte del texto en textarea? Por ejemplo: digamos que el texto es “Hola, @twitter @twitpic” y ahora me gustaría resaltar @twitter y @twitpic solamente y no Hola . Esto tiene que suceder sobre la marcha. No quiero usar iframe Gracias por adelantado