Obtener texto entre 2 tags html c #

Estoy tratando de obtener los datos entre el html (span) proporcionado (en este caso 31)

Aquí está el código original (desde inspeccionar elementos en cromo)

31 

Tengo un cuadro de texto enriquecido que contiene el origen de la página, aquí está el mismo código pero en la línea 51 del cuadro de texto enriquecido:

 
You have
17
Points
When people subscribe to you, you lose a point

¿Cómo voy a hacer esto? He intentado varios métodos y ninguno de ellos parece funcionar para mí.

Estoy tratando de recuperar el valor del punto de esta página: http://www.subxcess.com/sub4sub.php El número cambia dependiendo de quién te subscribe.

Podrías ser increíblemente específico al respecto:

 var regex = new Regex(@"(.*?)"); var match = regex.Match(@"31"); var result = match.Groups[1].Value; 

Querrá usar HtmlAgilityPack para hacer esto, es bastante simple:

 HtmlDocument doc = new HtmlDocument; doc.Load("filepath"); HtmlNode node = doc.DocumentNode.SelectSingleNode("//span"); //Here, you can also do something like (".//span[@id='point_total' class='tooltip' jQuery16207621750175125325='23' oldtitle='Note: If the number is black, your points are actually a little bit negative. Don't worry, this just means you need to start subbing again.']"); to select specific spans, etc... string value = node.InnerText; //this string will contain the value of span, ie ***value*** 

Regex, si bien es una opción viable, es algo que generalmente querría evitar si fuera posible para analizar html (consulte Aquí )

En términos de sostenibilidad, querrás asegurarte de que entiendes el origen de la página (es decir, actualizarla varias veces y ver si el espacio objective está nested dentro de los mismos padres después de cada actualización, asegúrate de que la página esté en el mismo lugar formato general, etc., luego navegue al tramo utilizando el principio anterior).

Hay múltiples posibilidades

  1. Regex
  2. Deje que HTML se analice como XML y obtenga el valor a través de XPath
  3. Itera a través de todos los elementos. Si obtiene una etiqueta span, omita todos los caracteres hasta que encuentre el cierre ‘>’. Entonces, el valor que necesita es todo antes de la próxima apertura ‘<'

Consulte también System.Windows.Forms.HtmlDocument