Extraer texto de páginas web solo da la URL

Por favor, eche un vistazo al siguiente código:

if (Intent.ACTION_SEND.equals(getIntent().getAction())) { String text = getIntent().getStringExtra(Intent.EXTRA_TEXT); try { Document doc = Jsoup.connect(text).get(); Log.i("DOC", doc.toString().toString()); Elements elementsHtml = doc.getElementsByTag("tr"); ArrayList temp1 = new ArrayList(); for(Element element: elementsHtml) { temp1.add( element.text()); } //Add all the text to the edit text for(int i=0;i<temp1.size();i++) { textField.append(temp1.get(i)); } } catch(Exception e) { e.printStackTrace(); } } 

Este código utiliza la biblioteca JSoup con el código de Android. Necesito extraer todo el texto de la página web, y ese es el propósito del código anterior. Pero, en cambio, lo que hace es obtener la URL de la página web y agregarla al campo de texto y eso es todo.

Y necesito todo el texto. Este código está apuntando a “tr”.

¿Por qué sucede esto? ¿Cómo puedo corregirlo?

ACTUALIZAR

Cambié mi código de la siguiente manera, ¡y ahora no consigo nada!

  //Get the web page text if called from Share-Via if (Intent.ACTION_SEND.equals(getIntent().getAction())) { String text = getIntent().getStringExtra(Intent.EXTRA_STREAM); try { Document doc = Jsoup.connect(text).get(); Log.i("DOC", doc.toString().toString()); Elements elementsHtml = doc.getElementsByTag("tr"); ArrayList temp1 = new ArrayList(); for(Element element: elementsHtml) { temp1.add( element.text()); } //Add all the text to the edit text for(int i=0;i<temp1.size();i++) { textField.append(temp1.get(i)); } } catch(Exception e) { e.printStackTrace(); } } 

Este es mi código de archivo de manifiesto (solo la parte requerida) si ayuda