Articles of python

Cómo obtener el título de la página en las solicitudes.

¿Cuál sería la forma más sencilla de obtener el título de una página en Solicitudes? r = requests.get(‘http://www.imdb.com/title/tt0108778/’) # ? r.title Friends (TV Series 1994–2004) – IMDb

Formatear el código HTML con Python

Tengo una lista de URL en una columna en un archivo CSV. Me gustaría utilizar Python para recorrer todas las URL, descargar una parte específica del código HTML de la URL y guardarla en la siguiente columna. Por ejemplo: desde esta URL me gustaría extraer este div y escribirlo en la siguiente columna. VM−2N ist […]

XPATH – html con muchos niños

Considere el html en la variable de página . ¿Cómo accedo a la td s? Quiero acceder a ellos como xpath(“/table/tr/td/text())” No quiero indicar los otros tr s Lamentablemente, esta expresión xpath(‘.//table/tr/tr/tr/td/text()’) tampoco funciona. Código de Python: import __future__ from lxml import html import requests from bs4 import BeautifulSoup page = “”” cv table1 td1 […]

¿Cómo paso el parámetro url al valor de forma?

La forma tiene este campo oculto los parámetros de url son /dir?type=tshirt /dir?type=books /dir?type=posters y así. Ahora valoré duro value=”tshirts” pero ¿cómo obtengo el parámetro para la página relevante? Encontré varias páginas como esta que trataban temas similares pero no entendía cómo se hace esto. Gracias por tu ayuda. ACTUALIZAR La respuesta por systempuntoout funciona […]

‘forms.ContactForm object’ no tiene ningún atributo ‘hidden_tag’

Intento crear un formulario de contacto utilizando un matraz pero sigo recibiendo este error cuando se procesa la página. ‘forms.ContactForm object’ has no attribute ‘hidden_tag’ Aquí están mis archivos: contact.html {% extends “layout.html” %} {% block content %} Contact {{ form.hidden_tag() }} {{ form.name.label }} {{ form.name }} {{ form.email.label }} {{ form.email }} {{ […]

¿Cómo personalizar el formulario de registro de usuario de Django?

Quiero saber cómo cambiar la visualización del UserRegistrationForm predeterminado. Este es mi archivo views.py from django.http import * from django.shortcuts import render_to_response from django.http import HttpResponseRedirect from django.contrib import auth from django.core.context_processors import csrf from django.contrib.auth.forms import UserCreationForm from forms import MyRegistrationForm def register_user(request): if request.method == ‘POST’: form = MyRegistrationForm(request.POST) if form.is_valid(): form.save() return […]

Biblioteca de detección de encoding en python

Esto de alguna manera está relacionado con mi pregunta aquí . Proceso toneladas de textos (principalmente en HTML y XML) obtenidos a través de HTTP. Estoy buscando una biblioteca en python que pueda hacer una detección inteligente de encoding basada en diferentes estrategias y convertir textos a unicode utilizando la mejor conjetura de encoding de […]

Concatenación de texto nested de Xpath en Scrapy

He intentado concatenar texto nested junto con xpath en Scrapy. Creo que usa xpath 1.0? He visto un montón de otras publicaciones, pero nada parece obtener todo lo que quiero Aquí está la parte específica del html (página actual http://adventuretime.wikia.com/wiki/List_of_episodes ): Finn and Princess Bubblegum must protect the Candy Kingdom from a horde of candy […]

Cargar blobstore con javascript

Esta es la statement mínima del HTML para cargar un archivo en Blobstore en la página upload_url . Lo que se requiere con esta solución es hacer clic en el botón Enviar para que el contenido se envíe y se redireccione. ¿Cómo puedo hacer la publicación en segundo plano con javascript o jQuery sin perder […]

Scraping with Beautiful Soup: ¿Por qué el método get_text no devuelve el texto de este elemento?

Últimamente he estado trabajando en un proyecto en Python que implica robar algunos sitios web para algunos proxies. El problema con el que me estoy metiendo es que cuando trato de robar un cierto sitio proxy conocido, Beautiful Soup no hace lo que espero cuando le pido que encuentre dónde están las direcciones IP en […]