Encuentra blogs eliminados con autoridad de forma automática

lekroz

Platino
Usuario de Bronce
Mensajes
1,734
Puntuación de reacción
0
Y... al final lo vas a compartir con nosotros :D o lo guardaras solo para ti

La idea es compartirlo, pero puesto que tengo poco tiempo y esto no me genera dinero, espera sentado :mola:
Lo tengo casi terminado, pero hay un problema con Javascript y he de solucionarlo.
 

Pure Profit

Oro
Usuario de Bronce
Mensajes
1,085
Puntuación de reacción
0
Quedo a la espera del nuevo programa en Python. Tiene pintaza!

Te envío MP.
 

Novato

Oro Blanco
Usuario de Bronce
Mensajes
1,239
Puntuación de reacción
3
Esperando el nuevo, se ve que será una joyita!

Gracias @lekroz por compartirlo :mola:
 

lekroz

Platino
Usuario de Bronce
Mensajes
1,734
Puntuación de reacción
0
La versión de Java funciona, no? Pues usad esa xD No puedo ahora mejorar el de Python, porque además tendría que ver como evitar un bloqueo que hace blogger con Javascript.
 

Pure Profit

Oro
Usuario de Bronce
Mensajes
1,085
Puntuación de reacción
0
Una pregunta...los blogs que te salen del tipo "This blog doesn't exist. In a future you can register it", ¿cuánto tiempo hay que esperar para poder registrarlos?

- - - Actualización- - -

Aaah y también...¿podrías explicar qué es lo que hace exactamente el programa?
 

Pure Profit

Oro
Usuario de Bronce
Mensajes
1,085
Puntuación de reacción
0

lekroz

Platino
Usuario de Bronce
Mensajes
1,734
Puntuación de reacción
0
El programa del primer post caduca el día 1 de abril. No tengo intención de actualizarlo.
 

lekroz

Platino
Usuario de Bronce
Mensajes
1,734
Puntuación de reacción
0
de liberar el codigo? :(

Sin problemas eso, pero como no lo compiles tu mismo no funciona xD Haber si luego puedo subirlo.

- - - Actualización- - -

de liberar el codigo? :(

Resulta que el programa funcionará hasta Mayo, no Abril.

La versión de Java no voy a compartirla, en su lugar, comparto la versión de Python que no llegue a terminar. Funciona pero había que solucionar algunas cosas. Si alquien quiere usarlo va a tener que instalar librerías como lxml, mechanize... Hay que tener instalado Python para poder usarlo.
You must reply before you can see the hidden data contained here.
 

Jose Ferreira

Zafiro
Usuario de Bronce
Mensajes
2,471
Puntuación de reacción
0
Sin problemas eso, pero como no lo compiles tu mismo no funciona xD Haber si luego puedo subirlo.

- - - Actualización- - -



Resulta que el programa funcionará hasta Mayo, no Abril.

La versión de Java no voy a compartirla, en su lugar, comparto la versión de Python que no llegue a terminar. Funciona pero había que solucionar algunas cosas. Si alquien quiere usarlo va a tener que instalar librerías como lxml, mechanize... Hay que tener instalado Python para poder usarlo.
You must reply before you can see the hidden data contained here.


Gracias por liberar el .py, voy a ver que puedo hacer. Yo lo he usado si bien, cada semana y me ha servido, no se los demas, pero en mi caso es algo que utilizo constantemente
muchas gracias
 

Pure Profit

Oro
Usuario de Bronce
Mensajes
1,085
Puntuación de reacción
0
He estado usando el script en python y me gustaría saber si hay alguna manera de interrumpir el proceso y que se te guarde un archivo de texto con el resultado de la consola.
 

lekroz

Platino
Usuario de Bronce
Mensajes
1,734
Puntuación de reacción
0
He estado usando el script en python y me gustaría saber si hay alguna manera de interrumpir el proceso y que se te guarde un archivo de texto con el resultado de la consola.
Cada vez que encuentra un blog guarda el archivo, no hay que esperar. Pero haz la prueba y asegúrate.
 

Pure Profit

Oro
Usuario de Bronce
Mensajes
1,085
Puntuación de reacción
0
Cada vez que encuentra un blog guarda el archivo, no hay que esperar. Pero haz la prueba y asegúrate.

Vale, no me di cuenta y lo guardaba en el root en vez de en la misma carpeta que estaba el .py

Me daré el lujo de modificarlo un poco a mi gusto.

Gracias por el aporte de nuevo
 
Mensajes
10
Puntuación de reacción
0
Alguien lo puede resubir? Ya tiene todo el dia dando error la descarga :S
 

Pure Profit

Oro
Usuario de Bronce
Mensajes
1,085
Puntuación de reacción
0
@lekroz ¿La velocidad de este script en python es menor que en la versión java? Me da la impresión al estar probándolo un tiempo...

Por cierto, ¿de qué forma se podría guardar el archivo blogs.txt que te genera en la misma carpeta que el script? Actualmente me lo guarda en un nivel superior.

Y otra duda...¿por qué empieza a scrapear a partir de la página 11 de Google y no empieza por la 1?
 
Última edición:
Arriba