Raivens
Usuario de Bronce
- Mensajes
- 1,619
- Puntuación de reacción
- 0
Titulo sensacionalista no?, ya me acostumbre a ellos al ver guias de CPA :greedy_dollars:
Resumen
Me he decidido a escribir este minitutorial, en el cual aprenderas de manera muy sencilla a crear un pequeño bot para extraer datos de cualquier pagina web. en este caso "Hackear a Chuiso" :sisi1:.
Que necesitamos?
- Autoit
- Ingenio
1 - Instalamos el programa Autoit y abrimos "SciTE Script Editor"
2 - Guardarmos File-Save As, escogemos un titulo acorde a nuestro programa
3 - Codigo
Primero que todo, se haria muy extenso este post si explico cada cosa del programa, he comentado casi todas las lineas, si tienes alguna duda extra puedes escribir y tratare de darle solucion :mola:
Codigo completo, Incluye el codigo y el resultado final
Imagen referencia 1
Imagen referencia 2
Resumen
Me he decidido a escribir este minitutorial, en el cual aprenderas de manera muy sencilla a crear un pequeño bot para extraer datos de cualquier pagina web. en este caso "Hackear a Chuiso" :sisi1:.
Que necesitamos?
- Autoit
- Ingenio
1 - Instalamos el programa Autoit y abrimos "SciTE Script Editor"
2 - Guardarmos File-Save As, escogemos un titulo acorde a nuestro programa
3 - Codigo
Primero que todo, se haria muy extenso este post si explico cada cosa del programa, he comentado casi todas las lineas, si tienes alguna duda extra puedes escribir y tratare de darle solucion :mola:
Código:
#include <Inet.au3> ; Liberia para obtener archivos de internet, en este caso el codigo fuente de la url
#include <Array.au3> ; Array para almacenar nuestros datos, cada dato incluira una posicion
#include <String.au3> ; Funciones para el manejo de Strings
#include <File.au3> ; Guardar y Escribir archivos.
$contador = 0 ; Contador para manejar las paginas de Chuiso.com
while $contador < 14 ; En la parte de abajo de Chuiso.com puedes ver que tiene 14 Paginas
if $contador = 0 Then ; La primera pagina, es la portada de Chuiso.com
local $url = _InetGetSource('http://chuiso.com') ; Url de la portada
Else
local $url = _InetGetSource('http://chuiso.com' & '/page/' & $contador & '/') ; Url de la pagina con el contador Ej: http://chuiso.com/page/14/ .Ver Img1
EndIf
local $aArray1 ; Declaramos el Array dodne vamos a guardar los datos
$aArray1 = _StringBetween ($url, '<h2>', '</h2>') ; Con esta funcion tomaremos los datos que esten entre '<h2>', '</h2>' .Ver Img2
$contador2 = 0 ; Contador para los articulos
While $contador2 < 7 ; Este contador limita a 7, que son los articulos que se muestran por pagina en Chuiso.com
$buffer = $aArray1[$contador2] ; Añadimos el valor de la posicion $contador en el Array1 a $buffer
$buffer = BinaryToString($buffer, 4) ; Esto lo hacemos porque muchas paginas tienen formato charset=utf-8 - Busca en wikipedia si no sabes que es :D
Local $file = FileOpen ("Enlaces.txt",1) ; Abrimos el archivo donde guardaremos los enlaces
if $file = -1 Then
MsgBox (0, "Error", "No se puede abrir")
Exit
EndIf
FileWriteLine($file, $buffer) ; Escribimos los enlaces en una linea del archivo
FileClose($file)
$contador2 = $contador2 + 1 ; Aumentamos el contador para seguir recorriendo el Array que contiene los enlaces
WEnd
$contador += 1 ; Aumentamos el contador para visitar otra pagina de Chuiso.com
WEnd
Codigo completo, Incluye el codigo y el resultado final
You must reply before you can see the hidden data contained here.
You must reply before you can see the hidden data contained here.
Imagen referencia 2
Última edición: