Como usar Google Spreadsheet para scrapear contenido?

Mensajes
3
Puntuación de reacción
0
Buenas a todos,

estoy intentando scrapear contenido de páginas de directorios tales como paginasamarillas. No dispongo de ningún software como screamingfrog o similares. Debido a ello, estoy usando Google Spreadsheet como primera alternativa. La información es únicamente para recopilar datos y conocer mi competencia.

Si vamos a páginasamarillas y ponemos como búsquedas ejemplo "tiendas de animales" y localidad en "murcia" (por poner algo), nos salen una serie de resultados. Quiero scrapear estos resultados pero me está resultando imposible algo que debería de ser super fácil.

La XPATH que uso es "li[@class='m-results-business']" pero me devuelve que el resultado es empty ???.

=IMPORTXML('http://www.paginasamarillas.es/search/tienda-de-animales/all-ma/murcia/all-is/murcia/all-ba/all-pu/all-nc/1?what=tienda+de+animales&where=murcia',"li[@class='m-results-business']")


Imposible chiquillo.

Alguno ha intentado o ha tenido problemas scrapeando contenido con Google Spreadsheet? Me da que el Html está mal formado y parece que eso jode el XPath pero tampoco puedo asegurarlo. Alguno que haya scrapeado paginasamarillas o directorios similares?

Un saludo,
 
Arriba