[eside-ghost] Web Scraping con Javascript

Gustavo Fernández gus en zylk.net
Mie Abr 14 10:18:56 CEST 2010


Buenas: 

Si lo que necesitas es acceder al API de busqueda de google en realidad creo que se puede acceder por REST con lo que simplemente tendrás que crearte un script en python o cualquier lenguaje de programación y ejecutarlo. Al final rest no es mas que llamar a un url y parsear la respuesta. 
En java que es de lo que yo se algo simplemente habría que crear un cliente http con la librería httpclient de apache, hacer la llamada de busqueda a la url necesaria por get o post y parsear la vuelta. 
Con el api de google no lo he hecho pero con el de alfresco o nuxeo si que lo he hecho de esta manera. 

De todas formas no se si he entendido bien la problemática. 

un saludo 
--gustavo 


PS: 
"For Flash developers, and those developers that have a need to access the AJAX Search API from other Non-Javascript environments, the API exposes a simple RESTful interface. In all cases, the method supported is GET and the response format is a JSON encoded result set with embedded status codes." 

----------------------------------------- 
Gustavo Fernández 

ZYLK.net :: consultoría.openSource 
Ribera de Axpe, 11 
Edificio A, modulo 215 
48950 Erandio (Bizkaia) 

movil: 637546184 
ofic.: 944272119 
email: gus at zylk.net 
----------------------------------------- 

----- Mensaje original ----- 
De: "Javier Infante" <jabi en irontec.com> 
Para: "David Santamaria" <d.highwayman en gmail.com> 
CC: "Lista de eside-ghost" <eside-ghost en listas.deusto.es> 
Enviados: Miércoles, 14 de Abril 2010 8:35:44 GMT +01:00 Amsterdam / Berlín / Berna / Roma / Estocolmo / Viena 
Asunto: Re: [eside-ghost] Web Scraping con Javascript 

El mié, 14-04-2010 a las 08:28 +0200, David Santamaria escribió: 
> Aupa Jabi!!! 
> Pues el tema es que el JS no es mio, es de Google ;P.... estoy 
> intentando acceder a su API de Busquedas, pero solo ofrecen esta API 
> via Ajax [1], asi que me he creado una pagina que accede a esa api, y 
> devuelve un "true" o "false" dependiendo de un resultado, pero claro 
> todo via AJAX, se os ocurre algun parche? 

Se me ocurre que abras Firebug, comprubes las peticiones XHR (Red > 
XHR), y las emules idénticas (fakeando las cabeceras HTTP), desde un 
script. Aunque supongo que necesitarás primero tener una sesión válida, 
y luego enviar correctamente las caberas... 

De todas maneras, creo que yo en breve tengo que utilizar la API de 
Google Search Images, también desde un script. Si doy con algo ya te 
comento. 

venga suerte! 





-- 
Javier Infante <jabi en irontec.com> 
Irontec 

_______________________________________________ 
eside-ghost mailing list 
eside-ghost en listas.deusto.es 
https://listas.deusto.es/mailman/listinfo/eside-ghost 
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: https://listas.deusto.es/mailman/private/eside-ghost/attachments/20100414/469a1485/attachment.htm 


Más información sobre la lista de distribución eside-ghost