[eside-ghost] Web Scraping con Javascript
Gustavo Fernández
gus en zylk.net
Mie Abr 14 15:07:49 CEST 2010
Buenas:
Si al final con al orientación REST funciona, comentalo y asà si alguna vez lo necesitamos podremos acceder de esta manera e incorporar las búsquedas de google desde el lado del servidor.
un saludo
--gustavo
-----------------------------------------
Gustavo Fernández
ZYLK.net :: consultorÃa.openSource
Ribera de Axpe, 11
Edificio A, modulo 215
48950 Erandio (Bizkaia)
movil: 637546184
ofic.: 944272119
email: gus at zylk.net
-----------------------------------------
----- Mensaje original -----
De: "David Santamaria" <d.highwayman en gmail.com>
Para: "Lista de eside-ghost" <eside-ghost en listas.deusto.es>
Enviados: Miércoles, 14 de Abril 2010 10:52:34 GMT +01:00 Amsterdam / BerlÃn / Berna / Roma / Estocolmo / Viena
Asunto: Re: [eside-ghost] Web Scraping con Javascript
Hola,
No me percate de que ofrecieran una interfaz REST, le hecho un vistazo, aunque parece que si que va a ser lo que necesito.
No se como se me paso por alto, porque esta bastante bien documentado.
Gracias por la info!
Un saludo.
2010/4/14 Gustavo Fernández < gus en zylk.net >
Buenas:
Si lo que necesitas es acceder al API de busqueda de google en realidad creo que se puede acceder por REST con lo que simplemente tendrás que crearte un script en python o cualquier lenguaje de programación y ejecutarlo. Al final rest no es mas que llamar a un url y parsear la respuesta.
En java que es de lo que yo se algo simplemente habrÃa que crear un cliente http con la librerÃa httpclient de apache, hacer la llamada de busqueda a la url necesaria por get o post y parsear la vuelta.
Con el api de google no lo he hecho pero con el de alfresco o nuxeo si que lo he hecho de esta manera.
De todas formas no se si he entendido bien la problemática.
un saludo
--gustavo
PS:
"For Flash developers, and those developers that have a need to access the AJAX Search API from other Non-Javascript environments, the API exposes a simple RESTful interface. In all cases, the method supported is GET and the response format is a JSON encoded result set with embedded status codes."
-----------------------------------------
Gustavo Fernández
ZYLK.net :: consultorÃa.openSource
Ribera de Axpe, 11
Edificio A, modulo 215
48950 Erandio (Bizkaia)
movil: 637546184
ofic.: 944272119
email: gus at zylk.net
-----------------------------------------
----- Mensaje original -----
De: "Javier Infante" < jabi en irontec.com >
Para: "David Santamaria" < d.highwayman en gmail.com >
CC: "Lista de eside-ghost" < eside-ghost en listas.deusto.es >
Enviados: Miércoles, 14 de Abril 2010 8:35:44 GMT +01:00 Amsterdam / BerlÃn / Berna / Roma / Estocolmo / Viena
Asunto: Re: [eside-ghost] Web Scraping con Javascript
El mié, 14-04-2010 a las 08:28 +0200, David Santamaria escribió:
> Aupa Jabi!!!
> Pues el tema es que el JS no es mio, es de Google ;P.... estoy
> intentando acceder a su API de Busquedas, pero solo ofrecen esta API
> via Ajax [1], asi que me he creado una pagina que accede a esa api, y
> devuelve un "true" o "false" dependiendo de un resultado, pero claro
> todo via AJAX, se os ocurre algun parche?
Se me ocurre que abras Firebug, comprubes las peticiones XHR (Red >
XHR), y las emules idénticas (fakeando las cabeceras HTTP), desde un
script. Aunque supongo que necesitarás primero tener una sesión válida,
y luego enviar correctamente las caberas...
De todas maneras, creo que yo en breve tengo que utilizar la API de
Google Search Images, también desde un script. Si doy con algo ya te
comento.
venga suerte!
--
Javier Infante < jabi en irontec.com >
Irontec
_______________________________________________
eside-ghost mailing list
eside-ghost en listas.deusto.es
https://listas.deusto.es/mailman/listinfo/eside-ghost
_______________________________________________
eside-ghost mailing list
eside-ghost en listas.deusto.es
https://listas.deusto.es/mailman/listinfo/eside-ghost
--
David.
_______________________________________________ eside-ghost mailing list eside-ghost en listas.deusto.es https://listas.deusto.es/mailman/listinfo/eside-ghost
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: https://listas.deusto.es/mailman/private/eside-ghost/attachments/20100414/d764fc41/attachment.htm
Más información sobre la lista de distribución eside-ghost