Script en Bash para bajar fotos de Soho.com

Hace algun tiempo hice un Script en bash (para Linux) que se encargaba de bajar todas las imágenes de soho.com. En ese entonces la pagina usaba una animación en Flash para exhibir su galeria de fotos, una verdadera pesadilla para los coleccionistas de fotos de modelos semi (o completamente) desnudas.

Anteriormente me había inspirado en una pagina en php que había creado el amigo Bird of Paradise de la comunidad de Dragonjar.org, quien encontró unos archivos XML que se encargaban de guardar la información de las galerías y posteriormente eran importados a la animación Flash. Muchos usuarios de otras comunidades se basaron en su trabajo para hacer aplicaciones que permitieran bajar las imágenes.

soho-downloader soho-downloader

En estos dias quize reciclar mi script, mejorarlo un poco y luego publicarlo nuevamente. Primero tuve que buscarlo en mi disco duro, entonces puse a mi ejercito de de gnomos ninjas a ejercer el trabajo sucio (find / -iname “*soho*”) y despues de un rato lo tuve en mi pantalla. Me pase unos 5 minutos probándolo y confieso que me desilusione mucho al ver que no se ejecutaba bien y fue ahi cuando caí en cuenta que la galeria de soho fue rediseñada.

Ya no hay animaciones pesadas en Flash que se encarguen de comer RAM y las fotos se pueden bajar con un cómodo click derecho y guardar imagen como. De todas formas quize arreglar mi script para que funcionara correctamente, pero para mi sorpresa, ya no usan archivos XML, me imagino que tendrán todos esos datos guardados en alguna base de datos. Me siento orgulloso de anunciar que esos días de hacer click derecho se terminaron mis queridos lectores (que no son muchos, pero no bueno..).

Hasta el momento no he encontrado ningún programa/script que funcione con la nueva version de la galeria. Hoy he terminado de reescribir mi script en Bash (para mis cangris linuxeros), compatible con esta nueva galeria. Mi solución a la falta de archivos XML fue simplemente coger los datos necesarios en la fuente HTML de las paginas.

Este script es mucho mas elegante que hacer un “for i in $(seq 1  100000); do“, cosa que he visto en otras aplicaciones por ahi.

Como lo Uso?:
Primero que todo hay que Bajar el Archivo y descomprimirlo. Para ejecutarlo hay que escribir ./soho-downloader También se puede ejecutar con el comando sh soho-downloader. Logicamente estos comandos se escriben en la consola.

Forma de uso:

 ./soho-downloader [Opcion]

Ejemplos:

./soho-downloader bajar 313
./soho-downloader bajar-todo

El primer ejemplo baja la Galeria d Marbelle XD y el segundo baja todas las Galerias
Aqui estan las instrucciones completas sobre como se corre el script :D

Hay algunos tips, como por ejemplo, si tienes Xdialog instalado, puedes ejecutar el comando de la siguiente forma:

DIALOG=Xdialog ./soho-downloader menu

Si hay algun problema corriendo el Script, es recomendable correrlo de la siguiente manera (Solo para Version >= 0.6):

DEBUG=1 ./soho-downloader [Opcion]

Bueno, con este aporte me despido por hoy. No se olviden de leer las instrucciones completas :)

Offtopic: Definitivamente hay que hacer algo con este chuzo, pues mientras escribia esta entrada, sentia como las aranhas y el polvo se espantaban con mi presencia.

Actualizacion 30-septiembre-2008: Actualizé el script para corregir algunos errores y otras cositas. En caso de tener dificultades con el Script, es recomendable usar el comando DEBUG=1 ./soho-downloader y dejar el resultado en este Post para poder ayudar a resolver cualquier duda.

This entry was posted on Jueves, Agosto 21st, 2008 at 2:36 am and is filed under Proyectos. You can follow any responses to this entry through the
Comentarios al respecto (Subscribase a los Comentarios via RSS)
Selmineos dijo (El 25 de Septiembre, 2008 - 4:01 pm) :

gracias hermano.. muy buen aporte aun que me sale un error el cual aun no se aque se debe.. me podrias ayudar.
Las Fotos/Imagenes son Copyright de Soho | http://www.soho.com.co
Cargando….
–15:58:13– http://www.soho.com.co/wf_InfoSeccion.aspx?IdSec=185
=> `wf_InfoSeccion.aspx?IdSec=185′
Resolviendo http://www.soho.com.co... falló: Nombre ó servicio desconocido.
mv: no se puede efectuar `stat’ sobre «wf_Info*»: No existe el fichero ó directorio.

//lo ejecuto desde mi memoria usb bajo el comando
DIALOG=Xdialog ./soho-downloader menu
gracias y si porfa me puedes ayudar.. gracias.

How To: Descargar todas las galerias de fotos de Soho | gEEK tHE pLANET dijo (El 29 de Septiembre, 2008 - 6:59 pm) :

[...]Michael Pratt un inquieto programador ha creado un script de bash para ahorrarnos esta tarea.[...]

Pratt dijo (El 29 de Septiembre, 2008 - 8:10 pm) :

Selmineos: Gracias por el comentario!

Estas seguro que estas conectado a internet?

Porque creo que el problema es relacionado a que wget no puede resolver la pagina de soho.com

javi dijo (El 30 de Septiembre, 2008 - 4:02 pm) :

AMigo buen dia!

probando tu script en consola me sale lo siguiente:

Las Fotos/Imagenes son Copyright de Soho | http://www.soho.com.co
Cargando….
–16:01:22– http://www.soho.com.co/wf_InfoSeccion.aspx?IdSec=185
=> `wf_InfoSeccion.aspx?IdSec=185.41′
Resolviendo http://www.soho.com.co... mv: el destino, «tmp_main_url_list», no es un directorio
pipe@pipe-desktop:~$ 72.35.86.210
Conectando a http://www.soho.com.co|72.35.86.210|:80… conectado.
Petición HTTP enviada, esperando respuesta… 200 OK
Longitud: 57,863 (57K) [text/html]

100%[====================================>] 57,863 56.91K/s

16:01:24 (56.84 KB/s) - `wf_InfoSeccion.aspx?IdSec=185.41′ guardado [57863/57863]

entiendo que no en cuentra un parametro mv: el destino, «tmp_main_url_list», no es un directorio.

podria ayudarme? para cualquier comando hace lo mismo ( menu, list, bajar-todo) cualquiera, sabe que puede estar pasando???

gracias!!!

Pratt dijo (El 30 de Septiembre, 2008 - 5:14 pm) :

Ejecuta el comando:
./soho-downloader clean

y luego si el comando que deseas, por ejemplo:
./soho-downloader list
./soho-downloader menu (si tienes dialog instalado)

Pratt dijo (El 1 de Octubre, 2008 - 1:24 am) :

Ya Actualize el Script. Aplaste algunos bugs que aparecieron por ahi :D.

Ademas, los de Soho estuvieron actualizando algunas Galerias y renombraron algunas fotos. Ahi le hize un Workaround para bajar absolutamente todo (Incluso las que son para subscriptores) y de bonus agregue la opcion para bajar las galerias de las X ediciones mas recientes :D

./soho-downloader bajar-recientes 3

Muy recomendable bajar la nueva version - Gracias Totales :D

javi dijo (El 1 de Octubre, 2008 - 2:05 pm) :

AMIGO BUEN DIA!!!

INTENTE CON EL CLEAN, E IGUAL ME SALE EL MISMO MENSAJE.

CABE MENCIONAR QUE ESTOY CON EL UBUNTU Y EN LA TERMINAL ME TOCA ESCRIBIR:

pipe@pipe-desktop:~$ ‘/home/pipe/Escritorio/soho-downloader’ clean

porque con el comando : ./soho-downloader list

sale lo siguiente: bash: ./soho-downloader: No existe el fichero ó directorio

ah! y que me recomiendas para entrrar el el mundo de realizar scrips como el tuyo. se algo de programacion pero me falta practica!!

gracias por sus respuestas!!!

saludos!

Pratt dijo (El 1 de Octubre, 2008 - 2:34 pm) :

Que version tienes del Script? La 0.5? Ya hay una version 0.6 en donde ese problema ya debe estar solucionado.

De todas formas puedes hacer un:
pipe@pipe-desktop:~$ rm $HOME/.soho-script/*

Y luego correr el Script nuevamente.

Para aprender a hacer scripts en Bash, lo basico es aprenderse varios comandos basicos de Linux y luego leer algun tutorial.

Tambien puedes abrir el script con gedit o algun editor de texto, asi puedes estudiar el contenido.

Si manejas bien el idioma ingles, te puedo recomendar esta pagina para empezar ;)

Pratt dijo (El 1 de Octubre, 2008 - 2:59 pm) :

Listo, encontre el error.
Yo uso Slackware y ahi me estaba funcionando de perlas.

Me pase un rato a Ubuntu y vi que salian algunos errores.

Ya los corregi.

Bajar la Version 0.7

WILLIAM dijo (El 21 de Octubre, 2008 - 8:00 am) :

SI NO TENGO EL SISTEMA LINUX SINO XP DE MICROSOFT COMO HAGO PARA DESCARGAR LAS FOTOS DE SOHO?GRACIAS MEN

sigifredo cleves the best dijo (El 23 de Octubre, 2008 - 5:23 pm) :

seria bueno que se pudieran bajar fotos sin necesidad de escribir el codigo

Pratt dijo (El 23 de Octubre, 2008 - 5:42 pm) :

@ William: Este Script solo funciona para Linux. Se podria usar el programa cygwin y luego intentar correr el script desde ahi. No he probado esa opcion, por eso no estoy seguro si funciona. De todas formas he visto algunos programas para windows que pueden bajar todas las galerias, especificando los rangos.

@ Sigifredo: No entiendo.. En vez de escribir el codigo de la galeria, escribir el nombre de la modelo? Se podria hacer, vamos a ver cuando le saco un tiempito a ese asunto, no debe ser tan dificil de aplicar…

Davinchi dijo (El 11 de Noviembre, 2008 - 11:00 pm) :

Mis respetos.

Tocará estudiar el codigo a ver si aprendo alguito. que talento jaja

Dejar un Comentario

Website: