viernes, 18 de diciembre de 2009

Subir archivos con Java mediante HTTP y tratamiento con PHP

Más de una vez me ha surgido la necesidad de subir varios archivos al servidor asíncronamente y de tal forma que muestre al detalle el total de archivos subidos, progreso, tamaño total ,etc.
Pues bien, en uno de mis experimentos, me decidí a desarrollar mi propio uploader en Java, que es lo que voy a tratar de explicar aquí. Para ello analizaremos los paquetes que son enviados al servidor mediante el protocolo HTTP, oséase al servidor web y así poder implementar dicho protocolo en Java.

La subida de archivos por el protocolo HTTP mediante PHP y un servidor web tal como APACHE, para un programador experimentado es bien conocida, no obstante, vamos a repasar algunos conceptos de cómo se hace con este método tan rudimentario y tan usado por muchos.

upload.html

Tenemos preparado el documento html para la entrada de datos, una vez que se pulsa el botón "Subir!", la petición se redirige al script especificado en el atributo "action", en este caso vamos a parar a "tratar-upload.php".

tratar-upload.php
Bien, ya tenemos todo listo, ahora nos toca analizar cómo hace intrínsicamente la operación de subir archivos. Para ello nos valemos de un analizador de protocolos de red tal como wireshark. Ponemos a la escucha en el interfaz de red pertinente, seleccionamos archivos en el documento html y pulsamos el botón "Subir!".

Análisis de subida de archivos por el protocolo HTTP usando el método POST.

Petición HTTP
Quiero hacer una objeción respecto a -RETORNO DE CARRO + SALTO DE LINEA-. Indica que existen 2 bytes no visibles adicionales para el salto a la siguiente línea. Véase más sobre secuencias de escape, pero para el ejemplo sólo usaremos dos:

Retorno de carro:\r
Salto de línea: \n

Donde se indica "2 x", es que existen dos saltos.
Pasemos a analizar paso a paso cada campo de la cebecera de la petición.

Realizamos petición para "mandar, fijar, poner" en el script "tratar-upload.php" los datos de la petición.
POST tratar-upload.php HTTP/1.1
Dirección completa del servidor desde donde realizamos la petición.
Host: localhost
Agente-navegador usado desde donde realizamos la petición.
User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; es-ES; rv:1.9.0.16)
Tipos de datos que acepta el agente-navegador para procesar la respuesta una vez concluida la petición.
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Lenguajes aceptados para la respuesta por parte del navegador.
Accept-Language: es-es,es;q=0.8,en-us;q=0.5,en;q=0.3
Tipos de codificación aceptados para la respuesta por parte del navegador.
Accept-Encoding: gzip,deflate
Conjunto de carácteres aceptados para la respuesta por parte del navegador.
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7
Representa el número máximo de segundos entre envío y respuesta de paquetes sobre una conexión persistente.
Keep-Alive: 300
Indica que el navegador soporta conexiones persistentes sobre una misma conexión TCP.
Connection: keep-alive
Indica desde donde procede la petición.
Referer: http://localhost/upload.html
Muy Importante.
Establece que la petición puede estar formada por diferentes partes de datos y se indica el separador (límite) entre las partes involucradas. Oséase, que cada archivo debe estar separado convenientemente por el límite establecido boundary. La serie numérica que le sigue está formada aleatoriamente y no sigue ningún tipo de lógica.
Content-Type: multipart/form-data; boundary=---------------------------265001916915724
Tamaño en bytes del conjunto de datos que vamos a enviar excluyendo la cabecera.
Content-Length: total_bytes_de_los_ficheros_incluyendo_los_delimitadores<2 x RETORNO DE CARRO + SALTO DE LINEA>

A continuación voy a explicar las partes de cada archivo que enviamos al servidor.

Indica el comienzo de una parte, osea, los datos de un archivo
-----------------------------265001916915724
Aquí se establece el nombre del campo del fichero especificado en el form y el nombre del archivo que vamos a enviar.
Content-Disposition: form-data; name="f1"; filename="archivo1.ext"
Tipos de datos que contiene el archivo. Normalmente binarios.
Content-Type: application/binary<2 x RETORNO DE CARRO + SALTO DE LINEA>
Los datos en bruto del fichero son colocados aquí, acabamos con un salto de línea.


Para terminar la retransmisión de datos hacia el servidor, debemos indicarlo con el siguiente campo.
-----------------------------265001916915724--
(nótese que acaba con dos guiones -- más retorno de carro y el salto de línea correspondiente.)

Ya creo que estamos listos para ver el código fuente del programa que desarrollé en Java para la subida de ilimitado número de archivos. El código se corresponde con la clase más significativa del programa, el uploader. He suprimido algunas partes del código para exponer más claramente lo que estamos tratando aquí.

Uploader.java

Si estás interesado en todo el desarrollo del applet, puedes ponerte en contacto conmigo.
Para poder usarlo correctamente, el applet está firmado para poder explorar el disco duro del cliente con los archivos que desea subir al servidor.

3 comentarios:

  1. Buenas, me parece muy interesante tu articulo para subir ficheros estoy interesado en poder recepcionar el fichero desde java en vez desde php y me gustaria saber si tienes algo de esto o puede tirarme una soga, jejeje.

    ResponderEliminar
  2. Hola Pablo, gracias por tu interés!

    Supongo que sabrás la diferencia entre Java (applet) y PHP (servidor). Bien, el applet se ejecuta en el entorno del usuario, mientras que php es ejecutado en el lado del servidor, es por eso, que la recepción del fichero la estamos haciendo con php, puesto que con Java, que se está ejecutando al lado del cliente (navegador), se limita a transmitir los datos al servidor. Si php no te vale, y quieres hacerlo con Java, necesitas que éste se ejecute en el lado del servidor. Para ello existen los SERVLETS, que vienen a ser clases desarrolladas en Java que funcionan en el lado del servidor y desde ahí puedes hacer cualquier cosa con el archivo que es enviado por el propio applet en Java.
    Por lo tanto, de esa forma tenemos applet(cliente) y servlets(servidor), ambos trabajando conjuntamente y en Java.

    Espero resuelva algo tus dudas, saludos!

    ResponderEliminar
  3. Hola, muy bueno tu tutorial, yo entiendo mas o menos el tema, el problema es que intento subir un archivo con Visual Basic 6, pero no puedo, me tira error la web. Me gustaria saber si pudieras explicar de una forma mas simple el procedimiento, o sea, yo pido la web al server, ellos me mandan esto, yo les mando esto y asi. Muchas gracias.

    ResponderEliminar