Gestión de ficheros en AWS con Spring Boot

En muchas ocasiones, para llevar a cabo la lógica de negocio de una aplicación, se hace necesario trabajar con imágenes, documentos, ficheros de texto plano, etc., por lo que es vital un mecanismo resiliente y de alta disponibilidad para almacenar y recuperar esos archivos.

Amazon Simple Storage Service (Amazon S3) es un servicio ofrecido por AWS que nos brinda un almacenamiento de objetos escalable, seguro y de buen rendimiento.

Esta simple prueba de concepto nos va a permitir explorar las operaciones básicas de S3, como subir, eliminar y descargar ficheros del servicio de almacenamiento de Amazon AWS, todo ello integrado en una aplicación Spring Boot.

Arquitectura de la solución
Prerrequisitos
Conceptos básicos de S3
Creación del bucket en S3
Crear usuario de acceso al bucket
Creación del proyecto Spring Boot
Creación de un bean de cliente de AmazonS3
Creación del servicio de negocio.
Tests
Recursos

Arquitectura de la solución

La arquitectura de la solución es simple. Crearemos una aplicación Spring Boot, que contendrá un controlador REST para recibir las peticiones HTTP del cliente.

spring boot app and Amazon S3 - architecture

El negocio se desarrolla en un único servicio al que le hemos inyectado un cliente del servicio S3 que, haciendo uso del SDK de AWS para Java, permitirá conectar con él para realizar las siguientes operaciones:

Subir un fichero a un bucket previamente creado
Descargar un fichero existente en el bucket
Eliminar un fichero existente en el bucket
Listar todos los documentos existentes en el bucket

Prerrequisitos

SDK Java 17
Maven
Cuenta en Amazon Web Services (AWS). Los primeros 12 meses son gratuitos, y el servicio S3 proporciona hasta 5 TB de almacenamiento gratuito.
Tu IDE favorito. En este caso, Spring Tool Suite (STS)

Conceptos básicos de S3

Antes de comenzar, es interesante resaltar un par de conceptos básicos del servicio S3 de AWS, a modo de resumen, con el objetivo de facilitar la lectura de este artículo a los más nóveles.

Buckets

Los buckets son contenedores de objetos que queremos almacenar. Algo importante a tener en cuenta aquí es que S3 requiere que el nombre del bucket sea globalmente único.

Objetos

Los objetos son los documentos que estamos almacenando en los buckets de S3. Se identifican mediante una clave, que es una secuencia de caracteres Unicode cuya codificación UTF-8 tiene una longitud máxima de 1.024 bytes.

Delimitador de clave

Por defecto, el carácter “/” recibe un tratamiento especial si se utiliza en una clave de objeto. Un almacén de objetos no utiliza directorios ni carpetas, sino sólo claves. Sin embargo, si usamos un “/” en nuestra clave de objeto, la consola de AWS S3 renderizará el objeto como si estuviera en una carpeta.

Así, si nuestro objeto tiene la clave “foo/bar/test.json” la consola mostrará una “carpeta” foo que contiene una carpeta “bar” que contiene el objeto real “test.json”. Este delimitador de clave nos ayuda a agrupar nuestros datos en jerarquías lógicas.

Creación del bucket en S3

Crear un bucket en Amazon S3 a través de la consola de AWS es muy sencillo. Para ello, lo mejor es seguir la propia documentación del servicio, ya que es muy clara y siempre está actualizada: https://aws.amazon.com/es/getting-started/hands-on/backup-files-to-amazon-s3/

En este caso, vamos a crear un bucket con el nombre spring-boot-aws-s3-poc, seleccionando la región donde queremos que se despliegue y dejando por defecto el resto de configuración:

spring boot app and Amazon S3 - Crear bucket

Una cosa a tener en cuenta es que el nombre del bucket debe ser único en todo AWS, no sólo en la cuenta usada.

Crear usuario de acceso al bucket

El primer paso es crear las credenciales de seguridad que se utilizarán para acceder a los servicios de AWS. Para ello, buscamos el servicio IAM, y accedemos a él para administrar el acceso a los recursos de AWS:

spring boot app and Amazon S3 - Acceder a IAM