Microservicio LLM para Análisis de Sentimientos

Microservicio de inferencia para clasificación de sentimientos usando el modelo DistilBERT, desarrollado con FastAPI y preparado para despliegue en AWS EKS (Elastic Kubernetes Service).

Contenido

Descripción
Inicio Rápido
Construcción y ejecución con Docker
Documentacion API
Configuración Kubernetes (k8s) y AWS

Descripción

El microservicio utiliza el modelo distilbert-base-uncased-finetuned-sst-2-english disponible en Hugging Face el cual analiza el sentimiento de textos y los clasifica. Cabe mencionar que el lenguaje del modelo es en inglés por lo que el texto provisto debe ser en ese idioma. El modelo clasificará el texto como POSITIVE o NEGATIVE con un nivel de confianza correspondiente.

Componentes Principales

FastAPI: API REST para recibir requests de clasificación
DistilBERT: Modelo de Hugging Face para clasificación de sentimientos
Docker: Containerización de la aplicación
Kubernetes: Orquestación y despliegue
AWS Load Balancer: Distribución de tráfico y alta disponibilidad

Estructura del Proyecto

.
├── src/
│   ├── __init__.py
│   ├── main.py              # aplicación FastAPI 
│   └── model_service.py     # servicio DistilBERT
├── k8s/
│   ├── deployment.yaml      # Configuración de despliegue
│   ├── service.yaml         # Servicio para exposición
│   ├── loadbalancer.yaml    # AWS Load Balancer
│   ├── hpa.yaml             # Escalado automático horizontal
│   └── configmap.yaml       # Variables de configuración
├── tests/
│   ├── test_main.py         # test servicio FastAPI
│   └── test_model_service.py # test servicio modelo
├── Dockerfile
├── pyproject.toml           # gestión dependencias Poetry
├── Makefile                 # comandos de desarrollo y despliegue
└── README.md

Inicio Rápido

Configuración Inicial (Una sola línea)

# Iniciar servidor de desarrollo
make quick-start

# El servidor estará disponible en:
# - API: http://localhost:8000

Este comando:

Verifica e instala Poetry si es necesario
Instala todas las dependencias del proyecto
Inicia el servicio de clasificación de forma local

Nota: Es necesario tener instalado Poetry en el sistema para la gestión de dependencias y ejecución de comandos. Se puede instalar siguiendo la documentación oficial.

Comandos Make Esenciales

make setup          # Configurar entorno de desarrollo
make dev            # Iniciar servidor de desarrollo  
make test           # Ejecutar tests
make clean          # Limpiar archivos temporales

make docker-build   # Construir imagen Docker
make docker-run     # Ejecutar contenedor
make docker-stop    # Detener el contenedor

Construcción y ejecución con Docker

# Construir la imagen
docker build -t microserv-llm:latest .

# Ejecutar el contenedor
docker run -p 8000:8000 microserv-llm-container:latest

# Detener el contenedor
docker stop microserv-llm-container

Documentación API

GET `/`

Endpoint raíz del servicio

curl http://localhost:8000/

GET `/health`

Health check del servicio

curl http://localhost:8000/health

POST `/predict_sentiment`

Predicción de sentimientos

curl -X POST "http://localhost:8000/predict_sentiment" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "I love this product!"
  }'

Configuración Kubernetes (k8s) y AWS

Recursos del Pod

En los manifiestos de Kubernetes, se recomienda definir los recursos del pod para el microservicio de la siguiente manera:

resources:
  requests:
    cpu: "500m"
    memory: "1Gi"
  limits:
    cpu: "1000m"
    memory: "2Gi"

Esto asegura que cada pod tenga recursos mínimos garantizados y límites máximos para evitar sobrecarga.

Exposición del Servicio

Para exponer el microservicio externamente, se utiliza un Service de tipo LoadBalancer:

apiVersion: v1
kind: Service
metadata:
  name: microserv-llm-service
spec:
  type: LoadBalancer
  selector:
    app: microserv-llm
  ports:
    - protocol: TCP
      port: 80
      targetPort: 8000

Esto crea automáticamente un Load Balancer en AWS que enruta el tráfico al servicio.

Recursos AWS necesarios

Amazon EKS: Cluster Kubernetes gestionado.
AWS Load Balancer Controller: Para gestionar la creación de Load Balancers (ALB/NLB) desde los servicios tipo LoadBalancer.
IAM Roles for Service Accounts (IRSA): Si el microservicio necesita acceder a otros servicios AWS (como S3), se recomienda configurar roles IAM específicos para los pods.

Nota: La integración de estos recursos se realiza durante la creación del cluster EKS y la instalación de controladores, siguiendo la documentación oficial de AWS.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Microservicio LLM para Análisis de Sentimientos

Contenido

Descripción

Componentes Principales

Estructura del Proyecto

Inicio Rápido

Configuración Inicial (Una sola línea)

Comandos Make Esenciales

Construcción y ejecución con Docker

Documentación API

GET `/`

GET `/health`

POST `/predict_sentiment`

Configuración Kubernetes (k8s) y AWS

Recursos del Pod

Exposición del Servicio

Recursos AWS necesarios

About

Uh oh!

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 20 Commits
k8s		k8s
src		src
tests		tests
.env.example		.env.example
.gitignore		.gitignore
Dockerfile		Dockerfile
LICENSE		LICENSE
Makefile		Makefile
README.md		README.md
poetry.lock		poetry.lock
pyproject.toml		pyproject.toml

License

metalkutz/microserv-llm

Folders and files

Latest commit

History

Repository files navigation

Microservicio LLM para Análisis de Sentimientos

Contenido

Descripción

Componentes Principales

Estructura del Proyecto

Inicio Rápido

Configuración Inicial (Una sola línea)

Comandos Make Esenciales

Construcción y ejecución con Docker

Documentación API

GET /

GET /health

POST /predict_sentiment

Configuración Kubernetes (k8s) y AWS

Recursos del Pod

Exposición del Servicio

Recursos AWS necesarios

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

GET `/`

GET `/health`

POST `/predict_sentiment`

Packages