Semantic-Router-Chocolate-Factory

Imagem gerada pelo modelo Stable Image Ultra 1.0, via Amazon Bedrock

Introdução

Este projeto demonstra o poder de um roteador semântico utilizando AWS Step Functions e Amazon Bedrock para criar uma solução inovadora e inteligente. Inspirado no universo mágico de Willy Wonka ✨, o caso de uso consiste em um chatbot para atendimento de uma fábrica de chocolates, capaz de oferecer respostas precisas 🍬 e personalizadas aos clientes.

A ideia central é ilustrar como um roteador semântico pode direcionar mensagens 📬 e solicitações de forma eficiente para diferentes fluxos, garantindo que cada cliente receba a melhor experiência possível 🌟. Por meio do uso de ferramentas avançadas da AWS 🛠️, o projeto destaca:

Integração inteligente 🤝: conexão fluida entre fluxos de atendimento e modelos de linguagem.
Escalabilidade 📈: suporte a diversos cenários de interação com alta performance.
Personalização 🎯: respostas adaptadas ao contexto das solicitações.

Seja você um entusiasta de IA 💡, desenvolvedor 👨‍💻👩‍💻 ou arquiteto de soluções 🏗️, este repositório oferece uma base sólida para explorar o potencial de aplicações modernas em AI/ML e serverless.

O que é um Roteador Semântico? 🤔🔍

Um roteador semântico é uma solução baseada em inteligência artificial que compreende o significado (ou semântica) de uma mensagem ou solicitação e a direciona ao fluxo mais adequado. Em vez de depender de palavras-chave ou regras rígidas, ele analisa o contexto e a intenção por trás de cada interação, tornando o processamento mais inteligente e eficiente.

Por que um Roteador Semântico é importante? 🚀 Em sistemas baseados em IA generativa, como chatbots, um roteador semântico desempenha um papel fundamental para melhorar a experiência do usuário e otimizar recursos, oferecendo benefícios como:

Redução de alucinações 🎭: diminui a probabilidade de respostas incoerentes ou imprecisas, direcionando solicitações apenas para modelos ou fluxos capazes de lidar com o contexto corretamente.
Menor latência ⚡: ao encaminhar as solicitações diretamente para os serviços ou fluxos mais adequados, elimina atrasos desnecessários, resultando em interações mais rápidas.
Custo otimizado 💰: evita o uso excessivo de modelos avançados ou fluxos complexos para solicitações simples, otimizando o consumo de recursos e reduzindo despesas operacionais.
Precisão no atendimento 🎯: garante que as solicitações sejam tratadas de forma eficaz, conectando os usuários às respostas ou soluções mais relevantes.

No contexto deste projeto, o roteador semântico ajuda o chatbot da fábrica de chocolates 🍫 a interpretar corretamente solicitações diversas — como rastrear pedidos, sugerir produtos ou solucionar problemas —, proporcionando uma experiência encantadora, eficiente e economicamente viável.

Como essa solução funciona?

Basicamente, as perguntas feitas ao chatbot são enviadas uma Lambda, que centraliza os prompts/variaveis importantes e redireciona para uma Step Functions, que utiliza o roteador semantico para decidir qual fluxo seguir.

O fluxo sendo definido, os estados corretos são executados e a resposta é retornada ao usuário. Possivelmente, o usuário fará uma pergunta técnica sobre os produtos e, para essas, uma base de conhecimento é utilizada (RAG) para responder.

Ao fim de todas as interações, é chamado uma outra Step Function de forma assíncrona para gerar um resumo do que foi conversado até o momento e armazenar a mensagem atual, resposta da IA e resumo em um DynamoDB

Como fazer o deploy?

Para configurar a demo, são necessários alguns passos:

Configurar o venv do AWS CDK

cd iac
python3 -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt

Realizar o deploy

cdk deploy

Caso você nunca tenha configurado o CDK, será necessário executar o comando cdk bootstrap

Subir o streamlit (pasta /front-end)

cd front-end
pip install -r requirements.txt
streamlit run main_streamlit_sf.py -- --lambda-function-arn XXXX

O ARN da função lambda pode ser obtido nos outputs do CDK -> "chocolate-factory-chatbot.LambdaAPI"

F.A.Q

Como a solução automatizou o processo de criação da Base de conhecimento?

Basicamente, foi utilizado Custom Resources do CloudFormation, definidos no IaC para executar as tarefas específicas. Podemos quebrar esse processo em 4 passos:

O Bucket S3 e Aurora Postgres Serverless v2 (já com o scale to zero!!) são provisionados
Os arquivos na pasta /iac/upload_kb_files_lambda/file são enviados para o bucket S3
Uma Lambda configura o Aurora Postgres para ser compatível com o Bedrock Knowledge Base (mais detalhes aqui)
A Knowledge Base é criada e a API é chamada para dar start no sync

Name		Name	Last commit message	Last commit date
Latest commit History 39 Commits
.idea		.idea
back-end		back-end
front-end		front-end
iac		iac
imgs		imgs
.DS_Store		.DS_Store
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Semantic-Router-Chocolate-Factory

Introdução

O que é um Roteador Semântico? 🤔🔍

Como essa solução funciona?

Como fazer o deploy?

F.A.Q

Como a solução automatizou o processo de criação da Base de conhecimento?

About

Uh oh!

Releases

Packages

Uh oh!

Languages

License

Brvilardi/Semantic-Router-Chocolate-Factory

Folders and files

Latest commit

History

Repository files navigation

Semantic-Router-Chocolate-Factory

Introdução

O que é um Roteador Semântico? 🤔🔍

Como essa solução funciona?

Como fazer o deploy?

F.A.Q

Como a solução automatizou o processo de criação da Base de conhecimento?

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages