AI-Voice-Assistant-AIVA-

Voice enabled AI Assistant with voice activity detection AI Voice Assistant Pipeline This project implements an end-to-end AI Voice Assistant Pipeline that converts voice queries into text, processes them using a Large Language Model (LLM), and converts the response back into speech. Features

Voice-to-Text conversion using VAD (Voice Activity Detection) and Whisper Text processing using Google's Gemini AI Text-to-Speech conversion with adjustable parameters Low latency design Output restriction to 2 sentences Tunable parameters for voice output (pitch, gender, speed)

Technologies Used

Python Transformer (Pipeline) Torch Numpy speech_recognition VAD (Voice Activity Detection) Whisper google.generativeai (for Gemini) edge-tts

Pipeline Steps

Voice-to-Text Conversion Text Input into LLM Text-to-Speech Conversion

Contributing Contributions are welcome! Please feel free to submit a Pull Request.

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
AIVA.ipynb		AIVA.ipynb
AIVA_Assignment.docx		AIVA_Assignment.docx
Demo.mp4		Demo.mp4
LICENSE		LICENSE
README.md		README.md
main.py		main.py
output.wav		output.wav
recording.wav		recording.wav
speech_reco.py		speech_reco.py
text_generation.py		text_generation.py
text_to_speech.py		text_to_speech.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

AI-Voice-Assistant-AIVA-

About

Releases

Packages

Languages

License

RaghavArora14/AI-Voice-Assistant-AIVA-

Folders and files

Latest commit

History

Repository files navigation

AI-Voice-Assistant-AIVA-

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages