Skip to content

Latest commit

 

History

History
248 lines (208 loc) · 20.8 KB

README_RU.md

File metadata and controls

248 lines (208 loc) · 20.8 KB

main

  • В процессе разработки, но стабильно! CodeQL Pylint GitHub Clones
  • English | Русский | 漢語

Описание:

Простой и удобный интерфейс для использования различных моделей нейронных сетей. Вы можете общаться с LLM, используя текстовый, голосовой и визуальный ввод; использовать StableDiffusion, Kandinsky, Flux, HunyuanDiT, Lumina-T2X, Kolors, AuraFlow, Würstchen, DeepFloydIF, PixArt, CogView3-Plus и PlaygroundV2.5 для генерации изображений; ModelScope, ZeroScope 2, CogVideoX и Latte для генерации видео; StableFast3D, Shap-E, и Zero123Plus для генерации 3D-объектов; StableAudioOpen, AudioCraft и AudioLDM 2 для генерации музыки и аудио; CoquiTTS, MMS и SunoBark для преобразования текста в речь; OpenAI-Whisper и MMS для преобразования речи в текст; Wav2Lip для синхронизации губ; LivePortrait для анимации изображений; Roop для замены лиц; Rembg для удаления фона; CodeFormer для восстановления лиц; PixelOE для пикселизации изображений; DDColor для раскрашивания изображений; LibreTranslate и SeamlessM4Tv2 для перевода текста; Demucs и UVR для разделения аудиофайлов; RVC для преобразования голоса. Вы также можете просматривать файлы из выходной директории в галерее, загружать модели LLM и StableDiffusion, изменять настройки приложения внутри интерфейса и проверять системные датчики.

Цель проекта - создать максимально простое в использовании приложение для работы с моделями нейронных сетей.

Текст: 1ru

Изображение: 2ru

Видео: 3ru

3D: 4ru

Аудио: 5ru

Дополнительно: 6ru

Интерфейс: 7ru

Функции:

  • Легкая установка через install.bat (Windows) или install.sh (Linux & MacOS)
  • Возможность использования приложения через мобильное устройство в локальной сети (через IPv4) или в интернете (через Share)
  • Гибкий и оптимизированный интерфейс (на основе Gradio)
  • Ведение журнала отладки в логах из файлов Install и Update
  • Доступно на трех языках
  • Поддержка моделей Transformers, BNB, GPTQ, AWQ, ExLlamaV2 и llama.cpp (LLM)
  • Поддержка моделей diffusers и safetensors (StableDiffusion) - txt2img, img2img, depth2img, marigold, pix2pix, controlnet, upscale (latent), refiner, inpaint, outpaint, gligen, diffedit, blip-diffusion, animatediff, hotshot-xl, video, ldm3d, sd3, cascade, t2i-ip-adapter, ip-adapter-faceid и riffusion вкладки
  • Поддержка моделей stable-diffusion-cpp для FLUX и Stable Diffusion
  • Поддержка дополнительных моделей для генерации изображений: Kandinsky (txt2img, img2img, inpaint), Flux (txt2img с поддержкой cpp quantize и LoRA, img2img, inpaint, controlnet), HunyuanDiT (txt2img, controlnet), Lumina-T2X, Kolors (txt2img с поддержкой LoRA, img2img, ip-adapter-plus), AuraFlow (с поддержкой LoRA и AuraSR), Würstchen, DeepFloydIF (txt2img, img2img, inpaint), PixArt, CogView3-Plus и PlaygroundV2.5
  • Поддержка Extras с моделями Rembg, CodeFormer, PixelOE, DDColor, DownScale, Format changer, FaceSwap (Roop) и Upscale (Real-ESRGAN) для изображений, видео и аудио
  • Поддержка StableAudio
  • Поддержка AudioCraft (Модели: musicgen, audiogen и magnet)
  • Поддержка AudioLDM 2 (Модели: audio и music)
  • Поддержка моделей TTS и Whisper (Для LLM и TTS-STT)
  • Поддержка MMS для преобразования текста в речь и речи в текст
  • Поддержка моделей Lora, Textual inversion (embedding), Vae, MagicPrompt, Img2img, Depth, Marigold, Pix2Pix, Controlnet, Upscale (latent), Refiner, Inpaint, Outpaint, GLIGEN, DiffEdit, BLIP-Diffusion, AnimateDiff, HotShot-XL, Videos, LDM3D, SD3, Cascade, T2I-IP-ADAPTER, IP-Adapter-FaceID и Riffusion (Для StableDiffusion)
  • Поддержка модели Multiband Diffusion (Для AudioCraft)
  • Поддержка LibreTranslate (Локальный API) и SeamlessM4Tv2 для переводов языков
  • Поддержка ModelScope, ZeroScope 2, CogVideoX и Latte для генерации видео
  • Поддержка SunoBark
  • Поддержка Demucs и UVR для разделения аудиофайлов
  • Поддержка RVC для преобразования голоса
  • Поддержка StableFast3D, Shap-E и Zero123Plus для 3D генерации
  • Поддержка Wav2Lip
  • Поддержка LivePortrait для анимации изображений
  • Поддержка Multimodal (Moondream 2, LLaVA-NeXT-Video, Qwen2-Audio), PDF-Parsing (OpenParse), TTS (CoquiTTS), STT (Whisper), LORA и WebSearch (с DuckDuckGo) для LLM
  • Просмотр MetaData-Info для сгенерированных изображений, видео и аудио
  • Настройки моделей внутри интерфейса
  • Онлайн и оффлайн Wiki
  • Галерея
  • ModelDownloader
  • Настройки приложения
  • Возможность просмотра системных датчиков

Необходимые зависимости:

Минимальные системные требования:

  • Система: Windows, Linux или MacOS
  • GPU: 6GB+ или CPU: 8 ядер 3.6GHZ
  • ОЗУ: 16GB+
  • Место на диске: 20GB+
  • Интернет для загрузки моделей и установки

Как установить:

Windows & MacOS

  1. Сначала установите все Необходимые зависимости
  2. Git clone https://github.com/Dartvauder/NeuroSandboxWebUI.git в любое место
  3. Запустите Install.bat, выберите свою версию и дождитесь установки
  4. После установки запустите Start.bat и пройдите начальную настройку
  5. Дождитесь запуска приложения и перейдите по ссылке из терминала
  6. Теперь вы можете начинать генерацию. Наслаждайтесь!
  • Для получения обновлений запустите Update.bat
  • Для работы с виртуальной средой через терминал запустите Venv.bat

Linux

  1. Сначала установите все Необходимые зависимости
  2. Git clone https://github.com/Dartvauder/NeuroSandboxWebUI.git в любое место
  3. Запустите ./Install.sh, выберите свою версию и дождитесь установки
  4. После установки запустите ./Start.sh и пройдите начальную настройку
  5. Дождитесь запуска приложения и перейдите по ссылке из терминала
  6. Теперь вы можете начинать генерацию. Наслаждайтесь!
  • Для получения обновлений запустите ./Update.sh
  • Для работы с виртуальной средой через терминал запустите ./Venv.sh

Вики

Благодарность разработчикам

Большое спасибо этим проектам, потому что благодаря их приложениям/библиотекам я смог создать свое приложение:

Прежде всего, я хочу поблагодарить разработчиков PyCharm и GitHub. С помощью их приложений я смог создать и поделиться своим кодом

Лицензии третьих сторон:

Многие модели имеют свои собственные лицензии на использование. Перед использованием я советую вам ознакомиться с ними:

Эти сторонние репозитории кода также используются в моем проекте:

Пожертвование

Если вам понравился мой проект и вы хотите сделать пожертвование, вот варианты для этого. Заранее большое спасибо!

  • "Buy Me A Coffee"

История звезд

Star History Chart