Skip to content

Latest commit

 

History

History
123 lines (83 loc) · 10.5 KB

README_rus.md

File metadata and controls

123 lines (83 loc) · 10.5 KB
KrillinAI

AI инструмент для перевода и озвучки аудио и видео

krillinai%2FKrillinAI | Trendshift

English简体中文日本語한국어Tiếng ViệtFrançaisDeutschEspañolPortuguêsРусскийاللغة العربية

Twitter Bilibili

Обзор

Krillin AI — это универсальное решение для простой локализации и улучшения видео. Этот минималистичный, но мощный инструмент выполняет всё: от перевода и дубляжа до клонирования голоса и адаптации формата — легко преобразует видео между горизонтальным и вертикальным режимами для идеального отображения на любых платформах (YouTube, TikTok, Bilibili, Douyin, WeChat Channel, RedNote, Kuaishou). Благодаря сквозному рабочему процессу Krillin AI превращает исходные материалы в готовый к публикации контент всего за несколько кликов.

Ключевые возможности:

🎯 Запуск в один клик - мгновенное начало работы

📥 Загрузка видео - поддержка yt-dlp и локальных файлов

📜 Точные субтитры - распознавание с высокой точностью на основе Whisper

🧠 Умное разделение - логическая разбивка и выравнивание субтитров с помощью LLM

🌍 Профессиональный перевод - согласованный перевод на уровне абзацев

🔄 Замена терминов - смена специализированной лексики в один клик

🎙️ Озвучка и клонирование голоса - выбор голосов CosyVoice или создание копий

🎬 Видеомонтаж - автоматическое форматирование для горизонтальных и вертикальных форматов

Пример работы

На изображении ниже показан результат автоматической вставки субтитров в видео после однокликового запуска обработки 46-минутного локального видео. Никаких ручных корректировок не производилось. Alignment

Перевод субтитров


subtitle_translation.mp4

Озвучка


tts.mp4

портретный режим


agi.mp4

🌍 Поддерживаемые языки

Входные языки: китайский, английский, японский, немецкий, турецкий (добавляются новые языки) Языки перевода: 56 языков, включая английский, китайский, русский, испанский, французский и др.

Предпросмотр интерфейса

Предпросмотр интерфейса

🚀 Быстрый старт

Основные шаги

  1. Скачайте исполняемый файл, соответствующий вашей операционной системе, из раздела релизов и поместите его в пустую папку.
  2. Создайте папку config внутри этой папки, затем создайте файл config.toml в папке config. Скопируйте содержимое файла config-example.toml из директории config исходного кода в config.toml и заполните вашу конфигурационную информацию соответствующим образом.
  3. Дважды щелкните на исполняемом файле, чтобы запустить сервис.
  4. Откройте браузер и введите http://127.0.0.1:8888, чтобы начать использование (замените 8888 на порт, который вы указали в файле config.toml).

Для пользователей macOS

Это программное обеспечение не подписано, поэтому после завершения настройки файлов в "Основных шагах" вам потребуется вручную подтвердить доверие к приложению в macOS. Выполните следующие действия:

  1. Откройте терминал и перейдите в директорию, где находится исполняемый файл (предположим, имя файла KrillinAI_1.0.0_macOS_arm64).
  2. Выполните следующие команды по порядку:
sudo xattr -rd com.apple.quarantine ./KrillinAI_1.0.0_macOS_arm64
sudo chmod +x ./KrillinAI_1.0.0_macOS_arm64
./KrillinAI_1.0.0_macOS_arm64

Это запустит сервис.

Инструкции по настройке Cookie

Этот проект поддерживает развертывание через Docker. Пожалуйста, обратитесь к Docker Deployment Instructions.

Cookie Configuration Instructions

Если вы столкнулись с ошибками при загрузке видео, пожалуйста, обратитесь к Cookie Configuration Instructions для настройки информации о ваших cookie.

Помощь по настройке

Самый быстрый и удобный способ настройки:

  • Выберите openai для transcription_provider и llm_provider. Таким образом, вам нужно будет заполнить только openai.apikey в следующих трех основных категориях конфигурации, а именно openai, local_model и aliyun, и затем вы сможете выполнять перевод субтитров. (Заполните app.proxy, model и openai.base_url в соответствии с вашей ситуацией.)

Способ настройки для использования локальной модели распознавания речи (временно не поддерживается на macOS) (выбор, учитывающий стоимость, скорость и качество):

  • Заполните fasterwhisper для transcription_provider и openai для llm_provider. Таким образом, вам нужно будет заполнить только openai.apikey и local_model.faster_whisper в следующих двух основных категориях конфигурации, а именно openai и local_model, и затем вы сможете выполнять перевод субтитров. Локальная модель будет загружена автоматически. (То же самое относится к app.proxy и openai.base_url, как упоминалось выше.)

Следующие ситуации использования требуют настройки Alibaba Cloud:

  • Если llm_provider заполнен как aliyun, это означает, что будет использоваться сервис больших моделей Alibaba Cloud. Следовательно, необходимо настроить параметр aliyun.bailian.
  • Если transcription_provider заполнен как aliyun, или если функция "озвучки" включена при запуске задачи, будет использоваться голосовой сервис Alibaba Cloud. Поэтому необходимо заполнить параметр aliyun.speech.
  • Если функция "озвучки" включена и одновременно загружаются локальные аудиофайлы для клонирования тембра голоса, также будет использоваться сервис облачного хранилища OSS от Alibaba Cloud. Следовательно, необходимо заполнить параметр aliyun.oss. Руководство по настройке: Alibaba Cloud Configuration Instructions

Часто задаваемые вопросы

Пожалуйста, обратитесь к Frequently Asked Questions

Рекомендации по внесению вклада

  • Не отправляйте ненужные файлы, такие как .vscode, .idea и т.д. Пожалуйста, используйте .gitignore для их фильтрации.
  • Не отправляйте config.toml; вместо этого отправляйте config-example.toml.

История звезд

Star History Chart