Krillin AI — это универсальное решение для простой локализации и улучшения видео. Этот минималистичный, но мощный инструмент выполняет всё: от перевода и дубляжа до клонирования голоса и адаптации формата — легко преобразует видео между горизонтальным и вертикальным режимами для идеального отображения на любых платформах (YouTube, TikTok, Bilibili, Douyin, WeChat Channel, RedNote, Kuaishou). Благодаря сквозному рабочему процессу Krillin AI превращает исходные материалы в готовый к публикации контент всего за несколько кликов.
🎯 Запуск в один клик - мгновенное начало работы
📥 Загрузка видео - поддержка yt-dlp и локальных файлов
📜 Точные субтитры - распознавание с высокой точностью на основе Whisper
🧠 Умное разделение - логическая разбивка и выравнивание субтитров с помощью LLM
🌍 Профессиональный перевод - согласованный перевод на уровне абзацев
🔄 Замена терминов - смена специализированной лексики в один клик
🎙️ Озвучка и клонирование голоса - выбор голосов CosyVoice или создание копий
🎬 Видеомонтаж - автоматическое форматирование для горизонтальных и вертикальных форматов
На изображении ниже показан результат автоматической вставки субтитров в видео после однокликового запуска обработки 46-минутного локального видео. Никаких ручных корректировок не производилось.
subtitle_translation.mp4 |
tts.mp4 |
agi.mp4 |
Входные языки: китайский, английский, японский, немецкий, турецкий (добавляются новые языки) Языки перевода: 56 языков, включая английский, китайский, русский, испанский, французский и др.
- Скачайте исполняемый файл, соответствующий вашей операционной системе, из раздела релизов и поместите его в пустую папку.
- Создайте папку config внутри этой папки, затем создайте файл config.toml в папке config. Скопируйте содержимое файла config-example.toml из директории config исходного кода в config.toml и заполните вашу конфигурационную информацию соответствующим образом.
- Дважды щелкните на исполняемом файле, чтобы запустить сервис.
- Откройте браузер и введите http://127.0.0.1:8888, чтобы начать использование (замените 8888 на порт, который вы указали в файле config.toml).
Это программное обеспечение не подписано, поэтому после завершения настройки файлов в "Основных шагах" вам потребуется вручную подтвердить доверие к приложению в macOS. Выполните следующие действия:
- Откройте терминал и перейдите в директорию, где находится исполняемый файл (предположим, имя файла
KrillinAI_1.0.0_macOS_arm64
). - Выполните следующие команды по порядку:
sudo xattr -rd com.apple.quarantine ./KrillinAI_1.0.0_macOS_arm64
sudo chmod +x ./KrillinAI_1.0.0_macOS_arm64
./KrillinAI_1.0.0_macOS_arm64
Это запустит сервис.
Этот проект поддерживает развертывание через Docker. Пожалуйста, обратитесь к Docker Deployment Instructions.
Если вы столкнулись с ошибками при загрузке видео, пожалуйста, обратитесь к Cookie Configuration Instructions для настройки информации о ваших cookie.
Самый быстрый и удобный способ настройки:
- Выберите openai для transcription_provider и llm_provider. Таким образом, вам нужно будет заполнить только openai.apikey в следующих трех основных категориях конфигурации, а именно openai, local_model и aliyun, и затем вы сможете выполнять перевод субтитров. (Заполните app.proxy, model и openai.base_url в соответствии с вашей ситуацией.)
Способ настройки для использования локальной модели распознавания речи (временно не поддерживается на macOS) (выбор, учитывающий стоимость, скорость и качество):
- Заполните fasterwhisper для transcription_provider и openai для llm_provider. Таким образом, вам нужно будет заполнить только openai.apikey и local_model.faster_whisper в следующих двух основных категориях конфигурации, а именно openai и local_model, и затем вы сможете выполнять перевод субтитров. Локальная модель будет загружена автоматически. (То же самое относится к app.proxy и openai.base_url, как упоминалось выше.)
Следующие ситуации использования требуют настройки Alibaba Cloud:
- Если llm_provider заполнен как aliyun, это означает, что будет использоваться сервис больших моделей Alibaba Cloud. Следовательно, необходимо настроить параметр aliyun.bailian.
- Если transcription_provider заполнен как aliyun, или если функция "озвучки" включена при запуске задачи, будет использоваться голосовой сервис Alibaba Cloud. Поэтому необходимо заполнить параметр aliyun.speech.
- Если функция "озвучки" включена и одновременно загружаются локальные аудиофайлы для клонирования тембра голоса, также будет использоваться сервис облачного хранилища OSS от Alibaba Cloud. Следовательно, необходимо заполнить параметр aliyun.oss. Руководство по настройке: Alibaba Cloud Configuration Instructions
Пожалуйста, обратитесь к Frequently Asked Questions
- Не отправляйте ненужные файлы, такие как .vscode, .idea и т.д. Пожалуйста, используйте .gitignore для их фильтрации.
- Не отправляйте config.toml; вместо этого отправляйте config-example.toml.