Skip to content

VectorSynth - Поиск семантически близких слов

License

Notifications You must be signed in to change notification settings

terratensor/vectorsynth

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

27 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

VectorSynth

License: MIT GitHub release

Инструмент для поиска семантически близких слов с использованием векторных представлений GloVe.

Особенности

  • Поиск семантически близких слов по векторному сходству
  • Поддержка векторной арифметики (например: "царь - мужчина + женщина")
  • Веб-интерфейс и REST API
  • Поддержка Docker и Docker Swarm
  • Интеграция с Traefik для автоматического HTTPS

Быстрый старт

Требования

  • Docker и Docker Compose
  • Файл с векторами (по умолчанию /data/vectors/vectors.txt)

Запуск через Docker

docker run -d \
-p 8080:8080 \
-v /path/to/vectors:/data/vectors \
ghcr.io/terratensor/vectorsynth:latest

Docker Swarm

docker stack deploy -c docker-compose.yml vectorsynth

Использование

Веб-интерфейс

Откройте в браузере: http://localhost:8080 (для локального запуска) или https://vectorsynth.gmtx.ru (для production)

API

curl -X POST https://vectorsynth.gmtx.ru/api/similar \
-H "Content-Type: application/json" \
-d '{"expression":"компьютер", "topN":5}'

Источник векторов

Векторные представления слов получены с использованием glove-pipeline на основе текстов с сайта svodd.ru.

Лицензия

Этот проект распространяется под лицензией MIT. См. файл LICENSE.

Разработка

Сборка

go build -o bin/vectorsynth ./cmd/server

Запуск

./bin/vectorsynth -vectors data/vectors.txt

Тестирование

go test ./...

Вклад в проект

PR и issues приветствуются!

About

VectorSynth - Поиск семантически близких слов

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages