Questo progetto utilizza Elasticsearch come motore di ricerca per archiviare frasi parallele e i loro vettori di embedding generati con il modello Sentence-Transformer (all-MiniLM-L12-v2). L'applicazione permette di inserire coppie di frasi tradotte e di effettuare ricerche tramite query per ottenere un prompt di traduzione basato su esempi paralleli simili.
- Docker: Assicurati di avere Docker installato e in esecuzione sul tuo sistema.
- Python 3.8+: Questo progetto è stato sviluppato utilizzando Python 3.8 o versioni successive.
-
Clonare il repository:
git clone <url-del-repository> cd <nome-del-repository>
-
Creare un ambiente virtuale (opzionale ma consigliato):
python -m venv venv source venv/bin/activate # su Linux/macOS venv\Scripts\activate # su Windows
-
Installare le dipendenze:
pip install -r requirements.txt
-
Avviare Docker con Elasticsearch:
Assicurati che Docker sia installato e in esecuzione. Usa il seguente comando per avviare il container Elasticsearch come single node:
docker run --name elasticsearch -d -p 9200:9200 -e "discovery.type=single-node" docker.elastic.co/elasticsearch/elasticsearch:7.10.0
Per eliminare tutti gli indici nel tuo cluster Elasticsearch (attenzione, questo cancellerà permanentemente tutti i dati):
curl -X DELETE "http://localhost:9200/*"
-
Fermare il container:
Se il container di Elasticsearch è in esecuzione, fermalo con il comando:
docker stop elasticsearch
-
Rimuovere il container:
Dopo aver fermato il container, puoi rimuoverlo con il comando:
docker rm elasticsearch
Se desideri rimuovere anche l'immagine di Elasticsearch per liberare spazio, esegui:
docker rmi docker.elastic.co/elasticsearch/elasticsearch:7.10.0