t1_knowledge_window

Инструкции по запуску

1. Сервинг эмбеддингов на FastAPI

Запуск осуществляется из папки /embeddings_model.

Построение и запуск контейнера:

docker build -t USER-bge-m3-server .
docker run --name --detach USER-bge-m3-server -p 8000:8000 --runtime nvidia --gpus device=1 USER-bge-m3-server

Важно! OpenAI API ключ нигде не изменять, так как для VLLM он не требуется (модели запускаются локально).

2. Запуск Neo4j

Команда для запуска:

docker run -d --publish=7474:7474 --publish=7687:7687 \
    --name appliner-knowledge-base \
    -v $HOME/kg/data:/data \
    -v $HOME/kg/logs:/logs \
    -v $HOME/kg/import:/var/lib/neo4j/import \
    -v $HOME/kg/plugins:/plugins \
    --env NEO4J_AUTH=neo4j/password \
    --env NEO4J_PLUGINS='["apoc"]' \
    --env NEO4J_apoc_export_file_enabled=true \
    --env NEO4J_apoc_import_file_enabled=true \
    --env NEO4J_dbms_security_procedures_unrestricted='*' \
    nexus.appl.local:5090/graphstack/dozerdb:5.22.0.0-alpha.1

После этого необходимо перейти в интерфейс Neo4j по адресу http://0.0.0.0:7474/browser/, залогиниться (логин и пароль указаны в аргументах) и создать базу знаний с помощью команды:

CREATE DATABASE hackaton

3. Запуск 7B модели Vikhrmodels_Vikhr-Llama3.1-8B-Instruct-R-21-09-24

Запуск модели с помощью инференс-сервера VLLM. Формат общения с моделью - OpenAI API.
Скачать модель: Vikhrmodels_Vikhr-Llama3.1-8B-Instruct-R-21-09-24

Команда для запуска:

docker run --detach --restart always --name Vikhrmodels_Vikhr-Llama3.1-8B-Instruct-R-21-09-24 --runtime nvidia --gpus device=0 --shm-size 8g \
    -v ~/.cache/huggingface:/root/.cache/huggingface \
    -v ~/text-generation-webui/models:/data \
    -p 8004:8000 --ipc=host vllm/vllm-openai:v0.5.5 \
    --model /data/awq_models/Vikhrmodels_Vikhr-Llama3.1-8B-Instruct-R-21-09-24 \
    --served-model-name vikhr_llama --dtype bfloat16 \
    --max_model_len 8096 --gpu-memory-utilization 0.4 --kv-cache-dtype fp8

4. Обработка PDF-файлов

Построение контейнера:

cd documents
docker build -t pdf-to-markdown-converter .

Обработка PDF:

Поместите PDF-файл в папку documents/pdfs/.
Запустите команду:

docker run --rm \
  -v ./documents/pdfs:/app/pdfs \
  -v ./documents/markdowns:/app/markdowns \
  -e PDF_FOLDER=/app/pdfs \
  -e MARKDOWN_FOLDER=/app/markdowns \
  pdf-to-markdown-converter

Результат (.md файл) появится в папке documents/markdowns/ после завершения обработки.

5. Заполнение базы данных

Инструкция:

Запуск осуществляется из папки /import.
Поместите файл .md из предыдущего шага в папку /import/md_files/example.md.

Команда для запуска:

cd import
docker build -t kg-processor .
docker run \
  -e OPENAI_API_KEY=your_openai_api_key \
  -e OPENAI_API_BASE="http://0.0.0.0:8004/v1" \
  -e NEO4J_PASSWORD=password \
  -e NEO4J_URI="bolt://0.0.0.0:7687" \
  -e NEO4J_USERNAME="neo4j" \
  -e NEO4J_DATABASE="hackaton" \
  -v ./md_files/example.md:/app/example.md \
  kg-processor example.md --document_name "Example" --chunk_size 250 --chunk_overlap 30

По результатам заполнения графа в консоли отобразится лог.
Для визуализации графа можно зайти в интерфейс Neo4j.

6. Запуск FastAPI-сервера

Сервер отвечает на вопросы по загруженному документу.

Команда для запуска:

cd retriever
docker build -t retriever .
docker run \
  -e OPENAI_API_KEY=your_openai_api_key \
  -e OPENAI_API_BASE="http://0.0.0.0:8004/v1" \
  -e NEO4J_PASSWORD=password \
  -e NEO4J_URI="bolt://0.0.0.0:7687" \
  -e NEO4J_USERNAME="neo4j" \
  -e NEO4J_DATABASE="hackaton" \
  -e EMBEDDINGS_SERVER_URL="http://0.0.0.0:8000" \
  retriever

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
document_process		document_process
embeddings_model		embeddings_model
import		import
retriever		retriever
README.md		README.md
hackaton.sh		hackaton.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

t1_knowledge_window

Инструкции по запуску

1. Сервинг эмбеддингов на FastAPI

Построение и запуск контейнера:

2. Запуск Neo4j

Команда для запуска:

3. Запуск 7B модели Vikhrmodels_Vikhr-Llama3.1-8B-Instruct-R-21-09-24

Команда для запуска:

4. Обработка PDF-файлов

Построение контейнера:

Обработка PDF:

5. Заполнение базы данных

Инструкция:

Команда для запуска:

6. Запуск FastAPI-сервера

Команда для запуска:

t1_knowledge

t1_hackaton_window

About

Uh oh!

Releases

Packages

Uh oh!

Languages

lexbuchi/t1_hackaton_window

Folders and files

Latest commit

History

Repository files navigation

t1_knowledge_window

Инструкции по запуску

1. Сервинг эмбеддингов на FastAPI

Построение и запуск контейнера:

2. Запуск Neo4j

Команда для запуска:

3. Запуск 7B модели Vikhrmodels_Vikhr-Llama3.1-8B-Instruct-R-21-09-24

Команда для запуска:

4. Обработка PDF-файлов

Построение контейнера:

Обработка PDF:

5. Заполнение базы данных

Инструкция:

Команда для запуска:

6. Запуск FastAPI-сервера

Команда для запуска:

t1_knowledge

t1_hackaton_window

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages