Проект: локальное (on-premises) развертывание PrivateGPT с моделью Saiga 13B (файл model-q4_K.gguf) на Windows 11.
Цель: стабильно работающий веб-интерфейс (http://127.0.0.1:8001) с корректной загрузкой модели, возможностью добавлять свои документы (RAG) и русским интерфейсом.
Текущее состояние:
ОС — Windows 11 Pro x64, CPU i5-10600, 32 GB RAM, SSD 1 ТБ.
Python 3.11 + Poetry уже установлены, репозиторий privateGPT клонирован.
Файл-модель model-q4_K.gguf (≈ 8 GB) лежит:
C:\privategpt_old\models\modelssaiga\model-q4_K.gguf
(при необходимости можно перенести).
Базовые зависимости установлены, но приложение не запускается из-за ошибок Pydantic / пути к модели.
Требования к результату:
Область / Что должно быть настроено
LLM: llama_cpp грузит Saiga 13B без ошибок «Provided model path does not exist», все переменные окружения и YAML-конфиг приведены к валидной схеме.
Web UI: PrivateGPT доступен по http://127.0.0.1:8001, принимает запросы и отвечает (русский + английский).
RAG-подсистема: Возможность ingestion локальных PDF/DOCX и вопросов по ним.
Документация: README-файл (или комментарии .md) с описанием: шаг запуска, где лежит конфиг, как добавлять новые документы, как сменить модель.
Формат выполнения:
☐ Удалённо (AnyDesk/TeamViewer/VS Code SSH)
☐ Очно (СПб), договоримся о времени.
Срок: 5 часов с момента утверждения.
Бюджет: 3000 ₽ (либо укажите свою ставку)
Требования к исполнителю:
— Опыт с llama_cpp, PrivateGPT или аналогичными self-host LLM-стеками.
— Умение работать на Windows-станциях (без Docker предпочтительно).
— Готовность предоставить короткий отчёт по итогам.
По всем вопросам обращаться к @MihailUr888
Цель: стабильно работающий веб-интерфейс (http://127.0.0.1:8001) с корректной загрузкой модели, возможностью добавлять свои документы (RAG) и русским интерфейсом.
Текущее состояние:
ОС — Windows 11 Pro x64, CPU i5-10600, 32 GB RAM, SSD 1 ТБ.
Python 3.11 + Poetry уже установлены, репозиторий privateGPT клонирован.
Файл-модель model-q4_K.gguf (≈ 8 GB) лежит:
C:\privategpt_old\models\modelssaiga\model-q4_K.gguf
(при необходимости можно перенести).
Базовые зависимости установлены, но приложение не запускается из-за ошибок Pydantic / пути к модели.
Требования к результату:
Область / Что должно быть настроено
LLM: llama_cpp грузит Saiga 13B без ошибок «Provided model path does not exist», все переменные окружения и YAML-конфиг приведены к валидной схеме.
Web UI: PrivateGPT доступен по http://127.0.0.1:8001, принимает запросы и отвечает (русский + английский).
RAG-подсистема: Возможность ingestion локальных PDF/DOCX и вопросов по ним.
Документация: README-файл (или комментарии .md) с описанием: шаг запуска, где лежит конфиг, как добавлять новые документы, как сменить модель.
Формат выполнения:
☐ Удалённо (AnyDesk/TeamViewer/VS Code SSH)
☐ Очно (СПб), договоримся о времени.
Срок: 5 часов с момента утверждения.
Бюджет: 3000 ₽ (либо укажите свою ставку)
Требования к исполнителю:
— Опыт с llama_cpp, PrivateGPT или аналогичными self-host LLM-стеками.
— Умение работать на Windows-станциях (без Docker предпочтительно).
— Готовность предоставить короткий отчёт по итогам.
По всем вопросам обращаться к @MihailUr888
Data Engineer/ Search Engineer
#вакансия #dataengineer #Elasticsearch #AWS
Location: Remote (outside of Russia)
Work format: Remote, Full-time
Salary range: $25-35 per hour
Company name: CloudSquad
Contacts: @natalia_kurland
Our customer is generative AI company headquartered in San Francisco provides a comprehensive AI platform tailored for enterprise use. In late 2023, the company secured $100 million in Series B funding from leading institutional investors, including a prominent growth equity firm and several other major venture capital groups.
We are looking for an experienced Elasticsearch Engineer to help us scale and optimize search infrastructure across multi- and single-tenant environments. You will be responsible for improving performance isolation, managing large-scale clusters (terabytes of data per tenant), and designing a scalable, resilient Elasticsearch/OpenSearch architecture to meet enterprise requirements.
Hiring specifics:
Candidates must be located outside of Russia
Preferred candidates in or near GMT+1 time zones
Minimum 1 years hands-on experience with Elasticsearch required
Minimum 1 years experience with major cloud platforms (AWS/GCP) required
English proficiency: Upper Intermediate (B2+) or higher required
Key Responsibilities:
Optimize and scale multi-tenant Elasticsearch/OpenSearch deployments
Design and implement sharding strategies for performance isolation
Implement backup, recovery, and cross-cluster replication strategies
Collaborate with platform and application teams on data ingestion and retrieval patterns, automated provisioning
Requirements:
3–5+ years managing Elasticsearch/OpenSearch in production at scale
Deep knowledge of cluster design, indexing strategies, and search performance tuning
Experience with AWS OpenSearch, Elasticsearch Service, and/or Elastic Cloud
Familiarity with Kubernetes-based deployments is a plus
Contacts: @natalia_kurland
#вакансия #dataengineer #Elasticsearch #AWS
Location: Remote (outside of Russia)
Work format: Remote, Full-time
Salary range: $25-35 per hour
Company name: CloudSquad
Contacts: @natalia_kurland
Our customer is generative AI company headquartered in San Francisco provides a comprehensive AI platform tailored for enterprise use. In late 2023, the company secured $100 million in Series B funding from leading institutional investors, including a prominent growth equity firm and several other major venture capital groups.
We are looking for an experienced Elasticsearch Engineer to help us scale and optimize search infrastructure across multi- and single-tenant environments. You will be responsible for improving performance isolation, managing large-scale clusters (terabytes of data per tenant), and designing a scalable, resilient Elasticsearch/OpenSearch architecture to meet enterprise requirements.
Hiring specifics:
Candidates must be located outside of Russia
Preferred candidates in or near GMT+1 time zones
Minimum 1 years hands-on experience with Elasticsearch required
Minimum 1 years experience with major cloud platforms (AWS/GCP) required
English proficiency: Upper Intermediate (B2+) or higher required
Key Responsibilities:
Optimize and scale multi-tenant Elasticsearch/OpenSearch deployments
Design and implement sharding strategies for performance isolation
Implement backup, recovery, and cross-cluster replication strategies
Collaborate with platform and application teams on data ingestion and retrieval patterns, automated provisioning
Requirements:
3–5+ years managing Elasticsearch/OpenSearch in production at scale
Deep knowledge of cluster design, indexing strategies, and search performance tuning
Experience with AWS OpenSearch, Elasticsearch Service, and/or Elastic Cloud
Familiarity with Kubernetes-based deployments is a plus
Contacts: @natalia_kurland