Откликнуться

Описание вакансии

Задачи:
Подготовка и обработка текстовых данных:
— Разработка пайплайнов для предобработки текстов
— Реализация логики разделения документов на смысловые части
— Создание систем фильтрации и очистки данных
— Работа с различными форматами данных (txt, pdf, doc)
Работа с embedding моделями:
— Опыт работы с embedding моделями
— Настройка и оптимизация векторных представлений текста
— Работа с векторными базами данных (ChromaDB, FAISS)
— Оценка качества эмбеддингов
Fine-tuning модели:
— Опыт fine-tuning языковых моделей
— Подготовка данных для обучения моделей
— Разработка методик оценки качества моделей
— Работа с метриками и валидацией
Разработка компонентов оценки:
— Создание систем оценки релевантности документов
— Разработка метрик для оценки качества извлеченной информации
— Реализация логики валидации результатов
— Не менее 1 года опыта работы с NLP проектами
— Опыт работы с языковыми моделями и RAG системами
— Практический опыт подготовки данных для обучения моделей
— Желательно наличие опыта работы с текстовыми данными
— Знание языков программирования и фреймворков: Python, PyTorch/TensorFlow, Hugging Face Transformers, LangChain/LlamaIndex
— Найм в штат
— 5 дней в неделю с 9:00 до 18:00
— Практикуем быстрый найм, без долгих согласований и этапов
— В команде есть тимлид
— Работа в офисе в г.Астана, ул.Жошы хан 27, н.п. 4