SL
Разработка и IT / Скрипты, боты и mini apps / Машинное обучение
02.12.2025, в 20:57

Система диаризации и идентификации голосов сотрудников

Нужно разработать систему, которая автоматически расшифровывает записи совещаний, разделяет речь по спикерам (диаризация) и определяет, кто именно из сотрудников говорит (идентификация по базе голосов). Что должна делать система: 1. Транскрибация: Преобразовывать аудио совещания в текст (русский язык). 2. Диаризация: Разделять запись на сегменты по спикерам. 3. Идентификация: Сопоставлять каждого спикера с базой голосовых отпечатков сотрудников (~60 человек). 4. Хранить базу «голосовых профилей» сотрудников. Каждый сотрудник один раз записывает несколько секунд/минут своего голоса для регистрации. 5. Возвращать готовый результат с разметкой по именам: Например: [00:00 - 00:15] Иванов И.И.: Добрый день, коллеги... [00:16 - 00:35] Петров А.С.: Давайте начнем с первого вопроса... [00:36 - 00:50] Неизвестный: А можно уточнить по срокам? Важно: - Стоимость эксплуатации должна быть низкой - Корректная обработка ситуаций, когда говорят несколько человек одновременно (overlapping speech). Варианты реализации (на ваш выбор): - Облачное решение (Сторонние сервисы по api). - Полностью своё решение на Open Source. - Гибрид. Что нужно от вас в отклике: 1. Какой стек предлагаете (модели, сервисы, библиотеки). 2. Примерная стоимость эксплуатации в месяц. 3. Сроки выполнения. 4. Опыт работы с аудио/ML/speech recognition (желательно примеры). Результат: Исходный код проекта, не важен удобный и красивый интерфейс или api, я это решение потом сам буду встраивать в свой проект

Бюджет: 10 000₽ — 30 000₽Перейти на Kwork

Релевантные проекты

ML-ядро адаптивного тренажёра по обществознанию

Проект: онлайн-тренажёр по обществознанию подготовки к олимпиадам для 9–11 классов.

Бюджет: 100 000₽ — 200 000₽

Вчера, в 13:44

Консультация + обучение

Есть проект написанный на php (один из фреймворков). Общая задача найти критические баги, сделать описание проекта. Хочу для этого настроить LLM-сервис, типа cursor, copilot или подобное.

Бюджет: 10 000₽ — 30 000₽

04.12.2025, в 16:53

Собрать промпт

Добрый день! Создаем приложение Android, iOS в сфере растениводства. Нам требуется специалист, кто может грамотно собрать Промпт под нашу задачу, чтобы на выходе получать стабильный, предсказуемый, качественный результат от AI.

Бюджет: 20 000₽ — 60 000₽

04.12.2025, в 14:22

Перевод каталога товаров (Excel) с помощью нейросети

Добрый день! Во вложении каталог товаров в Excel на китайском языке. Необходимо чем-нибудь более-менее адекватным перевести столбцы категория и наименование и заполнить значения в соседних столбцах.

Бюджет: 2 000₽ — 6 000₽

03.12.2025, в 02:06

Нейросеть виртуальная примерочная на Python

Не бот в телеграм! Нейросеть виртуальной примерочной на Python которая позволяет примерить одежду онлайн и увидеть, как она будет сидеть на заданной модели/фигуре или загруженной модели/фигуре пользователя.

Бюджет: 20 000₽ — 60 000₽

28.11.2025, в 08:39
Система диаризации и идентификации голосов сотрудников / SmartLancer