Этот API предоставляет удобный способ для автоматической транскрибации и диаризации аудио через облако.
Поддерживаются такие задачи, как перевод аудио в текст с таймкодами (транскрибация) и сегментация по спикерам (диаризация).
{ "task_id": "XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX", // Уникальный идентификатор задачи "data": { "text": "Добро пожаловать!", // Полный распознанный текст "segments": [ // Список сегментов аудио с распознанным текстом { "id": 0, // Идентификатор сегмента "start": 0.0, // Время начала сегмента в секундах "end": 1.23, // Время окончания сегмента в секундах "text": "Добро пожаловать!", // Текст, распознанный в данном сегменте "tokens": [50257, 456], // Список токенов, соответствующих тексту сегмента "avg_logprob": -0.12, // Средний логарифмический уровень вероятности для токенов "compression_ratio": 1.0, // Коэффициент сжатия текста "no_speech_prob": 0.01, // Вероятность отсутствия речи в сегменте "temperature": 0.0 // Температура, использованная при генерации текста } ] }, "task_status": True // Статус выполнения задачи (True - успешно завершена)}