Контекст
Имеется действующий продакшен-колл-центр на Asterisk с интеграцией в Битрикс24 (on-premises). Asterisk и Битрикс24 находятся на разных серверах, между ними настроен прямой линк.
Проблема
Периодически (рандомно) возникают сбои в передаче результатов звонка в Битрикс24:
аудиофайл записи звонка иногда не приходит вообще, либо
приходит с задержкой 2–5 минут, иногда до 15 минут,
сигналы о звонках (из-за чего карточки/сделки) могут создаваться с задержкой или не создаваться вообще.
Пробовали подозревать дисковую подсистему — диски заменили на SSD, но проблему это не решило.
Что нужно сделать (цель проекта)
Нужен специалист, который без остановки работающего Asterisk и без радикальных изменений:
Грамотно настроит диагностическое логирование (не гигантские логи на 100k строк на один звонок, а логирование, которое реально анализировать в поисках причины проблемы).
Настроит удобный веб-интерфейс для просмотра/поиска логов и быстрого расследования инцидентов (в идеале — поиск по времени/номеру/ID звонка).
Проведёт root cause analysis: найдёт корневую причину задержек/потерь записи и событий.
Внесёт минимально инвазивные правки, чтобы проблему устранить/минимизировать, и добавит контроль/мониторинг, чтобы:
ситуация не повторялась, или
было однозначно видно, где ломается цепочка и что делать.
Важные ограничения (обязательно)
Нельзя останавливать Asterisk и “ронять” телефонию.
Нельзя переустанавливать Asterisk (если это потребует долгий перерыв в работе - более часа и объём работ после переустановки будет слишком значительный).
Решение должно быть с минимальными вложениями и с планом отката.
Ожидаемые результаты
Устранение лага между звонком и созданием карточки в Битрикс24
Наличие удобного логирования