Разработчики Google представили Gemini 2.5 Pro с экспериментальным режимом Deep Think, который потеснил лидирующие позиции моделей OpenAI. Обновленная линейка ИИ-решений делает ставку на глубокую логику, экономию токенов при генерации кода и способность нейросетей распознавать эмоциональный окрас человеческой речи в режиме реального времени.
Версия Gemini 2.5 Flash стала эффективнее предшественников: теперь она справляется с логическими задачами и программированием, потребляя при этом на 20–30% меньше токенов. Рост производительности сопровождается внедрением функций для работы со звуком. Модель научилась синтезировать речь на 24 языках, передавая шепот и эмоциональные акценты, что делает диалог с машиной естественнее.Инженеры также добавили инструменты для более глубокого взаимодействия. Функция Affective Dialogue позволяет нейросети считывать настроение пользователя и подстраивать тон ответа под его состояние, будь то радость или грусть. В свою очередь, Proactive Audio эффективно отсекает фоновые шумы, позволяя алгоритму реагировать исключительно на обращение владельца. Эти шаги укрепляют позиции Google на фоне недавних проблем с обновлениями ChatGPT, которые вызвали волну критики у пользователей OpenAI.

Комментарии (0)
Пока нет комментариев. Будьте первым!