Обзоры
15 минут
07.08.2025

Chat GPT-5: что важно знать бизнесу уже сегодня

OpenAI выпустила GPT-5 — гибрид reasoning-моделей, GPT-4o, агентов и математики с новым режимом structured thinking, обещая рост точности, скорости и логики. В vivochat тестируют модель в сценариях поддержки, аналитики и автоматизации рутины, проверяя её на удержание контекста, честность и адаптацию к нестандартным запросам. Первые результаты показывают меньше галлюцинаций, поддакиваний и больше последовательных, контекстно грамотных ответов, но окончательные выводы сделают после нагрузочных тестов.

Привет! Меня зовут Егор Урванов. Я - CTO vivochat. Хочу рассказать Вам про Open AI и GPT-5

Когда крупная ИТ-компания выкатывает свежую модель, рынок сначала делает вид, что затаил дыхание… а потом начинается карусель: пафосные заявления, волна статей, тесты, первые фейлы, первые «вау»-кейсы для бизнеса. А боссы пишут: «Завтра не выходи на работу». OpenAI с Chat GPT-5 эту карусель запустили по полной. Уже в заголовках кричат: «smartest, fastest, most useful model yet». Переводим с маркетингового: «мы смешали всё, что умели, и теперь оно быстрее, точнее и вроде как полезнее».

😁

Кстати, мы сделали игрушечную модельку, попробуйте. Она внизу. Либо сразу прыгайте в vivo

Что ещё есть про GPT и чатботы?

Ключевые улучшения GPT-5

Ключевые улучшения GPT-5

Скорость

"faster speeds compared to prior models"

Мгновенные ответы для создания более естественного диалога в чат-ботах vivochat.

Точность

"~45% less likely to contain a factual error than GPT-4o"

Значительное снижение ошибок обеспечивает надежность бизнес-решений.

Контекстное мышление

"better at navigating ambiguity where context matters"

Понимание нюансов разговора для более точных ответов в сложных ситуациях.

Structured Thinking

"leaps in reasoning and decision-making"

Революционные улучшения логики для решения сложных бизнес-задач.

Safe Completions

"answers that are more helpful while staying safe"

Безопасность и полезность в каждом ответе для корпоративного использования.

Что именно сулят

По пресс-релизу, Chat GPT-5 — это не просто новый мотор, а гибрид всего, что они раньше делали: reasoning-модели, GPT-4o, агенты, математика. Плюс вшили новый режим — structured thinking. Чтобы бот не просто плевался словами, а мог собрать из них стройную мысль и довести до внятного решения.

OpenAI уверяют: мы сделали рывок в точности, скорости, логике и понимании контекста. Звучит эффектно, но для нас, кто реально интегрирует ИИ в рабочие процессы, это значит конкретные тестовые вопросы:

  • Точность — станет ли меньше галлюцинаций в живых чатах, а не только на тестах.
  • Скорость — как быстро будет отвечать, когда диалог уже километровый.
  • Логика — что он придумает, если ответа «в лоб» нет.
  • Память — удержит ли детали разговора, когда сообщений уже под сотню.

Почему это цепляет vivochat

В vivochat мы живём на стыке диалогового ИИ и реальных задач. Когда человек пишет нам в чат, ему до лампочки «скачки точности» — он хочет понятный, полезный ответ прямо сейчас. Но за всей этой маркетинговой мишурой как раз и прячется то, что мы можем выжать для продукта.

У GPT-5 мы видим три зоны, где он может зайти:

  1. Поддержка — разруливать мутные ситуации, где нет инструкции, а решение надо придумать.
  2. Аналитика — вычленять важные моменты, тон и проблемные места в куче переписок.
  3. Рутина — заявки, документы, шаблоны — всё с учётом контекста клиента.

Наш способ тестировать

Да, мы уже гоняем GPT-5 в нашей песочнице. Не в боевом чате, а в закрытых сценариях, где можно померить:

  • как держит длинный диалог;
  • где включается режим «я точно знаю», но без фактов;
  • что делает, если данных мало или они противоречат.

Правило простое: внедрение — не цель. Мы всегда сверяем

the true magic will happen

с тем, что реально видят пользователи. Потому что магия магией, а привычная ИИшная самоуверенность без доказательств — это для нас красный свет.

Ах, да, не забудьте протестировать GPT-5 в самом низу. Модель ждёт тебя

😉

На чём сделали упор: ключевые улучшения CHAT GPT-5

Ощущение от GPT-5 такое, будто OpenAI специально кидали в зал маленькие приманки — мол, вот тебе, разработчик, вот тебе, продукт-тим, берите, пробуйте, внедряйте. На слайдах всё блестит: accuracy, speed, reasoning, context, structured thinking — но если раскрутить это по винтикам и примерить к vivochat, картина интереснее.

Точность

По их данным, GPT-5 почти в полтора раза реже врёт, чем GPT-4o, и реже — чем OpenAI o3 в режиме «thinking». Для обычного пользователя это меньше сюрпризов и больше внятных фактов. Для нас — тест на живых чатах, где клиент может выдать половину запроса в одном сообщении, половину — в другом. На пробных сценариях GPT-5 чаще останавливается, чтобы уточнить, чем лепит ответ «на глазок». Минус — иногда задержка на пару секунд длиннее, чем хотелось бы.

Скорость

Они говорят — быстрее думает, быстрее отвечает, и даже сложные ответы теперь без долгих «подождите...». В бизнес-чате эти секунды критичны: свыше 3–4 — и пользователь уже ощущает заторможенность. На потоковой подаче текста GPT-5 стартует резвее, особенно в коротких задачах — прямо видно, как ответ выстреливает почти сразу.

Логика и пошаговость

Тут ключевое — «structured thinking» и спецрежим «thinking» для тяжёлых кейсов. Модель теперь не шарашит готовое решение с ходу, а раскладывает задачу на шаги. В саппорте это золото: можно последовательно разобрать, уточнить, предложить варианты. Мы гоняли это на сложных тикетах — операторов подключать приходилось реже, бот вытягивал сам.

Контекст

GPT-5 держит тему крепче. Даже если собеседник внезапно уехал в сторону, а потом через 20 сообщений вернулся к старому вопросу — модель помнит, что было в начале. В длинных B2B-диалогах это прямо спасение: нужные детали не теряются где-то на полпути. Кстати, о разных моделях взаимодействия с пользователем мы тоже кое-что знаем.

Приятные мелочи

— Почти вдвое меньше бессмысленного поддакивания. Вместо «да-да, конечно» — нормальный ответ по сути.
— Чётче говорит «не знаю» там, где реально не знает. Не фантазирует. Для нас это давно был must-have.

👇

Итог? Конечно, нужно во всём убедиться самому и протестировать на практике. Интерактивный ассистент совсем близко - в самом конце статьи

GPT-5 — не просто «умнее» и «быстрее», а внятнее, осторожнее и контекстно грамотнее. Если интеграция пройдёт гладко, в vivochat это будет не чат-бот, а собеседник, который и думает, и слушает. А правда ли всё так круто — проверим только на своих тестах.

Мифы и реальность: точность и честность модели

OpenAI бодро рапортует: GPT-5 якобы «на ~45% реже ошибается, чем GPT-4o» и аж на «~80% реже… чем OpenAI o3» в режиме thinking. На слайдах — почти победа над галлюцинациями, аплодисменты, фанфары. Но мы в vivochat слишком давно возимся с ИИ, чтобы верить цифрам на презентации. Лабораторные тесты — это стерильная комната, где всё аккуратно разложено по полочкам. А живые запросы от реальных пользователей — это шум, обрывки контекста, двусмысленности и случайные детали, которые рушат идеальные проценты.

Диаграмма кликабельная
GPT-5 Interactive Infographic

GPT-5

Уровень улучшения 0%

Почему нам это важно

В чате ошибка ИИ — это не просто «ой». Это момент, когда человек напротив решает: «Окей, этот бот врёт». Даже если он не врал, а просто сболтнул что-то от себя. И вернуть это доверие потом — как поднимать упавший стакан с тонким стеклом: вроде можно, но трещины уже останутся.

Поэтому мы ценим не только точность, но и честность. OpenAI пишет: «Модель лучше понимает, когда задача невыполнима, и чётче сообщает о своих ограничениях». Перевод на наш рабочий язык: GPT-5 чаще говорит «Нужны уточнения» или «В этой среде это нельзя сделать», вместо того чтобы уверенно лепить ответ с потолка.

А ещё мне очень важно, чтобы ты посмотрел GPT-5 ниже
Дочитывай - и го!

😏

Почему это реально шаг вперёд

В прошлых версиях, особенно GPT-4o и ранних reasoning-моделях, был синдром «уверенного вымысла», которые неплохо работают для продаж. Модель могла с каменным лицом описать несуществующую функцию, дать ссылку на фантомный документ или предложить совет, который вообще не работает в заданной среде. OpenAI сейчас утверждает: доля таких фейков в тестах упала с 4,8% до 2,1%. На бумаге — не сенсация, но в нашей практике это может быть сотни спасённых ответов в месяц, где бот вовремя промолчал, а не нёс чушь.

И ещё — меньше поддакиваний

OpenAI хвастается: sycophantic replies теперь меньше 6% против прежних 14,5%. Если по-простому — ИИ стал реже соглашаться с клиентом, когда тот неправ. Для поддержки это критично: поддакивающий бот закрепляет ошибку, вместо того чтобы её исправить. А теперь он чаще осмеливается возразить, уточнить, предложить другую точку зрения — и это прямое повышение качества сервиса.

Возможности для бизнеса и поддержки клиентов

В официальных материалах OpenAI эта часть подана как обещание, что GPT-5 “can follow your instructions more faithfully and get more of the work done end-to-end”. На бумаге это значит: меньше недопониманий, больше задач закрывается автоматически, меньше переключений между человеком и машиной. Для нас в vivochat это напрямую касается двух ключевых направлений — поддержки клиентов и внутренних бизнес-процессов.

В большинстве компаний 70–80% входящих обращений — это повторяющиеся запросы: «Как восстановить пароль?», «Где отследить заказ?», «Как оформить возврат?». GPT-4o и его предшественники с этим уже справлялись. Но оставались «трудные» 20–30%, где клиент формулирует проблему косвенно, меняет детали на ходу или смешивает несколько тем в одном сообщении. GPT-5, по нашим тестам, лучше удерживает контекст и адаптирует ответ под изменяющиеся условия, что соответствует заявлению OpenAI о “better at navigating ambiguity where context matters”.

В сценариях вроде обработки заявок, составления резюме встреч, анализа переписок GPT-5 способен пройти от запроса до готового результата без вмешательства человека. Это то, что OpenAI описывает как

improved collaboration, and faster outcomes on high-stakes work

Для нас это означает меньше переключений между ботом и оператором, особенно в задачах, где важно не только правильно ответить, но и оформить результат в заданной форме. Попробовать vivochat и оценить наши результаты можно прямо тут.

Ещё один интересный момент — в GPT-5 улучшили работу с инструкциями и «тонкую настройку» поведения. Это позволяет встраивать модель в конкретные регламенты компании: от стандартов общения с клиентами до соблюдения юридических формулировок. Здесь мы видим перспективу, потому что наш опыт показывает: любая интеграция ИИ в бизнес требует, чтобы он говорил «на языке» конкретной организации, а не на универсальном нейросетевом диалекте.

Да, GPT-5 обещает

higher quality outputs and faster speeds compared to prior models

Но пока мы тестируем, мы хотим увидеть, насколько эти улучшения сохраняются при нагрузке, где сотни диалогов идут параллельно, и при этом контекст у каждого клиента свой. Опыт подсказывает, что некоторые «лабораторные» улучшения могут теряться в реальной эксплуатации, и мы хотим поймать эти моменты до релиза.

В результате мы смотрим на GPT-5 как на инструмент, который уже сегодня может взять на себя больше задач поддержки и внутренних процессов, чем прошлые модели. Но чтобы он стал основой для бизнес-критичных функций, нужно пройти полный цикл проверок на наших данных и сценариях.

А это моделька 💪

GPT-5 с рычажками и кнопками. Перед вами — пульт управления ИИ. Не просто «задай вопрос и жди», а целый набор регуляторов, которые позволяют настроить бота под настроение и задачу.

GPT-5 в Vivochat: управление качеством ответа

GPT-5 в Vivochat: управление качеством ответа

70
70
40
50
Здравствуйте! Подскажите, как подключить виджет к сайту?
Коротко: вставьте скрипт в <head>, затем подтвердите домен в кабинете. Нужна пошаговая инструкция?
Latency
1.3s
Steps
2
Honesty
Med
Fluff
4%
Context
Med

Слева — контрольная панель.

Тянем ползунок «Точность» — и бот превращается либо в быстрого советчика, либо в педантичного эксперта. Крутим «Скорость» — хотим молниеносно или с эффектом «подумал, взвесил, ответил». Есть даже шкала поддакивания: можно попросить сухо по делу, а можно добавить чуточку «да, вы правы».

Ниже — логика и контекст.

Здесь решается, будет ли GPT-5 молчаливым минималистом, автоматическим рассуждателем или устроит настоящий разбор с пунктами и подзаголовками.

А если лень подбирать каждую ручку — есть пресеты. Нажал «Быстрый ответ» — и всё уже настроено на скорость. «Надёжность» — бот проверит себя трижды. «Глубокий разбор» — и он выдаст инструкцию, от которой не отвертишься.

Справа — живое превью. Пишешь вопрос, и сразу видишь, каким получится ответ при текущих настройках. Ниже — мини-панель телеметрии:

  • через сколько секунд бот выстрелил ответ (Latency),
  • сколько шагов подумал (Steps),
  • насколько был честен,
  • сколько налил воды (Fluff),
  • и какой объём контекста использовал.

Мы в соцсетях

Обзоры
15 минут
07.08.2025
Обзоры
15 минут
07.08.2025

Мы в социальных сетях