Помните голосовую демонстрацию GPT-4o от OpenAI, которая потрясла мир своей схожестью с человеческим голосом? Знаете, ту, которая могла заставить вас на время забыть, что вы разговариваете с ИИ, и даже напомнила многим образ персонажа Скарлетт Йоханссон из фильма Её (и также подверглась критике за то же самое).
OpenAI наконец-то начинает развертывание альфа-версии для небольшого числа пользователей ChatGPT Plus, о чем компания сообщила на X. Хотя изначально планировалось начать развертывание в июне, оно было отложено по соображениям безопасности для того, чтобы гарантировать возможность «достичь [у OpenAI] необходимых стандартов для запуска». Таким образом, компания была занята улучшением модели с помощью команды внешних специалистов, чтобы она могла обнаруживать и отклонять определённый контент.
Мы начинаем развертывать расширенный голосовой режим для небольшой группы пользователей ChatGPT Plus. Расширенный голосовой режим предлагает более естественные разговоры в реальном времени, позволяет вам прерывать собеседника в любое время, а также чувствует и реагирует на ваши эмоции. pic.twitter.com/64O94EhhXK
— OpenAI (@OpenAI) 30 июля 2024 г.
Теперь некоторые платные пользователи начинают получать доступ к модели в своём приложении ChatGPT, но в настоящее время доступ к альфа-версии останется ограниченным. Компания заявляет, что планирует постепенно предоставить доступ для большего числа пользователей и распространить его на всех платных пользователей позже осенью.
Похоже, нет способа запросить доступ к расширенному голосовому режиму. Если вы входит в число тех, кто получит доступ к альфа-версии, вы получите электронное письмо с инструкциями, а также уведомление в приложении ChatGPT для опробования голосового режима.
Расширенный голосовой режим будет способен использовать только 4 предустановленных голоса: Джунипер, Эмбер, Коув и Бриз. Примечательно, что OpenAI удалили Скай — тот голос, который звучал как Скарлетт Йоханссон, вскоре после того, как демо было выпущено на весеннем мероприятии, и актриса отправила письма в компанию с вопросом о том, как был создан этот голос (на которые OpenAI, по-видимому, так и не ответила). Скай, похоже, всё ещё не входит в список.
ChatGPT-4o также не сможет предоставлять выходные данные любым другим голосом, кроме указанных в предустановках, чтобы защитить конфиденциальность пользователя. Также существуют механизмы для блокировки запросов на любой жестокий или защищённый авторским правом контент.
Если у вас есть доступ к расширенному голосовому режиму в приложении ChatGPT, продолжайте и попробуйте. Хотя он ещё не сможет делать всё, что показано в демонстрациях, пока не получит возможность обработки визуального контента, он всё равно выглядит весьма впечатляюще, согласно некоторым видео, которыми поделились пользователи, имеющие доступ.
Игорь Бастионов — увлеченный технологический журналист и блогер, родившийся в 1985 году в Санкт-Петербурге. С юных лет Игорь проявлял интерес к компьютерам и электронике, что определило его будущую карьеру.
Окончив факультет информационных технологий Санкт-Петербургского политехнического университета в 2007 году, Игорь начал работать программистом в IT-компании. Однако вскоре понял, что его истинное призвание — делиться знаниями о технологиях с широкой аудиторией.
В 2021 году Игорь запустил свой блог о современных гаджетах и программном обеспечении, который быстро набрал популярность благодаря понятным обзорам и глубоким аналитическим статьям. Через три года блог перерос в полноценный веб-сайт, посвященный новинкам мира технологий.
Сегодня Игорь Бастионов — признанный эксперт в области потребительской электроники и программного обеспечения. Его сайт ежемесячно посещают сотни тысяч читателей, ищущих актуальную и достоверную информацию о последних технологических трендах.
Кроме ведения сайта, Игорь часто выступает на технологических конференциях и является автором нескольких книг по цифровой грамотности и кибербезопасности.