Google I/O 2025: от 3D-звонков до ИИ-ассистентов — главные анонсы на конференции
- 20 мая началась конференция Google I/O 2025.
- На ней представили множество обновлений, среди которых Google Beam, генеративные модели Veo 3 и Imagen 4.
- Также в Google Meet добавили автоматический перевод в режиме реального времени с имитацией голоса и мимики.
20 мая 2025 года в американском городе Маунтин-Вью началась ежегодная конференция разработчиков Google I/O 2025. На мероприятии представили массу обновлений, в частности, в сфере искусственного интеллекта. Среди главных новинок — Google Beam — платформа для видеосвязи с реалистичным 3D-эффектом присутствия, которая использует ИИ и шесть камер.
Отдельное внимание уделили генеративным моделям: Veo 3 создает видео со звуком и диалогами, а Imagen 4 — детализированные изображения.
Google Beam и автоматический перевод в режиме реального времени
Google представила Google Beam — новую ИИ-платформу для видеосвязи, которая превращает 2D-видео в 3D-опыт присутствия. Технология использует шесть камер и искусственный интеллект для воспроизведения с точностью до миллиметра и 60 кадров в секунду в реальном времени, создавая эффект присутствия собеседника в одной комнате. Первые устройства Beam появятся для ранних пользователей уже в 2025 году.
Также Google улучшила Google Meet, добавив перевод речи в режиме реального времени, воспроизводящий голос, тон и мимику говорящего. Пока перевод работает с английского на испанский в бета-версии для пользователей AI Pro и Ultra, вскоре добавят новые языки. Эта функция станет доступной для бизнес-клиентов Workspace для раннего тестирования.
Veo 3 и Imagen 4 — новые генеративные модели для видео и изображений
Компания представила Veo 3 — новую ИИ-модель для генерации видео, которая может создавать звуковые эффекты, фоновый шум и даже диалоги. Качество видео значительно улучшено по сравнению с предыдущей версией. Veo 3 доступна с 21 мая в приложении Gemini для подписчиков тарифа AI Ultra по цене $249,99 в месяц. Модель можно запускать как по текстовым, так и по визуальным подсказкам.
Также представлено Imagen 4 для генерации изображений. Она может создавать как фотореалистичные, так и абстрактные изображения с высокой детализацией (ткани, капли воды, мех и т.д.) в разрешении до 2K.
Gemini Live
На конференции Google I/O показали обновление Gemini Live, которое теперь включает функции универсального ИИ-ассистента Project Astra с поддержкой камеры и совместного доступа к экрану. Функцию уже используют для подготовки к собеседованиям, марафонских тренировок и других задач. Она доступна всем пользователям Android и начинает появляться у пользователей iOS.
Mariner
Google разрабатывает агентов на базе ИИ, которые автоматически выполняют задачи за пользователей, например, ищут жилье онлайн, ставят фильтры и записывают на просмотры.
Проект Mariner — это прототип таких агентов с возможностью работать с сайтами и многозадачностью. Эти функции доступны разработчикам через Gemini API и вскоре появятся в приложении Gemini, Chrome и поиске.
«Сила персонализации»
На мероприятии объявили о внедрении персонализированных умных ответов в Gmail. Функция станет доступной для подписчиков в конце года.
«Если друг попросит совета о поездке, Gemini автоматически найдет ваши предыдущие письма и файлы, например, маршруты в Google Docs, и предложит ответ, соответствующий вашему стилю и тону», — заявили в Google.
AI Mode
Компания представила новый AI Mode — переработанную функцию поиска с возможностью ставить более длинные и сложные запросы, и уточняющие вопросы. AI Mode доступен в виде отдельной вкладки прямо в «поиске».
Обновленный Gemini Deep Research с поддержкой собственных файлов
Google обновила функцию Deep Research. Теперь пользователи могут загружать собственные PDF-файлы и изображения, а вскоре появится поддержка Google Drive и Gmail для еще более точной персонализации.
Stitch: ИИ-инструмент для разработчиков
Google представила Stitch — инструмент для генерации интерфейсов веб- и мобильных приложений. Пользователь может задать несколько слов или изображение, а Stitch создаст HTML и CSS-код для соответствующего дизайна.
Также компания расширила доступ к ИИ-ассистенту Jules — помощнику для разработчиков, который, в частности, помогает находить баги в коде.
Gemini 2.5
Google обновила свою самую мощную модель Gemini 2.5 Flash. Версия 2.5 Flash улучшена почти по всем параметрам — в логике, мультизадачности, программировании и работе с большим контекстом. Для 2.5 Pro представлен новый режим глубокого мышления Deep Think, который использует самые современные исследования в области логики и параллельного мышления. Подробнее о преимуществах обновления в материале.
Кроме того, Google обновила Wear OS 6. Play Store получил улучшения для разработчиков: появились новые инструменты для управления подписками, предварительный просмотр контента и прочее.
Также на конференции Google I/O 2025 компания анонсировала инвестиции в $150 млн в производителя очков Warby Parker.
Сообщение Google I/O 2025: от 3D-звонков до ИИ-ассистентов — главные анонсы на конференции появились сначала на INCRYPTED.