Одной строкой

Google I/O 2025: от 3D-звонков до ИИ-ассистентов — главные анонсы на конференции

  • 20 мая началась I/O 2025.
  • На ней представили множество обновлений, среди которых Google Beam, генеративные модели Veo 3 и Imagen 4.
  • Также в Google Meet добавили автоматический перевод в режиме реального времени с имитацией голоса и мимики.

20 мая 2025 года в американском городе Маунтин-Вью началась ежегодная конференция разработчиков Google I/O 2025. На мероприятии представили массу обновлений, в частности, в сфере искусственного интеллекта. Среди главных новинок — Google Beam — платформа для видеосвязи с реалистичным 3D-эффектом присутствия, которая использует ИИ и шесть камер.

Отдельное внимание уделили генеративным моделям: Veo 3 создает видео со звуком и диалогами, а Imagen 4 — детализированные изображения.

Google Beam и автоматический перевод в режиме реального времени

Google представила Google Beam — новую ИИ-платформу для видеосвязи, которая превращает 2D-видео в 3D-опыт присутствия. Технология использует шесть камер и для воспроизведения с точностью до миллиметра и 60 кадров в секунду в реальном времени, создавая эффект присутствия собеседника в одной комнате. Первые устройства Beam появятся для ранних пользователей уже в 2025 году.

Также Google улучшила Google Meet, добавив перевод речи в режиме реального времени, воспроизводящий голос, тон и мимику говорящего. Пока перевод работает с английского на испанский в бета-версии для пользователей AI Pro и Ultra, вскоре добавят новые языки. Эта функция станет доступной для бизнес-клиентов Workspace для раннего тестирования.

Veo 3 и Imagen 4 — новые генеративные модели для видео и изображений

Компания представила Veo 3 — новую ИИ-модель для генерации видео, которая может создавать звуковые эффекты, фоновый шум и даже диалоги. Качество видео значительно улучшено по сравнению с предыдущей версией. Veo 3 доступна с 21 мая в приложении Gemini для подписчиков тарифа AI Ultra по цене $249,99 в месяц. Модель можно запускать как по текстовым, так и по визуальным подсказкам.

Также представлено Imagen 4 для генерации изображений. Она может создавать как фотореалистичные, так и абстрактные изображения с высокой детализацией (ткани, капли воды, мех и т.д.) в разрешении до 2K.

Gemini Live

На конференции Google I/O показали обновление Gemini Live, которое теперь включает функции универсального ИИ-ассистента Project Astra с поддержкой камеры и совместного доступа к экрану. Функцию уже используют для подготовки к собеседованиям, марафонских тренировок и других задач. Она доступна всем пользователям Android и начинает появляться у пользователей iOS.

Mariner

Google разрабатывает агентов на базе ИИ, которые автоматически выполняют задачи за пользователей, например, ищут жилье онлайн, ставят фильтры и записывают на просмотры.

Проект Mariner — это прототип таких агентов с возможностью работать с сайтами и многозадачностью. Эти функции доступны разработчикам через Gemini API и вскоре появятся в приложении Gemini, Chrome и поиске.

«Сила персонализации»

На мероприятии объявили о внедрении персонализированных умных ответов в Gmail. Функция станет доступной для подписчиков в конце года.

«Если друг попросит совета о поездке, Gemini автоматически найдет ваши предыдущие письма и файлы, например, маршруты в Google Docs, и предложит ответ, соответствующий вашему стилю и тону», — заявили в Google.

AI Mode

Компания представила новый AI Mode — переработанную функцию поиска с возможностью ставить более длинные и сложные запросы, и уточняющие вопросы. AI Mode доступен в виде отдельной вкладки прямо в «поиске».

Обновленный Gemini Deep Research с поддержкой собственных файлов

Google обновила функцию Deep Research. Теперь пользователи могут загружать собственные PDF-файлы и изображения, а вскоре появится поддержка Google Drive и Gmail для еще более точной персонализации.

Stitch: ИИ-инструмент для разработчиков

Google представила Stitch — инструмент для генерации интерфейсов веб- и мобильных приложений. Пользователь может задать несколько слов или изображение, а Stitch создаст HTML и CSS-код для соответствующего дизайна.

Также компания расширила доступ к ИИ-ассистенту Jules — помощнику для разработчиков, который, в частности, помогает находить баги в коде.

Gemini 2.5

Google обновила свою самую мощную модель Gemini 2.5 Flash. Версия 2.5 Flash улучшена почти по всем параметрам — в логике, мультизадачности, программировании и работе с большим контекстом. Для 2.5 Pro представлен новый режим глубокого мышления Deep Think, который использует самые современные исследования в области логики и параллельного мышления. Подробнее о преимуществах обновления в материале.

Кроме того, Google обновила Wear OS 6. Play Store получил улучшения для разработчиков: появились новые инструменты для управления подписками, предварительный просмотр контента и прочее.

Также на конференции Google I/O 2025 компания анонсировала в $150 млн в производителя очков Warby Parker.

Сообщение Google I/O 2025: от 3D-звонков до ИИ-ассистентов — главные анонсы на конференции появились сначала на INCRYPTED.

Добавить комментарий