Cansado de vídeo chamadas sem graça? O Google tem uma solução

·2 min de leitura
  • Ideia do Google é transformar a chamada de vídeo padrão em uma novidade tecnológica

  • Solução da gigante da internet quer fazer você sentir a presença da outra pessoa

  • Sistema incluiu quatro câmeras, quatro microfones e dois alto-falantes de alta potência

Em um novo artigo de pesquisa, o Google detalhou a tecnologia por trás de sua impressionante demonstração do Projeto Starline da conferência I/O deste ano. O Projeto Starline é essencialmente uma cabine de chat de vídeo 3D que visa substituir uma chamada de videoconferência 2D individual por uma experiência que dá a sensação de que você está realmente sentado na frente de um ser humano real.

Leia também

Parece simples, mas o artigo de pesquisa do Google destaca quantos desafios existem em fazer seu cérebro pensar que existe um ser humano de verdade sentado a poucos metros de você. Obviamente, a imagem precisa ser de alta resolução e livre de artefatos perturbadores, mas também precisa parecer correta de sua posição relativa no estande. O áudio é outro desafio, pois o sistema precisa fazer parecer que as palavras de uma pessoa estão saindo de sua boca real. E então há apenas a pequena questão do contato visual.

Eventualmente, a esperança é que o Projeto Starline possa oferecer uma sensação de presença semelhante à realidade virtual ou aumentada, sem que os usuários precisem usar fones de ouvido volumosos ou rastreadores.

Sistema do Google será em 8k e quer fazer você sentir a presença da pessoa

O documento detalha exatamente quanto hardware é necessário para começar a resolver esses problemas. O sistema é construído em torno de um grande painel 8K de 65 polegadas que funciona a 60Hz. Em torno dele, os engenheiros do Google organizaram três "pods de captura", que são capazes de capturar imagens coloridas e dados de profundidade.

O sistema também inclui quatro câmeras de rastreamento adicionais, quatro microfones, dois alto-falantes e projetores infravermelhos. No total, imagens coloridas de quatro pontos de vista são capturadas, bem como três mapas de profundidade, para um total de sete fluxos de vídeo. O áudio é capturado a 44,1 kHz e codificado a 256 Kbps.

Obviamente, todo esse hardware gera muitos dados que precisam ser transmitidos, e o Google diz que a largura de banda de transmissão varia de 30 Mbps a 100 Mbps, dependendo "do detalhe da textura nas roupas do usuário e da magnitude de seus gestos". Portanto, é significativamente mais do que uma chamada Zoom padrão, mas nada que um escritório típico em uma área metropolitana não pudesse suportar.

O Project Starline está equipado com quatro placas gráficas Nvidia de última geração (duas placas Quadro RTX 6000 e duas Titan RTX) para codificar e decodificar todos esses dados. A latência ponta a ponta é supostamente em média 105,8 milissegundos.

Nosso objetivo é criar um lugar seguro e atraente onde usuários possam se conectar uns com os outros baseados em interesses e paixões. Para melhorar a experiência de participantes da comunidade, estamos suspendendo temporariamente os comentários de artigos