Novos modelos permitem previsão, geração de mundo controlável e raciocínio para IA física;
Dois novos projetos oferecem geração massiva de dados sintéticos de IA física para robôs e veículos autônomos após o treinamento;
1X, Agility Robotics, Figure AI, Skild AI estão entre os primeiros a adotarem o lançamento.
GTC — A NVIDIA anuncia um grande lançamento dos novos modelos de base de mundo (WFMs) do NVIDIA Cosmos™, introduzindo um modelo de raciocínio aberto e totalmente personalizável para desenvolvimento de IA física e dando aos desenvolvedores controle sem precedentes sobre a geração de mundos.
A NVIDIA também está lançando dois novos projetos — alimentados pelas plataformas NVIDIA Omniverse™ e Cosmos — que fornecem aos desenvolvedores mecanismos de geração de dados sintéticos massivos e controláveis para robôs pós-treinamento e veículos autônomos.
Líderes do setor, incluindo 1X, Agility Robotics, Figure AI, Foretellix, Skild AI e Uber estão entre os primeiros a adotar o Cosmos para gerar dados de treinamento mais ricos para IA física de forma mais rápida e em escala.
“Assim como os grandes modelos de linguagem (LLM) revolucionaram a IA generativa e os agentes de IA, os modelos de fundação do mundo Cosmos são um avanço para a IA física”, diz Jensen Huang, fundador e CEO da NVIDIA. “O Cosmos apresenta um modelo de raciocínio aberto e totalmente personalizável para IA física e desbloqueia oportunidades para avanços de função de passo na robótica e nas indústrias físicas.”
“A IA física já está sendo, e será ainda mais transformadora para todo o mercado. Estamos falando daquilo que até pouco tempo só existia na idealização e na expectativa. Vivemos um momento em que essas ideias, enfim saem do campo dos planejamentos e protótipos para alcançarem todos os mercados. Isso realmente incrível”, comenta Marcio Aguiar, diretor da divisão Enterprise da NVIDIA para América Latina.
Cosmos Transfer para geração de dados sintéticos
Os WFMs do Cosmos Transfer ingerem entradas de vídeo estruturadas, como mapas de segmentação, mapas de profundidade, varreduras, mapas de estimativa de pose e mapas de trajetória para gerar saídas de vídeo fotorrealistas controláveis.
O Cosmos Transfer simplifica o treinamento de IA de percepção, transformando simulações 3D ou informações básicas criadas no Omniverse em vídeos fotorrealistas para geração de dados sintéticos controláveis em larga escala.
A Agility Robotics será uma das primeiras a adotar o Cosmos Transfer e o Omniverse para geração de dados sintéticos em larga escala para treinar seus modelos de robôs.
“O Cosmos nos oferece uma oportunidade de escalar nossos dados de treinamento fotorrealístas além do que podemos coletar de forma viável no mundo real”, afirma Pras Velagapudi, diretor de tecnologia da Agility Robotics. “Estamos animados para ver que novo desempenho podemos desbloquear com a plataforma, enquanto aproveitamos ao máximo os dados de simulação baseados em física que já temos.”
O NVIDIA Omniverse Blueprint para simulação de veículos autônomos usa o Cosmos Transfer para amplificar variações de dados de sensores baseados em física. Com o blueprint, a Foretellix pode aprimorar cenários comportamentais variando condições como clima e iluminação para diversos conjuntos de dados de direção. A Parallel Domain também está usando o blueprint para aplicar variações semelhantes à sua simulação de sensor.
O NVIDIA GR00T Blueprint para geração de movimento de manipulação sintética combina Omniverse e Cosmos Transfer para gerar diversos conjuntos de dados em escala, beneficiando-se de simulações baseadas em OpenUSD e reduzindo o tempo de coleta e aumento de dados de dias para horas.
Cosmos Predict para geração de mundo inteligente
Anunciado na feira CES em janeiro, os WFMs Cosmos Predict geram estados de mundo virtual a partir de entradas multimodais como texto, imagens e vídeo. Os novos modelos Cosmos Predict permitirão a geração de vários quadros, prevendo ações intermediárias ou trajetórias de movimento quando forem fornecidas imagens de entrada de início e fim. Construídos especificamente para pós-treinamento, esses modelos podem ser personalizados usando o conjunto de dados de IA física disponível abertamente da NVIDIA.
Com o poder de computação de inferência dos sistemas NVIDIA Grace Blackwell NVL72 e seu grande domínio NVIDIA NVLink™ , os desenvolvedores podem obter geração de mundo em tempo real.
A 1X está usando o Cosmos Predict e o Cosmos Transfer para treinar seu novo robô humanoide NEO Gamma. A desenvolvedora de cérebros de robôs Skild AI está usando o Cosmos Transfer para aumentar conjuntos de dados sintéticos para seus robôs. Além disso, a Nexar e a Oxa estão usando o Cosmos Predict para avançar seus sistemas de direção autônoma.
Raciocínio multimodal para IA física
O Cosmos Reason é um WFM aberto e totalmente personalizável com consciência espaço-temporal que usa raciocínio de cadeia de pensamento para entender dados de vídeo e prever os resultados de interações — como uma pessoa pisando na faixa de pedestres ou uma caixa caindo de uma prateleira — em linguagem natural.
Os desenvolvedores podem usar o Cosmos Reason para melhorar a anotação e curadoria de dados de IA física, aprimorar modelos de fundação de mundo existentes ou criar novos modelos de ação de linguagem de visão. Eles também podem pós treiná-lo para construir planejadores de alto nível para dizer à IA física o que ela precisa fazer para concluir uma tarefa.
Acelerando a curadoria de dados e o pós-treinamento para IA física
Com base em suas tarefas posteriores, os desenvolvedores podem pós-treinar os Cosmos WFMs usando scripts PyTorch nativos ou a estrutura NVIDIA NeMo ™ no NVIDIA DGX™ Cloud.
Os desenvolvedores do Cosmos também podem usar o NVIDIA NeMo Curator no DGX Cloud para processamento e curadoria de dados acelerados. A Linker Vision e a Milestone Systems estão usando-o para curar grandes quantidades de dados de vídeo para treinar grandes modelos de linguagem (LLM) de visão para agentes visuais construídos no NVIDIA AI Blueprint para pesquisa e sumarização de vídeo . A Virtual Incision está explorando-o para ser implantado em futuros robôs cirúrgicos, enquanto a Uber e a Waabi estão avançando no desenvolvimento de veículos autônomos.
Impulsionando IA responsável e transparência de conteúdo
Em linha com os princípios de IA confiáveis da NVIDIA, a NVIDIA impõe guardrails abertos em todos os Cosmos WFMs. Além disso, a NVIDIA está colaborando com o Google DeepMind para integrar o SynthID para marcar d’água e ajudar a identificar saídas geradas por IA do microsserviço Cosmos WFM NVIDIA NIM™ apresentado em build.nvidia.com.
Disponibilidade
Os Cosmos WFMs estão disponíveis para visualização no catálogo da API da NVIDIA e agora listados no Vertex AI Model Garden no Google Cloud. O Cosmos Predict e o Cosmos Transfer estão disponíveis abertamente no Hugging Face e no GitHub . O Cosmos Reason está disponível em acesso antecipado.
Saiba mais assistindo à palestra principal do NVIDIA GTC e registrando-se para as sessões e treinamentos do Cosmos da NVIDIA e líderes do setor na feira, incluindo “Uma introdução aos modelos da Cosmos World Foundation” com Ming-Yu Liu, vice-presidente de pesquisa de IA generativa da NVIDIA.
Sobre a NVIDIA
Desde sua fundação em 1993, a NVIDIA (NASDAQ: NVDA) tem sido pioneira em computação acelerada. A invenção da GPU pela empresa em 1999 estimulou o crescimento do mercado de games para PC, redefiniu a computação gráfica, iniciou a era da IA moderna e tem ajudado a digitalização industrial em todos os mercados. A NVIDIA agora é uma empresa de infraestrutura de computação full-stack com soluções em escala de data center que estão revolucionando o setor. Mais informações em: https://www.nvidia.com/pt-br/.
Acesse também:
Facebook: @NVIDIABrasil
Twitter: @NVIDIABrasil
YouTube: NVIDIA Latinoamérica
Instagram: @NVIDIABrasil
LinkedIn: @ NVIDIA Brasil
Informações para a Imprensa (NVIDIA):
Sing Comunicação de Resultados
Larissa Nato, Welton Ramos, Isadora Fernandes, Janaína Leme e Vânia Gracio
nvidia@singcomunica.com.br
(11) 5091-7838
Certas declarações neste press release, incluindo, mas não se limitando a, declarações sobre: os benefícios, impacto, disponibilidade e desempenho dos produtos, serviços e tecnologias da NVIDIA; terceiros adotando produtos e tecnologias da NVIDIA e os benefícios e impactos deles; e Cosmos abrindo oportunidades para avanços de função de passo em robótica e nas indústrias físicas são declarações prospectivas que estão sujeitas a riscos e incertezas que podem fazer com que os resultados sejam materialmente diferentes das expectativas. Fatores importantes que podem fazer com que os resultados reais sejam materialmente diferentes incluem: condições econômicas globais; nossa dependência de terceiros para fabricar, montar, embalar e testar nossos produtos; o impacto do desenvolvimento tecnológico e da concorrência; desenvolvimento de novos produtos e tecnologias ou melhorias em nossos produtos e tecnologias existentes; aceitação de mercado de nossos produtos ou produtos de nossos parceiros; defeitos de design, fabricação ou software; mudanças nas preferências ou demandas do consumidor; mudanças nos padrões e interfaces da indústria; perda inesperada de desempenho de nossos produtos ou tecnologias quando integrados em sistemas; bem como outros fatores detalhados de tempos em tempos nos relatórios mais recentes que a NVIDIA arquiva na Securities and Exchange Commission, ou SEC, incluindo, mas não se limitando a, seu relatório anual no Formulário 10-K e relatórios trimestrais no Formulário 10-Q. Cópias dos relatórios arquivados na SEC são publicadas no site da empresa e estão disponíveis na NVIDIA sem custo. Essas declarações prospectivas não são garantias de desempenho futuro e falam apenas a partir da data deste documento e, exceto conforme exigido por lei, a NVIDIA se isenta de qualquer obrigação de atualizar essas declarações prospectivas para refletir eventos ou circunstâncias futuras.
© 2025 NVIDIA Corporation. Todos os direitos reservados. NVIDIA, o logotipo NVIDIA, NVIDIA Cosmos, NVIDIA DGX, NVIDIA NeMo, NVIDIA NIM, NVIDIA Omniverse e NVLink são marcas comerciais e/ou marcas registradas da NVIDIA Corporation nos EUA e em outros países. Outros nomes de empresas e produtos podem ser marcas comerciais das respectivas empresas às quais estão associados. Recursos, preços, disponibilidade e especificações estão sujeitos a alterações sem aviso prévio.
Notícia distribuída pela saladanoticia.com.br. A Plataforma e Veículo não são responsáveis pelo conteúdo publicado, estes são assumidos pelo Autor(a):
LUIZ FERNANDO VALLOTO
lvalloto@singcomunica.com.br