Connect with us

Líderes de pensamento

Dados Gerados por Jogos Pode Ser o Recurso Mais Subestimado no Treinamento de IA

mm

As empresas de IA gastaram os últimos cinco anos consumindo todos os textos, imagens e fragmentos de dados publicamente disponíveis na internet. Esse suprimento é finito, e estamos nos aproximando do ponto em que simplesmente não haverá dados suficientes para sustentar o ritmo de progresso que depende dele.

No entanto, há um candidato óbvio que a indústria de IA tem largamente desprezado.

Eu construo sistemas de jogos para ganhar a vida, e os dados que fluem por meio deles todos os dias são diferentes de qualquer coisa que a maioria dos pesquisadores de IA já trabalhou. E, no entanto, quase ninguém fora do setor de jogos parece estar prestando atenção neles.

As plataformas de jogos geram terabytes de dados comportamentais todos os dias, fluxos estruturados de decisões em tempo real, atividade econômica e interação social, todos dentro de ambientes construídos com base em regras físicas consistentes.

Quase nenhum desses dados foi usado para treinamento de IA. E as empresas que os usaram, desde a DeepMind até a NVIDIA, produziram alguns dos avanços mais significativos no campo.

O problema de dados da IA

Um estudo da Epoch AI projeta que o estoque de dados de texto humanos gerados publicamente disponíveis será totalmente utilizado em algum lugar entre 2026 e 2032. Os modelos por trás do ChatGPT, Gemini e Claude já consumiram essencialmente tudo o que a internet tem a oferecer.

Os dados sintéticos ou textos que a IA gera para alimentar a própria IA são a solução de contorno da indústria. Mas os modelos treinados com sua própria saída se deterioram com o tempo por meio de um fenômeno documentado que os pesquisadores chamam de colapso do modelo.

O que eu acredito que o campo precisa é de informações ricas, interativas e multimodais, onde causa e efeito acontecem em tempo real e cada ação tem uma consequência mensurável. Os jogos produzem exatamente isso, e o fazem em uma escala que quase nada mais pode igualar.

As plataformas de jogos empurram terabytes de dados comportamentais por meio de seus sistemas todos os dias. Movimentos dos jogadores, escolhas estratégicas, tempos de reação, transações econômicas e interações sociais fluem por meio de fluxos estruturados e cronometrados que a maioria dos pesquisadores de IA nunca tocou.

Um artigo acadêmico recente sobre dados gerados por jogos apresenta uma taxonomia de nove categorias dessas informações e argumenta que a grande maioria delas permanece completamente inexplorada pela indústria de IA.

Posso confirmar isso com base na minha própria experiência. A quantidade de dados que flui por meio de nossos sistemas de jogos em qualquer dia seria considerada um tesouro em qualquer outra área de pesquisa de IA. Nos jogos, ele simplesmente é arquivado ou descartado.

Por que os dados de jogos são diferentes

Quando você constrói dentro de um mecanismo de jogo por muito tempo, começa a perceber quanto dados estruturados você está sentado que ninguém em IA pediu ainda. Cada sessão produz física sincronizada, comportamento do jogador e causa e efeito ao nível do sistema em uma escala que é difícil de encontrar em qualquer outro lugar.

Os mecanismos de jogo impõem física. Os objetos caem, colidem e quebram de acordo com regras consistentes, o que significa que os dados carregam relações causais incorporadas no nível do sistema, em vez de padrões que um modelo precisa adivinhar a partir de correlações de texto.

Quando um jogador lança um projétil, o mecanismo calcula a trajetória, a resistência do vento e o impacto. A IA aprende com um ambiente que demonstra física diretamente por meio de cada interação, em vez de um que trata leis físicas como aproximações estatísticas.

Há também o problema de alinhamento multimodal. Em um jogo, dados visuais, sinais de áudio, entradas do jogador e estado ambiental ocorrem simultaneamente e são registrados juntos. Esse tipo de sincronização natural custa uma fortuna para replicar em conjuntos de dados do mundo real, onde os pesquisadores normalmente têm que rotular e alinhar cada modalidade manualmente.

Os jogos produzem casos de bordo em escala, também, por meio da geração de conteúdo procedural. No Man’s Sky tem 18 quintilhões de planetas únicos, e para a IA, essa variação é enormemente importante porque os casos de bordo determinam se um modelo funciona de forma confiável ou falha perigosamente.

E então há a complexidade emergente, que pode ser a propriedade mais valiosa de todas. Quando a OpenAI colocou agentes em um jogo simples de esconde-esconde, esses agentes desenvolveram seis fases distintas de estratégia sofisticada inteiramente por conta própria ao longo de centenas de milhões de rodadas.

Eles construíram abrigos a partir de objetos móveis, usaram rampas para romper fortificações e até exploraram glitches de física para surfar caixas sobre paredes. Nada disso foi programado. Tudo emergiu da competição dentro do ambiente do jogo, sem uma única linha de código que os instruísse a fazer qualquer coisa.

Esse tipo de complexidade auto-gerada é exatamente o que a pesquisa de IA precisa em escala, e os jogos são os únicos ambientes que a produzem de forma confiável sem supervisão humana cara.

De tabuleiros de jogos a prêmios Nobel

A prova mais clara de que a IA treinada em jogos se transfere para o mundo real é um sistema que foi premiado com um Prêmio Nobel, e é o exemplo ao qual eu sempre volto quando as pessoas me perguntam por que construí minha carreira em torno de jogos e IA.

A DeepMind começou com o AlphaGo em 2016, então construiu o AlphaZero, um sistema que se ensinou a jogar xadrez, Go e shogi sem conhecimento humano. A arquitetura do AlphaZero se tornou a base para o AlphaFold, que resolveu o problema de dobramento de proteínas de 50 anos e rendeu aos seus criadores o Prêmio Nobel de Química de 2024.

O CEO da DeepMind, Demis Hassabis, foi aberto sobre essa pipeline. Ele disse à Scientific American que os jogos nunca foram o objetivo final, mas sim a forma mais eficiente de desenvolver e testar técnicas de IA antes de aplicá-las a problemas científicos reais.

Lembro-me de ler isso e sentir como se alguém tivesse articulado exatamente o que eu vinha vendo de dentro do desenvolvimento de jogos por anos.

Essa trajetória se repetiu desde então em todo o campo. Os ambientes de aprendizado por reforço que a OpenAI padronizou primeiro por meio do Gymnasium agora sustentam pesquisas em robótica, veículos autônomos e automação industrial.

A estrutura de jogo do agente, ambiente, ação e recompensa começou como uma conveniência de pesquisa e desde então se tornou o quadro padrão para qualquer sistema de IA que precise agir no mundo físico.

Jogos como a nova camada de simulação

Em dezembro de 2025, a NVIDIA lançou o NitroGen, um modelo de base treinado em 40.000 horas de jogo em mais de 1.000 títulos. O modelo assiste a vídeos de jogo publicamente disponíveis, extrai ações do jogador de sobreposições de controle e aprende a jogar jogos diretamente a partir de pixels brutos.

Em jogos que nunca havia encontrado, o NitroGen mostrou uma melhoria de até 52% no sucesso da tarefa em comparação com modelos treinados do zero. Mas a verdadeira significância reside na arquitetura por baixo.

O NitroGen roda na estrutura de robótica GR00T da NVIDIA, a mesma base que a empresa usa para IA física e transferência sim-to-real em sua plataforma Isaac Sim. O agente de jogo e o robô de fábrica compartilham o mesmo sistema subjacente.

O Jim Fan da NVIDIA descreveu o projeto como uma tentativa de construir “um GPT para ações”, um modelo de propósito geral que aprende a operar em qualquer ambiente.

Como alguém que constrói sistemas de jogos que geram exatamente o tipo de dados que esses modelos consomem, encontro difícil superestimar o que isso significa para a indústria em que trabalho.

E isso não se limita à NVIDIA. A Waymo registrou mais de 20 bilhões de milhas simuladas para treinar seus veículos autônomos, todos em ambientes de estilo de mecanismo de jogo que ensaiam cenários perigosos ou raros demais para testar em estradas reais.

Plataformas cirúrgicas construídas em mecanismos de jogo mostraram melhorias dramáticas no desempenho dos treinados. Planejadores urbanos usam ferramentas semelhantes para otimização de tráfego em escala de cidade.

Plataformas cirúrgicas construídas em mecanismos de jogo mostraram melhorias dramáticas no desempenho dos treinados. Planejadores urbanos usam ferramentas semelhantes para otimização de tráfego em escala de cidade. O mecanismo de jogo se tornou uma camada de simulação universal em qualquer lugar onde a IA precise aprender por meio da interação com o ambiente.

A infraestrutura sobre a qual ninguém fala

Quando as pessoas discutem infraestrutura de IA, elas tendem a significar centros de dados, clusters de GPU e computação. Em todos os anos que trabalhei em jogos, posso contar no dedo o número de vezes que ouvi alguém no espaço de IA mencionar ambientes de jogo na mesma respiração. Essa desconexão vai fechar muito rapidamente.

Isso se tornará ainda mais óbvio à medida que os conjuntos de dados tradicionais se esgotarem. As indústrias que produzem as informações interativas mais ricas inevitavelmente se moverão para o centro da pesquisa de IA, e jogos, simulações e mundos virtuais estão melhor posicionados do que qualquer outra coisa para preencher essa lacuna.

O dinheiro já está seguindo essa tendência. A IA no setor de jogos foi avaliada em 4,54 bilhões de dólares em 2025 e está projetada para atingir 81 bilhões de dólares até 2035.

A maioria dos estúdios de jogos com os quais falo ainda se considera empresas de entretenimento. Mas quando seus sistemas geram exatamente os dados que a próxima geração de modelos de IA precisa para treinar, você está no ramo de infraestrutura, querendo ou não.

Ilman Shazhaev é o Fundador e CEO da Dizzaract, o maior estúdio de jogos na região do MENA. Ele é um pesquisador de IA e especialista das Nações Unidas no programa da UNODC, trabalhando na interseção da inteligência artificial e do impacto no mundo real.