AGI

Quem está vencendo a corrida de IA em 2024? A corrida de Big Tech para AGI

Publicado em 8 de agosto de 2024

Atualizado em 21 de maio de 2026

Por

Aayush Mittal Mittal

Who is Winning the AI Race? Big Tech's Race to AGI

div]:bg-bg-300 [&_pre]:-mr-4 md:[&_pre]:-mr-9″>

_*]:min-w-0″>

A Inteligência Artificial (IA) se tornou o avanço tecnológico mais discutido desta década. À medida que empurramos os limites do que as máquinas podem fazer, o objetivo final para muitos gigantes da tecnologia é alcançar a Inteligência Artificial Geral (AGI) – uma forma hipotética de IA que pode entender, aprender e aplicar sua inteligência para resolver qualquer problema, assim como um cérebro humano.

A corrida para AGI não é apenas uma questão de supremacia tecnológica; é uma busca que pode redefinir a própria estrutura da nossa sociedade. As aplicações potenciais da AGI são vastas e transformadoras, variando desde a resolução de problemas globais complexos até a revolução de indústrias em todo o mundo. É por isso que as principais empresas de tecnologia do mundo estão investindo bilhões de dólares e incontáveis horas em pesquisa e desenvolvimento de IA.

Neste artigo, exploraremos os esforços dos principais jogadores na corrida de IA, incluindo Google, NVIDIA, Microsoft, OpenAI, Meta e outros. Discutiremos suas estratégias, conquistas e as abordagens únicas que estão adotando para empurrar os limites da tecnologia de IA.

Entendendo AGI

O que é AGI?

AGI, frequentemente descrita como o “Santo Graal” da inteligência artificial, é imaginada como um sistema capaz de realizar qualquer tarefa intelectual que um ser humano possa. No entanto, definir AGI provou ser tão elusivo quanto alcançá-la. Geoffrey Hinton, uma figura pioneira em IA, observa que, embora AGI seja um “conceito sério, embora mal definido“, há pouca concordância sobre o que exatamente envolve. Hinton prefere o termo “superinteligência” para descrever sistemas AGI que superariam as capacidades cognitivas humanas.

A Natureza Elusiva de AGI

Os principais gigantes da tecnologia, incluindo OpenAI, Google, Meta, Microsoft e Amazon, estão à frente desta corrida. Cada empresa traz suas forças e objetivos estratégicos únicos para a mesa. OpenAI, por exemplo, está profundamente comprometida em garantir que AGI, uma vez desenvolvida, beneficie toda a humanidade. A organização estabeleceu uma estrutura de governança onde sua diretoria decidirá quando seus sistemas terão alcançado AGI, um marco que terá um impacto significativo em sua parceria com a Microsoft.

Google

O Google está há muito tempo à frente da pesquisa e desenvolvimento de IA, com duas principais divisões impulsionando seus esforços: DeepMind e Google Brain.

A. DeepMind e seus feitos

DeepMind, adquirida pelo Google em 2014, foi responsável por alguns dos feitos mais revolucionários em IA. Seu AlphaGo programa famosamente derrotou o campeão mundial no complexo jogo de Go em 2016, um feito que muitos pensavam que estava décadas à frente. Isso foi seguido por AlphaZero, que alcançou desempenho super-humano em xadrez, shogi e Go por meio do aprendizado de reforço por autojogo.

Mais recentemente, a DeepMind fez progressos significativos no dobramento de proteínas com AlphaFold. Este sistema de IA pode prever estruturas de proteínas com precisão notável, potencialmente revolucionando a descoberta de drogas e nossa compreensão das doenças.

B. Google Brain e TensorFlow

O Google Brain, a equipe de pesquisa de IA da empresa, foi instrumental no desenvolvimento de ferramentas e frameworks que aceleraram a pesquisa de IA em todo o mundo. TensorFlow, uma biblioteca de aprendizado de máquina de código aberto desenvolvida pelo Google Brain, se tornou uma das ferramentas mais amplamente utilizadas para construir modelos de IA.

Google Brain também fez contribuições significativas para o processamento de linguagem natural com modelos como BERT (Bidirectional Encoder Representations from Transformers), que melhorou os resultados de busca do Google e as capacidades de compreensão de linguagem.

C. Desenvolvimentos recentes e planos futuros

O Google continua a empurrar os limites da IA com projetos como LaMDA (Language Model for Dialogue Applications), que visa tornar a IA conversacional mais natural e consciente do contexto. A empresa também tem trabalhado na integração da IA mais profundamente em seus produtos, desde a Pesquisa do Google até o Gmail e o Google Photos.

Em termos de hardware, o Google desenvolveu seus próprios chips de IA, chamados Tensor Processing Units (TPUs), otimizados para cargas de trabalho de aprendizado de máquina. Esses chips alimentam muitos dos serviços de IA do Google e também estão disponíveis para os clientes por meio do Google Cloud.

Olhando para o futuro, a estratégia de IA do Google parece focada em desenvolver sistemas de IA mais gerais e versáteis que possam lidar com uma ampla gama de tarefas, aproximando-se do conceito de AGI. A empresa também está fortemente investida em pesquisa em computação quântica.

O Papel da NVIDIA no Ecossistema de IA

Embora a NVIDIA possa não ser um nome familiar como o Google ou a Microsoft, ela desempenha um papel crucial no ecossistema de IA como o principal fornecedor de hardware que alimenta os cálculos de IA.

A. Domínio da GPU no hardware de IA

As Unidades de Processamento Gráfico (GPUs) da NVIDIA se tornaram o padrão de fato para treinar e executar modelos de IA. Originalmente projetadas para renderizar gráficos em jogos de vídeo, as GPUs se revelaram excepcionalmente adequadas para o processamento paralelo necessário nos cálculos de IA.

A receita do centro de dados da NVIDIA, impulsionada principalmente por vendas relacionadas à IA, tem crescido rapidamente. Em 2022, a empresa introduziu sua GPU H100, baseada na nova arquitetura Hopper, que promete melhorias significativas de desempenho para cargas de trabalho de IA.

B. Pilha de software de IA da NVIDIA

Além do hardware, a NVIDIA desenvolveu uma pilha de software abrangente para o desenvolvimento de IA. Isso inclui CUDA, uma plataforma de computação paralela e modelo de programação que permite aos desenvolvedores aproveitar o poder das GPUs da NVIDIA para processamento geral.

A NVIDIA também oferece ferramentas como cuDNN (CUDA Deep Neural Network library) e TensorRT, que otimizam o desempenho de aprendizado profundo em GPUs da NVIDIA. Essas ferramentas são amplamente utilizadas na comunidade de IA e contribuíram para a posição dominante da NVIDIA no mercado de hardware de IA.

C. Parcerias e colaborações

A NVIDIA formou parcerias estratégicas com muitas empresas de tecnologia líderes e instituições de pesquisa. Por exemplo, ela trabalha em estreita colaboração com fabricantes de veículos autônomos para fornecer soluções de IA para carros autodirigíveis. A empresa também colaborou com instituições de saúde para aplicar a IA em imagens médicas e descoberta de drogas.

Em 2022, a NVIDIA anunciou uma parceria com a Booz Allen Hamilton para desenvolver soluções de cibersegurança habilitadas por IA para o governo dos EUA e infraestrutura crítica. Isso destaca a crescente importância da IA em aplicações de segurança nacional e defesa.

Estratégia de IA da Microsoft

A Microsoft se posicionou estrategicamente como líder em IA, aproveitando parcerias e investindo em startups de IA-chave. O investimento de $13 bilhões da Microsoft em OpenAI forneceu à empresa acesso exclusivo aos modelos da OpenAI, que foram integrados a produtos da Microsoft, como GitHub Copilot e a plataforma Azure AI.

A. Azure AI e serviços de nuvem

A plataforma de nuvem da Microsoft, Azure, oferece uma ampla gama de serviços de IA que permitem que as empresas incorporem a IA em seus aplicativos. Esses serviços cobrem áreas como aprendizado de máquina, visão computacional, processamento de linguagem natural e reconhecimento de fala.

O Azure Machine Learning, um ambiente baseado em nuvem para treinar, implantar e gerenciar modelos de aprendizado de máquina, se tornou uma escolha popular para empresas que buscam implementar soluções de IA. A estratégia da Microsoft de fornecer ferramentas de IA fáceis de usar ajudou a democratizar o desenvolvimento de IA e acelerar sua adoção em várias indústrias.

B. Integração de IA em produtos da Microsoft

A Microsoft tem integrado consistentemente capacidades de IA em sua linha de produtos. No Microsoft 365 (anteriormente Office), a IA alimenta recursos como a composição inteligente no Outlook, o design automático de slides no PowerPoint e a análise de dados no Excel.

O Windows 11 viu uma maior integração de IA com recursos como os Windows Studio Effects, que usam a IA para borramento de fundo, contato visual e enquadramento automático em chamadas de vídeo. A empresa também introduziu recursos habilitados por IA em seu navegador Edge e no mecanismo de busca Bing, aproveitando modelos de linguagem grande para fornecer experiências de busca mais interativas e informativas.

Progresso Rápido da OpenAI

A OpenAI permanece como uma figura central no cenário de IA, particularmente com sua missão de desenvolver AGI. A empresa tem sido uma pioneira na criação de alguns dos modelos de linguagem mais avançados, incluindo GPT-4 e o próximo GPT-5. Os modelos da OpenAI não apenas lideram em termos de capacidade técnica, mas também em integração comercial, graças à sua parceria profunda com a Microsoft.

A ambição da OpenAI em relação à AGI é bem documentada, com o CEO Sam Altman afirmando que alcançar AGI representaria “a tecnologia mais poderosa que a humanidade já inventou“. A abordagem da empresa para o desenvolvimento de IA equilibra a inovação de ponta com um forte ênfase em considerações éticas e impacto social. No entanto, os altos custos associados ao treinamento de modelos grandes exigiram financiamento externo significativo, incluindo negociações com investidores como o governo dos Emirados Árabes Unidos para garantir até $7 trilhões para projetos futuros de fabricação de chips de IA

A. Série GPT e seu impacto

O feito mais notável da OpenAI foi o desenvolvimento da série GPT (Generative Pre-trained Transformer) de modelos de linguagem. O GPT-3, lançado em 2020, foi um divisor de águas no campo do processamento de linguagem natural, demonstrando uma capacidade sem precedentes de gerar texto similar ao humano.

O lançamento do GPT-4 em 2023 empurrou ainda mais os limites do que é possível com modelos de linguagem. O GPT-4 demonstrou capacidades de raciocínio aprimoradas, reduziu alucinações e conseguiu lidar com entradas multimodais (texto e imagens). Esses modelos encontraram aplicações em vários campos, desde criação de conteúdo até geração de código e atendimento ao cliente automatizado.

B. DALL-E e IA multimodal

Além da geração de texto, a OpenAI fez progressos significativos na geração de imagens com DALL-E. Este sistema de IA pode criar imagens únicas a partir de descrições de texto, demonstrando o potencial da IA em campos criativos. A última iteração, DALL-E 3, melhorou a qualidade e a precisão das imagens geradas, enquanto também introduziu recursos como pintura e fora da pintura.

Esses desenvolvimentos em IA multimodal – sistemas que podem trabalhar com diferentes tipos de dados, como texto e imagens – representam um passo significativo em direção a sistemas de IA mais gerais.

Iniciativas de IA da Meta

A Meta, sob a liderança do CEO Mark Zuckerberg, mudou seu foco para o desenvolvimento de Inteligência Artificial Geral (AGI). A estratégia da Meta envolve construir sistemas de AGI que possam realizar uma ampla gama de tarefas complexas tão bem ou melhor do que os humanos. Este objetivo ambicioso reflete a visão mais ampla da Meta de integrar IA avançada em todo o seu ecossistema de aplicativos e serviços.

Para apoiar esse esforço, a Meta está investindo pesadamente em poder computacional, com planos para reunir mais de 340.000 GPUs H100 da Nvidia até o final de 2024. Essa capacidade computacional imensa é crucial para treinar modelos de IA em larga escala, como LLaMA 3, que foi recentemente lançado.

A. PyTorch e contribuições de código aberto

Uma das contribuições mais significativas da Meta para a comunidade de IA foi o PyTorch, uma biblioteca de aprendizado de máquina de código aberto. O PyTorch ganhou adoção generalizada na comunidade de pesquisa devido à sua flexibilidade e facilidade de uso, particularmente para aplicações de aprendizado profundo.

Meta AI, a divisão de pesquisa de IA da empresa, publica regularmente sua pesquisa e lança ferramentas de código aberto, contribuindo para o ecossistema de IA mais amplo. Essa abordagem aberta ajudou a Meta a atrair talentos de IA de ponta e permanecer à frente na pesquisa de IA.

B. IA em mídia social e metaverso

A Meta aproveita a IA extensivamente em suas plataformas de mídia social (Facebook, Instagram, WhatsApp) para recomendação de conteúdo, direcionamento de anúncios e moderação de conteúdo. Os algoritmos de recomendação da empresa processam vastas quantidades de dados para personalizar as experiências dos usuários.

C. Avanços recentes e desafios

Em 2024, a Meta anunciou vários avanços em IA, incluindo o Segment Anything Model (SAM), um novo modelo de IA para segmentação de imagens que pode identificar e delinear objetos em imagens e vídeos com precisão notável. Eles também introduziram uma das LLMs de código aberto mais populares, chamada LLaMA (Large Language Model Meta AI).

No entanto, a Meta enfrentou desafios, particularmente na moderação de conteúdo. A empresa lutou para usar efetivamente a IA para combater a desinformação e o discurso de ódio em suas plataformas, destacando as complexidades de aplicar a IA a questões sociais reais.

Outros Jogadores Notáveis

A IBM continua a ser um jogador importante em IA com sua plataforma watsonx, que evoluiu significativamente desde sua criação. A IBM mudou seu foco para tornar a IA mais aberta, acessível e escalável para empresas. A plataforma watsonx agora inclui uma suíte de ferramentas de automação habilitadas por IA e capacidades de governança que permitem que as empresas integrem e gerenciem soluções de IA de forma mais eficaz em vários domínios, como operações de TI, cibersegurança e atendimento ao cliente.

Recentemente, a IBM introduziu capacidades de IA generativa para melhorar seus Serviços de Detecção e Resposta a Ameaças Gerenciados. Isso inclui um novo Assistente de Cibersegurança habilitado por IA projetado para agilizar e acelerar a investigação e a resposta a ameaças de segurança, aproveitando ainda mais as capacidades de IA mais amplas construídas na plataforma watsonx (IBM Newsroom) (IBM Newsroom).

A IBM também está fomentando parcerias estratégicas com empresas como AWS, Adobe, Meta e Salesforce para integrar suas soluções de IA em ecossistemas mais amplos, garantindo que suas tecnologias de IA sejam tanto versáteis quanto amplamente adotadas em várias indústrias (IBM TechXchange Community) (IBM – United States).

B. Serviços de IA da Amazon

A Amazon permanece como uma força dominante em IA por meio de sua plataforma Amazon Web Services (AWS), que fornece uma suíte abrangente de ferramentas de IA e aprendizado de máquina. O Amazon SageMaker da AWS é uma oferta-chave, permitindo que os desenvolvedores construam, treinem e implantem modelos de aprendizado de máquina em escala.

Além dos serviços de IA para empresas, a Amazon continua a inovar em produtos de IA para consumidores com Alexa, seu assistente virtual, que utiliza processamento de linguagem natural avançado e aprendizado de máquina para interagir com os usuários. O foco da empresa em integrar a IA de forma transparente em seus serviços de comércio eletrônico e nuvem a posicionou como líder no espaço de IA.

C. Abordagem de IA no Dispositivo da Apple

A abordagem única da Apple para a IA enfatiza o processamento no dispositivo para priorizar a privacidade do usuário. Isso é exemplificado por recursos como o Face ID e o uso mais amplo de modelos de aprendizado de máquina por meio do framework Core ML. O silício personalizado da Apple, incluindo os chips da série A e M, inclui motores neurais dedicados que alimentam tarefas de IA de forma eficiente nos dispositivos.

A empresa também melhorou suas ofertas de IA com melhorias no processamento de linguagem natural por meio do Siri e avanços na visão computacional com recursos como Live Text.

O que vem a seguir? O caminho para AGI

O caminho para AGI está repleto de desafios técnicos, éticos e regulatórios. À medida que os sistemas de IA se tornam mais avançados, as preocupações sobre seu impacto em empregos, privacidade e até direitos humanos estão crescendo. As empresas não estão apenas competindo para desenvolver IA mais poderosa, mas também estão lidando com como implantar essas tecnologias de forma responsável.

Por exemplo, o desenvolvimento do Med-PaLM pelo Google, um sistema de IA capaz de passar nos exames de licenciamento médico nos EUA, destaca o potencial da IA para revolucionar indústrias como a saúde. No entanto, também levanta questões sobre responsabilidade e confiança em decisões impulsionadas por IA.

A integração da IA pela Microsoft em sua suíte de produtos reflete uma tendência mais ampla de incorporar IA em ferramentas do dia a dia. Essa abordagem poderia democratizar a IA, tornando capacidades avançadas acessíveis a uma audiência mais ampla.

Insights do Podcast de Lex Fridman

O podcast de Lex Fridman fornece insights valiosos de algumas das principais vozes no campo. Uma discussão particularmente esclarecedora envolve Yann LeCun, Cientista Chefe de IA da Meta, que fala extensivamente sobre os desafios de desenvolver AGI. LeCun destaca as limitações dos modelos de IA atuais, particularmente os grandes modelos de linguagem (LLMs), na compreensão e interação com o mundo físico. Ele enfatiza que, embora os LLMs possam processar texto e gerar respostas, carecem da capacidade de compreender as complexidades da física intuitiva e do raciocínio de senso comum, que são cruciais para a verdadeira AGI. Essa lacuna destaca a necessidade contínua de avanços em IA que possam replicar a compreensão e a tomada de decisões humanas (Lex Fridman).

Em outro episódio, Sam Altman, CEO da OpenAI, discute as implicações mais amplas da AGI na sociedade. Altman enfatiza a importância de garantir que a AGI seja desenvolvida de uma maneira que alinhe com os valores e a ética humanos. Ele reconhece o imenso potencial da AGI para revolucionar indústrias e melhorar a vida humana, mas também destaca os riscos associados ao desenvolvimento de IA não controlado. As reflexões de Altman revelam o delicado equilíbrio que deve ser mantido entre inovação e segurança na busca por AGI (Lex Fridman).

Essas discussões ilustram que a corrida para AGI não é apenas um desafio técnico, mas também filosófico e ético. Essa perspectiva adiciona profundidade à compreensão de como empresas como Meta e OpenAI estão navegando no desenvolvimento de IA.

Conclusão: A Corrida de IA Está Apenas Começando

A corrida para desenvolver AGI é um desafio definidor de nosso tempo, com empresas como Google, Microsoft, OpenAI, Meta e Nvidia liderando a carga. Cada empresa traz suas forças e estratégias únicas para a mesa, contribuindo para um cenário em rápida evolução. À medida que a competição se intensifica, as implicações para a sociedade, a economia e a governança ética serão primordiais. A jornada em direção à AGI não é apenas sobre avanço tecnológico; é também sobre moldar um futuro onde a IA sirva aos melhores interesses da humanidade.

Aayush Mittal, Mittal

Eu passei os últimos cinco anos me imergindo no fascinante mundo de Aprendizado de Máquina e Aprendizado Profundo. Minha paixão e expertise me levaram a contribuir para mais de 50 projetos de engenharia de software diversificados, com um foco particular em IA/ML. Minha curiosidade contínua também me levou em direção ao Processamento de Linguagem Natural, um campo que estou ansioso para explorar mais.

Unite.AI