LĂderes de pensamento
Novas fronteiras em IA generativa â longe da nuvem

No inĂcio existia a internet, que mudou nossas vidas para sempre â a forma como nos comunicamos, fazemos compras, conduzimos negĂłcios. E entĂŁo, por razĂ”es de latĂȘncia, privacidade e economia, a Internet migrou para a borda da rede, dando origem Ă âInternet das coisasâ.
Agora existe a inteligĂȘncia artificial, que torna tudo o que fazemos na internet mais fĂĄcil, mais personalizado, mais inteligente. Para utilizĂĄ-lo, porĂ©m, sĂŁo necessĂĄrios grandes servidores e alta capacidade computacional, por isso fica confinado Ă nuvem. Mas as mesmas motivaçÔes â latĂȘncia, privacidade, eficiĂȘncia de custos â levaram empresas como a Hailo a desenvolver tecnologias que permitem a IA no limite.
Sem dĂșvida, a prĂłxima grande novidade Ă© IA generativa. A IA generativa apresenta um enorme potencial em todos os setores. Ele pode ser usado para agilizar o trabalho e aumentar a eficiĂȘncia de vĂĄrios criadores â advogados, redatores de conteĂșdo, designers grĂĄficos, mĂșsicos e muito mais. Pode ajudar a descobrir novos medicamentos terapĂȘuticos ou auxiliar em procedimentos mĂ©dicos. A IA generativa pode melhorar a automação industrial, desenvolver novos cĂłdigos de software e aumentar a segurança do transporte por meio da sĂntese automatizada de vĂdeo, ĂĄudio, imagens e muito mais.
No entanto, a IA generativa tal como existe hoje Ă© limitada pela tecnologia que a permite. Isso ocorre porque a IA generativa acontece na nuvem â grandes centros de dados com processadores de computador caros e que consomem energia, muito distantes dos usuĂĄrios reais. Quando alguĂ©m emite um aviso para uma ferramenta generativa de IA como o ChatGPT ou alguma nova solução de videoconferĂȘncia baseada em IA, a solicitação Ă© transmitida pela Internet para a nuvem, onde Ă© processada pelos servidores antes que os resultados sejam retornados pela rede.
Ă medida que as empresas desenvolvem novas aplicaçÔes para IA generativa e as implementam em diferentes tipos de dispositivos â cĂąmaras de vĂdeo e sistemas de segurança, robĂŽs industriais e pessoais, computadores portĂĄteis e atĂ© automĂłveis â a nuvem Ă© um estrangulamento em termos de largura de banda, custo e conectividade.
E para aplicaçÔes como assistĂȘncia ao motorista, software de computador pessoal, videoconferĂȘncia e segurança, a movimentação constante de dados em uma rede pode ser um risco Ă privacidade.
A solução é permitir que esses dispositivos processem IA generativa no Beira. Na verdade, a IA generativa baseada na borda pode beneficiar muitas aplicaçÔes emergentes.
IA generativa em ascensĂŁo
Considere que em junho, Mercedes-Benz disse introduziria o ChatGPT em seus carros. Em um Mercedes aprimorado pelo ChatGPT, por exemplo, um motorista poderia pedir ao carro â com as mĂŁos livres â uma receita de jantar baseada em ingredientes que jĂĄ tem em casa. Isto Ă©, se o carro estiver conectado Ă internet. Em um estacionamento ou local remoto, todas as apostas estĂŁo canceladas.
Nos Ășltimos anos, a videoconferĂȘncia tornou-se uma segunda natureza para a maioria de nĂłs. As empresas de software jĂĄ estĂŁo integrando formas de IA em soluçÔes de videoconferĂȘncia. Talvez seja para otimizar a qualidade de ĂĄudio e vĂdeo rapidamente ou para âcolocarâ pessoas no mesmo espaço virtual. Agora, videoconferĂȘncias generativas alimentadas por IA podem criar automaticamente atas de reuniĂ”es ou obter informaçÔes relevantes de fontes da empresa em tempo real, Ă medida que diferentes tĂłpicos sĂŁo discutidos.
No entanto, se um carro inteligente, um sistema de videoconferĂȘncia ou qualquer outro dispositivo de ponta nĂŁo conseguir chegar Ă nuvem, a experiĂȘncia de IA generativa nĂŁo poderĂĄ acontecer. Mas e se eles nĂŁo precisassem? Parece uma tarefa difĂcil, considerando o enorme processamento da IA ââna nuvem, mas agora estĂĄ se tornando possĂvel.
IA generativa no Edge
Jå existem ferramentas generativas de IA, por exemplo, que podem criar automaticamente apresentaçÔes em PowerPoint ricas e envolventes. Mas o usuårio precisa que o sistema funcione de qualquer lugar, mesmo sem conexão com a internet.
Da mesma forma, jĂĄ estamos vendo uma nova classe de assistentes âcopilotosâ generativos baseados em IA que mudarĂŁo fundamentalmente a forma como interagimos com nossos dispositivos de computação, automatizando muitas tarefas rotineiras, como a criação de relatĂłrios ou a visualização de dados. Imagine abrir um laptop, o laptop reconhecendo vocĂȘ atravĂ©s de sua cĂąmera e, em seguida, gerando automaticamente um curso de ação para o dia/semana/mĂȘs com base nas ferramentas mais usadas, como Outlook, Teams, Slack, Trello, etc. privacidade e uma boa experiĂȘncia do usuĂĄrio, vocĂȘ deve ter a opção de executar IA generativa localmente.
AlĂ©m de enfrentar os desafios de conexĂ”es nĂŁo confiĂĄveis ââe privacidade de dados, a IA de ponta pode ajudar a reduzir as demandas de largura de banda e melhorar o desempenho dos aplicativos. Por exemplo, se uma aplicação generativa de IA estiver criando conteĂșdo rico em dados, como um espaço de conferĂȘncia virtual, por meio da nuvem, o processo poderĂĄ atrasar dependendo da largura de banda disponĂvel (e cara). E certos tipos de aplicaçÔes generativas de IA, como segurança, robĂłtica ou saĂșde, exigem respostas de alto desempenho e baixa latĂȘncia que as conexĂ”es em nuvem nĂŁo conseguem suportar.
Na segurança por vĂdeo, a capacidade de reidentificar pessoas Ă medida que elas se movem entre muitas cĂąmeras â algumas colocadas onde as redes nĂŁo conseguem alcançå-las â requer modelos de dados e processamento de IA nas cĂąmeras reais. Nesse caso, a IA generativa pode ser aplicada a descriçÔes automatizadas do que as cĂąmeras veem por meio de consultas simples como âEncontre a criança de 8 anos com camiseta vermelha e bonĂ© de beisebolâ.
Ă isso que o IA generativa na borda.
Desenvolvimentos em Edge AI
AtravĂ©s da adoção de uma nova classe de processadores de IA e do desenvolvimento de modelos de dados de IA generativos mais enxutos e eficientes, embora nĂŁo menos poderosos, os dispositivos de borda podem ser projetados para operar de forma inteligente onde a conectividade em nuvem Ă© impossĂvel ou indesejĂĄvel.
Ă claro que o processamento em nuvem continuarĂĄ a ser um componente crĂtico da IA ââgenerativa. Por exemplo, os modelos de IA de treinamento permanecerĂŁo na nuvem. Mas o ato de aplicar informaçÔes do usuĂĄrio a esses modelos, chamado de inferĂȘncia, pode â e em muitos casos deveria â acontecer no limite.
A indĂșstria jĂĄ estĂĄ desenvolvendo modelos de IA mais enxutos, menores e mais eficientes que podem ser carregados em dispositivos de ponta. Empresas como Hailo fabricar processadores de IA projetados especificamente para realizar processamento de redes neurais. Esses processadores de redes neurais nĂŁo apenas lidam com modelos de IA de forma incrivelmente rĂĄpida, mas tambĂ©m o fazem com menos energia, tornando-os energeticamente eficientes e aptos para uma variedade de dispositivos de ponta, de smartphones a cĂąmeras.
O processamento de IA generativa na borda também pode equilibrar efetivamente cargas de trabalho crescentes, permitir que os aplicativos sejam escalonados de forma mais eståvel, aliviar os data centers em nuvem do processamento dispendioso e ajudå-los a reduzir sua pegada de carbono.
A IA generativa estĂĄ preparada para mudar a computação novamente. No futuro, o LLM do seu laptop poderĂĄ ser atualizado automaticamente da mesma forma que o seu sistema operacional faz hoje â e funcionar da mesma maneira. Mas para chegar lĂĄ, precisaremos habilitar o processamento generativo de IA na borda da rede. O resultado promete ser maior desempenho, eficiĂȘncia energĂ©tica, alĂ©m de privacidade e segurança. Tudo isto leva a aplicaçÔes de IA que mudam o mundo tanto quanto a prĂłpria IA generativa.