Líderes de pensamento
Como podemos usar Deep Learning com Pequenos Dados? – Líderes de Pensamento

Quando se trata de manter-se atualizado sobre as tendências emergentes de cibersegurança, o processo de acompanhar os desenvolvimentos recentes pode ser bastante tedioso, pois há muitas notícias para acompanhar. Nos dias de hoje, no entanto, a situação mudou drasticamente, pois os domínios de cibersegurança parecem girar em torno de duas palavras: deep learning.
Embora tenhamos sido inicialmente pegos de surpresa pela grande cobertura que o deep learning estava recebendo, logo ficou claro que o burburinho gerado pelo deep learning era bem merecido. De uma forma semelhante ao cérebro humano, o deep learning permite que um modelo de IA alcance resultados altamente precisos, realizando tarefas diretamente a partir de textos, imagens e áudio.
Até este ponto, era amplamente acreditado que o deep learning depende de um grande conjunto de dados, semelhante à magnitude de dados hospedados por gigantes do Vale do Silício, como o Google e o Facebook, para atingir o objetivo de resolver os problemas mais complicados dentro de uma organização. Contrariamente à crença popular, no entanto, as empresas podem aproveitar o poder do deep learning, mesmo com acesso a um conjunto de dados limitado.
Em uma tentativa de ajudar nossos leitores com o conhecimento necessário para equipar sua organização com deep learning, compilamos um artigo que mergulha fundo (sem intenção de trocadilho) em algumas das maneiras pelas quais as empresas podem utilizar os benefícios do deep learning, apesar de terem acesso a um conjunto de dados limitado ou “pequeno”.
Mas antes de podermos entrar no mérito do artigo, gostaríamos de fazer uma sugestão pequena, mas altamente essencial: comece simples. No entanto, antes de começar a formular redes neurais complexas o suficiente para serem apresentadas em um filme de ficção científica, comece experimentando com alguns modelos simples e convencionais (por exemplo, random forest) para se familiarizar com o software.
Com isso fora do caminho, vamos direto para algumas das maneiras pelas quais as empresas podem amalgamar a tecnologia de deep learning, enquanto têm acesso a um conjunto de dados limitado.
#1 – Ajuste fino do modelo de linha de base:
Como já mencionamos acima, o primeiro passo que as empresas precisam dar após terem formulado um modelo de deep learning simples é ajustá-lo para o problema específico em questão.
No entanto, ajustar um modelo de linha de base soa muito mais difícil no papel do que na prática. A ideia fundamental por trás do ajuste fino de um grande conjunto de dados para atender às necessidades específicas de uma empresa é simples: você pega um grande conjunto de dados que tenha alguma semelhança com o domínio em que atua e, em seguida, ajusta os detalhes do conjunto de dados original com seus dados limitados.
Quanto à obtenção do grande conjunto de dados, os proprietários de empresas podem confiar no ImageNet, que também fornece uma solução fácil para problemas de classificação de imagens. O conjunto de dados hospedado pelo ImageNet permite que as organizações acessem milhões de imagens, que são divididas em várias classes de imagens, o que pode ser útil para empresas de uma ampla variedade de domínios, incluindo, mas não se limitando a, imagens de animais, etc.
Se o processo de ajuste fino de um modelo pré-treinado para atender às necessidades específicas de sua organização ainda parecer muito trabalho para você, recomendamos procurar ajuda na internet, pois uma simples pesquisa no Google fornecerá centenas de tutoriais sobre como ajustar um conjunto de dados.
#2 – Coletar mais dados:
Embora o segundo ponto da nossa lista possa parecer redundante para alguns de nossos leitores mais céticos, o fato é que, quando se trata de deep learning, quanto maior for o seu conjunto de dados, mais provável é que você alcance resultados mais precisos.
Embora a essência deste artigo seja fornecer às empresas com um conjunto de dados limitado as informações necessárias, já tivemos o desprazer de encontrar muitos “superiores” que tratam o investimento na coleta de dados como um pecado capital.
É muito comum que as empresas ignorem os benefícios oferecidos pelo deep learning, simplesmente porque estão relutantes em investir tempo e esforço na coleta de dados. Se sua empresa não tem certeza sobre a quantidade de dados que precisa coletar, sugerimos plotar curvas de aprendizado, à medida que os dados adicionais são integrados ao modelo, e observar a mudança no desempenho do modelo.
Contrariamente à crença popular mantida pela maioria dos CSO e CISO, às vezes a melhor maneira de resolver problemas é coletando mais dados relevantes. O papel do CSO e CISO é extremamente importante neste caso, pois há sempre a ameaça de ataques cibernéticos. Foi constatado que, em 2019, o gasto total global em cibersegurança chegou a $103,1 bilhões, e o número continua a crescer. Para colocar isso em perspectiva, vamos considerar um exemplo simples: imagine que você estivesse tentando classificar diamantes raros, mas tem acesso a um conjunto de dados muito limitado. Como a solução mais óbvia para o problema, em vez de se divertir com o modelo de linha de base, basta coletar mais dados!
#3 – Aumento de dados:
Embora os dois primeiros pontos que discutimos acima sejam altamente eficazes para fornecer uma solução fácil para a maioria dos problemas que cercam a implementação do deep learning em empresas com um conjunto de dados pequeno, eles dependem fortemente de um certo nível de sorte para resolver o problema.
Se você não tiver sucesso em ajustar um conjunto de dados pré-existente, recomendamos tentar o aumento de dados. A maneira como o aumento de dados funciona é simples: o conjunto de dados de entrada é alterado ou aumentado de tal forma que fornece um novo resultado, sem alterar o valor da etiqueta.
Para colocar a ideia de aumento de dados em perspectiva para nossos leitores, vamos considerar uma imagem de um cão. Quando rotacionada, o espectador da imagem ainda poderá dizer que é uma imagem de um cão. É exatamente o que o bom aumento de dados espera alcançar, em comparação com uma imagem rotacionada de uma estrada, que muda o ângulo de elevação e deixa muito espaço para o algoritmo de deep learning chegar a uma conclusão incorreta e derrotar o propósito de implementar o deep learning em primeiro lugar.
Quando se trata de resolver problemas relacionados à classificação de imagens, o aumento de dados serve como um jogador fundamental no campo e hospeda uma variedade de técnicas de aumento de dados que ajudam o modelo de deep learning a obter uma compreensão aprofundada das diferentes classificações de imagens.
Além disso, quando se trata de aumentar os dados, as possibilidades são virtualmente ilimitadas. As empresas podem implementar o aumento de dados de várias maneiras, que incluem NLP e experimentação de GANs, o que permite que o algoritmo gere novos dados.
#4 – Implementação de um efeito de ensemble:
A tecnologia por trás do deep learning dicta que a rede é construída sobre várias camadas. No entanto, contrariamente à crença popular mantida por muitos, em vez de ver cada camada como uma “hierarquia sempre crescente” de recursos, a última camada serve ao propósito de oferecer um mecanismo de ensemble.
A crença de que as empresas com acesso a um conjunto de dados limitado ou pequeno devem optar por construir suas redes profundas também foi compartilhada em um artigo do NIPs, que refletiu a crença que expressamos acima. As empresas com pequenos conjuntos de dados podem facilmente manipular o efeito de ensemble a seu favor, simplesmente construindo suas redes de deep learning profundas, por meio do ajuste fino ou de alguma outra alternativa.
#5 – Incorporação de autoencoders:
Embora o quinto ponto que consideramos tenha recebido apenas um sucesso relativo, ainda estamos a bordo do uso de autoencoders para pré-treinar uma rede e inicializá-la corretamente.
Uma das maiores razões, além dos ataques cibernéticos, pelas quais as empresas falham em superar os obstáculos iniciais da integração do deep learning é a inicialização ruim, e seus muitos armadilhas. O pré-treinamento não supervisionado frequentemente leva a uma execução pobre ou incorreta da tecnologia de deep learning, o que é onde os autoencoders podem brilhar.
A noção fundamental por trás de uma rede neural dicta a criação de uma rede neural que prevê a natureza do conjunto de dados de entrada. Se você não tem certeza de como usar um autoencoder, há vários tutoriais online que fornecem instruções claras e concisas.
Para concluir:
No final do artigo, gostaríamos de reembolsar o que dissemos ao longo do artigo, com uma adição – incorporar conhecimento específico do domínio no processo de aprendizado! Não apenas a incorporação de insights valiosos acelera o processo de aprendizado, mas também permite que a tecnologia de deep learning produza resultados melhores e mais precisos.












