Tamanho do conjunto de dados necessários para treinar uma IA se igualará ao volume de texto público online
Uma projeção do Epoch AI, um instituto de pesquisa virtual, aponta que as inteligências artificiais (IAs) podem ficar sem bases de dados para treinamento em 2029. Isso ocorreria porque, segundo os cientistas, o tamanho do conjunto de dados necessários para treinar uma IA se igualará ao volume de texto público online — limitando, portanto, o treinamento de novos modelos e de modelos mais complexos.
Outro fator complicador é que os veículos de mídia, como jornais e site de notícias, estão restringindo cada vez mais o uso do conteúdo gerado por eles e impedindo, entre outras coisas, que o material possa ser usado para alimentar e treinar a IA.
Um artigo publicado na revista Nature na quarta-feira (11) debate o tema e aponta que as principais empresar do ramo já estão elencando soluções para o esgotamento eminente. Conforme apurado por Nicola Jones, a tendência é de que a saída seja somar o potenciais dos bancos de dados privados com os textos públicos.