Diante da necessidade de mais armazenamento, páginas antigas estão desaparecendo para dar lugar a novas
(Imagem: /Shutterstock)
Encontramos praticamente tudo que precisamos na internet, desde uma simples receita até informações importantes sobre nossa própria história. Isso pode estar mudando. Com a produção de conteúdo aumentando, é necessário mais espaço para armazenar esses dados. A solução para isso já está acontecendo e é bastante radical: “excluir” informações mais antigas.
A inteligência artificial (IA) pode ser um agravante. Afinal, quanto mais a tecnologia produz, mais exige espaço no grande mundo da internet. No entanto, isso também pode afetar os próprios autores e internautas.
Parte das páginas da internet já não existe mais
- Um estudo do Pew Research Center mostrou que um quarto de todas as páginas da internet que já existiram em algum momento entre 2013 e 2023 não existem mais;
- Das páginas existentes em 2013, 38% não funciona mais. Apenas na Wikipedia, mais da metade dos artigos conta com pelo menos um link quebrado na seção de referências;
- Além disso, cerca de 8% dos conteúdos publicados em 2023 desapareceram até outubro daquele mesmo ano;
- A tendência é que isso comece a acontecer com páginas cada vez mais recentes.
IA pode agravar problema de armazenamento na internet
Uma coluna do The Verge chamou atenção para dois agravantes nessa situação: a IA e a própria noção de autoria.
O boom da inteligência artificial facilitou para que qualquer pessoa no mundo comece a “criar” textos, imagens e, mais recentemente, vídeos online. Involuntariamente, isso gera ainda mais conteúdos na internet e, consequentemente, aumenta a necessidade de armazenamento (justamente o que está em falta). A consequência é o apagamento de conteúdos antigos.
O problema disso é simples: a IA se alimenta de dados do próprio mundo online, muitos deles anteriores a esta década. Ou seja, se a tecnologia está se baseando em conteúdos que, em um futuro próximo, não existirão mais, o futuro online se tornará uma grande repetição de dados que já foram aproveitados pela IA, o que o site chama de “ecos”. De certa forma, boa parte dos conteúdos serão reaproveitados e não mais originais.
Esse descarte da internet também cria um problema de autoria. Para um autor que publica online, uma vez que seus trabalhos desapareçam, sua própria identidade deixa de existir naquele ambiente. Isso também dificulta para que pesquisadores, jornalistas e até pessoas que queiram consultar informações originais cheguem à fonte dela. No lugar, elas apenas ficarão com os “ecos” daquilo que foi repercutido, uma vez que os conteúdos originais podem já ter desaparecido.
Acervo gigantesco busca guardar informações
Nesse contexto, algumas organizações, em sua maioria voluntárias, buscam salvar enormes quantidades de dados antes que sejam excluídos. É o caso, por exemplo, do Internet Archive, uma organização sem fins lucrativos sediada em São Francisco, nos Estados Unidos.
Nele, são 866 bilhões de páginas web, 44 milhões de livros, além de 10,6 milhões de vídeos com filmes e programas de televisão guardados em centros de dados pelo mundo todo, para evitar que sejam completamente perdidos.
Outro exemplo é o Wayback Machine, que usa robôs para rastrear cópias de websites e guardar este conteúdo.
No entanto, muitas dessas organizações enfrentam dificuldades técnicas, de ciberataques e batalhas jurídicas por parte de empresas que não aceitam cópias da propriedade intelectual. Sem esse trabalho, provavelmente vamos continuar perdendo cada vez mais a história das páginas da internet.
*Olhar Digital