O problema não é a deep web

Coluna semanal do Ronaldo Lemos publicada na Folha de São Paulo.

publicado em

27 de março de 2019

categorias

{{ its_tabs[single_menu_active] }}

tema

Nas últimas semanas muito se falou sobre Deep Web e Dark Web, nem sempre de forma precisa. Os termos não são sinônimos. Por causa das tragédias em Suzano (SP) e na Nova Zelândia, tem havido muita confusão sobre o que é exatamente cada um. Especialmente porque os assassinos frequentavam fóruns na internet antes da tragédia relacionados a esses conceitos.

Vale então explicar melhor. O termo deep web se refere à parte das informações que constam da internet que não estão indexadas pelos buscadores da rede, como o Google ou Bing. São servidores em que os dados não aparecem em buscas, por mais detalhadas que sejam. A razão para isso não é maliciosa na maioria absoluta dos casos.

É só pensar no Facebook. Boa parte do conteúdo que está no site é protegido por senha. Portanto, não é acessível pelo buscador e acaba não sendo indexado. O mesmo vale para mensagens, emails, arquivos na nuvem, etc.

Há também outros bancos de dados privados online. Eles incluem registros médicos (muitas vezes armazenados em servidores governamentais), informações científicas (armazenadas em sites acadêmicos fechados), registros financeiros (armazenados em servidores de bancos) e assim por diante.

A estimativa é que 90% de todos os dados na internet estejam na deep web. São, literalmente, trilhões de bytes. Como dá para ver, boa parte desses dados é composta de informações técnicas, científicas ou privadas.

Já a web aberta (ou “surface web” como também é chamada), que consegue ser mapeada por buscadores como Google e Bing, usualmente consiste em apenas 4% de todo o conjunto.

É claro que essa montanha de dados não mapeados é também uma enorme oportunidade econômica.

Analisar e “minerar” esses dados pode gerar muito dinheiro. Não por acaso, cada vez mais empresas (incluindo os buscadores) estão tentando chegar a esses dados.

No Brasil, por exemplo, empresas como o GuiaBolso fazem exatamente isso. Pedem autorização a clientes de bancos para acessarem seus dados da conta bancária. Em troca, processam as informações de forma inteligente retornando ao usuário diversas análises úteis sobre esses dados (antes inacessíveis).

Nesse sentido, o Banco Central —seguindo o exemplo europeu— está por criar regras de “open banking”, que farão com que os bancos possam compartilhar esses dados da sua “deep web” privada, tornando-os acessíveis (e processáveis) publicamente, mediante regras. Isso pode gerar um valor imenso.

Já a dark web é uma questão diferente. É como se fosse uma internet “dissidente”, que só pode ser acessada por software e protocolos especiais.

Se você digitar um endereço da maioria dos sites da dark web no navegador, ele provavelmente não vai conseguir acessá-lo, porque não usa o endereçamento padrão.

É na dark web que surgiu boa parte dos sites de venda de drogas, armas, pedofilia e fóruns mais radicais da rede. Vale dizer, no entanto, que a dark web tem algum valor por ser um refúgio para debates livres em países autoritários que controlam a internet, então nem todos os usos são negativos. Desfazer essa confusão entre deep e dark web ajuda a enxergar melhor qual é o problema.

Reader

Já era gráficos e tabelas complicadas e ininteligíveis

Já é data visualization (visualização de dados)

Já vem data sonification (“sonificação” de dados)

{{ pessoas.pessoaActive.title }}

×