O lado
obsucuro
do Google

Ilustração: Monge Han

"Não seja mau", esta expressão está registrada na carta oficial de abertura de IPO do Google de 2004 e é utilizada dentro da companhia como um lema interno até hoje. É como se fosse um senso comum da empresa que com tanto poder, vive na eminência da corrupção para o lado negro da força. Star Wars ou não, é preciso abrir os olhos, pois este lado obscuro vem ganhando força no império colorido chamado Google.

Em 2013 a revista Edge entrevistou várias personalidades, reconhecidas pelos seus trabalhos intelectuais para responder a seguinte pergunta: “Com o que deveríamos estar preocupados?”. O cientista e pesquisador W. Daniel Hillis 1 ressaltou que devemos nos preocupar com os mecanismos de busca se tornarem os árbitros da verdade.

Hillis explica, antigamente qualquer pesquisa retornaria páginas da web com a sequência de letras que combinavam com os termos buscados. Hoje o Google faz uma busca semântica, ao pesquisar “Museu de Nova York” ele vai procurar as entidades que ele reconhece como museus e que estão localizados dentro da região geográfica com o nome de Nova York. Para fazer isso, os computadores que executam a pesquisa devem ter alguma noção do que é um museu, o que é Nova York e como eles estão relacionados. Os computadores devem possuir este conhecimento e utilizá-lo para fazer um julgamento.

Um problema se torna aparente se mudarmos o exemplo de “Museus de Nova York” para “Províncias da China”. Taiwan é uma província? Esta é uma questão controversa e na pesquisa semântica essas decisões não são baseadas em estatísticas, mas em um modelo de mundo. Que tal uma pesquisa por “ditadores do mundo”? Aqui os resultados, que incluem uma lista de ditadores famosos, não são apenas o julgamento sobre se uma determinada pessoa é um ditador, mas também um julgamento implícito, na escolha de exemplos individuais do próprio conceito de um ditador. Ao construir o conhecimento de conceitos como “ditador” em nossos meios de buscar informação, estamos implicitamente aceitando um conjunto de pressupostos.

Museu de Nova York página do Google Província da China página do Google

É preciso questionar e monitorar esses modelos pois no passado o significado era apenas nas mentes dos seres humanos. Agora, ele também está na mente das ferramentas que nos trazem informações. A busca possui um ponto de vista editorial, e os resultados da pesquisa refletem esse ponto de vista . Não podemos mais ignorar as premissas por trás dos resultados. Seus julgamentos invisíveis irão enquadrar a nossa consciência. E a função deste texto é iniciar o debate sobre o que o monopólio do Google já está ocasionando com a forma como buscamos e recebemos informações pela internet.

Bolha de filtro

Desde 2009 cada usuário possui uma página de resultados só sua, a partir de mais de 555 sinalizadores o Google julga e ordena os resultados especificamente para você. Basicamente ele examina aquilo que aparentemente gostamos - as coisas que fazemos, ou as coisas das quais as pessoas parecidas conosco gostam - e tenta fazer extrapolações. São mecanismos de previsão que criam e refinam constantemente uma teoria sobre quem somos e sobre o que vamos fazer ou desejar a seguir. Juntos, esses mecanismos criam um universo de informações exclusivo para cada um de nós. Mas estas previsões possuem um custo que Eli Pariser 2 discute em seu livro “O Filtro Invísivel” 3, com a captura de tela de uma busca no Google feita por dois amigos Scoot e Daniel. Ambos pesquisaram pelo termo Egito, enquanto o segundo obteve resultados sobre os protestos que estavam acontecendo no período o outro não registrou nenhum item a respeito do tema em sua primeira página.

Tela de resultados pela busca Egito de Scoot no Google Tela de resultados pela busca Egito de Daniel no Google Fonte: Eli pariser, 2011 imagem original

Qual foi a decisão de julgar que os protestos no Egito eram irrelevantes para Daniel? Pariser continua o raciocínio sobre a bolha de filtros não conseguir lidar de maneira transparente com a complexidade de interesses do ser humano. A eterna disputa do que queremos agora e o que projetamos para nós no futuro.

“Há filmes que demoram mais para serem assistidos e outros logo que entram na lista automáticamente já são consumidos. É uma batalha entre nossas aspirações futuras e nossos impulsos presentes: Todo querem ser alguém que assiste Rashomon, mas bem agora queremos ver Ace Ventura pela quarta vez.” - PARISER, 2011

A busca fecha o conteúdo de forma invisível, literalmente criando uma bolha na qual não enxergamos o que há fora dela. “Não existe uma opção de zoom out e nos faz acreditar que o mundo é uma ilha estreita quando, na verdade, é um continente imenso e variado”

Zuckerman 4 em sua apresentação no TED: Listening to Global Voices em 2010, comenta como é difícil encontrar a produção criativa de outros países na internet:

“Se eu entro numa loja nos Estados Unidos, é muito, muito fácil para eu comprar água engarrafada em Fiji, importada a altos custos para os EUA. É surpreendentemente difícil que eu consiga assistir a um filme de Fiji. É muito difícil que eu ouça música de Fiji.” - ZUCKERMAN, 2010

A bolha cria um víes da confirmação, tendência das pessoas "preferirem informações que confirmem suas crenças ou hipóteses, idependente de serem ou não verdadeiras” 5, por exibir apenas os interesses imediatos do indivíduo, indo contra promover a diversidade de ideias ou pessoas.

Privacidade e Transparência

O algoritmo de personalização se baseia no conceito de Big Data 6 para tomar decisões, ou seja, ele necessita da maior quantidade de informação possível. O que resulta em armazenar e rastrear toda e qualquer informação sobre o usuário. Sites como MSN, Yahoo, CNN instalam em média 64 cookies a fim de obter informações sobre seu comportamento online.

O site Dont Track Us, em um passo a passo, expõe como é feito este monitoramento e como é utilizado: Quando o usuário pesquisa no Google e clica em um resultado, seu termo de busca é enviado para o site junto com informações do seu computador, localização, navegador criando uma identidade única sobre o mesmo na internet. Estes sites costumam ter anúncios de terceiros, e os terceiros a partir da identidade única montam um perfil sobre o usuário: idade, gênero, gostos, características físicas e colocam anúncios que perseguem o cliente por todo lugar.

Estas informações não ficam apenas nos anúncios. O seu perfil pode ser vendido para oferecer preços mais altos, como no caso da rede de Hotéis Orbitz que exibe os hotéis com preços mais elevados para usuários que utilizam computadores da Apple ou para descobrir se é um comprador de risco ou não, como aponta o The Washington Street Journal. Ou até mesmo vender as informações para empresas de banco de dados como a TargusInfo que se gaba por oferecer mais de 62 milhões de atributos em tempo real por ano, ou a Rubicon ao afirmar que sua base de dados inclui mais de meio bilhão de usuários da internet.

O site Financial Times publicou uma calculadora interativa que retorna o valor estimado das suas informações pessoais dependendo do seu perfil. O preço desta personalização vai além, o Google também salva todas suas pesquisas e ela pode ser legalmente requerida por tribunais de justiça e pelo governo como aponta o site Readwrite. O Brasil, em 2010, realizou 3.663 pedidos de acesso aos dados e remoção de 291 sites. Chris Palmer diretor da Electronic Frontier Foundation comentou: “Recebemos um serviço gratuito e o custo são informações sobre nós mesmos”.

Indução de Comportamento

Um artigo de 2010, na revista Scientific American Tim Berners-Lee 7, alerta que empresas estariam, cada vez mais, desenvolvendo “produtos fechados” e “ilhas de informação”. A internet estaria ficando mais fragmentada e menos universal. Um caminho contrário ao proposto para a rede, que nasceu com a intenção de dividir conhecimento e a premissa democrática de acesso igualitário de informações a todos. Possibilitando uma empresa ter o mesmo poder de expressão que uma pessoa.

Os sistemas de buscas estão se tornando enormes, prova disso é que não há como medir o impacto das alterações no algoritmo do Google. “A equipe faz ajustes aqui e ali, não sabe muito bem o que funciona nem porque funciona, só examina o resultado”. Lanier 8 questiona a relevância dos links da primeira página dos motores de busca:

Quando procurar por alguma coisa em uma ferramenta de busca, simplesmente pule os resultados até encontrar o primeiro escrito por uma pessoa em relação ao tema buscado. Se você fizer isso, em geral descobrirá que, na maioria dos tópicos, a entrada da Wikipédia é o primeiro link sugerido pelas ferramentas de busca, mas não necessariamente o melhor link disponível. - LANIER, 2010

Ele comprova esta situação comentando sobre as páginas que raramente aparecem nos primeiros resultados da busca, como o ThinkQuest, uma iniciativa que aconteceu nos primórdios da World Wide Web na qual equipes de alunos do segundo grau competiam por bolsas de estudos projetando websites que explicavam conceitos e ideias de uma variedade de áreas acadêmicas. O trabalho incluía simulações, jogos interativos e outros elementos numa busca por novas formas de apresentar conteúdos complexos, como a matemática.

Joachims realizou um experimento com a disposição vertical dos motores de busca, invertendo a ordem dos resultados e comprovou que os participantes foram influenciados em sua avalição pela ordem de apresentação, já que o número de cliques no primeiro resultado foi significativamente maior que a importância que merecia. Morville no livro "Search Patterns"9 aponta que o primeiro e o segundo resultado obtém 80% de atenção. A abordagem vertical insinua ao usuário a ideia de um resultado único que responde todas as questões, fechando possibilidades e excluindo a ideia de um pensamento lateral.

Monopólio

Ballmer ao deixar o seu cargo na Microsoft em reunião com analistas acusou o Google de funcionar como um monopólio, e sua declaração entrou para a lista de acusações que a empresa já recebeu de controlar o mercado e realizar cartéis, que ja culminou em julgamento e investigação da união européia pela empresa bloquear rivais em resultado de buscas.

Tim Wu em seu livro The Master Switch 10 , descreve o 'ciclo' de todo sistema de informação, inicia-se de forma aberta e ao consolidar-se começa um processo de fechamento. Ele exemplifica contando a história do monopólio das telecomunicações com a The Bell AT&T, a trajetória do fundador da indústria do entretenimento de Hollywood e o surgindo das indústrias de TV a cabo. Por fim alerta para a etapa que a internet está no 'ciclo' com empresas como o Google, Facebook e Apple no comando.

Recentemente o Gizmodo publicou uma lista dos serviços que o Google atua: Software de produtividade, Softwares de Publicação, Sistemas operacionais, Celulares, Laptops, Mapas, Vídeos online, Compras, Pagamentos, Redes Sociais, Mensagens, Telecomunicações, Tecnologias futurísticas, Saúde e Publicidade. Em todos eles utilizam a influência de um serviço como vantagem competitiva para outro. Exemplo disto são o maior número de funcionalidades que você possui no sistema de busca ao utilizar o navegadora da empresa, o Chrome. Essa dominação de mercado se extende, Harris em artigo no seu blog fez um estudo da página de resultados e noticiou que apenas 13% da tela é utilizada pela pesquisa orgânica - resultado colhido diretamente pelo algoritmo - em uma busca por “auto mecanich” quando logado em sua conta. O restante da página é tomado pelos produtos do Google: 29% Adwords, 14% barra de navegação e as notificações do Google+ e 7% o serviço de mapas da empresa.

Fonte: Herris Tutpress imagem original

E a porcentagem diminui em um ambiente móvel. Harris executa o mesmo teste com palavra-chave “Italian Food” em seu Iphone e depois de rolar a página por completo quatro vezes ele chegou na busca orgânica. Se relacionarmos que 29% da página pertence ao google Adwords, sistema de publicidade do Google, e em 2011 a empresa controlava 43,5% do total de gastos de toda a publicidade online utilizando o serviço do Adwords 11, é possível projetar um futuro que, para entrar no mundo do Google, será preciso pagar.

Alternativas de Busca

Continuar utilizando estes serviços sem questioná-los e evidenciá-los é permitir uma curadoria robótica invisível que pode passar uma falsa sensação de neutralidade, criar um isolamento para outros conteúdos, afastar-nos da produção cultural de outros países, tornando-se algo comum e aceitável.

Como Tim Wu, Eli Pariser e outros que lutam pela Open Web é preciso estar sempre atento e informado sobre o que as empresas pretendem e nunca deixar de termos alternativas para qualquer serviço. Compartilhe, debata, informe outras pessoas sobre o assunto e teste outros sistemas de busca também.

yossarianlives.com

Sistema propõe uma busca por metáforas.

duckduckgo.com

Defende uma busca privada e não rastreada

Comentários

comments powered by Disqus
  1. W. Daniel Hillis Inventor americano, cientista, engenheiro e autor. Ele co-fundou Thinking Machines Corporation, um supercomputador com processamento em paralelo, no Instituto de Tecnologia de Massachusetts.
  2. Foto Kris Krug
    Eli Pariser é o presidente-executivo da Upworthy, um site de conteúdo viral. Ativista político da internet, presidente do conselho da MoveOn.org e co-fundador da Avaaz.org.
  3. O Filtro Invisível Livro escrito por Eli Pariser que alerta sobre os perigos da curadoria automatizada de serviços como Google, Facebook, NetFlix e outros.
  4. Ethan Zuckerman Estudioso americano de mídia, blogueiro e ativista da Internet. Faz parte do conselho de administração da Ushahidi e do Global Voices, uma rede internacional de compartilhamento de notícias.
  5. Conceito descrito pelo psícologo e professor Scott Plous no livro "The Psychology of Judgment and Decision Making" de 1993.

  6. Conceito, no qual o foco é o grande armazenamento de dados e seus relacionamentos.

  7. Foto CERN
    Tim Berners-Lee Físico Britânico é o criador da World Wide Web, atualmente é o diretor da W3C, que supervisiona o desenvolvimento continuado da web.
  8. Foto Lanier
    Jaron Lanier Lanier é um dos maiores conhecedores de realidade virtual no mundo, por ser um dos primeiros a estudar o tema e construir produtos de realidade virtual desde o início dos anos 80.
  9. Search Pattern Livro publicado pela editora O'Reilly, faz um estudo aprofundado dos padrões de pesquisa do usuário e a melhor forma de desenhar uma interface de busca em relação a estes padrões.
  10. The Master Switch De Tim Wu o livro descreve o "ciclo" pelo qual os sistemas de informação passam. Iniciam-se abertos tornando-se consolidado fecha-se ao longo do tempo e reabre somente após uma inovação disruptiva.
  • Dado retirado do livro Dieta da Informação de Clay A. Johnson