VidaGeek.net

Linux, Open-source, Programação e Produtividade

Archive for the ‘Google’ Category

Até o número de cliques?

Esses dias, quando estava instalando o plugin do Remember The Milk, eu notei uma coisa interessante. O site de busca do Google mostra o número de vezes que você clicou em um determinado link e a data do último clique.

Número de cliques e data do último

Isso só funciona se você estiver logado, mas é bastante perturbador.

Não é por causa de questões de privacidade (não quer que o Google receba informações sobre onde você clica? não fique logado o tempo inteiro). É mais por questões computacionais.

Eu sei que o Google talvez possua a maior capacidade computacional do mundo. Muitos programadores muito bons trabalham na Google. Mas isso já é demais.

Para manter essa informação, ou ela está armazenada no cliente ou no servidor. Se estivesse no cliente (e fosse apenas para nos mostrar algo bonitinho no site) bastaria que você entrasse no site de busca de duas máquinas diferentes e o número de cliques não bateria. Não e isso que acontece. E o número de cliques inclusive influencia a ordem em que os sites estão listados. A primeira vez que acessei o remember the milk, ele era o terceiro na lista. Hoje é o primeiro.

Ou seja, a informação está no servidor. A Google guarda cada clique que damos no site. Mas como? Existem milhões de contas no google. Sei lá quantas buscas diárias a Google responde, mas só eu faço pelo menos 100 (se não tiver muito o que fazer no dia). Como você faz com que isso que parece apenas uma bobeira (mas na verdade é informação vital para o sistema de busca deles) seja escalável?

Eles têm que guardar isso em disco. Quantos sites eu já acessei hoje? Tudo guardado. No modelo mais minimalístico que consigo pensar, associado a minha conta existe algo que guarda a busca que fiz, o site que acessei, o número de vezes que acessei e a data do último acesso. Pode parecer pouco, mas quando você multiplica o acesso disso por N (para valores bem grandes de N) é algo absurdo.

É algo pra deixar qualquer um louco (ainda mais eu que adoro fazer otimizações de baixo nível).

Já estou melhor depois desse desabafo. Mas ainda assusta.

Posts Relacionados:

  • AdSense Flood
  • Brasileiros no Google Summer of Code
  • Não Calcule PI em Binário
  • Deixando seu Ubuntu mais rápido
  • E se alguém trocar a sua id do AdSense?
  • Jogos Educativos
  • FISL 8.0: Entrevista com Guilherme Silveira, um dos ganhadores da Arena
  • Acompanhe-nos por RSS, por Email ou via Twitter.

  • 3 Comments
  • Filed under: Google, Programacao
  • Quer trabalhar na Google?

    É fácil! E nem precisa de entrevista! Aliás, não precisa nem sair de casa, se você tiver Internet. É só entrar em http://images.google.com/imagelabeler/.

    Google Image Labeler

    Bom, não tem salário, mas em compensação não precisa sair de casa, não precisa ter formação e, ainda por cima, você se diverte (como em qualquer emprego da Google, provavelmente)!

    Essa ferramenta é um tipo de jogo que a Google criou para melhorar a ferramenta de busca de imagens deles. O objetivo é descrever as imagens que forem aparecendo com tags relevantes. Quanto mais relevante, melhor!

    Aviso: é viciante (mesmo para quem não é workaholic)!

    Posts Relacionados:

  • Mac Widgets
  • Alguns Videos da Google….
  • Viva aos programadores brasileiros
  • FISL 9.0: Introducing Google Summer of Code
  • Google SO: Haiku
  • Google em Inglês
  • Que curso eu faço?
  • Acompanhe-nos por RSS, por Email ou via Twitter.

  • 4 Comments
  • Filed under: Google, Humor, Jogos
  • Grafos no Orkut

    Essa é mais uma feature que o Google possui que está acelerando o processo de calvicie em mim.

    Todo mundo conhece o orkut. Aquele sistema bobo, sem muita utilidade concreta mas que faz um sucesso absurdo (Inclusive, existe uma comunidade do VidaGeek.net lá).

    O que muitos não notam é um pequeno detalhe que aparece quando você está no perfil de outra pessoa. O Orkut mostra pra você o caminho mais curto entre você e essa outra pessoa (atravéz de amigos).

    Grafos no orkut

    O que que isso tem de assustador? É apenas uma busca em um grafo… Com milhões de vértices. Faça um programa simples que faz uma busca em um grafo com milhões de vértices e você vai entender do que estou falando. Demora muito mais do que uma requisição no Orkut pode demorar.

    Ou seja, tudo isso está pré-calculado. Quando você acessa o perfil de outra pessoa, o algoritmo já rodou e ele simplesmente recupera a informação e devolve para você.

    O jeito mais simples de fazer isso? Um Floyd-Warshall modificado (para não levar o peso das arestas em consideração), com complexidade O(n^3) rodado quando algum usuário se cadastra no Orkut ou sai dele.

    Isso não funciona. Com a quantidade de usuários que o orkut tem, ele teria saido do ar há muito tempo se fosse desse jeito. Uma estratégia lazy (rodar apenas de tempos em tempos) também não ajuda muito, pois ocupa muito espaço em disco (quando o orkut foi criado, ele manteve vários milhares de usuário apenas com um computador comum como servidor).

    O que é mais possível, então? Uma boa Heurística. Hoje mesmo eu notei que têm alguns profiles que eu entro e não aparece a sequência de usuários. Portanto, o que deve ser feito é estabelecer um limite na profundidade da busca, baseado nos seus amigos e nas comunidades em que você participa. Isso reduz de milhões de usuários para milhares de usuários. Mesmo assim ainda acho que é um esforço computacional muito grande e provavelmente deve ser rodado de forma lazy (especialmente se você lembrar que já está sendo usada uma heurística e nem sempre vai aparecer o caminho).

    Posts Relacionados:

  • Problemas Técnicos
  • Palestra do Orkut
  • Google para todos os gostos
  • EXTRA, EXTRA, EXTRA: Grow lançará Super Trunfo: Grafos
  • “Free Software Song” de Stallman faz ações da Microsoft caírem
  • Programação para crianças
  • Guia Latex - Parte III: Estruturando e marcando o texto
  • Acompanhe-nos por RSS, por Email ou via Twitter.

  • 2 Comments
  • Filed under: Google, Programacao
  • Google em Inglês

    De tempos em tempos eu entro no Labs da Google pra ver quais as novidades que eles estão lançando no sistema de busca. Nada algoritimico, apenas aquelas coisas bobas que chamam atenção, como usar a busca para fazer contas ou procurar em dicionários.

    O problema é que essas novidades costumam estar disponíveis apenas no site em inglês. Isso não seria um problema se o site da google não redirecionasse para o site na nossa lingua nativa (no caso, português).

    Depois de muito tempo batendo a cabeça (e entrando no labs para mostrar pros colegas as novidades), notei que no google.com.br tem um link para o site em inglês.

    Para acessar o site em inglês direto é só entrar em www.google.com/ncr.

    Dica boba, mas é algo que me custou um tempo para descobrir. Quem sabe ajuda mais alguem ;).

    Só não sei o que significa ncr.

    Posts Relacionados:

  • Alguns Videos da Google….
  • Viva aos programadores brasileiros
  • Quer trabalhar na Google?
  • Google SO: Haiku
  • 18 dicas para o Google Calendar
  • O Mal da Google
  • Google Books Search ganha apoio alemão
  • Acompanhe-nos por RSS, por Email ou via Twitter.

  • 2 Comments
  • Filed under: Dicas, Google

  • Publicidade