Hoje estava dando uma geral no Google Analytics (GA), vendo as estatísticas de acesso e percebi que um dos meus sites não possuía nenhum acesso registrado. Na dúvida verifiquei se o código de rastreamento do google estava no cabeçalho… e estava. Como tenho acesso aos logs do servidor, fui confirmar se não houve nenhum acesso, e realmente haviam acessos realizados esta semana. Com a pulga atrás da orelha, comecei a comparar alguns indicadores entre o GA e os logs do Apache (servidor web) e percebi que o GA sempre está com os totalizadores menores que os contabilizados pelos logs.
Meu primeiro chute, e não deixa de ser válida, é que o GA não consegue processar todas as requisições das centenas de milhares de sites que utilizam ele. Depois comecei a me lembrar de várias opções que os usuários têm de bloquear o rastramento do GA.. uma delas é um Addon oferecido pelo próprio Google (GA OptOut) disponível para vários navegadores e que impede que os sites que usam o GA coletem dados do usuário/navegador. Usuários de Firefox/Chrome/etc que suportam plugins, também podem ter optado por desabilitar o GA usando as extensões AdBlock que possui uma subscrição específica para filtros de rastreamento (e.g EasyPrivacy).
E hoje me deparei com um artigo no MeioBit falando de uma nova extensão para o Chorme chamada Disconnect que permite o bloqueio do rastreamento das redes sociais Digg, Facebook, Google, Twitter e Yahoo.
Acho importante frisar que esses bloqueios permitem uma navegação mais privada. Quando um site está usando estes serviços ou está integrado a uma rede social, ele estará permitindo que sejam coletadas diversas informações e até mesmo validando seus usuários por meio de cookies ou sessões previamente abertas em seus servidores. Ou seja, cada serviço/rede social poderá traçar um perfil de uso/tendência ou preferências dos seus usuários; o que acessam, em que momento, de onde acessam.
Mas voltando as estatísticas, tenho um site e quero saber quantas pessoas acessaram ele! bem, eu recomendo também o uso de ferramentas que analisam diretamente os logs do servidor como o AWStats. Não tem erro, se um navegador requisitou alguma coisa e o servidor web entregou, foi gerado um log da operação (salvo problemas de configuração do web server ou disco cheio :) .
A quantidade de informação com certeza é bem menor que a oferecida pelo GA (Esqueça informações como resolução da tela, se tem ou não flash/java instalado.. essas coisas), mas o importante estará lá: quantas pessoas acessaram, de onde vieram, para onde foram, qual o tipo de navegador, etc.
Nada impede de você usar as duas opções (GA / Logs do servidor). Os logs são gerados de qualquer jeito e é bem provável que você já tenha os logs de acesso ao seu site dos últimos dias… é só processá-las com o awstats e terá novos indicadores!
Como nem todo mundo tem acesso aos logs dos servidores, algumas empresas de hosting oferecem ferramentas próprias ou pré-configuradas para acessar os logs. O Dreamhost por exemplo oferece o Analog. Se você não tem acesso ao servidor (shell) para instalar o awstats, veja com seu hosting como poderá acessar as estatísticas geradas pelo web server.
E pra resumir a história é por isso que nem sempre temos os mesmos indicadores no Google Analytics e nas ferramentas de análise de logs..os usuários de ferramentas de privacidade não são contados no GA. ;)