segunda-feira, 11 de maio de 2009

Já somos mais de 1% ?

Desde o dia 04 de maio, na lista de usuários Ubuntu-BR (digamos a lista "oficial", se é que existe algo oficial no mundo OSS - e isso é mais uma postagem, com certeza), estamos discutindo uma matéria que saiu na Info:

(http://info.abril.uol.com.br/noticias/tecnologia-pessoal/linux-bate-1-de-mercado-pela-primeira-vez-02052009-2.shl)

sobre uma pesquisa da Net Applications (notícia offical em: http://marketshare.hitslink.com/operating-system-market-share.aspx?qprid=8&sample=35)

que dá conta que o Linux atingiu a marca de 1,02% de market share total, isto é, inclui aí tudo: servidores, desktops, dispositivos móveis etc.

Vamos a metodologia aplicacada; de seu site:

We use a unique methodology for collecting this data. We collect data from the browsers of site visitors to our exclusive on-demand network of live stats customers. The data is compiled from approximately 160 million visitors per month. The information published is an aggregate of the data from this network of hosted website statistics. The site unique visitor and referral information is summarized on a monthly, weekly, daily and hourly basis.


Então: eles coletam dados de acesso à Web através de uma rede de clientes e parceiros. Nestes clientes eles coletam coisas do tipo qual é o navegador que o cara tá usando, qual é o sistema operacional e dados relativos à geografia (para distribuição espacial das estatísticas, o que acaba sendo um serviço pago se você quiser tais informações). Colocam tudo isso em um modelo estatístico (o tal "agregate of data") e voi-lá, taí o gráfico.

É uma boa metodologia. Talvez a mais acurada, de fato, por ser quase impossível se levantar, com um custo razoável, os dados "verdadeiros".

Se não vejamos: há um grupo de computadores (desktop) que saem de fábrica com Linux, isso notadamente no terceiro mundo. Boa parte destes computadores não acessam a Internet, seja por custo, seja por falta mesmo de infra-estrutura para isso. Olhemos o Brasil: mesmo com a capilaridade da rede de telecomunicações, boa parte das pessoas estão longe da Internet e, um bom número tem computador em casa. Apenas se o percentual destas for o mesmo dos que tem acesso a Internet, o número final não modificaria. Agora, como sabemos que o público de mais baixa renda é justamente o maior consumidor de Linux, é de esperar então que o market share seja um pouquinho maior.

Há igualmente o problema dos mobile. Nem todos os que possuem a tecnologia acessam a Internet através deles, principalmente por causa do custo. Eu tenho um Sony Ericson que permite acesso a Internet mas raramente o uso para este fim, pois os custos são altos, prefiro usar o meu PC, que no caso tem Linux Ubuntu. O mesmo deve acontecer com usuários normais do Windows. Digamos que o percentual seja o mesmo, significa então que uma proporção equivalente de máquinas que deve ter Linux ou outros SOs para mobile simplesmente aparecem na estatística como usuários Windows, mas poderiam aparecer também como usuários Linux ou outros.

Por último há a questão da rede de parceiros. Por mais vasta que seja, há sempre um percentual residual (que existe fora da rede pesquisada, como no caso das eleições, por exemplo) que acaba distorcendo os dados, para mais ou para menos. No caso do Linux, deve sempre significar para mais, por que os fatores prejudicam bem mais os detendores dos maiores percentuais que dos menores (2% sobre 80% significa bem mais do que os mesmos 2% sobre o 1%, chegando até mesmo a quase dobrar este valor percentual considerando o total).

Por exemplo, digamos que o mercado seja de 10 milhões de máquinas; 80%, significam 8 milhões e 1% significa 100 mil, então se a estatística estiver errada em 1% para menos no Windows, já são 800 mil máquinas a mais para os demais. Mesmo que distribuíssemos ponderadamente de acordo com os percentuais dos demais, são quase 100 mil a mais para o Linux. Só aqui chegaríamos a 2%, fora as outras considerações.

Mas como citei acima, é quase inviável fazer esse levantamento de outro jeito. Mas temos que ter em mente que o percentual do Linux já deve ser bem maior. Dependendo de como se estime os senões aqui levantados, podemos mesmo pensar que estamos mais de 2%.

Alguns podem dizer que o que estou fazendo é forçar a barra na estatística. É verdade! Mas foi exatamente o que o Ibope fez quando da 1a eleição do Lula, quando em vários estados, na eleição estadual, incluindo São Paulo, por exemplo, errou feio. No Amazonas, outro exemplo, predisse que não haveria 2o turno e houve. Depois justificou exatamente da mesma forma que eu estou usando acima. Se eles podem, porque eu não posso?

Um comentário:

  1. Boa análise, André. Dá pra entender que as medições feitas pela Net Applications não são comprobatórias de nada, a não ser de que aproximadamente 90% as pessoas que acessaram os sites dos parceiros usavam Windows. Por si só a metodologia restringiu seus próprios resultados.
    Embora também ache que você forçou a barra pra cima nos chutes acima (hehehehe), sou da mesma opinião: Se o Ibope pode, por que não você?

    ResponderExcluir