Origem: Everybody
Lies - big data, new data, and what the Internet can tell us about who we
really are. Seth
Stephens. Harper Collins, 2017. (Tradução
do Portal).
Peço-lhes
permissão para colocar em foco um assunto delicado: o que é Big Data, sua real
aplicabilidade aos assuntos de negócio e a crescente digitalização de toda a
atividade humana. Nas palavras de Seth Stephens, "How big is big?" O autor trabalhou como cientista de dados na
Google e é PhD em economia por Harvard.
Seth
reflete sobre a incalculável quantidade de informações armazenadas sobre
pesquisas no Google Search e sua aplicabilidade. Em síntese, observa que os
temas de pesquisas, consideradas em conjunto, refletem mais sobre o
comportamento humano que qualquer pesquisa sócio-econômica séria e bem
conduzida. A chave disso é que as pessoas contam mais em seus questionamentos
no Google do que elas mesmas poderia identificar em seus padrões de
comportamento ou sobre seu auto-conhecimento.
"Se nós agregarmos toda essa informação,
mantendo tudo de forma anônima, nos certificando de que nunca saberemos sobre
os medos, desejos e comportamento de qualquer indivíduo específico, e
adicionarmos a essas informações ciência de dados, começaremos a ter uma nova
visão dos seres humanos, sobre sua natureza."
Há
duas abordagens convergentes no livro: primeiro, procura evidenciar o grau de
acuracidade dos dados de pesquisa no Google Search sobre fenômenos conhecidos,
tentando dar alguma previsibilidade a eles, a exemplo das eleições americanas
recentes, associando seu resultado ao racismo da sociedade americana; depois,
procura vislumbrar alguma aplicabilidade do uso dessas informações para
assuntos relevantes no mundo atual.
Em
relação à questão do uso dessas informações, atenho-me sobre o nível de
previsibilidade sobre um determinado comportamento de consumidor, assunto muito
discutido e trabalhado nesses tempos de abordagens centradas no comportamento
humano. Por exemplo, até que ponto a utilização de testes A/B como experimentos
práticos poderiam ser substituídos pelos dados consolidados de comportamento
obtidos na Web?
Em
uma avaliação minha, o uso desse tipo de agregação é válida quando a quantidade
de informações analisadas é gigantesca (realmente BIG!), até pelo viés
estatístico que podem embutir. Quando começo a restringí-las à localização e mercados específicos, carecem de tratamento adequado e perdem seu efeito
prático.
Por
enquanto valem algumas tendências mais gerais de comportamento a exemplo da
correlação existente entre a ansiedade e a neurose urbana, colocadas em dúvida
pelo estudo.
Nenhum comentário:
Postar um comentário