Tecnologia no Cotidiano

O Twitter pode revelar sua obesidade

Segundo pesquisa realizada pelo Illinois Institute of Technology Researcher, estatísticas de saúde de uma determinada localidade, incluindo taxas de obesidade, podem ser obtidas por intermédio dos tweets da respectiva população. Desse modo, há como descobrir se você é obeso, ou, pelo menos, se o seu município o é.

Esta pesquisa, conduzida pelo professor Aron Culotta, afirma que os tweets pode prever com precisão as taxas de obesidade, diabetes, gravidez de adolescentes, cobertura de serviços de saúde e acesso a alimentos saudáveis. Como resultado, o Twitter e outras mídias sociais podem complementar as demais fontes de dados, auxiliando as autoridades a identificarem comunidades em risco e a providenciarem o auxílio necessário.

Para cada um dos 100 condados mais populosos nos EUA, Culotta reuniu estatísticas referentes a 27 temas relacionados a saúde. Ele também coletou mais de 1,4 milhão de perfis no Twitter e 4,3 milhões de tweets referentes às populações dos mesmos 100 condados, durante 9 meses. A partir daí, ele realizou uma análise estatística para identificar a precisão das previsões referentes à saúde obtidas a partir do Tweeter, bem como identificou quais marcadores linguísticos podem prever com maior grau cada uma das estatísticas de saúde.

Dentre outras coisas, Culotta descobriu que os tweets forneceram previsões para 6 de 27 estatísticas das populações dos condados, incluindo obesidade, diabetes, gravidez de adolescentes, cobertura de serviços de saúde e acesso a alimentos saudáveis. Os modelos que uniram variáveis demográficas (raça, idade, gênero, renda) com variáveis linguísticas (extraídas do Twitter) foram mais precisos que aqueles que utilizaram somente variáveis demográficas em 20 das 27 estatísticas de saúde consideradas. Ou seja, os dados do Twitter auxiliaram os modelos tradicionais a se tornarem mais precisos, sugerindo que esta nova metodologia pode complementar as abordagens existentes.

Em 2 estatísticas em especial – acesso limitado a alimentos saudáveis e predominância de fast foods – o modelo do Twitter isoladamente foi mais preciso que o modelo de variável demográfica.

A análise de mídias sociais para a maior parte das preocupações em saúde, tais como gripes, foca na detecção de menções a algum sintoma de interesse, como por exemplo “Ficando em casa hoje com garganta inflamada”. Mas Culotta também investigou mais alguns indícios de nuanças linguísticas relacionados à saúde geral de uma população. Ele identificou os indicadores linguísticos que são mais preditivos de cada um dos resultados. Por exemplo, referências à religião e certos pronomes (nós, dela) estão correlacionados com um melhor apoio sócio-emocional. Referências a dinheiro e inibição estão correlacionadas a menores taxas de desemprego. Referências à família e amor se correlacionam com maiores taxas de gravidez dentre adolescentes. No que se refere à obesidade, os indicadores incluem as denominadas palavras de engajamento negativo (cansado, entediado, sonolento), bem como expressões irreverentes.

Segundo Culotta, a atividade no Twitter fornece uma representação mais detalhada da saúde de uma comunidade que as estatísticas demográficas. Ainda segundo o pesquisador, a razão para isto parece ser oriunda das visões que o Twitter fornece da personalidade, atitudes e comportamento, as quais, por sua vez, estão correlacionadas à saúde.

 Os resultados obtidos a partir desta pesquisa são empolgantes. Em geral, há órgãos governamentais incumbidos de identificar populações mais vulneráveis a determinadas ameaças à saúde, sendo que o fazem por intermédio de programas que demandam tempo considerável e, frequentemente, são limitados pelo tamanho da amostra ou pela especificidade geográfica. A pesquisa de Culotta sugere que as mídias sociais podem ser uma fonte complementar de dados para a identificação de comunidades em risco.

A este respeito Culotta disse, “Enquanto esta nova metodologia requer mais experimentos, acreditamos que ela pode auxiliar os pesquisadores de saúde pública provendo (1) uma alternativa com mais nuanças em relação aos perfis demográficos para a identificação de populações em risco; (2) um método de baixo custo para medição de risco em diferentes subpopulações; e (3) um processo para o auxílio na formulação de novas hipóteses sobre o relacionamento entre ambiente, comportamento e indicadores de saúde, que então poderão ser testadas em um conjunto mais controlado.

Tagged on:

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *