Como os algoritmos podem ajudar a salvar o mundo

13 ago, 2018 - 10:00 • Inês Rocha

Este verão, 15 cientistas de dados chegaram a Portugal com um objetivo na bagagem: ajudar a resolver problemas sociais a “bater código” no computador.

A+ / A-
DSSG_2
Como os algoritmos podem ajudar a salvar o mundo

“Salvar o mundo talvez seja uma expressão exagerada”, diz, entre risos, Alexander Rich, cientista de dados norte-americano que está em Lisboa, na Nova School of Business and Economics (Nova SBE), para participar no programa “Data Science for Social Good”, em português “Ciência de Dados para o bem social”.

Mas foi mesmo para salvar o mundo - um problema social de cada vez - que Rayid Ghani criou o programa na Universidade de Chicago, em 2013.

O cientista de dados paquistanês que se tornou famoso por ter sido o primeiro a usar as potencialidades do Big Data (grandes volumes de dados) numa campanha política (a que levou à reeleição de Barack Obama, em 2012), encontrou, assim, uma maneira de “juntar aquilo em que era bom àquilo que lhe importava”.

O objetivo? Ajudar governos, organizações e instituições sem fins lucrativos a apanhar o comboio da Ciência dos Dados.

É que, se a famosa frase “os dados são o novo petróleo” é verdadeira para muitas empresas que exploram o potencial lucrativo do valioso recurso que inundou o planeta Terra na era digital, a maioria das instituições move-se ainda a carro de bois, na resolução dos problemas das populações.

Rayid quis “colocar os estudantes perante problemas sociais, em áreas como saúde pública, educação e segurança e treiná-los para os resolver”, explica à Renascença.

Ciência de dados em Portugal? Primeiro é preciso que as entidades comuniquem

A brasileira Laura Moraes é uma das quatro cientistas de dados que, este verão, estão a tentar combater o desemprego de longa duração em Portugal, no âmbito de um projeto desenvolvido em parceria com o Instituto de Emprego e Formação Profissional (IEFP).

A equipa de profissionais da Argentina, Brasil, Índia e China está a procurar ajudar o IEFP a prever quem é que, nos próximos seis meses, poderá estar numa situação de desemprego de longa duração.

“Estamos a criar um algoritmo para identificar os possíveis desempregados de longa duração, para que sejam alvo de mais atenção”, explica Laura Moraes.

Para isso, os cientistas começaram por mapear o fluxo do processamento das pessoas no IEFP: como é que entram, que tipo de informação têm que dar à organização, como é que os dados são utilizados e, com o passar do tempo, como é que elas saem do sistema. Seguiu-se a “modelagem” para, depois, passarem à aplicação do algoritmo que identifique os fatores que levam ao desemprego de longa duração.

O projeto é a continuação de um trabalho que começou no ano passado, em parceria com a Câmara de Cascais. Leid Zejnilović, o professor da Nova SBE que trouxe o programa para Portugal, explica que, na edição do ano passado, a organização percebeu que 12 semanas era pouco tempo para desenvolver os projetos a que se propunham. Assim, este ano, a Universidade decidiu alargar o mesmo projeto a todo o território nacional.

No entanto, por muito que tentem chegar a um algoritmo robusto, que permita ao IEFP ajudar as pessoas a encontrar um trabalho com mais facilidade, os cientistas têm esbarrado com um grande problema: a falta de comunicação entre entidades em Portugal.

O projeto desenvolvido no ano passado em parceria com a Câmara de Cascais não foi ainda colocado em execução porque colidiu com a lei portuguesa: o IEFP não pode partilhar dados com a Câmara e vice-versa.

Esta proibição, na visão de Rayid Ghani, não faz sentido. “Neste momento, muitos problemas estão a tentar ser resolvidos sem o uso de dados, e os resultados são muito piores. Com grandes quantidades de dados e padrões, conseguimos simplificar o problema”.

O próximo passo, para a Nova SBE, é “procurar aproximar várias entidades públicas em Portugal para arranjar forma de partilhar dados de uma maneira segura”, explica Leid Zejnilović.

“Estamos a falar com várias pessoas que gerem a parte dos dados nos ministérios, na Agência para a Modernização Administrativa, e todos percebem que isto é importante”, revela o professor. “Mas uma coisa é perceber, outra é elaborar um plano que não coloque em perigo os dados das pessoas”.

A privacidade neste processo é uma grande preocupação. “Nós pensamos muito sobre a privacidade, mesmo antes do Regulamento Geral de Proteção de Dados já pensávamos”, garante o professor. Mas Leid considera que a partilha de dados de maneira segura é possível e desejável.

“Precisamos de saber aquilo que o mercado precisa e quais as competências que precisamos de dar a estes desempregados para os aproximar dos trabalhos procurados no mercado”, explica o professor.

Leid Zejnilović considera que o trabalho que estão a desenvolver vai muito além da Ciência dos Dados. “A Ciência dos Dados ajuda, mas com uma melhoria na comunicação entre entidades poderemos ajudar muito mais”, explica. “Só a partilha dos dados já pode fazer uma grande diferença”, garante.

Rayid Ghani entende que o problema não é exclusivamente português. “É um problema de todas as organizações grandes em todo o mundo – têm sempre dificuldade em comunicar entre elas”.

Ao nível governamental, o professor paquistanês considera que “os governos têm que criar leis que forcem as instituições a partilhar dados”.

O interesse, segundo Rayid, é dos cidadãos. “As pessoas que precisam de serviços dos governos sofrem porque os seus dados não são partilhados.”

Mas, antes dessa partilha, o fundador do "Data Science for Social Good" afirma que é importante haver transparência perante os cidadãos. “Os governos devem mostrar às pessoas o que estão a fazer com os seus dados, como estão a usá-los para seu benefício e que serviços estão a oferecer por causa disso”, considera Rayid Gani. “Têm que lhes dizer também como estão a manter os seus dados seguros. Quem terá acesso a eles e como serão utilizados.”

Problemas concretos que se transformam em “conhecimento aberto”

Além do projeto de combate ao desemprego de longa duração, os cientistas de dados estão a criar algoritmos para resolver outros três problemas sociais ao nível europeu: promover o turismo sustentável na Toscânia, prevenir acidentes rodoviários na Holanda e promover a vacinação contra o sarampo na Croácia, através de formação da população.

E como é que os dados podem ajudar a promover o turismo sustentável? Em primeiro lugar, há que perceber onde os turistas vão e de onde vêm. É o que está a fazer uma das equipas na Nova SBE, utilizando os dados da Vodafone Itália e do Fireze Card, um cartão que permite a entrada em 72 museus naquela região.

O próximo passo, depois de a autarquia perceber os fluxos de turistas, é levar a que se espalhem mais pelo território, criando novos “pontos de interesse”.

Ao mesmo tempo que os “fellows” do programa de verão trabalham neste projeto, há um português a desenvolver um projeto parecido, em parceria com o Turismo de Portugal.

Para a sua tese de Mestrado em Gestão de Informação, João Fonseca decidiu analisar o modo como os turistas se comportam em Portugal, mais especificamente em Lisboa e no Porto. Através de dados de redes sociais (fotografias e publicações de turistas em determinados locais), no Airbnb e nas telecomunicações, João está a tentar perceber os perfis desses turistas.

O facto de estar a trabalhar lado a lado com os 15 “fellows” a participar no Data Science for Social Good é “uma aprendizagem gigantesca”, garante. Estes cientistas de dados “têm um nível de conhecimento enormíssimo sobre esta área” e têm-no ajudado muito no desenvolvimento do seu projeto.

Os problemas concretos para os quais se procuram soluções neste programa de verão estão associados a quatro países, mas eles na verdade são globais. Por isso, todos os códigos criados durante o curso são open source (podem ser usados e modificados por qualquer pessoa). “Temos repositórios onde as pessoas podem explorar o que fizemos, pegar no código e aplicá-lo no âmbito das suas instituições”, diz Leid Zejnilović.

“Queremos que isto seja mais do que um conhecimento que vive numa escola durante 12 semanas. Queremos que seja um conhecimento aberto”, afirma o professor.

O código é partilhado, mas os dados não. “Quaisquer dados que não sejam públicos não são partilhados. Não queremos pôr em causa a privacidade das pessoas”, afirma o professor.

Cinco anos depois da criação do programa, o “Data Science for Social Good” ainda não vê grandes resultados práticos – isto porque as áreas de aplicação são sensíveis e exigem toda a precaução. “Estas coisas levam vários anos a construir, testar, implementar. Estamos a ver os nossos primeiros projetos implementados”, conta o fundador do programa.

Rayid Ghani diz já ver alguns resultados, mas “neste momento é demasiado cedo para falar sobre eles. Estas coisas demoram três, quatro anos a serem implementadas”.

No entanto, o professor vê já dois resultados: “estamos a treinar pessoas para perceber problemas sociais e vemos que depois eles vão trabalhar com governos e organizações”. Além disso, “vemos que as organizações estão a usar mais dados”.

O cientista chefe da campanha de Obama, em 2012, diz não querer voltar à política, para já, porque sente que aquilo que faz, neste momento, tem um impacto social maior (e não há gente suficiente a fazê-lo).

Leid Zejnilović pensa que devem ser as universidades a assumir a liderança nestas inovações. “Se nós, como universidade, não quisermos fazê-lo, será a Google ou a Amazon, que já têm os nossos dados”, alerta o docente da Nova SBE. “Eu acredito que devemos assumir a responsabilidade de tratar deste assunto”, afirma.

Para isso, diz Rayid Ghani, as universidades devem dar mais competências em ciências sociais e ética a futuros cientistas de dados. "Neste momento os melhores alunos estão a ir para as grandes empresas, mas não acho que seja porque não querem saber destes problemas. Acho que é porque não sabem que as suas competências podem ajudar a resolvê-los", diz o fundador do projeto.

"As pessoas saem daqui e vão resolver esses problemas. Isso significa que é possível, só temos que o fazer numa escala maior", remata Rayid Ghani.

Comentários
Tem 1500 caracteres disponíveis
Todos os campos são de preenchimento obrigatório.

Termos e Condições Todos os comentários são mediados, pelo que a sua publicação pode demorar algum tempo. Os comentários enviados devem cumprir os critérios de publicação estabelecidos pela direcção de Informação da Renascença: não violar os princípios fundamentais dos Direitos do Homem; não ofender o bom nome de terceiros; não conter acusações sobre a vida privada de terceiros; não conter linguagem imprópria. Os comentários que desrespeitarem estes pontos não serão publicados.

  • Francisco Mello
    18 ago, 2018 Carcavelos 22:16
    Salvar o mundo? Realmente, é um mundo bem distraído, que caminha, por causo de pecado, para a destruição. E só não será destruído, porque DEUS há-de intervir. Enquanto este mundo se mantiver na via da cultura da morte, continuará no caminho da auto-destruição.
  • RAYMUNDO de Oliveira
    16 ago, 2018 Rio de Janeiro 03:11
    Belíssimo trabalho, colocando a tecnologia de ponta a serviço dos mais carentes. Parabéns a toda essa equipe de jovens talentosos. Para isso deve servir, principalmente, a ciência e as tecnologias. Vamos construir um mundo melhor, mais justo , mais fraterno, mais humano. Raymundo

Destaques V+