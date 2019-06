Para proceder à recolha dos contratos do Portal BASE, criado para promover a transparência na contratação, a Renascença escreveu um “scraper” - um “robot” em código que recolhe informações - que requisitou os dados em duas fases.

Inicialmente, a Renascença requisitou ao Portal BASE todos os contratos celebrados entre 2011 e 2019 por um conjunto de 67 hospitais públicos recorrendo ao seu NIF.

Como o Portal BASE coloca uma limitação no número de “respostas” que devolve, a Renascença pediu ao site os dados de 10 em 10 dias no intervalo de tempo analisado. Como esse pedido devolveu casos repetidos, a Renascença eliminou os casos em que todos os campos - desde o preço, à data de celebração, como a própria descrição - era igual.

Recolhemos assim 263.992 contratos que incluíam todo o tipo de gastos dos hospitais - desde a compra de medicamentos, passando pela compra de parafusos para a reparação de camas. Devido à quantidade de dados e à necessidade de respeitar os tempos de resposta do site, este processo de recolha foi lento, tendo sido iniciado às 23h45 de 5 de fevereiro de 2019 e tendo terminado a 20 de fevereiro às 15h14.

Dessa base de dados inicial, e tendo sido já filtrados os casos repetidos, a Renascença procedeu a uma primeira filtragem automatizada para tentar retirar da parafernália de contratos recolhidos, aqueles que correspondiam somente a contratos de médicos tarefeiros. Fizemo-lo selecionando os casos que, no campo “Objeto do Contrato”, recorriam a alguma palavra que os associasse a serviços médicos, que estavam associados à “Aquisição de serviços” no campo “Tipo(s) de Contrato” e que não continham nenhuma destas palavras no campo CPVs (Vocabulário Comum para os Contratos Públicos).

Apesar desta primeira base de dados já conter um número alto de contratos de prestação de serviços médicos, a Renascença optou por realizar uma segunda recolha de forma a assegurar que a limpeza de dados não eliminou nenhum caso que deveria ter sido mantido. Para tal, e com recurso à primeira base de dados já filtrada, elencamos uma lista com o NIF de entidades que, durante esse período, realizou pelo menos um contrato. Usando essa lista, requisitamos ao Portal BASE, com recurso a um segundo “robot”, todos os contratos que essas empresas - chamadas entidades adjudicatárias - realizaram com instituições públicas. Essa segunda recolha aconteceu entre as 20h12 do dia 12 de abril e as 00h18 do dia 13 de abril, tendo devolvido um total de 28.007 contratos.

Como esta segunda recolha ainda incluía vários casos que não correspondiam a casos de médicos tarefeiros, e correndo o risco de uma limpeza “automatizada” poder eliminar casos que interessavam para a análise, a Renascença fez uma limpeza manual desta base de dados. Esta limpeza foi feita com recurso ao Google Sheets, tendo os jornalistas da Renascença lido o campo “Objecto do Contrato” e procedendo à avaliação se o contrato em causa se referia à contratação de médicos tarefeiros.

Quando o contrato em causa causava dúvidas, ou quando a informação disponibilizada não era suficientemente clara, a Renascença recorreu ao Portal BASE para consultar, quando disponível, o ficheiro .pdf referente ao contrato em causa para averiguar a validade desse caso. Ainda assim, 37 casos não foram suficientemente claros para poderem ser classificados. A Renascença optou por não incluir esses casos na análise.

Como a definição sobre exatamente o que podem ser considerados serviços médicos não é suficientemente clara, a Renascença optou por tomar uma perspectiva o mais abrangente possível para que não corresse o risco de não considerar casos que envolvessem contratação de médicos. É o caso da prestação de serviços de imagiologia ou de meios completementares de diagonóstico que, apesar de não estarem diretamente associados à contratação de médicos, podem incluir a contratação de médicos.A inclusão desses casos pode explicar o facto de sete instituições de saúde terem um valor comunicado ao BASE superior ao valor indicado pela ACSS.

Foi com estes critérios que a Renascença chegou à base de dados de 4.987 contratos que utilizou nesta investigação.

Como muitas instituições incluem no BASE o valor do preço contratual mas não voltaram a atualizar o mesmo contrato para indicar o preço efetivo esse contrato após a sua conclusão, a Renascença optou por criar uma nova variável de preço que obedecia ao seguinte critério: sempre que estivesse disponível o preço real do contrato, era esse o valor que contava mas, nos mais de 50% de casos em que esse valor estava em falta, considerou-se o preço contratual como o preço real - apesar deste valor poder sofrer oscilações.

A Renascença está consciente que, devido à complexidade envolvida na recolha e filtragem de dados, a base de dados em causa pode não representar a 100% dos contratos de serviços médicos disponíveis no Portal BASE, mas está confiante que esta é representativa da realidade.

Todos os dados , assim como a análise com recurso à linguagem de programação R podem ser consultados no Portal de Dados Abertos da Renascença