');
transparente.png

Health Lake

Dados públicos e privados
sobre a saúde brasileira
ao seu alcance

About me

Um lago de dados brasileiro no domínio da saúde

Lago de Dados

Uma forma unificada, escalável, resiliente e auditável para armazenar dados relativos ao COVID-19 e posteriormente de outras doenças. Sempre com foco no Brasil. Nosso projeto é executado por voluntários espalhados por todo o país! Tudo isso patrocinado e apoiado por empresas de base tecnológica.

Motivação

Fomos motivados pela eclosão da COVID-19 a criar um projeto com componentes open-source, de forma unificada, escalável, resiliente e auditável. Vimos de perto a situação desesperadora do Brasil frente aos desafios de coleta e integração de dados. Nosso sonho é mudar nosso país para uma cultura mais data-driven, começando pela saúde.

Como?

Para alcançar nosso sonho, estamos desenvolvendo uma fonte confiável que possa permanecer disponível até mesmo após falhas eventuais das plataformas do Governo.
Nosso ponto inicial foi o levantamento de dados sobre o Coronavírus. O nosso Lago de Dados irá conter as mais diversas informações públicas e privadas sobre a área da saúde!

Longevidade

O projeto iniciou-se durante a pandemia do COVID-19, mas não se limita a ela. A ideia central do projeto é que outras doenças sejam integradas e que o acesso aos dados seja patrocinado por entidades públicas e privadas de forma vitalícia.

Onde

Todos os dados são armazenados em nuvem. A arquitetura do projeto prevê em um segundo momento uma redundância através da disponibilização dos dados em três nuvens principais de mercado. Assim, teremos a possibilidade de conceder acesso a todos os pesquisadores e profissionais que tenham interesse em investigar os dados do Health Lake.

Custos

As horas de profissionais utilizadas no projeto são totalmente voluntárias e os custos de cloud, design e marketing foram inicialmente patrocinados pela DataSprints.
O projeto é aberto para contribuições monetárias de pessoas físicas, jurídicas e governamentais.

Apoiadores e Patrocinadores

DATASPRINTS

Patrocinador

Consultoria de Inteligência de Dados ponta a ponta. Participa ativamente da evolução do projeto atuando como facilitadora e provedora para o projeto, investindo tempo de colaboradores e o auxiliando com recursos mensais (nuvem, marketing, design etc.)

www.datasprints.com

Amazon Web Services

Patrocinador

Web Services da Amazon, a AWS patrocinou o projeto com 100.000 USD de créditos para uso da nuvem AWS S3, além disso contamos com seu apoio institucional na promoção de eventos e divulgação do conteúdo desenvolvido.

www.aws.com.br

INLOCO

Apoiador

Empresa de tecnologia de base privada especialista em serviços de geolocalização. Fornece dados de mobilidade anonimizada de Brasileiros usuários de aplicativos mobile.

www.inloco.com

PEBMED

Apoiador

Plataforma de conteúdo para profissionais de saúde de base privada. Fornece dados anonimizados de consumo de conteúdo de saúde por médicos Brasileiros usuários do aplicativo Whitebook.

www.pebmed.com

COLETIX

Patrocinador

Serviço de coleta de dados fornecedor de pipelines específicas de integração dados e monitoria de qualidade.

www.coletix.com

SPOT SCI

Apoiador

Plataforma de conteúdo jornalístico de divulgação científica e material didático qualificado para o ensino de ciências.

www.spotsci.com

Nossos Líderes Técnicos

Beatriz Antunes

Data Project Manager

Gerencia a área de Engenharia de Dados.

Linkedin

Bruno Braziel

Data Engineering Tech Lead

Atua como Tech Lead do time de Engenharia, gerenciando a infraestrutura de dados do projeto.

Linkedin

Guilherme Eid

Data Analysis Tech Lead

Desenvolve análises em Plataformas de Visualização a partir dos dados disponíveis no Lago.

Linkedin

Larissa Eletério

Data Science Tech Lead

Atua na publicação de artigos a partir das análises dos dados disponíveis no Lago e auxilia a equipe de Engenharia na documentação das bases de dados e na elaboração de pipelines.

Linkedin

Luccas Meireles

Data Project Manager

Responsável por auxiliar e definir os padrões de gerenciamento de projeto, a fim de otimizar o controle e a execução das propostas de acordo com a organização.

Linkedin

Marcelo Felippe

Data Engineering Tech Lead

Atua no desenvolvimento da infraestrutura do projeto e na orquestração das demandas da engenharia. Além disso, também atua em um projeto end-to-end utilizando Machine Learning, Engenharia e Ciência de Dados.

Linkedin

Pedro Gemal

Technical Lead

Apoio na concepção e execução de projetos de dados.

Linkedin

Thaís Nunes

Communication Tech Lead

Lidera a equipe de Comunicação responsável pelo gerenciamento de mídias sociais, site e relações pública. Além de atuar na captação de recursos e desenvolvimento de parcerias para o projeto.

Linkedin

Victor Arnaud

Data Project Manager

Responsável por auxiliar e definir os padrões de gerenciamento de projeto, com foco nos time de ciência e análise de dados.

Linkedin

Conheça todos os voluntários

FAQ

Como os dados são disponibilizados?

Uma das possibilidades de disponibilização dos dados são relatórios com gráficos interativos, largamente conhecidos pela aplicação corporativa de ferramentas de self-service BI (Business Intelligence). No entanto, o Health Lake pode ser disponibilizado através de análises estatísticas, modelos estatísticos ou de Inteligência Artificial. Em alguns casos, nosso Lago pode ser utilizado simplesmente como uma maneira de explorar os dados disponíveis e comparar com análises prévias.

O foco do projeto é Global ou Estadual?

Nenhum dos dois. Focamos no Brasil e em dados granulares a nível municipal. Cogitamos a possibilidade de utilizar dados de pessoas anonimizados mas, até o presente momento, os dados de geolocalização são os mais granulares disponíveis.

Esse é mais um monitor de casos diagnosticados sem inteligência?

Apesar de reconhecermos a dificuldade em obtermos dados confiáveis no Brasil, o objetivo do projeto não é o de prover somente dados para análises descritivas. Queremos impactar estudos que trabalham com análises prescritivas, como: "Quando é a melhor época para a volta às aulas?"

Gostaria de fazer parte do projeto!

Envie um email para recrutamento@datasprints.com com seu currículo ou Linkedin, um parágrafo descrevendo sua motivação e onde acha que faria sentido contarmos com sua a ajuda! Ficaremos felizes em recebê-la(o).

Os dados do Health Lake estão sujeitos à legislação nacional e internacional de proteção de dados pessoais?

Não! Todos os dados que compõem o Health Lake são anonimizados, portanto, não configuram dados pessoais.

Posso comercializar dados do Health Lake?

O Health Lake é um serviço de natureza pública, de acesso gratuito. É expressamente vedada a utilização de qualquer dado disponibilizado no Health Lake para o desenvolvimento de qualquer produto ou serviço comercializável. Essa prática configura violação da licença de distribuição dos dados.