Tribunal de contas da união tc 005. 003/2014-8



Baixar 5,26 Mb.
Página16/17
Encontro27.09.2018
Tamanho5,26 Mb.
1   ...   9   10   11   12   13   14   15   16   17

4.4 Portal Brasileiro de Dados Abertos


274. O portal brasileiro de dados abertos (dados.gov.br), além de servir como um catálogo que contém os dados abertos produzidos ou custodiados pelos entes da administração pública, disponibiliza links para orientações técnicas sobre o tema, tais como a cartilha técnica para publicação de dados abertos no Brasil (peça 36), a cartilha técnica para desenvolvedores (peça 37) e o guia de dados abertos da OKF (opendatahandbook.org/pt_BR), destinados tanto ao público interno quanto à sociedade, especialmente os desenvolvedores de aplicações.

275. O próprio MP abriu parte dos dados públicos de um dos sistemas estruturantes da Administração Pública Federal, pelos quais é responsável, o Sistema de Convênios e Contratos de Repasse da Administração Pública Federal (Siconv), e os catalogou no Portal Brasileiro de Dados Abertos, no endereço dados.gov.br/dataset/siconv.

276. O portal brasileiro de dados abertos é baseado na plataforma de código aberto para portais de dados denominada CKAN (ckan.org/) da Open Knowledge Foundation (okfn.org). O CKAN é um padrão para portal de acesso a dados abertos, que possibilita acesso às informações por meio de uma API, com vistas a simplificar a automação e o reuso das informações por outras soluções tecnológicas.

277. Durante a fase de elaboração deste relatório, buscando avaliar a situação desse portal em momento em que a LAI e o próprio portal já contavam com mais de dois anos de vida, foi efetuada, em 21/7/2014, uma análise quantitativa e qualitativa do seu conteúdo. A análise foi feita a partir do catálogo disponível em dados.gov.br/dataset e do acesso a algumas das bases disponibilizadas no portal.

278. O catálogo do portal é dividido em conjuntos de dados, cada um contendo uma ou mais fontes de dados de temas inter-relacionados que podem ser individualmente acessadas. O portal denomina essas fontes de dados como recursos. Ou seja, o portal trata conjunto de dados como o agrupamento de recursos inter-relacionados. Cada conjunto de dados é identificado por um título, apresenta uma breve descrição do seu conteúdo e é indexado segundo algumas de suas propriedades, a saber: formato de seus arquivos, grupos temáticos e palavras chave (tags ou etiquetas). Os recursos podem ser disponibilizados em mais de um formato e identificados por mais de uma palavra chave. Um conjunto de dados recebe um selo “open data” se ele satisfaz a definição de dado aberto da organização The Open Definition (opendefinition.org) ou, em caso contrário, recebe o selo “Não abertamente licenciado”.



279. Para exemplificar, tomou-se, à época, o conjunto de dados Lista de Eleitores Filiados aos Partidos Políticos (dados.gov.br/dataset/filiados-partidos-politicos), pertencente ao grupo temático Governo e Política e com as seguintes etiquetas: TSE, eleitores, eleitores filiados, filiação partidária, partidos e partidos políticos. Esse conjunto continha 810 recursos, em formato csv, correspondentes aos eleitores filiados a cada um dos partidos políticos do Brasil em cada Unidade da Federação, como, por exemplo: Filiados ao PSC no Distrito Federal e Filiados ao PSDB em São Paulo.

280. No momento da análise, o catálogo apresentado pelo portal disponibilizava 55 conjuntos de dados e declarava que eles continham 2.135 recursos, distribuídos segundo suas propriedades nas várias etiquetas e grupos temáticos. Receberam o selo “open data” somente onze conjuntos de dados, o que representa 20% do total de conjuntos de dados.

281. Após alguns testes de busca no catálogo e algumas pesquisas feitas pelo sítio, foi possível identificar diversos conjuntos de dados que estavam de fato no portal, encontrados por caminhos de busca alternativos, mas que não puderam ser encontrados diretamente a partir da busca no catálogo. Citam-se como exemplos de recursos que constavam do sítio, mas não do catálogo, os seguintes: Cadastro Nacional de Entidades Sociais, que consta na página principal do portal, no elemento “Dados em destaque”, e que pode ser acessado no link dados.gov.br/dataset/cadastro-nacional-de-entidades-sociais; Unidades Básicas de Saúde (UBS), acessado pelo link dados.gov.br/dataset/unidades-basicas-de-saude-ubs; e Orçamento Federal, acessado pelo link dados.gov.br/dataset/orcamento-federal.

282. Essas discrepâncias levantam dúvidas com relação à integridade do catálogo disponibilizado e às estatísticas quantitativas por ele oferecidas, tal como o número de conjuntos de dados existentes no portal. Notou-se, por exemplo, que a totalização de conjuntos de dados por etiqueta na página principal mostrava valores diferentes daqueles obtidos ao acessar diretamente o catálogo. Diante disso, foi feito contato com a equipe gestora do portal na SLTI/MP, que reportou a existência de um problema de indexação que estaria sendo corrigido pelo Serpro, o hospedeiro do portal. Assim, de forma alternativa à realização dessa análise, a equipe gestora do Ministério sugeriu a utilização de um catálogo disponível no ambiente de desenvolvimento, cuja construção se baseou numa versão mais recente que aguardava homologação. Essa nova versão foi disponibilizada na internet no dia 1º/8/2014, contendo 239 conjuntos de dados e 2.135 recursos.



283. No entanto, estima-se que uma parte considerável dos 239 conjuntos de dados catalogados na nova versão do portal - 96 conjuntos ou 40% do total - é simples referência a recursos disponíveis em outros sítios na internet. É o que ocorre com os conjuntos de dados sob a etiqueta Inde. Do total de 135 conjuntos de dados, 96 apenas redirecionam o usuário ao visualizador de mapas da Infraestrutura Nacional de Dados Espaciais (Inde; visualizador.inde.gov.br), e os demais 39 conjuntos de dados, além de fazer esse redirecionamento, oferecem recursos no formato csv.

284. Nessa nova versão do portal, constam com o selo “open data” somente 47 conjuntos de dados, considerando-se as licenças descritas como “Licença aberta para bases de dados do Open Data Commons”, “Domínio Público”, “Atribuição” e “Aberta”, o que representa 20% do total.

285. Quanto à usabilidade, a página inicial do portal, no endereço dados.gov.br, permite uma visualização rápida dos conjuntos mais acessados e os atualizados mais recentemente. Nesse painel, lê-se que o conjunto atualizado mais recentemente, o foi no dia dois do último junho, ou seja, sessenta dias antes dessa consulta Essa página inicial parece ter como objetivo centralizar as buscas do interessado pelos dados abertos. Nela são apresentados, além das cinco publicações mais recentes, notícias e uma caixa de pesquisa textual.

286. O portal não oferecia, na versão anterior, meios fáceis de identificar a data da última atualização de um recurso disponibilizado ou o período de tempo ao qual ele corresponde. Na nova versão do portal, os recursos são melhor descritos e é possível uma pré-visualização do seu conteúdo, além da possibilidade de cópia. Boa parte dos recursos são arquivos que podem ser importados e, em alguns deles, é possível obter alguns detalhes do período considerado no próprio nome do arquivo. Em outros recursos, o nome da fonte não fornece qualquer informação útil em relação ao período ou a versão dos dados, exigindo a importação dos arquivos e análise do seu conteúdo para obter maiores esclarecimentos.

287. O que se observa é que o portal disponibiliza dados de relevância, tais como as bases do Inep relativas a desempenho escolar, avaliação da educação, etc.; dados do portal da transparência, o cadastro nacional de empresas inidôneas e suspensas, a relação dos servidores do poder executivo federal; diversas bases do IBGE; dados do TSE tais como a lista de eleitores filiados aos partidos políticos; dados do TCU, tais como a relação de licitantes inidôneas e dos inabilitados para função pública entre outros.

288. Em todos os casos citados acima, o portal republica dados existentes em portais dos próprios órgãos fornecedores das respectivas bases. Nesses casos, o portal de dados abertos serve de centralizador, disponibilizando dados de diversas fontes em um único local, o que facilita a busca realizada pelo cidadão.

289. Quanto à atualização das informações, na maioria dos conjuntos de dados pesquisados, os dados disponibilizados no portal estão bastante defasados com relação aos fornecidos diretamente pelo órgão/entidade de origem. Essa defasagem tende a confundir o usuário e a obrigá-lo a recorrer, de qualquer forma, ao sítio internet do fornecedor para obter a informação mais atual. Como exemplo, o conjunto de dados intitulado Despesas Diretas do Poder Executivo Federal publicadas no Portal Transparência contém oito recursos, sendo o arquivo mais atual despesas referentes ao ano de 2011, enquanto no Portal da Transparência os dados são atualizados mensalmente e, no momento dessa análise, os mais atuais se referiam ao mês de maio de 2014.

290. Outro exemplo: no caso do conjunto de dados Convênios do poder executivo federal, publicados no Portal da Transparência, que deveria ter atualização semanal, não é possível verificar o período compreendido pelos dados a partir do nome do arquivo disponibilizado nem pelo detalhamento ou pré-visualização desse recurso, uma vez que o campo Última Atualização consta como desconhecido. Somente após a cópia do arquivo, verifica-se que se trata de uma versão que compreende convênios com data de publicação entre abril de 1989 e março de 2013. Porém, no portal da transparência, é possível obter a mesma base atualizada até 22/7/2014 (uma semana anterior à data da pesquisa).

291. Da mesma forma, nota-se que os recursos disponibilizados representam, muitas vezes, uma pequena fração do conteúdo informacional existente no órgão fornecedor. É o caso, por exemplo, do IBGE, que disponibiliza, no portal brasileiro de dados abertos somente treze conjuntos de dados de um conjunto de centenas de bases disponíveis no próprio sítio do IBGE na internet. E, considerando-se a lista das dez séries estatísticas mais acessadas no sítio do IBGE, (downloads.ibge.gov.br/downloads_top.php), somente duas estão disponibilizadas no portal brasileiro de dados abertos: uma relativa ao Índice de Preços ao Consumidor (IPCA), sendo que no sítio do IBGE é possível obter a série histórica até junho de 2014 e no portal de dados abertos a última série disponível vai de 2006 a 2011; e a outra relativa à malha geométrica dos municípios, sendo que no sítio do IBGE é possível obter a série de vários anos (2001, 2005, 2007, 2010 e 2013; downloads.ibge.gov.br/downloads_geociencias.htm) e no portal de dados abertos somente os dados referentes a 2010.

292. Outra questão relevante diz respeito à documentação dos recursos. Na maioria dos conjuntos de dados pesquisados nas duas versões do portal brasileiro de dados abertos, havia informação sumária descrevendo o conteúdo dos recursos e muito pouca descrição dos dados em si (metadados). Para compreender as informações disponibilizadas, é muitas vezes necessário acessar o sítio internet da instituição fornecedora dos dados e buscar as explicações necessárias à sua compreensão.

293. Ao que parece, não é papel da equipe gestora do portal brasileiro de dados abertos gerenciar a frequência de atualização dos dados catalogados pelo fornecedor, sua documentação, nem os critérios de seleção dos dados tornados abertos dentre as bases ou recursos que a instituição fornecedora detém. Os próprios fornecedores, ou seja, órgãos e entidades que aderem ao portal brasileiro de dados abertos, é que devem gerir os recursos publicados. Essa gestão tem sido heterogênea, com alguns conjuntos de dados atualizados e bem documentados no portal brasileiro de dados abertos, enquanto outros conjuntos de dados encontram-se bastante defasados e com documentação precária.



294. Dessa forma, conclui-se que o Portal Brasileiro de Dados Abertos, como ambiente centralizador do tema, disponibiliza dados da APF de relevância. Da breve análise do portal verificou-se as seguintes dificuldades (parágrafos 274 a 293): a maioria dos conjuntos de dados disponibilizados não recebem o selo open data por não preencherem os requisitos inerentes ao conceito de dados abertos; a maioria dos conjuntos de dados estão desatualizados; os dados disponibilizados por organizações públicas nesse portal são, em sua maioria, uma fração dos dados disponibilizados em seus próprios sítios e sua gestão tem sido heterogênea, com alguns conjuntos de dados atualizados e bem documentados, outros bastante defasados e com documentação precária; e não se evidenciou a disponibilização de informações estatísticas acerca do uso e reuso dos dados abertos, tais como número de acesso ou de downloads realizados.

4.5 Atuação das empresas públicas prestadoras de serviços de TI em Dados Abertos e Big Data


295. Nesta seção, descreve-se o cenário de atuação do Serviço de Processamento de Dados do Governo Federal (Serpro) e da Empresa de Tecnologia e Informações da Previdência Social (Dataprev) em relação ao tema de dados abertos e de tecnologias de Big Data. Essa descrição se justifica em virtude do fato de essas entidades serem prestadores de serviços de TI para instituições e, além disso, custodiantes de um grande volume de dados de interesse coletivo e geral produzidos pela Administração Pública Federal.

4.5.1 Dataprev

296. A Dataprev é uma empresa pública vinculada ao Ministério da Previdência Social (MPS), que tem por objetivo estudar e viabilizar tecnologias de informática, na área da previdência e assistência social, compreendendo prestação de serviços de desenvolvimento, processamento e tratamento de informações, atividades de teleprocessamento e comunicação de dados, voz e imagem, assessoramento e assistência técnica no campo de sua especialidade.

297. Por tratar-se de uma entidade destinada a custodiar e divulgar informações de alto valor para a gestão e o acompanhamento da previdência, assistência social, seguro desemprego e fiscalização do trabalho no Brasil, a Dataprev é um ator estratégico no que diz respeito a governo aberto e dados de interesse social.

298. São descritas, a seguir, as informações obtidas por meio da resposta ao Ofício de Requisição 3-137/2014 (peça 32), assim como as colhidas na reunião realizada em 24/4/2014 com representantes da Dataprev, dentre os quais o Sr. Raphael Pacheco, assessor de diretoria da presidência da empresa e responsável pelas iniciativas de dados abertos.

Oferta de serviços de abertura de dados

299. O serviço de publicação de dados abertos constitui um novo negócio para a Dataprev, que tem investido recursos com pesquisa e desenvolvimento na tecnologia e na infraestrutura necessária para a futura prestação desse serviço aos seus clientes (peça 32, p. 2-3).

300. A Dataprev elaborou minutas referentes ao modelo de negócio e ao modelo de comercialização de serviço de publicação de dados abertos (peças 33 e 34) que se encontram em fase de análise e cuja aprovação pela direção da empresa, de acordo com o Plano de Ação 2014, está prevista para o ano de 2014 (peça 32, p. 2).

301. Dessa forma, o serviço de publicação de dados abertos não se encontra no catálogo de serviços da empresa e, portanto, ainda não pode ser contratado pelos atuais e potenciais clientes da Dataprev (peça 32, p. 2).

302. No entanto, apesar da Dataprev ainda não ter sido demandada ou contratada por seus clientes para prestação do serviço de disponibilização de dados públicos em formato aberto, a empresa acredita ser de interesse do Governo Federal que esses dados, nos diversos órgãos, sejam publicados em formato aberto e, portanto, prepara-se para prover esse serviço (peça 32, p. 4).

Abertura de dados custodiados pela Dataprev

303. A Dataprev realizou um evento com seus desenvolvedores internos, denominando-o de Hackathon interno. O evento utilizou dados custodiados pela Dataprev, mas sem participação direta de seus clientes. Segundo a empresa, os principais benefícios advindos do Hackathon interno foi, entre outros, a constatação da importância da qualidade e da relevância dos dados a serem publicados (peça 32, p. 2).

304. Além desse evento, a Dataprev publica, em caráter experimental, algumas bases de dados, das quais destacam-se o Anuário Estatístico da Previdência Social (Aeps), publicado em formatos abertos (json, xml e csv). Esse anuário corresponde às informações divulgadas pelo Ministério da Previdência Social (previdencia.gov.br/estatisticas), originalmente disponibilizados em arquivos pdf e tabelas xls (peça 32, p. 3). Os dados abertos do anuário apresentam-se publicados sob a forma de um conjunto de mais de cem conjuntos de dados (datasets) no portal de dados abertos da Dataprev (dadosabertos.dataprev.gov.br).

305. Ressalta-se que o Ministério da Previdência Social não participou da decisão de publicar dados do Anuário Estatístico da Previdência Social, no portal de dados abertos da Dataprev. Entretanto, houve ciência da intenção e autorização prévia para tal por parte da Coordenação Geral do Regime Geral de Previdência (peça 32, p. 4).



306. Na entrevista realizada em 24/4/2014, os representantes da Dataprev apontaram as seguintes dificuldades para a abertura de dados:

306.1. carência de definições únicas para termos correlatos empregados em sistemas diferentes, o que limita as possibilidades de integração desses dados (seria necessário reduzir as ambiguidades de vocabulário com a construção de uma ontologia);

306.2. problemas relativos à integridade e à confiabilidade dos dados; e

306.3. escassez de profissionais qualificados na área de ciência de dados (data science).

Uso de tecnologias de Big Data pela Dataprev

307. A Dataprev associou-se à Fundação Osvaldo Cruz/MS (FioCruz) para tornar disponíveis as bases de pesquisa na área de saúde realizadas com recursos públicos.

308. Foi firmado um convênio com a UFMG, em dezembro de 2013, para uma consultoria para realização de dois projetos pilotos em um projeto de dois anos, a título de investimento da empresa.

309. No primeiro projeto piloto com a Universidade, que se encontra em andamento, foi implantada uma infraestrutura para instalação de uma plataforma de processamento massivo de dados para execução de algoritmos de mineração de dados aplicados a uma questão específica de negócio, qual seja, os problemas que o INSS vem enfrentando para o agendamento das perícias médicas. Nesse projeto, a Dataprev realizou a extração dos dados e a UFMG está realizando a etapa de análise e caracterização dos dados.

310. Os principais benefícios esperados do convênio são materializados no conhecimento técnico a ser adquirido pelas equipes da empresa e na diminuição do risco tecnológico na escolha de uma nova solução relacionada ao tema (peça 32, p. 3).

Conclusão

311. Em face do exposto no levantamento realizado junto à Dataprev, é possível concluir que:



a) a empresa custodia e difunde informações de alto valor social;

b) trata-se de uma instituição sensível à importância da política de dados abertos, que aderiu à Inda e ao portal brasileiro de dados abertos e que, antecipando-se a futuras demandas de seus clientes, desenvolveu um serviço para a abertura de dados de outros órgãos e entidades governamentais, além de ter concluído com sucesso a abertura dos dados do Anuário Estatístico da Previdência Social;

c) o modelo de negócio em relação ao novo serviço permanece incerto, visto que ainda não houve contratações desse serviço de abertura de dados pelos clientes da Dataprev;

d) como dificuldades para a abertura de dados, os representantes da empresa apontaram: carência de definições únicas para termos correlatos empregados em sistemas diferentes, o que limita as possibilidades de integração desses dados; problemas relativos à integridade e à confiabilidade dos dados; e escassez de profissionais qualificados na área de ciência de dados;

e) em relação a projetos de Big Data, a empresa ainda está iniciando projeto piloto de pesquisa, mediante convênio com a UFMG, com o intuito de adquirir conhecimento técnico e diminuir o risco tecnológico na escolha de uma eventual solução relacionada ao tema.

4.5.2 Serpro

312. O Serpro é uma empresa pública vinculada ao Ministério da Fazenda (MF), que tem por negócio prestar serviços em tecnologia da informação e comunicações para o setor público.

313. Trata-se de uma entidade que se destina a desenvolver programas e serviços para permitir um maior controle e transparência sobre a receita e os gastos públicos, o que representa seu principal mercado de atuação. Além disso, desenvolve programas para ações estruturadoras da Administração Pública Federal, sob a gestão do Ministério do Planejamento, Orçamento e Gestão (MP), e programas que contemplam questões sociais de acessibilidade e inclusão digital. Desse modo, o Serpro também é um ator estratégico no que diz respeito a governo aberto e dados de interesse social.

314. São descritas e analisadas, a seguir, as informações obtidas por meio da resposta aos itens constantes no Ofício de Requisição 1-137/2014 (peça 12), assim como as colhidas na reunião realizada em 9/4/2014 na sede da empresa com seus representantes acerca dos temas dados abertos e Big Data.

Serviços de manutenção do Portal Brasileiro de Dados Abertos (dados.gov.br)

315. O Serpro hospeda o ambiente de hardware e software do Portal Brasileiro de Dados Abertos (dados.gov.br), tendo sua infraestrutura localizada no centro de dados do Serpro no Rio de Janeiro. O portal também é baseado na plataforma de código aberto para portais de dados CKAN, da OKFN (peça 24, p. 1).

316. À época dos trabalhos de campo, o Serpro informou que o Portal Brasileiro de Dados Abertos contava com 231 conjuntos de dados disponibilizados.

Ausência de oferta de serviços de abertura de dados a seus clientes

317. Entretanto, o Serpro manifestou que não há serviço específico e exclusivo para dispor dados públicos, de propriedade dos seus clientes, para publicação no Portal Brasileiro de Dados Abertos (peça 24, p. 2). Ademais, destacou que não firmou até então qualquer contrato que preveja disponibilização de dados dos sistemas sob sua guarda para o referido portal (peça 24, p. 4).

318. Além disso, o Serpro informou que não publica informações dos sistemas estruturantes do MP (Siape, Siasg, Comprasnet, SCDP e Siconv) nem da Secretaria do Tesouro Nacional (Siafi) diretamente no Portal Brasileiro de Dados Abertos (peça 24, p. 2).

319. O Serpro ressaltou que, nos contratos com esses clientes, há previsão de entrega de dados específicos e outras formas de extrações ao cliente demandante, as quais são faturadas sob o serviço de “apuração especial”. A entidade salientou que o destino do dado entregue ao cliente demandante não é de responsabilidade do Serpro (peça 24, p. 3).

320. O contrato celebrado entre o Serpro e o MP, por exemplo, define o serviço “apuração especial” como funcionalidades executadas apenas uma vez (grifo nosso) para: corrigir problemas ou atualizar dados nas bases de dados das aplicações; gerar um relatório específico ou arquivo para o usuário por meio de recuperação de informações nas bases da aplicação. Esses serviços, quando demandados, são cobrados seguindo a metodologia de pontos por função estabelecida pelo Sisp. De forma análoga, o contrato entre o Serpro e a STN define “apuração especial” como o desenvolvimento de rotinas para extração eventual de dados de um sistema ou para acerto do conteúdo da base de dados, sendo faturado também por ponto de função (peça 24, p. 3).

321. Assim, o Serpro envia dados dos sistemas estruturantes do MP para o portal da transparência da Controladoria Geral da União, conforme formatos e leiautes definidos pelo MP. Os dados do SCDP e do Siconv, semanalmente, e os dados do Siape, Siasg e do Comprasnet, mensalmente.

322. No caso do contrato com a STN, por exemplo, o Serpro disponibiliza dados do Siafi no formato de arquivos txt para download por usuários habilitados. Ou seja, nesse caso há restrição de acesso aos dados (peça 24, p. 2).

323. Convém lembrar que, em geral, os dados são disponibilizados em arquivos txt, formato não estruturado, portanto. Além disso, não são fornecidos metadados para permitir o entendimento do dado que está sendo entregue, o que seria necessário para serem considerados dados abertos (peça 24, p. 4).

324. No modelo de apurações especiais, os próprios gestores do Serpro apontaram as seguintes dificuldades para a abertura de dados (peça 24, p. 4):

a) baixos ganho de escala e reuso;

b) muito esforço na realização de cada demanda, visto que exige formatação e estruturação dos dados nos padrões definidos para dados abertos (organização para possibilitar o processamento por máquinas e inclusão de metadados);

c) exigência de conhecimento especializado dos modelos internos das bases de dados;

d) concorrência por recursos humanos com o desenvolvimento e evolução dos sistemas.

Uso de tecnologias de Big Data pelo Serpro

325. Com relação ao assunto, o Serpro informou que, nos últimos dois anos, vem prospectando tecnologias que permitam acessar grandes volumes de dados com baixa latência. Dentre essas tecnologias, citam Appliances de bancos de dados, ou seja, dispositivos de hardware com software integrado especificamente projetado para um propósito particular, no caso, consultar grandes bancos de dados de ambientes de Business Intelligence.

326. Outra linha de prospecção, segundo os gestores do Serpro, é a disponibilização dos dados dos sistemas via sua replicação, possibilitando seu acesso, em tempo real e sem concorrer com o ambiente produtivo. Esse tipo de abordagem tem sido chamada de Dados como Serviço (Data as a Service). Mas nessa prospecção, o Serpro ainda utiliza bancos de dados tradicionais na replicação dos dados. Uma evolução desta abordagem seria o uso de banco de dados baseados nas técnicas de Map Reduce (research.google.com/archive/mapreduce.html), tais como Hive/Hadoop (en.wikipedia.org/wiki/Apache_Hive), em substituição aos bancos de dados tradicionais atualmente utilizados. Segundo os interlocutores do Serpro, essa evolução no conjunto das arquiteturas utilizadas seria o que o mercado vem chamando de “Big Data”, o que ainda não é praticado pela empresa.



Conclusão

327. Em face do exposto no levantamento realizado junto ao Serpro, conclui-se que:



a) a empresa custodia e difunde informações de alto valor social;

b) trata-se de uma instituição que ainda não se mostra sensível à importância dos dados abertos, uma vez que, embora mantenha o Portal Brasileiro de Dados Abertos, não demonstrou estar se preparando para oferecer serviço exclusivo e específico para abertura de dados de seus clientes;

c) o modelo de apurações especiais adotado pelo Serpro para disponibilizar dados públicos, de propriedade dos seus clientes, seja para publicação no Portal Brasileiro de Dados Abertos ou para outra destinação, mostra-se ineficiente e oneroso para a Administração Pública Federal, em face das dificuldades reconhecidas pela própria empresa pública;

d) a empresa está prospectando tecnologias que permitam acessar grandes volumes de dados em alta velocidade, mas ainda não utiliza tecnologias que o mercado vem chamando de Big Data.


1   ...   9   10   11   12   13   14   15   16   17


©livred.info 2017
enviar mensagem

    Página principal