Tribunal de contas da união tc 005. 003/2014-8



Baixar 5,26 Mb.
Página5/17
Encontro27.09.2018
Tamanho5,26 Mb.
1   2   3   4   5   6   7   8   9   ...   17

2.4 Big Data


63. Inicialmente associada às pesquisas científicas em meteorologia, genômica e simulações físicas, que lidam com grandes quantidades de dados (nature.com/nature/journal/v455/n7209/edsumm/e080904-01.html), a expressão Big Data passou a ser associada à internet, com o processamento de dados associados ao comportamento dos usuários em mídias sociais, como no caso do Facebook ou em pesquisas da Google.

64. Considerando-se que a expressão é recente e que existem inúmeras definições (opentracker.net/article/definitions-big-data), considera-se que Big Data ainda é um termo vago e com definição imprecisa.

65. De forma geral, há definições para Big Data que ressaltam aspectos mais técnicos, enquanto há outras que buscam definir o termo sem o emprego de referências técnicas, tais como a proposta por Victor Mayer Schönberger e Kenneth Cukier, no livro intitulado Big Data: A Revolution that Will Transform How We Live, Work and Think, que define Big Data como:

Big Data se refere a análises de dados em larga escala que não são possíveis quando em baixa escala, para extrair novas ideias ou criar novas formas de valor, que alteram mercados, organizações, o relacionamento entre os cidadãos e os governos, e muito mais (tradução livre).

66. A seguir, tem-se duas definições que consideram aspectos técnicos.

67. Segundo o Gartner, Big Data é a expressão empregada para descrever ativos de informação em grande volume de dados, velocidade de atualização ou consulta e variedade de formatos, que demandam formas de processamento da informação próprias para essas características, para melhor compreensão e tomada de decisão, de um modo que não estaria disponível em uma menor escala do conjunto de dados (gartner.com/it-glossary/big-data).

68. Desse modo, a expressão Big Data é frequentemente utilizada em sentido lato para designar quaisquer grandes bases de dados, cuja análise escapa aos métodos tradicionais em banco de dados relacionais e em estatística descritiva ou que requeiram grande capacidade computacional distribuída em numerosas máquinas para ser executada. A estatística descritiva é a parte que procura descrever e avaliar características de uma amostra da população sem generalizar conclusões ou inferências sobre a população como um todo.

69. Assim, tem-se as seguintes características tecnológicas associadas a soluções de Big Data:



69.1. complexidade do conjunto dos dados: dados em diversos formatos e pouco estruturados que não se adequam ao modelo de armazenamento, manipulação e recuperação de dados adotado em bancos de dados relacionais;

69.2. métodos próprios de análise: métodos baseados em estatística indutiva (a parte da estatística que, baseando-se em resultados obtidos da análise de uma amostra da população, procura inferir, induzir ou estimar as regras de comportamento da população como um todo) e em aprendizado automático (machine learning – o desenvolvimento de  algoritmos e técnicas que permitam ao computador aperfeiçoar seu desempenho em alguma tarefa). Essa análise busca identificar padrões nos dados e correlações entre suas variáveis de forma a construir modelos que permitam realizar previsões mais confiáveis e, em última instância, que guiem ações mais eficientes;

69.3. uso de recursos computacionais distribuídos: devido às dimensões do conjunto de dados e à complexidade das análises estatísticas, seu processamento é tipicamente realizado de forma distribuída, sob numerosas máquinas independentes que atuam de forma coordenada e regidas por softwares próprios, tais como MapReduce (research.google.com/archive/mapreduce.html) e Hadoop (hadoop.apache.org).

70. Exemplo bem sucedido e conhecido de uso de Big Data, o serviço de tradução automática da Google (translate.google.com) consegue bons resultados utilizando correlações estatísticas entre textos que já foram previamente traduzidos por tradutores humanos, obtidos a partir de imensas bases de documentos escritos em várias línguas e de publicações da Organização das Nações Unidas (ONU).

71. Por oportuno, cita-se que o governo dos EUA anunciou, em 2012, uma iniciativa de Big Data (whitehouse.gov/blog/2012/03/29/big-data-big-deal) que agrupa diversos projetos associados à tecnologia em áreas tão diversas quanto defesa, energia, meio ambiente, saúde, espaço e espionagem (whitehouse.gov/sites/default/files/microsites/ostp/big_data_fact_sheet_final_1.pdf). Essa iniciativa levou a um relatório de atividades, de maio de 2014, que aponta conclusões da experiência americana (whitehouse.gov/sites/default/files/docs/big_data_privacy_report_may_1_2014.pdf), das quais se destacam: o caráter inevitável da adoção de Big Data no governo daquele país; riscos relacionados à proteção da privacidade; a relevância dos dados abertos governamentais que podem servir de insumos para projetos de Big Data; e a necessidade de investimento de recursos para tirar o máximo proveito da tecnologia em benefício da população.



72. Diversas publicações propõem benefícios potenciais alcançáveis com o uso de Big Data. Dentre esses benefícios, incluem-se:

a) personalização das respostas geradas por sistemas de informação, como nas recomendações de compra da Amazon (amazon.com), que sugerem automaticamente novos produtos em função de comparações de históricos de compras de sua base de clientes;

b) captação de informações dispersas em redes de sensores ou por meio de contribuições individuais voluntárias, como a iniciativa da cidade de Boston, nos Estados Unidos, que lançou um aplicativo para celulares que detecta a vibração causada pela passagem de um carro sobre um buraco na estrada, registra a posição geográfica em que isso ocorreu com o GPS e transmite esses dados pela internet para os servidores do departamento de estradas do município, que pode então alocar seus recursos em resposta à incidência de buracos e seu impacto sobre os motoristas que usam o aplicativo (cityofboston.gov/doit/apps/streetbump.asp).

c) detecção de fraudes: controle aduaneiro do trânsito de mercadorias (fcw.com/Articles/2013/09/25/big-data-transform-government.aspx?p=1);

d) resposta a incidentes e emergências: antecipação de problemas de trânsito; priorização de resposta a catástrofes (fcw.com/Articles/2013/09/25/big-data-transform-government.aspx?p=1);

e) democratização do acesso à informação: pelo uso de soluções de Big Data em conjunto com soluções baseadas em plataformas abertas, em que dados abertos podem suportar novas aplicações de governo eletrônico desenvolvidas por quaisquer pessoas. Como exemplo, citam-se as avaliações de qualidade e disponibilidade de hospitais e escolas, o que permitiria maior empoderamento da população e eventuais ganhos em participação social (fcw.com/Articles/2013/09/25/big-data-transform-government.aspx?p=1);

f) ganhos de eficiência e produtividade com a otimização do processo produtivo e redução de desperdícios (fcw.com/Articles/2013/09/25/big-data-transform-government.aspx?p=1);

g) novas oportunidades de negócio: como, por exemplo, o desenvolvimento do setor de mapeamento, georreferenciamento e rastreamento, após a abertura de bancos de imagens de satélites e acesso à rede GPS.

73. Identifica-se um consenso de que entre os principais desafios para se obter os benefícios esperados com o uso do Big Data destacam-se questões organizacionais, como acesso aos dados brutos, melhora no uso de métodos estatísticos empregados na análise dos dados (ft.com/cms/s/2/21a6e7d8-b479-11e3-a09a-00144feabdc0.html#axzz2yyxPpCGB) e riscos à privacidade das pessoas (whitehouse.gov/sites/default/files/docs/big_data_privacy_report_may_1_2014.pdf), mais do que questões propriamente tecnológicas, em que há rápidas inovações e contínuo aperfeiçoamento de soluções.


2.5 Benefícios potenciais de dados abertos


74. As práticas de governo aberto, quando promovidas pelo governo, podem gerar benefícios tanto para a sociedade como para o próprio governo. Ao levar conhecimento e entendimento sobre a execução de suas políticas, ações, serviços e desempenho, o governo se permite fiscalizar, expondo junto à sociedade sucessos e insucessos.

75. Em artigo intitulado Effective Open Government: Improving Public Access to Government Information, publicado em 2005, a OCDE já registrava que a transparência e a abertura de dados figuram como aspectos essenciais de um governo moderno (papers.ssrn.com/sol3/papers.cfm?abstract_id=2069870), destacando como benefícios a participação democrática e compreensão do cidadão, a melhoria do processo de tomada de decisão, do gerenciamento dos dados governamentais, da eficiência da gestão, dos serviços oferecidos aos cidadãos, além da redução da corrupção.

76. A literatura lista outros potenciais ganhos decorrentes da abertura das informações públicas. A OKF (okfn.org/opendata) ressalta a participação do cidadão na gestão do governo, uma vez que a disponibilização dos dados governamentais não somente leva informação aos cidadãos, mas também a possibilidade de que eles se envolvam no processo de decisão e contribuam com as ações públicas. É o empoderamento do cidadão que passa ao papel de agente da transformação social por meio do acompanhamento e da fiscalização das ações governamentais, das políticas públicas, enfim do desempenho do governo. Por outro lado, com mais poder e conhecimento, o cidadão pode passar a ter mais confiança no poder público e a se sentir participante desse poder.



77. O aplicativo Política Aberta (politicaaberta.org), por exemplo, apresenta a relação das empresas maiores doadoras de campanhas eleitorais de 2012 e a relação das empresas mais contratadas do governo federal no mesmo ano, fornecendo informação para o exercício do controle social e acompanhamento do processo eleitoral (parágrafo 222). Outro exemplo é a solução QEdu, que constitui um portal aberto e gratuito com informações sobre a qualidade do aprendizado dos alunos do 5º e 9º anos em cada escola, município e estado do Brasil, permitindo o acompanhamento da evolução de determinadas políticas públicas educacionais (parágrafo 228).

78. Ao disponibilizar seu dados, o governo também favorece a criação de negócios e serviços inovadores com valor tanto comercial como social. Organizações, cidadãos, acadêmicos, empresas e até mesmo as instituições públicas têm a possibilidade de utilizar bases de dados públicos para a produção e o compartilhamento de novos conhecimentos e de novos serviços, numa concepção de coparticipação entre ente privado e governo na oferta de serviços públicos. Uma vez que o Estado não tem capacidade de prover a quantidade e a diversidade de serviços que a sociedade pode e quer consumir, a conjunção de esforços se mostra oportuna.

79. Em outro artigo, intitulado Do More Transparent Governments Govern Better? e publicado em 2003, o Banco Mundial ressalta que o acesso à informação pode, ainda, induzir a melhoria do gerenciamento de riscos, do desempenho econômico do governo e de sua eficiência burocrática (www.oecd.org/gov/46560184.pdf).

80. Nota-se, portanto, a diversidade de potenciais benefícios oriundos de práticas de abertura de dados públicos, sendo que alguns deles já estão sendo mensurados, como é o caso dos exemplos a seguir.

81. A OKF publicou, em novembro de 2013, uma apresentação em que mostra os ganhos obtidos por países em decorrência da abertura de dados (peça 59, p. 56-65). Por exemplo, no Canadá, dados abertos expuseram um esquema de fraudes relacionadas a isenção de impostos sobre doações a instituições de caridade, que permitiu a contestação de U$ 32.000.000.000,00 em impostos devidos. Na Espanha, um estudo realizado aponta que cerca de cinco mil empregos estão relacionados a empresas que criam aplicativos, produtos e serviços, utilizando informações do setor público. Em Uganda, a política de acesso à informação e a decorrente divulgação dos recursos públicos recebidos por cada escola contribuiu para a redução da corrupção que se apoderava desses valores, e as escolas, que antes se apropriavam de apenas 20% do valor a elas destinado, passaram a dispor de 90% desse valor. Ao divulgar a localização de trezentos mil pontos de ônibus, a comunidade do Reino Unido retificou dezoito mil deles, contribuindo para a melhoria da qualidade das informações públicas.


2.6 Oportunidades de utilização de dados abertos em conjunto com Big Data


82. Dados abertos governamentais frequentemente atingem dimensões que poderiam qualificar a utilização de soluções de Big Data, dado o volume elevado de informações, a velocidade em que os dados são atualizados e a variedade dos dados. Para exemplificar, tomam-se as informações acerca das compras governamentais no âmbito do governo federal que são volumosas e diversificadas, constituindo fontes de conhecimentos variados, profundos e inovadores, passíveis de serem extraídos com a utilização de ferramentas de Big Data, para diversos fins, tais como detecção de fraudes. A fiscalização realizada por esta secretaria, que analisou as informações registradas no sistema Comprasnet, especificamente quanto ao cumprimento do disposto na Lei 10.520/2002, art. 7º (TC 015.239/2012-8), foi realizada utilizando-se ferramentas de auditoria de dados (Audit Command Language). Para esse objeto, portanto, seria adequado o uso de ferramentas de Big Data, que poderiam trazer mais e mais diversas inferências sobre a relação entre gestores, empresas e licitações.

83. Além disso, dados abertos governamentais fornecem informações básicas que podem ser necessárias e úteis para projetos de construção de aplicações a partir dos preceitos do Big Data, como informações de georreferenciamento, bases de códigos postais, informações climáticas, dados históricos ou dados de levantamentos estatísticos (como os do IBGE).

84. Adicionalmente, repositórios de dados públicos que se tornam abertos podem estimular novos projetos de Big Data específicos para aproveitar seu conteúdo, como exemplifica o sistema de mapas interativos da Google (maps.google.com), construído, inicialmente, sobre a base de dados espaciais do instituto do censo dos EUA (theatlantic.com/technology/archive/2012/09/how-google-builds-its-maps-and-what-it-means-for-the-future-of-everything/261913).

85. Entende-se que as tecnologias de Big Data podem e devem fazer uso de dados abertos no âmbito governamental, seja para informar o cidadão, gerar conhecimento, promover o controle social ou para qualquer outro fim que favoreça o progresso da gestão Estado e dos serviços que por ele são prestados.

2.7 Oportunidades de utilização de dados abertos com participação social


86. A participação social é um dos pilares de governo aberto, estimulando que o cidadão conheça, verifique, fiscalize, se esclareça e acompanhe as ações públicas de seu interesse. Por outro lado, com as vias de comunicação estabelecidas, o cidadão pode, também, fornecer informações ao Estado, contribuindo para a avaliação e ajustes das políticas públicas e para a melhoria dos dados públicos, entre outros benefícios.

87. Essa relação entre Estado e sociedade já se faz presente em soluções desenvolvidas com base em dados abertos. A Open Knowledge Foundation (okfn.org) relaciona alguns exemplos em que a participação social propiciou a melhoria da qualidade dos dados (blog.okfn.org/category/open-government-data/page/5/). O Reino Unido, por exemplo, ao disponibilizar os dados referentes às trezentas mil paradas de ônibus, tornou possível a contribuição da comunidade Open Street Map (openstreetmap.org), que atuou na correção das informações de dezoito mil paradas de ônibus, colaborando para a melhoria das informações do transporte público daquele país (peça 59, p. 61).

88. No entanto, para que a sociedade realmente participe, a simples publicação dos dados governamentais não é suficiente. É necessário que a disponibilidade das informações públicas, com fácil acesso aos cidadãos, seja divulgada e tenha despertado o interesse para o seu uso, tanto para a criação de novos produtos e serviços, como para a construção de novas e diferentes visões das informações.



89. Para fomentar a participação social com o uso de dados abertos, parece necessário que seja criada uma cultura de dados abertos (mckinsey.com/insights/public_sector/how_government_can_promote_open_data). Além de levar ao público o conhecimento do acesso às suas informações, o governo deve promover eventos que estimulem o uso dessas informações pela sociedade civil (universidades, empresas, organizações etc.). Várias estratégias têm sido utilizadas para instigar a utilização de dados abertos em dezenas de países, incluindo Reino Unido, Estados Unidos, Austrália, Canadá, Nigéria, Singapura e Brasil. Uma delas é a realização de encontros presenciais, tais como hackathon, desconferência, barcamp, meetup, speedgeek, lightning talk, etc, que, grosso modo, permitem aos gestores públicos conhecer quem são os prováveis usuários dos dados públicos, quais suas demandas e como eles querem reutilizar os dados produzidos ou custodiados pelo Estado. Da mesma forma, esses encontros permitem aos membros da sociedade conhecer os dados já disponibilizados e potenciais dados a serem publicados.

90. O modelo de competições em torno de dados abertos tem sido bastante utilizado, em geral com o nome de Hackathon ou Hack Day. Nesse evento, um conjunto de dados públicos é disponibilizado aos desenvolvedores de aplicativos reunidos num mesmo local durante um período de tempo, de 48 horas a até algumas semanas, para que eles construam uma solução (software) utilizando os dados objeto do concurso. Ao término do tempo definido, elege-se e premia-se a melhor solução desenvolvida. No Brasil, Hackathons já foram promovidos pela Câmara dos Deputados, Instituto Nacional de Estudos e Pesquisas Educacionais Anysio Teixeira (Inep), MJ, além de vários órgãos das esferas estaduais e mesmo por entidades não governamentais como a Fiesp. Um dos produtos oriundos do Hackathon promovido pelo Inep foi a solução “Escola que Queremos” (parágrafo 226).

91. Apesar das ideias e protótipos de soluções inovadoras que surgem nesses eventos, muitos dos produtos gerados não encontraram um ecossistema que os fomente e mantenha como produto de mercado, ficando desatualizados e caindo em desuso. Uma questão que se discute atualmente nas comunidades de dados abertos é a sustentabilidade das soluções produzidas nesses eventos. É aconselhável que exista um ecossistema, nos quais os seus elementos (sociedade, universidades, estudantes, empresas e governo) se estruturem para prover e permitir continuidade aos produtos e ideias gerados que tenham sido considerados potencialmente úteis para agregar valor para o cidadão, disseminando-o na sociedade.

92. Se por um lado aborda-se muito a temática de participação popular e acompanhamento para o envolvimento da população na política do país, tendo a tecnologia como valioso instrumento viabilizador das diversas formas de participação hoje existentes, por outro lado, pouca parece ser a evolução no sentido de mensurar como, se, e em que intensidade essa participação está efetivamente ocorrendo (peça 42, p. 13). Na busca realizada pela equipe de fiscalização, pouco se obteve de informação. Diante disso, cita-se que a OKF tem procurado coletar casos que mostrem os resultados da participação da sociedade na melhoria da qualidade das informações (blog.okfn.org/category/open-government-data/page/5/) e da gestão pública (peça 59, p. 56-64).


2.8 Principais riscos inerentes à abertura dos dados


93. A convergência e a ampla adoção dos conceitos e princípios relativos a dados abertos pelos governos das nações desenvolvidas demonstram sua solidez e um razoável consenso em torno da sua utilidade. Juntamente a esses conceitos e princípios, a necessidade de transparência governamental e a relação umbilical entre governo aberto, transparência e dados abertos são também consenso na maioria dos países estudados.

94. Entretanto, a disponibilização dos dados abertos por parte dos governos não deve ser considerada um fim em si mesma. Diversos profissionais e pesquisadores vêm alertando para uma certa “ilusão” de transparência que os dados abertos podem criar, além de jogar luz a uma série de questões adjacentes ao tema que não estão sendo discutidas na profundidade requerida.

95. Propõe-se, neste trabalho, expor um conjunto de riscos inerentes à adoção dos dados abertos, divididos em três grandes grupos:

a) custos da disponibilização continuada dos dados;

b) qualidade, utilidade, e usabilidade dos dados;

c) privacidade e proteção dos dados pessoais.

2.8.1 Custos da disponibilização continuada dos dados


96. Rob Kitchin, um especialista irlandês sobre dados abertos, no seu artigo Four critiques of open data initiatives (nuim.ie/progcity/2013/11/four-critiques-of-open-data-initiatives), destaca os custos e a sustentabilidade como um risco considerável à implantação das políticas de dados abertos. Segundo os princípios mais largamente aceitos a respeito de dados abertos, os custos da geração e disponibilização desses dados devem ser arcados pelo fornecedor, que nesse caso é o governo. Para justificar esse gasto público, o principal argumento econômico seria o de que o dado aberto estimula a inovação e, em consequência, a economia, abrindo novas possibilidades de negócios.

97. A questão é que, segundo o autor, esse retorno é dificilmente mensurável, imprevisível e mal distribuído. Enquanto algumas bases de dados públicas podem ser de grande valia, como as que disponibilizam mapas ou dados sobre transporte, outras tantas têm pouco ou nenhum valor econômico. Considerando-se que o dado aberto só é útil se for amplo, atual e detalhado, estima-se que os custos continuados em manter enormes quantidades de dados disponíveis pode vir a ser um peso considerável para a administração pública.


1   2   3   4   5   6   7   8   9   ...   17


©livred.info 2017
enviar mensagem

    Página principal