Dúvidas Frequentes
1. O que são Dados Abertos?
Dados Abertos são dados que são livremente disponíveis para todos utilizarem e redistribuírem como desejarem, sem
restrição de licenças, patentes ou mecanismos de controle. Na prática, a filosofia de dados abertos estipula
algumas
restrições tecnológicas para que os dados sejam legíveis por máquina.
Todo dado público tem vocação para ser dado aberto. Como praticamente todo dado governamental é público, é
fundamental que os governos implementem políticas para disponibilizá-los. Para saber mais, conheça as leis e os
princípios dos dados abertos.
2. O que é a Infraestrutura Nacional de Dados Abertos – INDA?
A Infraestrutura Nacional de Dados Abertos é um conjunto de padrões, tecnologias, procedimentos e mecanismos de
controle necessários para atender às condições de disseminação e compartilhamento de dados e informações
públicas no modelo de Dados Abertos, em conformidade com o disposto na e-PING. A INDA é a política do governo
brasileiro para dados abertos.
3. O que é um Mashup?
Mashup é um termo que vem do inglês e significar misturar ou mixar. Em termos tecnológicos, é uma página, ou um
serviço web, que combina dados ou código de duas ou mais fontes. Ele geralmente fornece mais informação e
funcionalidade do que os dados e códigos originais. O sucesso dos mashups vem da facilidade com que novos
aplicativos podem ser construídos na Internet. Um mashup pode ser uma visualização, um infográfico, um serviço
em uma página ou um aplicativo para celular.
4. O que são metadados?
Metadados são geralmente descritos como dados sobre dados. Metadados são essenciais na organização e
classificação de conjuntos de dados. Todo conjunto de dados estruturado faz uso de metadado para descrever a
estrutura e os tipos de dados contidos no conjunto. O portal dados.gov.br faz uso extenso de metadados. Na sua
essência ele é um motor de busca de dados, e para isso armazena apenas os metadados. É isso mesmo, o portal não
armazena os dados que disponibiliza. Eles são publicados na Internet por cada órgão, e assim catalogados no
portal para que todos possam encontrá-los.
5. O que são conjuntos de dados e recursos?
Os dados catalogados no portal estão organizados utilizando as estruturas de conjuntos de dados e recursos. Os
conjuntos de dados são as entidades principais retornadas a partir das buscas. Cada conjunto de dados possui uma
descrição, um ou mais recursos, e uma série de outros metadados, como periodicidade de atualização e órgão
responsável. Exemplos de conjuntos de dados são uma coleção de tabelas relacionadas entre si, dados extraídos de
um mesmo sistema de informações, ou ainda uma API de dados abertos. Um conjunto de dados deve possuir pelo menos
um recurso que seja dado aberto.
Cada recurso compreende uma fonte de dados. Pode ser um arquivo como uma planilha, um método de webservice /
API>/abbr> ou um documento.
A princípio cada recurso poderia ser catalogado como um conjunto de dados separado, porém é preferível que os
recursos sejam agrupados, sempre que forem oriundos da mesma base de dados, ou possuírem metadados em comum,
para facilitar a busca e o entendimento de seu conteúdo.
6. O portal tem algum dado pessoal ou sigiloso?
Os dados que estiverem sujeitos a restrições de sigilo (art. 25) ou de privacidade (art. 31), conforme definidos
na Lei de Acesso à Informação, precisam ser previamente classificados pelos seus responsáveis como tais, a
partir de sua origem (art. 27) e por definição não são dados abertos. Assim, eles não passam pelo processo de
abertura e não devem ser catalogados no Portal Brasileiro de Dados Abertos, podendo, em caso de descumprimento,
o órgão ou entidade ser responsabilizado nos termos do art. 34.
7. Os dados que procuro não estão no portal. O que posso fazer?
Se o dado é de competência do poder executivo federal, procure primeiro entre os Planos de Dados Abertos já
publicados se existe algum compromisso com data prevista de disponibilização desses dados. É possível realizar
uma solicitação com base na Lei de Acesso à Informação para solicitar a disponibilização de uma base de dados.
Glossário
A
API
API, de Application Programming Interface (em
português: Interface de Programação de Aplicativos) é um conjunto de
rotinas e padrões estabelecidos por um software para a utilização das suas funcionalidades por aplicativos que
não
pretendem envolver-se em detalhes da implementação do software, mas apenas usar seus serviços.
No contexto de desenvolvimento web, uma API, também chamda de API web, é um conjunto definido de mensagens de
requisição e resposta HTTP, geralmente expressado nos formatos XML ou JSON. Ainda que termo seja um sinônimo
para
web service, a chamada Web 2.0 está aos poucos depreciando o modelo de serviços SOAP para a técnica REST.
Arquivo Legível por Máquina
Arquivo
Legível por Máquina refere-se a informações ou dados que estejam em um formato que pode ser facilmente
processado por um computador, sem intervenção humana, assegurando nenhum significado semântico está perdido.
C
CSV
Pode significar Comma-Separated
Values (valores separados por vírgula), ou ainda, Character-Separated Values (valores separados por
caractere). É um formato para armazenamento de dados tabulares em texto. A codificação é muito simples: cada
linha do arquivo representa uma linha na tabela, e as colunas são separadas por vírgula. Campos que podem conter
vírgula devem ser delimitados por aspas. CSV é recomendado para representação de estrutura de dados mais
simples, de natureza tabular, onde não existem subpropriedades ou listas, gerando um arquivo menor e mais leve
para processamento. Arquivos CSV são processáveis diretamente por editores de planilhas, como o OpenOffice e o
MS Excel.
E
EGD
Estratégia de Governança Digital. Ver governança digital.
e-MAG
O Modelo
de Acessibilidade em Governo Eletrônicoa (eMAG) consiste em um conjunto de recomendações a ser
considerado para que o processo de acessibilidade dos sítios e portais do governo brasileiro seja conduzido de
forma padronizada e de fácil implementação.
e-PING
A arquitetura ePING
– Padrões de Interoperabilidade de Governo Eletrônico – define um conjunto mínimo de
premissas, políticas e especificações técnicas que regulamentam a utilização da Tecnologia de Informação e
Comunicação (TIC) no governo federal, estabelecendo as condições de interação com os demais Poderes e
esferas de
governo e com a sociedade em geral.
e-PMG
O objetivo do Padrão
de Metadados do Governo Eletrônico - e-PMG é assegurar às pessoas, que pesquisam as
informações do governo brasileiro na Web, o acesso rápido e eficiente a descrições dos recursos. Os
elementos
e-PMG têm o propósito de facilitar a localização dos recursos que as pessoas necessitam, mesmo que elas não
possuam conhecimento detalhado da localização ou da entidade responsável pela informação.
e-PWG
Os Padrões Web em
Governo Eletrônico (ePWG) são recomendações de boas práticas agrupadas em formato de cartilhas
com o objetivo de aprimorar a comunicação e o fornecimento de informações e serviços prestados por meios
eletrônicos pelos órgãos do Governo Federal.
e-SIC
O Sistema Eletrônico do Serviço de Informações ao Cidadão (e-SIC) é o Serviço de Informações ao Cidadão do poder
executivo federal prestado na web. Ele permite que qualquer pessoa, física ou jurídica, encaminhe pedidos de
acesso à informação, acompanhe o prazo e receba a resposta da solicitação realizada para órgãos e entidades do
Executivo Federal. O cidadão ainda pode entrar com recursos e apresentar reclamações sem burocracia.
Estratégia de Governança Digital
Ver governança
digital.
ETL
ETL, do inglês Extract Transform
Load (Extração Transformação Carga), são ferramentas de software cuja função é a
extração de dados de diversos sistemas, transformação desses dados conforme regras de negócios e por fim a carga
dos dados geralmente em um Data Mart e um Data Warehouse, porém nada impede que também seja para enviar os dados
para um determinado sistema da organização. A extração e carga são obrigatórias para o processo, sendo a
transformação/limpeza opcional, mas que são boas práticas, tendo em vista que os dados já foram encaminhados
para o sistema de destino. É considerada uma das fases mais críticas do Data Warehouse e/ou Data Mart.
G
GeoJSON
É um formato aberto baseado em JSON para representar informações geográficas. Possibilita representar formas como
pontos, linhas e polígonos com coordenadas geográficas, juntamente com seus atributos não-espaciais. O GeoJSON
não é mantido por um órgão formal de padronização, como alguns outros formatos para informações geográficas. Em
vez disso, ele é especificado por um grupo de trabalho de desenvolvedores.
Governança Digital
Política instituída pelo Decreto 8.638, de 15 de
janeiro de 2016 e que estabelece a Estratégia de Governança
Digital (EGD). Baseia-se no conceito
de Governo Digital da OCDE e refere-se ao uso de tecnologias digitais, como
parte integrada das estratégias de modernização governamentais, para gerar benefícios para a sociedade.
A EGD tem três eixos estruturantes: acesso à informação, prestação de serviços públicos e participação social. A
política de dados abertos é parte importante do eixo “acesso à informação”.
H
Hackathon
Um hackathon (também conhecido como um Hack
Day, Hackfest ou codefest) é um evento em que programadores e outras
pessoas envolvidas em desenvolvimento de software, incluindo designers gráficos, designers de interface e
gerentes de projeto, colaboram intensamente em projetos de software em um período de tempo curto, que pode durar
de 24 horas a 1 semana.
Hacker Cívico
Hacker
Cívico são tecnólogos, servidores públicos, designers, empresários, engenheiros - qualquer um - que está
disposto a colaborar com os outros para criar, construir e inventar para resolver problemas relevantes para
nossos bairros, nossas cidades, nossos estados e nosso país.
I
INDA
A Infraestrutura Nacional de Dados Abertos (INDA) é uma política para garantir e facilitar o acesso pelos
cidadãos, pela sociedade e, em especial, pelas diversas instâncias do setor público aos dados e informações
produzidas ou custodiadas pelo Poder Executivo Federal.
Ela consiste em um conjunto de padrões, tecnologias, procedimentos e mecanismos de controle necessários para
atender às condições de disseminação e compartilhamento de dados e informações públicas no modelo de Dados
Abertos.
Sua gestão cabe a um comitê
gestor, presidido pela Secretaria de Tecnologia da Informação do Ministério do Planejamento e composto
por
representantes da sociedade civil, do setor acadêmico e de nove entes federais.
J
JSON
É um acrônimo para JavaScript Object
Notation. É um padrão aberto de estruturação de dados baseado em texto e
legível por humano. A especificação é a RFC
7159. JSON ganhou maior utilização com a utilização de carga
dinâmica de conteúdo em páginas web com Javascript (técnica denominada “Ajax”). A serialização em JSON é
muito
simples e resulta em uma estrutura pouco verbosa o que se mostra uma ótima alternativa para o XML. JSON
possibilita serialização de estrutura de objetos complexos, como listas e subpropriedades. JSON está se
tornando
o padrão mais utilizado para integração de dados entre repositórios e frameworks, também está se tornando o
padrão nativo de armazenamento em alguns bancos de dados modernos.
JSON-LD
É um formato baseado em JSON para Linked
Data, também padronizado em 2014. Traz
todas as vantagens do formato JSON. A estrutura de mapeamento para IRIs pode opcionalmente ser separada em
um documento JSON de contexto, o que deixa o JSON principal, onde estão os dados, essencialmente com a mesma
estrutura que um documento JSON comum.
K
KML
Acrônimo para Keyhole Markup
Language. É um formato baseado em XML, desenvolvido originalmente pelo Google e
depois padronizado pelo Open
Geospatial Consortium. Pode representar informações geográficas, tais como
marcadores de local, imagens, polígonos, modelos tridimensionais ou descrições textuais, usando coordenadas
de latitude, longitude e elevação conforme o sistema WGS84.
Em alguns casos os arquivos KML são distribuídos compactados no formato zip, e o arquivo compactado recebe a
extensão .kmz.
L
Lei de Acesso à Informação
A Lei nº 12.527/2011, conhecida como Lei de Acesso à Informação - LAI, regulamenta o direito, previsto na
Constituição, de qualquer pessoa solicitar e receber dos órgãos e entidades públicos, de todos os entes e
Poderes, informações públicas por eles produzidas ou custodiadas.
M
Método Ágil
Desenvolvimento ágil de software ou Método ágil é um conjunto de metodologias de desenvolvimento de software.
O desenvolvimento ágil, tal como qualquer metodologia de software, providencia uma estrutura conceitual para
reger projetos de engenharia de software.
O Manifesto Ágil é uma declaração de princípios que fundamentam o desenvolvimento ágil de software.
O
ODS
Significa Open Document Spreadsheet. É um formato não proprietário de arquivo basedo em XML, padronizado pela
ABNT sob a norma NBR ISO/IEC 26300:2006. É comumente chamado de planilha, similar ao XLS do MS Office Excel,
porém aberto, por isso deve ser utilizado em substituição ao XLS. Planilhas são largamente utilizadas, são
de fácil utilização e manipuláveis por diversos aplicativos. Apesar de ser um formato estruturado, é muito
flexível, possibilitando manipulação e mistura de diversos tipos de dados, como imagens e textos formatados.
Para a publicação de dados abertos tabulares, é recomendável a utilização de CSV, pela sua simplicidade e
padronização.
OGP
OGP é o acrônimo para Open Government Partnership traduzindo em português para Parceria para Governo Aberto -
Vide Parceria para Governo Aberto
P
Plano de Ação da INDA
O Plano de Ação da INDA é o instrumento de planejamento da política de dados abertos, no âmbito da
Infraestrutura
Nacional de Dados Abertos - INDA. O plano é previsto no inciso VII do art. 6º da Instrução Normativa SLTI/MP
nº
4/2012. Ele contém, entre outras informações, os marcos de iniciativas que serão realizadas no período, no
que
se refere à implementação da política como um todo.
Não se confunde com o Plano de Dados Abertos (PDA), que é um instrumento de planejamento das iniciativas e
projetos de dados abertos no âmbito da organização que o institui.
Plano de Dados Abertos
O Plano de Dados Abertos orienta as ações de implementação e promoção de abertura de dados, inclusive
geoespacializados, de uma organização. O documento faz parte da política de dados abertos, e seu objetivo é
organizar e padronizar os processos de publicação de dados abertos do estado, resultando na melhoria da
qualidade dos serviços prestados ao cidadão e à própria administração pública.
R
RDF
A família de formatos RDF baseia-se em um metamodelo de grafos para indicar os relacionamentos entre os nós,
onde
cada nó pode ser qualquer coisa sobre a qual queira se afirmar algo. Esse metamodelo possibilita estabelecer
relações semânticas entre os dados, ao descrevê-los conforme um modelo (vocabulário ou ontologia)
preestabelecido para aquele domínio da informação.
Dados conforme esse metamodelo de grafos podem ser armazenados em bancos de dados especializados, chamados
triple
stores, ou bancos de triplas, numa referência à forma de descrever o grafo listando cada tripla
nó-aresta-nó,
representando sujeito, predicado e objeto.
Ao gravar dados RDF em um arquivo, no entanto, é necessário escolher uma entre as múltiplas sintaxes
possíveis
para representar o grafo como uma sequência de caracteres: XML, N-Triples, Turtle, JSON-LD, RDFa, etc.
RDF/XML
A sintaxe original, quando o padrão RDF foi inicialmente estabelecido, foi a baseada em XML. Por ser a
primeira
sintaxe para RDF, o seu suporte em ferramentas é excelente. Por outro lado, pela verbosidade do XML e pela
sua
estrutura hierárquica, os arquivos gerados são geralmente complexos e de difícil leitura.
S
Shapefile
Formato aberto para dados geoespaciais, desenvolvido pela empresa Esri, que produz soluções de software para
sistemas de informações geográficas (GIS). Apesar de ser mantido por uma empresa, a sua especificação é
aberta e
é implementada por praticamente todas as ferramentas de GIS.
Software Livre
Software Livre é uma forma de manifestação de um software em que, resumidamente, permite-se adaptações ou
modificações em seu código de forma espontânea, ou seja, sem que haja a necessidade de solicitar permissão
ao
seu proprietário para modificá-lo.
T
Turtle
Turtle significa “Terse RDF Triple Language”, ou linguagem sucinta de triplas RDF. Foi criada como uma
sintaxe
simplificada para leitura tanto por humanos quanto por máquinas e padronizada em 2014. A indentação e o uso
de
prefixos são elementos que facilitam a leitura, assim como o agrupamento de triplas que possuem o mesmo
sujeito
ou que possuem o mesmo sujeito e mesmo predicado.
X
XML
XML significa Extensible Markup Language, e é uma sintaxe para codificar documentos em um formato legível por
máquina. É baseado em texto e tem como alguns de seus objetivos a facilidade de uso e legibilidade.