
dARK - Decentralized Archival Resource Key
A decentralized implementation of the ARK persistent identifier
-
O que é dARK
dARK é uma implementação descentralizada do Archival Resource Key (ARK) que atribui e resolve identificadores ARK através de nós blockchain institucionais. Opera em uma rede de "bem público" onde a propriedade, armazenamento e controle dos dados são distribuídos entre todas as organizações participantes.
O projeto inicial foi principalmente hospedado e financiado pelo Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT), com apoio adicional da LA Referencia, possibilitado graças ao suporte das contribuições da Global Sustainability Coalition for Open Science Services (SCOSS).
Descentralização
Uma implementação inicial do ARK descentralizado baseada em uma rede blockchain privada leve
Tolerância a Falhas
Atribuição e resolução descentralizada tolerante a falhas de identificadores ARK através de uma rede distribuída
Integração
Um sistema de atribuição ARK em nível de agregador para produção de pesquisa legada no ecossistema brasileiro de ciência aberta (OasisBr, IBICT Brasil)
Motivações
Identificador Persistente ARK
O identificador ARK surgiu como uma alternativa viável e de baixo custo devido à possibilidade de implementar provedores locais para o resolvedor global. Seu uso facilita o acesso e preservação de longo prazo de recursos digitais, garantindo links estáveis e confiáveis.
Avaliação de Pesquisa
Identificadores persistentes são essenciais para construir grafos de pesquisa mais robustos, gerar indicadores precisos e melhorar a avaliação da produção científica. Sua capacidade de vincular vários objetos de informação aprimora a análise e compreensão do impacto da pesquisa.
Desafios no Sul Global
Nos países do Sul Global, a falta de cobertura de identificadores persistentes é um problema comum. Isso se deve principalmente aos custos associados a esses serviços, limitando o acesso a infraestruturas essenciais para garantir a visibilidade e preservação dos resultados de pesquisa.
Necessidade de Descentralização
Atualmente, a maioria dos sistemas de identificadores persistentes opera sob modelos centralizados, dependendo de algumas agências para manter a infraestrutura de serviço. Uma abordagem descentralizada, como a proposta pelo dARK, reduz essa dependência e aumenta a resiliência do sistema, promovendo maior equidade no acesso e gestão dos identificadores.
Objetivos de Longo Prazo
Infraestrutura Aberta
Fornecer um sistema aberto e não centralizado para identificadores persistentes únicos/desduplicados acessível a todos
Serviços de Resolução
Oferecer um serviço de resolução descentralizado para o ecossistema de Ciência Aberta, interoperável com outros serviços de PID (como agências DOI)
Preservação de Metadados
Garantir a preservação descentralizada dos metadados associados aos objetos digitais referenciados pelos identificadores ARK, visando fornecer PIDs e metadados consistentes para grafos de pesquisa (OpenAIRE, OpenAlex, entre outros)
Nota Importante
Este desenvolvimento não pretende substituir ou competir com identificadores/agências DOI, mas servir como uma solução complementar que também será interoperável com provedores DOI.
-
Arquitetura e Componentes
A arquitetura do sistema dARK é projetada com uma clara separação de componentes, organizados em Camada de Serviço e Camada Central.
Camada de Serviço
A Camada de Serviço fornece serviços essenciais que interagem com os componentes da Camada Central. Esses serviços incluem:
dARK Resolver
Integrado com o sistema global de resolução nt2.info, permitindo a resolução de identificadores persistentes
dARK Dashboard
Fornece recursos de monitoramento e administração para a plataforma
dARK API
Facilita a comunicação entre aplicações e o blockchain subjacente
dARK Backup
Garante a durabilidade dos dados e a confiabilidade do sistema
dARK LA Referencia
Implementa a criação em massa de dARK na Plataforma Coletora LA Referencia
Esses serviços são suportados por mecanismos de balanceamento de carga para garantir alta disponibilidade e desempenho ótimo do sistema.
Camada Central (dARK dApp)
A Camada Central é construída sobre uma rede blockchain permissionada que forma a espinha dorsal do sistema dARK. Em seu núcleo está uma rede pública permissionada operando com um mecanismo de consenso de Prova de Autoridade (PoA), fornecendo segurança e eficiência para o gerenciamento de PIDs.
dARK dApp
Aplicação descentralizada central que implementa os contratos inteligentes de gerenciamento de PID e garante a integridade dos dados através da tecnologia blockchain
Fundação Blockchain
A rede utiliza a tecnologia Hyperledger Besu para fornecer uma base blockchain segura e eficiente. O Hyperledger Besu é um cliente Ethereum projetado para uso empresarial que suporta implantações de rede permissionada tanto públicas quanto privadas. Sua implementação da Máquina Virtual Ethereum (EVM) permite contratos inteligentes sofisticados que gerenciam operações de PID com total transparência e auditabilidade.
Arquitetura de Rede
Projetada com resiliência e confiabilidade como princípios fundamentais, a arquitetura começa com uma Rede dARK Mínima Viável (MVDN). Esta rede consiste em nós blockchain essenciais que fornecem a funcionalidade fundamental necessária para a operação do sistema. Esses nós gerenciam comunicações RPC/API e mantêm o livro-razão distribuído de identificadores persistentes. Cada nó completo implementa endpoints de API para interação de serviços externos através de balanceamento de carga.
Para garantir operação contínua mesmo durante falhas de nós, a arquitetura incorpora redundância tolerante a falhas através de nós de backup e sistemas de replicação de dados. Esta abordagem distribuída garante que nenhum ponto único de falha possa comprometer a integridade ou disponibilidade da infraestrutura PID.
Camada de Aplicação
Na camada de aplicação, o dARK dApp oferece a funcionalidade central para gerenciar identificadores persistentes através de contratos inteligentes. Esta lógica de aplicação lida com a criação, atualização e resolução de PIDs, aplicando regras de governança definidas pelos participantes da rede.
Infraestrutura Federada
A arquitetura suporta múltiplas redes blockchain independentes operadas por diferentes autoridades, criando uma infraestrutura PID verdadeiramente federada.
Design Escalável
O sistema pode escalar horizontalmente adicionando mais nós à rede, garantindo alto desempenho mesmo com números crescentes de PIDs.
Extensões Futuras
O design modular permite a incorporação futura de soluções de armazenamento adicionais, como IPFS, para cargas de metadados maiores, mantendo a integridade dos dados através de verificação criptográfica na cadeia.
Integração com o Ecossistema
O sistema dARK é projetado para se integrar perfeitamente ao ecossistema acadêmico existente, particularmente com redes de repositórios, periódicos diamante e agregadores de metadados, seguindo este fluxo de trabalho inicial:
1Coleta de Metadados
Agregadores coletam regularmente metadados de repositórios institucionais, periódicos e outros provedores de conteúdo através de protocolos padrão como OAI-PMH ou APIs personalizadas.
2Atribuição de PID
Para conteúdo sem identificadores persistentes, o agregador pode solicitar novos ARKs através da API do dARK Minter. Para ARKs existentes, eles são validados e registrados no sistema dARK.
3Registro no Blockchain
O sistema dARK registra cada ARK no blockchain, juntamente com sua URL de destino e metadados essenciais, fornecendo um registro descentralizado e à prova de adulteração dos identificadores.
4Distribuição de PID
Os ARKs recém-criados ou validados podem ser enviados de volta aos repositórios para inclusão em seus registros de metadados, permitindo uma abordagem padronizada para identificação persistente em toda a rede.
5Resolução
Quando um usuário acessa um ARK, o resolvedor global redireciona para o resolvedor dARK, que usa o blockchain para recuperar as informações de localização atuais, garantindo acesso persistente mesmo quando as localizações dos recursos mudam.
Esta abordagem de integração permite que agregadores de metadados como LA Referencia aprimorem seus serviços com infraestrutura de PID descentralizada, preservando fluxos de trabalho existentes e agregando valor à rede de repositórios como um todo. Também permite transições perfeitas quando repositórios movem conteúdo ou mudam de plataformas, pois o sistema de resolução de PID pode ser atualizado sem quebrar links externos.
Desenvolvimento Futuro
Nas próximas fases de desenvolvimento, o projeto dARK planeja:
- Transformar este projeto inicial (atualmente em funcionamento no IBICT/Brasil) em um serviço regional abrangente projetado como uma infraestrutura pública, seguindo os princípios estabelecidos pela LA Referencia
- Desenvolver plugins para os sistemas de repositório e periódicos mais amplamente utilizados para facilitar a integração perfeita com a infraestrutura dARK
- Implementar persistência de metadados descentralizada para preservar informações bibliográficas e servir como fonte de dados confiável para sistemas analíticos como OpenAlex
Esses aprimoramentos fortalecerão ainda mais o ecossistema dARK e expandirão sua utilidade dentro do panorama de comunicação acadêmica na América Latina e além.