dARK - Decentralized Archival Resource Key

A decentralized implementation of the ARK persistent identifier

  • O que é dARK

    dARK é uma implementação descentralizada do Archival Resource Key (ARK) que atribui e resolve identificadores ARK através de nós blockchain institucionais. Opera em uma rede de "bem público" onde a propriedade, armazenamento e controle dos dados são distribuídos entre todas as organizações participantes.

    O projeto inicial foi principalmente hospedado e financiado pelo Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT), com apoio adicional da LA Referencia, possibilitado graças ao suporte das contribuições da Global Sustainability Coalition for Open Science Services (SCOSS).

    Descentralização

    Uma implementação inicial do ARK descentralizado baseada em uma rede blockchain privada leve

    Tolerância a Falhas

    Atribuição e resolução descentralizada tolerante a falhas de identificadores ARK através de uma rede distribuída

    Integração

    Um sistema de atribuição ARK em nível de agregador para produção de pesquisa legada no ecossistema brasileiro de ciência aberta (OasisBr, IBICT Brasil)

    Motivações

    Identificador Persistente ARK

    O identificador ARK surgiu como uma alternativa viável e de baixo custo devido à possibilidade de implementar provedores locais para o resolvedor global. Seu uso facilita o acesso e preservação de longo prazo de recursos digitais, garantindo links estáveis e confiáveis.

    Avaliação de Pesquisa

    Identificadores persistentes são essenciais para construir grafos de pesquisa mais robustos, gerar indicadores precisos e melhorar a avaliação da produção científica. Sua capacidade de vincular vários objetos de informação aprimora a análise e compreensão do impacto da pesquisa.

    Desafios no Sul Global

    Nos países do Sul Global, a falta de cobertura de identificadores persistentes é um problema comum. Isso se deve principalmente aos custos associados a esses serviços, limitando o acesso a infraestruturas essenciais para garantir a visibilidade e preservação dos resultados de pesquisa.

    Necessidade de Descentralização

    Atualmente, a maioria dos sistemas de identificadores persistentes opera sob modelos centralizados, dependendo de algumas agências para manter a infraestrutura de serviço. Uma abordagem descentralizada, como a proposta pelo dARK, reduz essa dependência e aumenta a resiliência do sistema, promovendo maior equidade no acesso e gestão dos identificadores.

    Objetivos de Longo Prazo

    Infraestrutura Aberta

    Fornecer um sistema aberto e não centralizado para identificadores persistentes únicos/desduplicados acessível a todos

    Serviços de Resolução

    Oferecer um serviço de resolução descentralizado para o ecossistema de Ciência Aberta, interoperável com outros serviços de PID (como agências DOI)

    Preservação de Metadados

    Garantir a preservação descentralizada dos metadados associados aos objetos digitais referenciados pelos identificadores ARK, visando fornecer PIDs e metadados consistentes para grafos de pesquisa (OpenAIRE, OpenAlex, entre outros)

    Nota Importante

    Este desenvolvimento não pretende substituir ou competir com identificadores/agências DOI, mas servir como uma solução complementar que também será interoperável com provedores DOI.

    more
  • Arquitetura e Componentes

    A arquitetura do sistema dARK é projetada com uma clara separação de componentes, organizados em Camada de Serviço e Camada Central.

    Diagrama de Arquitetura dARK

    Camada de Serviço

    A Camada de Serviço fornece serviços essenciais que interagem com os componentes da Camada Central. Esses serviços incluem:

    dARK Resolver

    Integrado com o sistema global de resolução nt2.info, permitindo a resolução de identificadores persistentes

    dARK Minter

    Usado para criar e registrar novos PIDs no sistema

    dARK Dashboard

    Fornece recursos de monitoramento e administração para a plataforma

    dARK API

    Facilita a comunicação entre aplicações e o blockchain subjacente

    dARK Backup

    Garante a durabilidade dos dados e a confiabilidade do sistema

    dARK LA Referencia

    Implementa a criação em massa de dARK na Plataforma Coletora LA Referencia

    Esses serviços são suportados por mecanismos de balanceamento de carga para garantir alta disponibilidade e desempenho ótimo do sistema.

    Camada Central (dARK dApp)

    A Camada Central é construída sobre uma rede blockchain permissionada que forma a espinha dorsal do sistema dARK. Em seu núcleo está uma rede pública permissionada operando com um mecanismo de consenso de Prova de Autoridade (PoA), fornecendo segurança e eficiência para o gerenciamento de PIDs.

    dARK dApp

    Aplicação descentralizada central que implementa os contratos inteligentes de gerenciamento de PID e garante a integridade dos dados através da tecnologia blockchain

    Fundação Blockchain

    A rede utiliza a tecnologia Hyperledger Besu para fornecer uma base blockchain segura e eficiente. O Hyperledger Besu é um cliente Ethereum projetado para uso empresarial que suporta implantações de rede permissionada tanto públicas quanto privadas. Sua implementação da Máquina Virtual Ethereum (EVM) permite contratos inteligentes sofisticados que gerenciam operações de PID com total transparência e auditabilidade.

    Arquitetura de Rede

    Projetada com resiliência e confiabilidade como princípios fundamentais, a arquitetura começa com uma Rede dARK Mínima Viável (MVDN). Esta rede consiste em nós blockchain essenciais que fornecem a funcionalidade fundamental necessária para a operação do sistema. Esses nós gerenciam comunicações RPC/API e mantêm o livro-razão distribuído de identificadores persistentes. Cada nó completo implementa endpoints de API para interação de serviços externos através de balanceamento de carga.

    Para garantir operação contínua mesmo durante falhas de nós, a arquitetura incorpora redundância tolerante a falhas através de nós de backup e sistemas de replicação de dados. Esta abordagem distribuída garante que nenhum ponto único de falha possa comprometer a integridade ou disponibilidade da infraestrutura PID.

    Camada de Aplicação

    Na camada de aplicação, o dARK dApp oferece a funcionalidade central para gerenciar identificadores persistentes através de contratos inteligentes. Esta lógica de aplicação lida com a criação, atualização e resolução de PIDs, aplicando regras de governança definidas pelos participantes da rede.

    Infraestrutura Federada

    A arquitetura suporta múltiplas redes blockchain independentes operadas por diferentes autoridades, criando uma infraestrutura PID verdadeiramente federada.

    Design Escalável

    O sistema pode escalar horizontalmente adicionando mais nós à rede, garantindo alto desempenho mesmo com números crescentes de PIDs.

    Extensões Futuras

    O design modular permite a incorporação futura de soluções de armazenamento adicionais, como IPFS, para cargas de metadados maiores, mantendo a integridade dos dados através de verificação criptográfica na cadeia.

    Integração com o Ecossistema

    O sistema dARK é projetado para se integrar perfeitamente ao ecossistema acadêmico existente, particularmente com redes de repositórios, periódicos diamante e agregadores de metadados, seguindo este fluxo de trabalho inicial:

    1

    Coleta de Metadados

    Agregadores coletam regularmente metadados de repositórios institucionais, periódicos e outros provedores de conteúdo através de protocolos padrão como OAI-PMH ou APIs personalizadas.

    2

    Atribuição de PID

    Para conteúdo sem identificadores persistentes, o agregador pode solicitar novos ARKs através da API do dARK Minter. Para ARKs existentes, eles são validados e registrados no sistema dARK.

    3

    Registro no Blockchain

    O sistema dARK registra cada ARK no blockchain, juntamente com sua URL de destino e metadados essenciais, fornecendo um registro descentralizado e à prova de adulteração dos identificadores.

    4

    Distribuição de PID

    Os ARKs recém-criados ou validados podem ser enviados de volta aos repositórios para inclusão em seus registros de metadados, permitindo uma abordagem padronizada para identificação persistente em toda a rede.

    5

    Resolução

    Quando um usuário acessa um ARK, o resolvedor global redireciona para o resolvedor dARK, que usa o blockchain para recuperar as informações de localização atuais, garantindo acesso persistente mesmo quando as localizações dos recursos mudam.

    Esta abordagem de integração permite que agregadores de metadados como LA Referencia aprimorem seus serviços com infraestrutura de PID descentralizada, preservando fluxos de trabalho existentes e agregando valor à rede de repositórios como um todo. Também permite transições perfeitas quando repositórios movem conteúdo ou mudam de plataformas, pois o sistema de resolução de PID pode ser atualizado sem quebrar links externos.

    Desenvolvimento Futuro

    Nas próximas fases de desenvolvimento, o projeto dARK planeja:

    • Transformar este projeto inicial (atualmente em funcionamento no IBICT/Brasil) em um serviço regional abrangente projetado como uma infraestrutura pública, seguindo os princípios estabelecidos pela LA Referencia
    • Desenvolver plugins para os sistemas de repositório e periódicos mais amplamente utilizados para facilitar a integração perfeita com a infraestrutura dARK
    • Implementar persistência de metadados descentralizada para preservar informações bibliográficas e servir como fonte de dados confiável para sistemas analíticos como OpenAlex

    Esses aprimoramentos fortalecerão ainda mais o ecossistema dARK e expandirão sua utilidade dentro do panorama de comunicação acadêmica na América Latina e além.

    more