dARK - Decentralized Archival Resource Key

A decentralized implementation of the ARK persistent identifier

  • ¿Qué es dARK?

    dARK es una implementación descentralizada de Archival Resource Key (ARK) que asigna y resuelve identificadores ARK a través de nodos blockchain institucionales. Opera en una red de "bien público" donde la propiedad, el almacenamiento y el control de los datos se distribuyen entre todas las organizaciones participantes.

    El proyecto inicial fue principalmente alojado y financiado por el Instituto Brasileño de Información en Ciencia y Tecnología (IBICT), con apoyo adicional de LA Referencia, hecho posible gracias al respaldo de los compromisos de la Coalición Global de Sostenibilidad para Servicios de Ciencia Abierta (SCOSS).

    Descentralización

    Una implementación inicial de ARK descentralizado basada en una red blockchain privada liviana

    Tolerancia a Fallos

    Atribución y resolución descentralizada tolerante a fallos de identificadores ARK a través de una red distribuida

    Integración

    Un sistema de atribución ARK a nivel de agregador para la producción de investigación heredada en el ecosistema de ciencia abierta brasileño (OasisBr, IBICT Brasil)

    Motivaciones

    Identificador Persistente ARK

    El identificador ARK ha surgido como una alternativa viable y de bajo costo debido a la posibilidad de implementar proveedores locales para el resolvedor global. Su uso facilita el acceso y preservación a largo plazo de recursos digitales, asegurando enlaces estables y confiables.

    Evaluación de la Investigación

    Los identificadores persistentes son esenciales para construir gráficos de investigación más robustos, generar indicadores precisos y mejorar la evaluación de la producción científica. Su capacidad para vincular diversos objetos de información mejora el análisis y la comprensión del impacto de la investigación.

    Desafíos en el Sur Global

    En los países del Sur Global, la falta de cobertura de identificadores persistentes es un problema común. Esto se debe principalmente a los costos asociados con estos servicios, limitando el acceso a infraestructuras esenciales para asegurar la visibilidad y preservación de los resultados de investigación.

    Necesidad de Descentralización

    Actualmente, la mayoría de los sistemas de identificadores persistentes operan bajo modelos centralizados, dependiendo de unas pocas agencias para mantener la infraestructura de servicios. Un enfoque descentralizado, como el propuesto por dARK, reduce esta dependencia y aumenta la resiliencia del sistema, promoviendo mayor equidad en el acceso y gestión de identificadores.

    Objetivos a Largo Plazo

    Infraestructura Abierta

    Proporcionar un sistema abierto y no centralizado para identificadores persistentes únicos/deduplicados accesible para todos

    Servicios de Resolución

    Ofrecer un servicio de resolución descentralizado para el ecosistema de Ciencia Abierta, interoperable con otros servicios PID (como agencias DOI)

    Preservación de Metadatos

    Asegurar la preservación descentralizada de metadatos asociados con objetos digitales referenciados por identificadores ARK, con el objetivo de proporcionar PIDs y metadatos consistentes a gráficos de investigación (OpenAIRE, OpenAlex, entre otros)

    Nota Importante

    Este desarrollo no pretende reemplazar o competir con los identificadores/agencias DOI, sino servir como una solución complementaria que también será interoperable con proveedores DOI.

    más
  • Arquitectura y Componentes

    La arquitectura del sistema dARK está diseñada con una clara separación de componentes, organizados en la Capa de Servicio y la Capa Core.

    Diagrama de Arquitectura dARK

    Capa de Servicio

    La Capa de Servicio proporciona servicios esenciales que interactúan con los componentes de la Capa Core. Estos servicios incluyen:

    dARK Resolver

    Integrado con el sistema de resolución global nt2.info, permitiendo la resolución de identificadores persistentes

    dARK Minter

    Utilizado para crear y registrar nuevos PIDs en el sistema

    dARK Dashboard

    Proporciona capacidades de monitoreo y administración para la plataforma

    dARK API

    Facilita la comunicación entre aplicaciones y la blockchain subyacente

    dARK Backup

    Asegura la durabilidad de los datos y la confiabilidad del sistema

    dARK LA Referencia

    Implementa la acuñación masiva de dARK en la Plataforma de Recolección de LA Referencia

    Estos servicios son respaldados por mecanismos de balanceo de carga para garantizar alta disponibilidad y rendimiento óptimo del sistema.

    Capa Core (dARK dApp)

    La Capa Core está construida sobre una red blockchain permisionada que forma la columna vertebral del sistema dARK. En su núcleo hay una red pública permisionada que opera con un mecanismo de consenso de Prueba de Autoridad (PoA), proporcionando tanto seguridad como eficiencia para la gestión de PIDs.

    dARK dApp

    Aplicación descentralizada central que implementa los contratos inteligentes de gestión de PID y asegura la integridad de los datos mediante tecnología blockchain

    Fundamentos de Blockchain

    La red aprovecha la tecnología Hyperledger Besu para proporcionar una base blockchain segura y eficiente. Hyperledger Besu es un cliente Ethereum diseñado para uso empresarial que soporta implementaciones de redes permisionadas tanto públicas como privadas. Su implementación de la Máquina Virtual Ethereum (EVM) permite contratos inteligentes sofisticados que gestionan operaciones de PID con total transparencia y auditabilidad.

    Arquitectura de Red

    Diseñada con la resiliencia y la confiabilidad como principios fundamentales, la arquitectura comienza con una Red dARK Mínima Viable (MVDN). Esta red consiste en nodos blockchain esenciales que proporcionan la funcionalidad fundamental requerida para la operación del sistema. Estos nodos gestionan las comunicaciones RPC/API y mantienen el libro contable distribuido de identificadores persistentes. Cada nodo completo implementa endpoints API para la interacción de servicios externos a través del balanceo de carga.

    Para garantizar la operación continua incluso durante fallos de nodos, la arquitectura incorpora redundancia tolerante a fallos mediante nodos de respaldo y sistemas de replicación de datos. Este enfoque distribuido asegura que ningún punto único de fallo pueda comprometer la integridad o disponibilidad de la infraestructura PID.

    Capa de Aplicación

    En la capa de aplicación, la dARK dApp ofrece la funcionalidad central para gestionar identificadores persistentes a través de contratos inteligentes. Esta lógica de aplicación maneja la creación, actualización y resolución de PIDs mientras hace cumplir las reglas de gobernanza definidas por los participantes de la red.

    Infraestructura Federada

    La arquitectura soporta múltiples redes blockchain independientes operadas por diferentes autoridades, creando una infraestructura PID verdaderamente federada.

    Diseño Escalable

    El sistema puede escalar horizontalmente añadiendo más nodos a la red, asegurando alto rendimiento incluso con números crecientes de PIDs.

    Extensiones Futuras

    El diseño modular permite la incorporación futura de soluciones de almacenamiento adicionales como IPFS para cargas de metadatos más grandes, manteniendo la integridad de los datos a través de verificación criptográfica en la cadena.

    Integración con el Ecosistema

    El sistema dARK está diseñado para integrarse perfectamente con el ecosistema académico existente, particularmente con redes de repositorios, revistas diamond y agregadores de metadatos, siguiendo este flujo de trabajo inicial:

    1

    Recolección de Metadatos

    Los agregadores recolectan regularmente metadatos de repositorios institucionales, revistas y otros proveedores de contenido a través de protocolos estándar como OAI-PMH o APIs personalizadas.

    2

    Asignación de PID

    Para contenido sin identificadores persistentes, el agregador puede solicitar nuevos ARKs a través de la API de dARK Minter. Para ARKs existentes, son validados y registrados en el sistema dARK.

    3

    Registro en Blockchain

    El sistema dARK registra cada ARK en la blockchain, junto con su URL de destino y metadatos esenciales, proporcionando un registro descentralizado y a prueba de manipulaciones de los identificadores.

    4

    Distribución de PID

    Los ARKs recién acuñados o validados pueden ser enviados de vuelta a los repositorios para su inclusión en sus registros de metadatos, permitiendo un enfoque estandarizado para la identificación persistente en toda la red.

    5

    Resolución

    Cuando un usuario accede a un ARK, el resolvedor global redirige al resolvedor dARK, que utiliza la blockchain para recuperar la información de ubicación actual, asegurando acceso persistente incluso cuando cambian las ubicaciones de los recursos.

    Este enfoque de integración permite a agregadores de metadatos como LA Referencia mejorar sus servicios con infraestructura PID descentralizada mientras preservan los flujos de trabajo existentes y añaden valor a la red de repositorios en su conjunto. También permite transiciones fluidas cuando los repositorios mueven contenido o cambian de plataformas, ya que el sistema de resolución de PID puede actualizarse sin romper enlaces externos.

    Desarrollo Futuro

    En las próximas fases de desarrollo, el proyecto dARK planea:

    • Transformar este proyecto inicial (actualmente funcionando en IBICT/Brasil) en un servicio regional integral diseñado como infraestructura pública, siguiendo los principios establecidos por LA Referencia
    • Desarrollar plugins para los sistemas de repositorios y revistas más utilizados para facilitar la integración perfecta con la infraestructura dARK
    • Implementar persistencia de metadatos descentralizada para preservar información bibliográfica y servir como fuente de datos confiable para sistemas analíticos como OpenAlex

    Estas mejoras fortalecerán aún más el ecosistema dARK y expandirán su utilidad dentro del panorama de comunicación académica en América Latina y más allá.

    más