
dARK - Decentralized Archival Resource Key
A decentralized implementation of the ARK persistent identifier
-
¿Qué es dARK?
dARK es una implementación descentralizada de Archival Resource Key (ARK) que asigna y resuelve identificadores ARK a través de nodos blockchain institucionales. Opera en una red de "bien público" donde la propiedad, el almacenamiento y el control de los datos se distribuyen entre todas las organizaciones participantes.
El proyecto inicial fue principalmente alojado y financiado por el Instituto Brasileño de Información en Ciencia y Tecnología (IBICT), con apoyo adicional de LA Referencia, hecho posible gracias al respaldo de los compromisos de la Coalición Global de Sostenibilidad para Servicios de Ciencia Abierta (SCOSS).
Descentralización
Una implementación inicial de ARK descentralizado basada en una red blockchain privada liviana
Tolerancia a Fallos
Atribución y resolución descentralizada tolerante a fallos de identificadores ARK a través de una red distribuida
Integración
Un sistema de atribución ARK a nivel de agregador para la producción de investigación heredada en el ecosistema de ciencia abierta brasileño (OasisBr, IBICT Brasil)
Motivaciones
Identificador Persistente ARK
El identificador ARK ha surgido como una alternativa viable y de bajo costo debido a la posibilidad de implementar proveedores locales para el resolvedor global. Su uso facilita el acceso y preservación a largo plazo de recursos digitales, asegurando enlaces estables y confiables.
Evaluación de la Investigación
Los identificadores persistentes son esenciales para construir gráficos de investigación más robustos, generar indicadores precisos y mejorar la evaluación de la producción científica. Su capacidad para vincular diversos objetos de información mejora el análisis y la comprensión del impacto de la investigación.
Desafíos en el Sur Global
En los países del Sur Global, la falta de cobertura de identificadores persistentes es un problema común. Esto se debe principalmente a los costos asociados con estos servicios, limitando el acceso a infraestructuras esenciales para asegurar la visibilidad y preservación de los resultados de investigación.
Necesidad de Descentralización
Actualmente, la mayoría de los sistemas de identificadores persistentes operan bajo modelos centralizados, dependiendo de unas pocas agencias para mantener la infraestructura de servicios. Un enfoque descentralizado, como el propuesto por dARK, reduce esta dependencia y aumenta la resiliencia del sistema, promoviendo mayor equidad en el acceso y gestión de identificadores.
Objetivos a Largo Plazo
Infraestructura Abierta
Proporcionar un sistema abierto y no centralizado para identificadores persistentes únicos/deduplicados accesible para todos
Servicios de Resolución
Ofrecer un servicio de resolución descentralizado para el ecosistema de Ciencia Abierta, interoperable con otros servicios PID (como agencias DOI)
Preservación de Metadatos
Asegurar la preservación descentralizada de metadatos asociados con objetos digitales referenciados por identificadores ARK, con el objetivo de proporcionar PIDs y metadatos consistentes a gráficos de investigación (OpenAIRE, OpenAlex, entre otros)
Nota Importante
Este desarrollo no pretende reemplazar o competir con los identificadores/agencias DOI, sino servir como una solución complementaria que también será interoperable con proveedores DOI.
-
Arquitectura y Componentes
La arquitectura del sistema dARK está diseñada con una clara separación de componentes, organizados en la Capa de Servicio y la Capa Core.
Capa de Servicio
La Capa de Servicio proporciona servicios esenciales que interactúan con los componentes de la Capa Core. Estos servicios incluyen:
dARK Resolver
Integrado con el sistema de resolución global nt2.info, permitiendo la resolución de identificadores persistentes
dARK Minter
Utilizado para crear y registrar nuevos PIDs en el sistema
dARK Dashboard
Proporciona capacidades de monitoreo y administración para la plataforma
dARK API
Facilita la comunicación entre aplicaciones y la blockchain subyacente
dARK Backup
Asegura la durabilidad de los datos y la confiabilidad del sistema
dARK LA Referencia
Implementa la acuñación masiva de dARK en la Plataforma de Recolección de LA Referencia
Estos servicios son respaldados por mecanismos de balanceo de carga para garantizar alta disponibilidad y rendimiento óptimo del sistema.
Capa Core (dARK dApp)
La Capa Core está construida sobre una red blockchain permisionada que forma la columna vertebral del sistema dARK. En su núcleo hay una red pública permisionada que opera con un mecanismo de consenso de Prueba de Autoridad (PoA), proporcionando tanto seguridad como eficiencia para la gestión de PIDs.
dARK dApp
Aplicación descentralizada central que implementa los contratos inteligentes de gestión de PID y asegura la integridad de los datos mediante tecnología blockchain
Fundamentos de Blockchain
La red aprovecha la tecnología Hyperledger Besu para proporcionar una base blockchain segura y eficiente. Hyperledger Besu es un cliente Ethereum diseñado para uso empresarial que soporta implementaciones de redes permisionadas tanto públicas como privadas. Su implementación de la Máquina Virtual Ethereum (EVM) permite contratos inteligentes sofisticados que gestionan operaciones de PID con total transparencia y auditabilidad.
Arquitectura de Red
Diseñada con la resiliencia y la confiabilidad como principios fundamentales, la arquitectura comienza con una Red dARK Mínima Viable (MVDN). Esta red consiste en nodos blockchain esenciales que proporcionan la funcionalidad fundamental requerida para la operación del sistema. Estos nodos gestionan las comunicaciones RPC/API y mantienen el libro contable distribuido de identificadores persistentes. Cada nodo completo implementa endpoints API para la interacción de servicios externos a través del balanceo de carga.
Para garantizar la operación continua incluso durante fallos de nodos, la arquitectura incorpora redundancia tolerante a fallos mediante nodos de respaldo y sistemas de replicación de datos. Este enfoque distribuido asegura que ningún punto único de fallo pueda comprometer la integridad o disponibilidad de la infraestructura PID.
Capa de Aplicación
En la capa de aplicación, la dARK dApp ofrece la funcionalidad central para gestionar identificadores persistentes a través de contratos inteligentes. Esta lógica de aplicación maneja la creación, actualización y resolución de PIDs mientras hace cumplir las reglas de gobernanza definidas por los participantes de la red.
Infraestructura Federada
La arquitectura soporta múltiples redes blockchain independientes operadas por diferentes autoridades, creando una infraestructura PID verdaderamente federada.
Diseño Escalable
El sistema puede escalar horizontalmente añadiendo más nodos a la red, asegurando alto rendimiento incluso con números crecientes de PIDs.
Extensiones Futuras
El diseño modular permite la incorporación futura de soluciones de almacenamiento adicionales como IPFS para cargas de metadatos más grandes, manteniendo la integridad de los datos a través de verificación criptográfica en la cadena.
Integración con el Ecosistema
El sistema dARK está diseñado para integrarse perfectamente con el ecosistema académico existente, particularmente con redes de repositorios, revistas diamond y agregadores de metadatos, siguiendo este flujo de trabajo inicial:
1Recolección de Metadatos
Los agregadores recolectan regularmente metadatos de repositorios institucionales, revistas y otros proveedores de contenido a través de protocolos estándar como OAI-PMH o APIs personalizadas.
2Asignación de PID
Para contenido sin identificadores persistentes, el agregador puede solicitar nuevos ARKs a través de la API de dARK Minter. Para ARKs existentes, son validados y registrados en el sistema dARK.
3Registro en Blockchain
El sistema dARK registra cada ARK en la blockchain, junto con su URL de destino y metadatos esenciales, proporcionando un registro descentralizado y a prueba de manipulaciones de los identificadores.
4Distribución de PID
Los ARKs recién acuñados o validados pueden ser enviados de vuelta a los repositorios para su inclusión en sus registros de metadatos, permitiendo un enfoque estandarizado para la identificación persistente en toda la red.
5Resolución
Cuando un usuario accede a un ARK, el resolvedor global redirige al resolvedor dARK, que utiliza la blockchain para recuperar la información de ubicación actual, asegurando acceso persistente incluso cuando cambian las ubicaciones de los recursos.
Este enfoque de integración permite a agregadores de metadatos como LA Referencia mejorar sus servicios con infraestructura PID descentralizada mientras preservan los flujos de trabajo existentes y añaden valor a la red de repositorios en su conjunto. También permite transiciones fluidas cuando los repositorios mueven contenido o cambian de plataformas, ya que el sistema de resolución de PID puede actualizarse sin romper enlaces externos.
Desarrollo Futuro
En las próximas fases de desarrollo, el proyecto dARK planea:
- Transformar este proyecto inicial (actualmente funcionando en IBICT/Brasil) en un servicio regional integral diseñado como infraestructura pública, siguiendo los principios establecidos por LA Referencia
- Desarrollar plugins para los sistemas de repositorios y revistas más utilizados para facilitar la integración perfecta con la infraestructura dARK
- Implementar persistencia de metadatos descentralizada para preservar información bibliográfica y servir como fuente de datos confiable para sistemas analíticos como OpenAlex
Estas mejoras fortalecerán aún más el ecosistema dARK y expandirán su utilidad dentro del panorama de comunicación académica en América Latina y más allá.