Implementacion de Un Repositorio Digital
Implementacion de Un Repositorio Digital
INFORMACIÓN DIGITAL
UNIVERSIDAD DE SALAMANCA
FACULTAD DE TRADUCCIÓN Y DOCUMENTACIÓN
MÁSTER EN SISTEMAS DE INFORMACIÓN DIGITAL
IMPLEMENTACION DE UN
REPOSITORIO DIGITAL CON
DSPACE Y VUFIND.
Autor:
Pastor Nso Mangue
Tutores:
Luis Carlos García de Figuerola Paniagua
José Luis Alonso Berrocal
Salamanca, 2022
MASTER EN SISTEMAS DE
INFORMACIÓN DIGITAL
UNIVERSIDAD DE SALAMANCA
FACULTAD DE TRADUCCIÓN Y DOCUMENTACIÓN
MÁSTER EN SISTEMAS DE INFORMACIÓN DIGITAL
IMPLEMENTACION DE UN
REPOSITORIO DIGITAL CON
DSPACE Y VUFIND.
Autor:
Pastor Nso Mangue
Tutores:
Luis Carlos García de Figuerola Paniagua
José Luis Alonso Berrocal
V.º B.º
i
ABSTRACT
In this final Master's project, an institutional repository is implemented with DSpace and
Vufind, where DSpace works on the "backend" and Vufind on the frontend. Institutional
repositories are becoming increasingly necessary, especially due to the "open Access"
movement, but it is difficult to find trained personnel among documentalists to install
the applications involved, having to resort in most cases to specialized personnel,
which is why it is A digital literacy is necessary in this regard. DSpace, for its part,
meets the requirements of gratitude (open source), adaptability, interoperability
(through OAI-PMH), continuous development and ease of use, while Vufind stands out
for its ability to serve as a universal search engine, replacing the traditional OPAC .
With this work, the aim is to provide documentalists with a guide that details the
architecture and infrastructure necessary for the installation of DSpace and Vufind, as
well as to provide them with the necessary steps for their successful completion.
ii
ASIENTO CATALOGRÁFICO CON FORMATO DEL REPOSITORIO
INSTITUCIONAL GREDOS
Fecha: 2022-06-20
iii
installation of DSpace and Vufind, as well as to provide them with
the necessary steps for their successful completion.
Descripción: Trabajo de Fin de Máster en Sistemas de Información
Digital, curso 2021-2022
iv
TABLA DE CONTENIDOS
INTRODUCCION........................................................................................................................ 1
JUSTIFICACION DEL PROYECTO Y OBJETIVOS ............................................................. 2
Justificación del proyecto ...................................................................................................... 2
Objetivos .................................................................................................................................. 3
Objetivos generales............................................................................................................ 3
Objetivos específicos ......................................................................................................... 3
METODOLOGÍA Y MATERIALES ........................................................................................... 3
Metodología ............................................................................................................................. 3
Materiales ................................................................................................................................ 4
DISPOSICIONES LEGALES, NORMAS Y REFERENCIAS ............................................... 5
Leyes ........................................................................................................................................ 5
Normas ..................................................................................................................................... 5
Referencias ............................................................................................................................. 5
DEFINICIONES Y ABREVIATURAS....................................................................................... 5
REQUISITOS FUCIONALES Y NO FUNCIONALES ........................................................... 6
Requisitos funcionales ........................................................................................................... 6
Casos de uso del repositorio digital ................................................................................. 7
Requisitos no funcionales ..................................................................................................... 8
ALCANCE Y RESTRICCIONES .............................................................................................. 8
Alcance del proyecto.............................................................................................................. 8
Restricciones del proyecto .................................................................................................... 8
ESTUDIO DE ALTERNATIVAS ............................................................................................... 8
Estudio de alternativas .......................................................................................................... 8
Estudio de viabilidad .............................................................................................................. 9
Viabilidad técnica ................................................................................................................ 9
Viabilidad económica ......................................................................................................... 9
Viabilidad legal .................................................................................................................... 9
ANALISIS DE RIESGOS ........................................................................................................... 9
ORGANIZACIÓN Y GESTIÓN DEL PROYECTO ............................................................... 10
PROGRAMACION TEMPORAL ............................................................................................ 11
PRESUPUESTO....................................................................................................................... 11
SOLUCION PROPUESTA ...................................................................................................... 12
Prototipo funcional del repositorio digital .......................................................................... 12
Arquitectura del sistema .................................................................................................. 12
Infraestructura del sistema .............................................................................................. 13
Prototipo conceptual avanzado del repositorio digital. ................................................... 14
v
Arquitectura del sistema .................................................................................................. 14
Infraestructura del sistema .............................................................................................. 14
RESULTADOS.......................................................................................................................... 15
DSpace Backend .................................................................................................................. 15
DSpace Frontend ................................................................................................................. 16
VuFind .................................................................................................................................... 17
Integración deDSspace y VuFind mediante el protocolo OAI-PMH ........................................ 17
Cosechando en DSpace con OAI-PMH desde el repositorio USAL GREDOS ....................... 18
Cosechando con OAI-PMH desde VuFind al “Repositorio Insitucional de la
Universidad de Huelva”. .................................................................................................. 22
CONCLUSIONES Y TRABAJOS FUTUROS....................................................................... 26
Conclusiones ......................................................................................................................... 26
Dificultades encontradas ................................................................................................. 26
Aportaciones del proyecto ............................................................................................... 26
Trabajos futuros .................................................................................................................... 27
BIBLIOGRAFÍA ......................................................................................................................... 27
ANEXOS .................................................................................................................................... 28
Anexo 1: Proceso de instalación de DSpace............................................................................ 28
Instalación de DSpace Backend ........................................................................................... 28
Instalación de DSpace-frontend ..................................................................................... 44
Anexo 2: Proceso de instalación de Vufind. ..................................................................... 52
Anexo 3: Proceso de integración de DSpace con VuFind ........................................................ 61
Configuración del protocolo OAI-PMH en VuFind .............................................................. 61
vi
ÍNDICE DE FIGURAS
vii
Figura 43. Fichero de configuración de DSpace Backend................................................. 40
Figura 44. Continuación del fichero de configuración de DSpace backend. ............................... 41
Figura 45. Compilación de DSpace Backend con la herramienta Maven ....................... 42
Figura 46. Instalación de DSpace Backend con Apache Ant ............................................ 43
Figura 47. Inicializar la base de datos de DSpace .............................................................. 43
Figura 48. Creación del usuario administrador de DSpace. .............................................. 44
Figura 49. Copiado de webapps de DSpace a Tomcat...................................................... 44
Figura 50. Copiado de los "Cores" de Solr ........................................................................... 44
Figura 51. Instalación de NVM (node version manager).................................................... 45
Figura 52. Listado de las versiones de nodejs disponibles para instalar. ....................... 45
Figura 53. Instalacion de la ultima version LTS de NodeJS .............................................. 46
Figura 54. Instalación de Yarn y PM2 ................................................................................... 46
Figura 55. Descarga de DSpace Frontend........................................................................... 47
Figura 56. Instalación de DSpace frontend mediante Yarn ............................................... 47
Figura 57. Continuación de instalación de DSpace frontend mediante Yarn. ............................ 47
Figura 58. Creación del fichero de configuración de DSpace Frontend .......................... 48
Figura 59. Fichero de configuración de DSpace Frontend ................................................ 48
Figura 60. Compilación de DSpace frontend ....................................................................... 49
Figura 61. Continuación de la compilación de DSpace ............................................................... 49
Figura 62. Fichero de configuración de arranque de DSpace Frontend con PM2 ......... 50
Figura 63. Arranque de DSpace frontend con PM2 ............................................................ 50
Figura 64- Página web de Dspace frontend. ............................................................................... 50
Figura 65. Login de DSpace frontend ................................................................................... 51
Figura 66. Descarga de VuFind 8.04 .................................................................................... 53
Figura 67. Instalación de VuFind 8.0.4 ................................................................................. 54
Figura 68. Arreglo de las dependencias faltantes en la instalación de VuFind. ............. 55
Figura 69. Continuación con el arreglo de dependencias faltantes. ........................................... 56
Figura 70. Interfaz web de instalación de Configuración de VuFind. ............................... 57
Figura 71. Arreglo de base de datos. .................................................................................... 58
Figura 72. Base de datos arreglada. ............................................................................................ 58
Figura 73. Configuración de Vufind para utilizar el puerto 8984 ....................................... 59
Figura 74. Configuración del script de arranque de Solr para usar el puerto 8984. ...... 59
Figura 75. Dependencias básicas de VuFind instaladas. ............................................................. 60
Figura 76. Portal de Vufind tras la instalación. .................................................................... 60
Figura 77. Configuración de cosechado de colecciones en VuFind. ............................... 61
Figura 78. Descarga de información de cosechado mediante OAI-PMH ........................ 62
Figura 79. Integración de la colección cosechada desde el reposotirio DSpace local a
VuFind. ....................................................................................................................................... 62
Figura 80. Integración de la colección cosechada desde el repositorio de la
Universidad de Huelva a VuFind. .......................................................................................... 63
Figura 81. Resultado de búsqueda de todos los objetos digitales cosechados en
VuFind. ....................................................................................................................................... 63
Figura 82. Fichero de configuración de las páginas web cuyo contenido se va a
indexar en VuFind. ................................................................................................................... 64
Figura 83. Ficheo de configuración de las fuentes de búsqueda que aparecen en la
web de VuFind. ......................................................................................................................... 64
Figura 84. Fichero de configuración de "facet" para refinar los resultados de la búsqueda. ..... 65
Figura 85. Incorporación de “No autor” como “facet” para filtrar artículos sin autores............ 65
Figura 86. Fichero de configuración general de VuFind. ............................................................. 66
Figura 87. Fichero de configuración del extractor de metadatos para indexación de páginas
web. ............................................................................................................................................. 66
viii
ÍNDICE DE TABLAS
ix
INTRODUCCION
La sociedad de la información y comunicación está basada en el uso de las
tecnologías de información y comunicación para las interacciones humanas. En
lugares donde dicha sociedad de la información ha madurado, ha dado lugar a otro
fenómeno que es la sociedad del conocimiento, donde las personas no solo consumen
información para aplicar conocimiento, sino que también lo comparten. La necesidad
de compartir conocimientos ha dado lugar al movimiento “open access”, lo cual ha
aumentado la demanda de creación de repositorios digitales. Pues debido a la
naturaleza anárquica de internet los repositorios digitales sirven como punto de acceso
a información fiable, ofrecida por una institución conocida y en que se puede confiar.
La puesta en funcionamiento de estos repositorios digitales no es asumible para
cualquiera y requiere de algunos conocimientos especializados de informática que
permitan la integración de todos los componentes involucrados, tanto a nivel de
infraestructura como arquitectura, teniendo en cuenta la satisfacción del usuario final,
que en última instancia determina la calidad. En este sentido, este trabajo final de
Máster en Sistemas de Información Digital trata de lo necesario para poner en marcha
un repositorio digital con DSpace y su integración con Vufind a través del protocolo
OAI-PMH; la función de Vufind es servir como buscador universal, una ventana única
de acceso a la información debido a su capacidad de buscar en repositorios
institucionales, revistas digitales, bibliotecas digitales y otros recursos. Desde luego
que existen otras aplicaciones informáticas para repositorios, entre los más
destacados están EPrints y Fedora Commons; pero DSpace sobresale por reunir
requisitos de gratitud, adaptabilidad, interoperabilidad, continuo desarrollo y facilidad
de uso, además de poseer el mayor número de implementaciones y comunidad de
usuarios, (Soler Bernal & Villadóniga Gómez, 2009).
La estructura del trabajo incorpora elementos del método científico y el método de
ingeniería, siendo éste último una estrategia para producir el mejor cambio con los
recursos disponibles. Si bien el método científico planeta una hipótesis a verificar, el
método de ingeniería produce un prototipo a analizar; el método de ingeniería consiste
en siete pasos, cuales son la identificación del problema, recolección de la información
necesaria, búsqueda de soluciones creativas, diseño preliminar, evaluación y
selección de la solución, preparación de especificaciones e implementación del diseño
(Calameo, 2021). Dicha estructura es la siguiente:
Introducción: donde se explica el contexto actual de los repositorios
institucionales y las tecnologías involucradas.
Justificación del proyecto y objetivos: donde se explican las razones que
han llevado a realizar este trabajo y las metas a conseguir.
Metodología y materiales: donde se explica el método seguido para realizar el
trabajo y los recursos materiales involucrados.
Normas y referencias: donde se explican las normas de obligado
cumplimiento y las recomendaciones a tener en cuenta a la hora de realizar
este trabajo.
Definiciones y abreviaturas: aclaración de algunos términos o herramientas
que se usan en este trabajo.
Estudio de alternativas y viabilidad: donde se expone un análisis de las
diferentes aplicaciones informáticas que pueden servir para la implementación
de un repositorio digital y justificación de la elegida para su implementación.
Requisitos funcionales y no funcionales: donde se establece las
funcionalidades básicas que se esperan del sistema y su desempeño para
satisfacer los objetivos establecidos.
1
Alcance y restricciones: donde se describe lo que se va abarcar o no, según
los recursos disponibles.
Análisis de riesgos: donde se analiza los contratiempos que pueden surgir
durante la realización del proyecto y lo que se hará al respecto para finalizar el
proyecto en el tiempo previsto.
Programación temporal: donde se especifica el tiempo necesario para
cumplimentar las etapas correspondientes.
Presupuesto: donde se calcula los recursos económicos necesarios para
culminar el proyecto en el tiempo previsto.
Solución propuesta: se exponen las soluciones tecnológicas adoptadas para
implementar un repositorio digital.
Discusión de resultados: se discuten los resultados obtenidos.
Conclusiones y trabajos futuros: se exponen las conclusiones y los trabajos
que se pueden realizar en el futura para mejorar el sistema o integrarlo con
otros.
Bibliografía: se presenta un listado de las referencias bibliográficas
consultadas.
Anexos: se exponen documentación adicional relevante para el proyecto que
no cabe en los apartados anteriores, para su consulta en caso necesario por
los interesados. En esta sección se detallan los procesos de instalación de las
aplicaciones que conforman el repositorio digital. También se exponen los
resultados de la evaluación de un repositorio digital del Instituto Biomédico de
Salamanca, el “Atlas de Genética oncológica”, que ha sido uno de los
motivadores de realizar este proyecto.
Otra de las razones que han motivado al autor a realizar es la experiencia vivida
durante su estancia de “prácticas en empresa” en el Instituto Biomédico de
Salamanca, donde tuvo que participar en la migración de un repositorio digital, “Atlas
of Genetics and Cytogenetics in Oncology and Haematology”, desde su versión
antigua que data desde 1997, https://atlasgeneticsoncology.com, a la nueva,
https://atlasgeneticsoncology.org. Durante la migración, el autor realizó la evaluación
del repositorio, basándose en las directrices de la “guía para la evaluación de
repositorios institucionales de investigación”, (Cristina, Bernal, & Gómez Castaño,
2
2021); dicha evaluación determinó que el repositorio incumple con gran parte de los
requisitos.
Objetivos
Objetivos generales
El objetivo general de este trabajo es implementar un repositorio DSpace funcional
integrado con el buscador VuFind a través del protocolo OAI-PMH.
Objetivos específicos
Los objetivos específicos son:
METODOLOGÍA Y MATERIALES
Metodología
Este trabajo abarca investigación científica e ingeniería, por lo tanto combina el
método científico, consiste en la observación sistemática, medición, experimentación y
la formulación, análisis y modificación de hipótesis, y el método de ingeniería, que
consiste en la identificación del problema, recolección de la información necesaria,
búsqueda de soluciones creativas, pasar de la idea principal al diseño preliminar,
evaluación y selección de la solución, preparación de reportes, planos y
especificaciones, y la implementación del diseño. Por lo tanto la metodología y
estructura del trabajo debe combinar ambos métodos.
3
La metodología a seguir para conseguir los objetivos arriba propuestos es:
Revisión bibliográfica sobre los repositorios digitales y el software involucrado
para su implementación. Dicha información se obtienen a través de los
repositorios institucionales y motores especiales de búsqueda:
o Google Académico, https://scholar.google.es, el buscador de
bibliografía científico académica.
o Scielo: https://scielo.org/es/. Librería electrónica científica en línea.
o Usal Gredos: https://gredos.usal.es. Repositorio documental de la
Universidad de Salamanca.
o Dialnet: https://dialnet.unirioja.es. Portal que integra la búsqueda en
varios repositorios documentales, gestionado por la Universidad de la
Rioja.
Análisis de requisitos funcionales y no funcionales.
Diseño de la arquitectura e infraestructura.
Implementación del prototipo funcional.
Discusión de resultados.
Conclusiones.
Recomendaciones y trabajos futuros.
Materiales
Los materiales que que utilizan en este trabajo son:
4
DISPOSICIONES LEGALES, NORMAS Y REFERENCIAS
Este trabajo, como todo proyecto destinado a ser utilizado por los ciudadanos, debe
estar sujeto a una serie de leyes, normas y referencias de buenas prácticas.
Leyes
El Reglamento General de Protección de Datos (RGPD). Es el reglamento
europeo relativo a la protección de las personas físicas en lo que respecta al
tratamiento de sus datos personales y a la libre circulación de estos datos.
España, al ser miembro de la Unión Europea está suscrito a este reglamento,
(Agencia Española de protección de datos, 2022).
Ley 37/2007, de 16 de noviembre, sobre reutilización de la información del
sector público, (Jefatura de Estado, 2007), (BOE, 2007).
Ley 14/2011, de 1 de junio, de la Ciencia, la Tecnología y la Innovación, (BOE,
2011). En su artículo 37 trata de la difusión en acceso abierto.
DIRECTIVA (UE) 2019/1024 DEL PARLAMENTO EUROPEO Y DEL
CONSEJO de 20 de junio de 2019 relativa a los datos abiertos y la reutilización
de la información del sector público, (DIRECTIVA (UE) 2019/1024 DEL
PARLAMENTO EUROPEO Y DEL CONSEJO, 2019).
Normas
Las normas aplicables al desarrollo de este proyecto son:
Referencias
Sistema de información de archivo abierto (OAIS, Open Archival Information
System), (Cruz Mundet & Díez Carrera, 2016)
Guía para la evaluación de repositorios institucionales, (Cristina, Bernal, &
Gómez Castaño, 2021).
Recomendaciones para la implementación del artículo 37 Difusión en Acceso
Abierto de la Ley de la Ciencia, la Tecnología y la Innovación, (FECYT, 2014).
DEFINICIONES Y ABREVIATURAS
5
Documento digital: es la representación digital (información codificada en modo
binario mediante bits) de un documento, contenido, textos, imágenes, videos y
sonidos. Es un objeto inteligible para las máquinas y no para los humanos, los cuales
necesitan de dispositivos electrónicos para su interpretación.
Software de código abierto: Programa informático cuyo código fuente puede ser
distribuido, modificado y utilizado libremente.
RF: requisito funcional que el software debe satisfacer para considerarse útil de cara al
usuario final.
RNF: requisito no funcional que el software debe cumplir para satisfacer sin
interrupción las demanda de los usuarios.
6
RF03: Registro, edición o eliminación de objetos digitales dentro de una colección.
Versión 1.0
Precondición El usuario debe estar dado de alta en el sistema. El sistema
debe haber aceptado las credenciales del usuario.
Descripción El sistema debe comportarse como se describe en el siguiente
caso de uso cuando el usuario ejecuta la búsqueda de
información sobre objetos digitales.
Secuencia Normal 1 El usuario solicita ejecuta una búsqueda simple o
avanzada sobre objetos digitales.
Versión 1.0
Precondición El usuario debe estar dado de alta en el sistema. El sistema
debe haber aceptado las credenciales del usuario.
El usuario debe haber creado la comunidad y colección que
va a contener el objeto digital.
Descripción El sistema debe comportarse como se describe en el siguiente
caso de uso cuando el usuario procede a registrar un objeto
digital en el repositorio.
Secuencia Normal 1 El usuario solicita registrar un objeto digital.
7
Post-condición El usuario sincroniza el “cosechador” para actualizar la
información de la colección correspondiente, con el fin de que
el nuevo objeto digital registrado aparezca en las búsquedas.
Requisitos no funcionales
RNF01 Rendimiento. El sistema debe ser capaz de ejecutar las búsquedas con
rapidez y sin mucha demora.
RNF02 Escalabilidad y crecimiento horizontal. El sistema debe ser capaz de
crecer horizontalmente, sin necesidad de interrumpir sus servicios.
RNF04 Seguridad. La comunicación entre los navegadores de los usuarios y el
portal web está protegida mediante encriptación HTTPS.
ALCANCE Y RESTRICCIONES
Alcance del proyecto
Este proyecto se centra en el diseño e implementación de un repositorio digital con
DSpace, el cual puede compartir información sobre sus colecciones con VuFind, que
es un cosechador/buscador capaz de servir de punto unificado de búsqueda para
múltiples repositorios remotos, a través del protocolo OAI-PMH.
El proyecto dispone de una sola máquina virtual que actúa de servidor con
sistema operativo “Debian 11”, donde se han instalado todos los servicios. Por
lo tanto no puede garantizar el cumplimiento con los requisitos no funcionales
RNF01 y RNF02.
La implementación del prototipo funcional se realiza en un servidor no
accesible desde internet, sino desde la intranet de la Universidad de
Salamanca. Por lo tanto no se contempla implementar HTTPS y las
comunicaciones están inseguras.
No es objetivo del trabajo cumplir con los requisitos de accesibilidad. Solo
pretende servir como guía de instalación. Las capacidades de accesibilidad
web están limitadas a las de DSpace y VuFind. No se elaboran capacidades
adicionales.
ESTUDIO DE ALTERNATIVAS
Estudio de alternativas
Existen varias aplicaciones informáticas para implementar repositorios digitales, cuyas
características vamos a analizar en este apartado. Aunque existen otros, como
Omeka e Invenio, que también gozan de gran popularidad, para este trabajo, solo
analizamos los más populares, cuales son:
Eprints: https://www.eprints.org/uk/index.php/eprints-software.
Fedora Commons (Flexible Extensible Digital Object Repository Architecture):
https://duraspace.org/fedora.
DSpace: https://duraspace.org/dspace.
8
Tras un análisis de sus características, se observa que DSpace sobresale en muchos
aspectos que lo convierten el mejor software para implementar repositorios digitales,
de entre las cuales destacamos:
Estudio de viabilidad
Viabilidad técnica
Este proyecto es viable técnicamente porque se dispone de equipo con el
correspondiente sistema operativo en forma de máquina virtual proporcionado por el
departamento de informática y automática de la Universidad de Salamanca, para el
desarrollo de este proyecto fin de máster. Igualmente también el autor dispone de
suficientes conocimientos informáticos para su implementación. El software necesario
también está disponible en internet y libre de licencias.
Viabilidad económica
La realización de este proyecto no requiere de grandes sumas económicas ya que los
recursos hardware y software necesario para su implementación están disponibles y
libres de pagos.
Viabilidad legal
La realización de este proyecto no infringe ninguna ley, sino al contrario, da
capacitación para que las instituciones puedan cumplir con la ley RISP (reutilización
de la información del sector público” (BOE, 2007), que obliga compartir los resultados
de investigaciones financiados por el estado a través de repositorios institucionales,
así como con el artículo 37 de la Ley de la Ciencia, tecnología e innovación (BOE,
2011).
ANALISIS DE RIESGOS
Durante el desarrollo de este trabajo se podrían producir incidentes asociados a
potenciales riesgos que requieren un análisis con el fin de adoptar planes de
mitigación. Para determinar la probabilidad y grado de impacto de estos riesgos se
toma como base referencial a la matriz de riesgos de la tabla 3.
9
Tabla 3: Matriz de riesgos. Fuente: https://en.wikipedia.org/wiki/Risk_matrix.
2) Indisponibilidad de uno de los miembros del equipo del proyecto: si falta algún
miembro del proyecto, tanto por parte del autor, como de la tutoría, por razones de
enfermedad o accidente, el proyecto se retrasará. La solución es llevar una dieta sana
y evitar desplazamientos innecesarios para minimizar la posibilidad de accidentes.
10
Figuerola Paniagua”, se encarga de guiar al autor, corregir los errores y aprobar el
proyecto una vez finalizado.
Los canales de comunicación verbal y escrita utilizados para la interacción del autor y
el tutor para interactuar durante la realización del proyecto son los siguientes:
PROGRAMACION TEMPORAL
La elaboración de este trabajo se aborda en fases, cuales son:
PRESUPUESTO
El presupuesto que aquí se presenta es orientativo y se compone de tres partes:
11
Tabla 4. Presupuesto orientativo del proyecto.
SOLUCION PROPUESTA
Prototipo funcional del repositorio digital
Arquitectura del sistema
En la figura 2 se muestra la arquitectura del repositorio digital que sirve de prototipo
funcional para este proyecto.
12
Figura 2. Arquitectura simple del sistema.
13
Básicamente consiste en un “router” con acceso a internet, al cual está conectado el
“switch de núcleo o core switch” que conecta con el servior. Lo ideal sería disponer de
tres servidores para este prototipo, uno para VuFind, otro para “DSpace backend” y
otro para “DSpace frontend”. Pero por precariedad de recursos se ha instalado todo en
un solo servidor virtual.
14
Figura 5. Infraestructura avanzada del sistema.
RESULTADOS
Los resultados que aquí se presenten derivan de las instalaciones descritas en los
anexos.
DSpace Backend
Las figures 6 y 7 muestran las interfaces de los servicios “servidor api” y “servidor OAI-
PMH“ de “DSpace backend”.
15
Figura 6. Interfaz Rest de DSpace backend (http://192.168.1.42:8080/server/#/server/api)
DSpace Frontend
La figura 8 ilustra la interfaz de gestión de “DSpace frontend”.
16
Figura 8. Interfaz web de DSpace tras finalizar la instalación.
VuFind
La figura 9 muestra la interfaz de VuFind recién instalado, aún sin configuraciones
adicionales.
Figura 9. Interfaz web de Vufind tras finalizar la instalación.
Metadatos.
Metadatos y referencias a los ficheros.
Metadatos y ficheros (con su contenido).
17
Debido a la poca potencia del servidor virtual con el que se dispone, solo se cosechará
los “metadatos y referencias a los ficheros”, para no tener que descargar el contenido
de los archivos durante el cosechado.
18
Para que finalmente se coseche la colección en el repositorio local, se procede como
sigue:
Una vez finalizado el proceso de cosecha, la nueva colección se llena del contenido de
su homólogo de “USAL GREDOS”, como se muestra en la figura 12.
19
Figura 12. Colección "Servicios de la USAL" cosechada desde GREDOS.
20
Figura 13. Cosechado de la colección "Sociedad y Valores Cívicos" de la UA.
21
En la siguiente 15 se puede observar la presencia de todos los metadatos en un
artículo de la colección cosechada.
Figura 15. Metadatos de un artículo de la colección cosechada "Servicios y Valores Cívicos”.
22
Figura 16. VuFind con contenido de las colecciones cosechadas mediante OAI-PMH.
23
En la figura 18 se muestra los resultados de la búsqueda del término “internet” en el
catálogo de VuFind. Se puede observar por la derecha los “facet” que permiten refinar
la búsqueda, ya sea por idioma (lenguaje), formato de archivo, autor, institución al que
pertenece, documentos que carecen de autor, etc. Se puede incorporar nuevos “facet”
configurando el archivo “facets.ini”.
24
Figura 19. Datos indexados desde el portal de la USAL "https://www.usal.es".
25
Figura 21. Resultado de la búsqueda de "metadatos" en VuFind a través de Google.
Dificultades encontradas
A lo largo de la ejecución de este trabajo se han encontrado varias dificultades, cuales
son:
26
Una guía de instalación e integración de DSpace 7.2 y VuFind 8.04, para
aquellos que no poseen grandes conocimientos de Linux y los paquetes
involucrados en los procesos de instalación de estas aplicaciones.
Prototipo de repositorio virtual para cumplir con la legislación vigente en
materia de acceso abierto y reutilización de información del sector público.
Trabajos futuros
Integracion de Vufind con “Matomo Analytics” o “Google Analytics” para
obtener estadísticas que sirvan para medir el desempeño del repositorio.
Integracion de Vufind con Koha, con el fin usar Vufind como sustituto de la
OPAC de Koha u otro sistema integrado de gestión de bibliotecas.
Automatizar el cosechado a través de OAI-PMH mediante programadores de
tareas (“Cron jobs”).
Personalizar el comportamiento de VuFind según las necesidades de los
usuarios.
Construir un portal web para el repositorio, compatible con los requerimientos
de accesibilidad, que incluya búsqueda exploratorio a través de DSpace y
búsqueda a través del catálogo de VuFind, facilitando la interacción del usuario
con el sistema.
BIBLIOGRAFÍA
Agencia Española de protección de datos. (Marzo de 2022). Obtenido de
https://ayudaleyprotecciondatos.es/guia-rgpd/
BOE. (Junio de 2011). BOE. Obtenido de Ley 14/2011, de 1 de junio, de la Ciencia, la Tecnología
y la Innovación: https://www.boe.es/buscar/pdf/2011/BOE-A-2011-9617-consolidado.pdf
Cristina, A., Bernal, I., & Gómez Castaño, J. (2021). Guía para la evaluación de repositorios
institucionales. Obtenido de
https://www.recolecta.fecyt.es/sites/default/files/contenido/documentos/2021GuiaEvaluacio
nRecolecta_vf.pdf
Cruz Mundet, J. R., & Díez Carrera, C. (Septiembre de 2016). Sistema de Información de Archivo
Abierto (OAIS): luces y sombras de un modelo de referencia. Obtenido de
http://www.scielo.org.mx/scielo.php?script=sci_arttext&pid=S0187-358X2016000300221
DIRECTIVA (UE) 2019/1024 DEL PARLAMENTO EUROPEO Y DEL CONSEJO. (Junio de 2019).
Obtenido de https://eur-lex.europa.eu/legal-
content/ES/TXT/PDF/?uri=CELEX:32019L1024&from=ES
27
FECYT. (Junio de 2016). INFORME DE LA COMISIÓN DE SEGUIMIENTO SOBRE EL GRADO DE
CUMPLIMIENTO DEL ARTÍCULO 37 DE LA LEY DE CIENCIA. Obtenido de
https://www.fecyt.es/es/publicacion/informe-de-la-comision-de-seguimiento-sobre-el-grado-
de-cumplimiento-del-articulo-37-de
Soler Bernal, M., & Villadóniga Gómez, J. C. (Noviembre de 2009). APLICACIÓN DE DSPACE
COMO GESTOR DE REPOSITORIOS EN LA UNIVERSIDAD DE HUELVA. Obtenido de
http://rabida.uhu.es/dspace/bitstream/handle/10272/1652/Bernal%20Soler%2c%20Montserr
at.pdf?sequence=1
ANEXOS
Anexo 1: Proceso de instalación de DSpace.
https://wiki.lyrasis.org/display/DSDOC7x/Installing+DSpace
apt-get update
28
Figura 22. Actualización del sistema operativo
29
Figura 24. Instalación de OpeJDK, versión 11.
30
Figura 26. Instalación de Apache Maven y Apache Ant
31
Figura 27. Instalación de PostgreSQL
Inicializamos postgresql.
passwd postgres
Password: Salamanca123
32
Figura 29. Creación de contraseña para el usuario postgres
33
Figura 31. Restringir la seguridad de acceso a la base de datos.
34
Figura 33. Instalación de paquetes necesarios para Apache Solr
Se procede con la descarga del binario Solr, desde la página oficial de Solr.
Figura 34. Descarga del paquete Solr
Unzip and install: Se procede con la instalación con el comando “bash solr-
8.11.1/bin/install_solr_service.sh solr-8.11.1.tgz”.
35
Figura 35. Instalación de Solr
36
Figura 37. Dar Permisos al usuario Tomcat sobre el directorio DSpace.
Aumentar la memoria de Java para que Tomcat tenga suficiente para su ejecución.
Figura 38. Aumento de la memoria de JVM (java virtual machine)
37
Figura 39. Fichero de configuración del servidor Tomcat 9
Reiniciar Tomcat9:
38
Descomprimir con “Unzip”
Crear la base de datos dspace y su usuario con privilegios exclusivos, así como la
extensión “pgcrypto”.
Figura 41. Creación de la base de datos DSpace y usuario dspace.
39
Figura 43. Fichero de configuración de DSpace Backend
40
Figura 44. Continuación del fichero de configuración de DSpace backend.
mvn package
41
Figura 45. Compilación de DSpace Backend con la herramienta Maven
42
Figura 46. Instalación de DSpace Backend con Apache Ant
/dspace/bin/dspace create-administrator
43
Figura 48. Creación del usuario administrador de DSpace.
Copiamos los “CoreSets” de DSpace a Solr y reiniciamos el servicio “solr”. Los ficheros
de configuración de solr se encuentran en “/var/solr/data”.
Figura 50. Copiado de los "Cores" de Solr
Dar privilegios de propietario al usuario “solr” sobre “/var/solr/data” (el home directory
de solr).
Instalación de DSpace-frontend
Instalación de nvm (node versión manager).
44
Figura 51. Instalación de NVM (node version manager)
Listar las versiones de nodejs disponibles para instalar, mediante el comando “nvm ls-
remote”.
45
Se instala la última versión LTS (long term support), v16.15.0
Figura 53. Instalacion de la ultima version LTS de NodeJS
46
Figura 55. Descarga de DSpace Frontend
47
Create dspace angular config file “config.prod.yml”
Figura 58. Creación del fichero de configuración de DSpace Frontend
48
Figura 60. Compilación de DSpace frontend
49
Fichero de configuración de arranque de DSpace Frontend con PM2.
Figura 62. Fichero de configuración de arranque de DSpace Frontend con PM2
50
Figura 65. Login de DSpace frontend
51
Subida de un archive PDF a la colección TFM
wget https://github.com/vufind-org/vufind/releases/download/v8.0.4/vufind_8.0.4.deb
52
Figura 66. Descarga de VuFind 8.04
53
Figura 67. Instalación de VuFind 8.0.4
54
Figura 68. Arreglo de las dependencias faltantes en la instalación de VuFind.
55
Figura 69. Continuación con el arreglo de dependencias faltantes.
http://localhost/vufind/install/home
56
Figura 70. Interfaz web de instalación de Configuración de VuFind.
Al ser la instalación bajo debían 11, debemos proceder a instalar manualmente mysql
o mariadb
57
Figura 71. Arreglo de base de datos.
58
Al tener instalados Vufind y DSpace en el mismo servidor, hay que cambiar el puerto
de “solr” de Vufind a “8984” para evitar conflictos. El fichero está localizado en
“/usr/local/vufind/config/vufind”.
Figura 73. Configuración de Vufind para utilizar el puerto 8984
Figura 74. Configuración del script de arranque de Solr para usar el puerto 8984.
59
Una vez actualizado correctamente ste fichero, que está localizado en
“/usr/local/vufind”, se inicializa la segunda instancia de “Solr” para VuFind en el puerto
8984, mediante el comando “./solr start”.
Una vez arreglado todas las incompatibilidades, se puede acceder a la página de inicio
de “vufind”.
60
Anexo 3: Proceso de integración de DSpace con VuFind
php harvest_oai.php
61
Figura 78. Descarga de información de cosechado mediante OAI-PMH
62
Figura 80. Integración de la colección cosechada desde el repositorio de la Universidad de Huelva
a VuFind.
Para garantizar que las todas las colecciones de DSpace estan actualizadas en el
servidor OAI-PMH es recomendable ejecutar el comando “./dspace oai import -o –c ”
comando en el directorio “/dspace/bin”.
63
Vufind también puede cosechar de páginas web, a través del contenido de su
“sitemap.xml”. Para extraer información de las páginas web hace uso de “Apache
Tika”. A continuación mostramos los ficheros de configuración involucrados.
Figura 82. Fichero de configuración de las páginas web cuyo contenido se va a indexar en VuFind.
Figura 83. Ficheo de configuración de las fuentes de búsqueda que aparecen en la web de VuFind.
64
Figura 84. Fichero de configuración de "facet" para refinar los resultados de la búsqueda.
Los “facet” que aparecen en la parte derecha del catálogo se configuran en el fichero
“facets.ini”. Se ha añadido un “facet” para filtrar el resultado con artículos que no tienen
autor, como se muestra en la siguiente figura.
Figura 85. Incorporación de “No autor” como “facet” para filtrar artículos sin autores.
65
Figura 86. Fichero de configuración general de VuFind.
Los “tabs” que aparecen encima de la caja de búsqueda, que son “Catalog” y
“Websites” se configuran este fichero “config.ini”.
Figura 87. Fichero de configuración del extractor de metadatos para indexación de páginas web.
Este fichero “fulltext.ini” configura el extractor de metadatos para indexación de páginas web.
66