0% encontró este documento útil (0 votos)
52 vistas77 páginas

Implementacion de Un Repositorio Digital

Este trabajo final de máster implementa un repositorio institucional con las aplicaciones DSpace y Vufind. DSpace funciona en el "backend" y Vufind en el "frontend". El objetivo es dotar a los documentalistas de una guía detallada para instalar ambas aplicaciones, dado que los repositorios institucionales son cada vez más necesarios pero requieren personal especializado. DSpace cumple con ser de código abierto, adaptable, interoperable y fácil de usar, mientras que Vufind sirve como buscador universal reemplazando al OPAC tradicional.

Cargado por

sercast99
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
52 vistas77 páginas

Implementacion de Un Repositorio Digital

Este trabajo final de máster implementa un repositorio institucional con las aplicaciones DSpace y Vufind. DSpace funciona en el "backend" y Vufind en el "frontend". El objetivo es dotar a los documentalistas de una guía detallada para instalar ambas aplicaciones, dado que los repositorios institucionales son cada vez más necesarios pero requieren personal especializado. DSpace cumple con ser de código abierto, adaptable, interoperable y fácil de usar, mientras que Vufind sirve como buscador universal reemplazando al OPAC tradicional.

Cargado por

sercast99
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 77

MASTER EN SISTEMAS DE

INFORMACIÓN DIGITAL

UNIVERSIDAD DE SALAMANCA
FACULTAD DE TRADUCCIÓN Y DOCUMENTACIÓN
MÁSTER EN SISTEMAS DE INFORMACIÓN DIGITAL

Trabajo de Fin de Máster

IMPLEMENTACION DE UN
REPOSITORIO DIGITAL CON
DSPACE Y VUFIND.

Autor:
Pastor Nso Mangue
Tutores:
Luis Carlos García de Figuerola Paniagua
José Luis Alonso Berrocal

Salamanca, 2022
MASTER EN SISTEMAS DE
INFORMACIÓN DIGITAL

UNIVERSIDAD DE SALAMANCA
FACULTAD DE TRADUCCIÓN Y DOCUMENTACIÓN
MÁSTER EN SISTEMAS DE INFORMACIÓN DIGITAL

Trabajo de Fin de Máster

IMPLEMENTACION DE UN
REPOSITORIO DIGITAL CON
DSPACE Y VUFIND.
Autor:
Pastor Nso Mangue
Tutores:
Luis Carlos García de Figuerola Paniagua
José Luis Alonso Berrocal

V.º B.º

Firmado por GARCIA DE FIGUEROLA PANIAGUA


LUIS CARLOS - 07811229S el día Firmado digitalmente
28/06/2022 con un certificado emitido por ALONSO
por AC FNMT Usuarios
BERROCAL JOSE LUIS
- 07859283E
Fecha: 2022.06.28
21:37:00 +02'00'

Dr. Luis C. García de Figuerola Paniagua Dr. José L. Alonso Berrocal


B
Salamanca, 2022
RESUMEN

En este trabajo final de Máster se implementa un repositorio institucional con DSpace


y Vufind, donde DSpace trabaja en el “backend” y Vufind en el frontend. Los
repositorios institucionales cada vez son muy necesarios sobre todo debido al
movimiento “open Access”, pero es difícil encontrar entre los documentalistas personal
capacitado para instalar las aplicaciones involucradas, teniendo que recurrir en la
mayoría de los casos a personal especializado, por lo que resulta necesaria una
alfabetización digital al respecto. DSpace, por su parte, reúnen los requisitos de
gratitud (open source), adaptabilidad, interoperabilidad (mediante OAI-PMH), continúo
desarrollo y facilidad de uso, mientras Vufind sobresale por su capacidad de servir
como buscador universal, remplazando a la OPAC tradicional. Con este trabajo se
persigue dotar a los documentalistas de una guía que detalla la arquitectura e
infraestructura necesarias para la instalación de DSpace y Vufind, a igual que dotarles
de los pasos necesarios para su feliz culminación.

Palabras clave: repositorio digital, DSpace, Vufind, OPAC, buscador universal.

i
ABSTRACT

In this final Master's project, an institutional repository is implemented with DSpace and
Vufind, where DSpace works on the "backend" and Vufind on the frontend. Institutional
repositories are becoming increasingly necessary, especially due to the "open Access"
movement, but it is difficult to find trained personnel among documentalists to install
the applications involved, having to resort in most cases to specialized personnel,
which is why it is A digital literacy is necessary in this regard. DSpace, for its part,
meets the requirements of gratitude (open source), adaptability, interoperability
(through OAI-PMH), continuous development and ease of use, while Vufind stands out
for its ability to serve as a universal search engine, replacing the traditional OPAC .
With this work, the aim is to provide documentalists with a guide that details the
architecture and infrastructure necessary for the installation of DSpace and Vufind, as
well as to provide them with the necessary steps for their successful completion.

Keywords: digital repository, DSpace, Vufind, OPAC, universal search engine.

ii
ASIENTO CATALOGRÁFICO CON FORMATO DEL REPOSITORIO
INSTITUCIONAL GREDOS

Título: Implementación de un repositorio digital con Dspace y Vufind

Autor: Pastor Nso Mangue

Directores: José Luis Alonso Berrocal

Luis Carlos García de Figuerola Paniagua

Palabras clave: [ES] Repositorio digital, DSpace, Vufind, OPAC, buscador


universal.

[EN] Digital repository, DSpace, Vufind, OPAC, universal search


engine.

Clasificación UNESCO: 5701.06 Documentación

5701.02 Documentación Automatizada

Fecha: 2022-06-20

Resumen: [ES] En este trabajo final de Máster se implementa un


repositorio institucional con DSpace y Vufind, donde DSpace
trabaja en el “backend” y Vufind en el frontend. Los repositorios
institucionales cada vez son muy necesarios sobre todo debido
al movimiento “open Access”, pero es difícil encontrar entre los
documentalistas personal capacitado para instalar las
aplicaciones involucradas, teniendo que recurrir en la mayoría de
los casos a personal especializado, por lo que resulta necesaria
una alfabetización digital al respecto. DSpace, por su parte,
reúnen los requisitos de gratitud (open source), adaptabilidad,
interoperabilidad (mediante OAI-PMH), continúo desarrollo y
facilidad de uso, mientras Vufind sobresale por su capacidad de
servir como buscador universal, remplazando a la OPAC
tradicional. Con este trabajo se persigue dotar a los
documentalistas de una guía que detalla la arquitectura e
infraestructura necesarias para la instalación de DSpace y
Vufind, a igual que dotarles de los pasos necesarios para su feliz
culminación.
[EN] In this final Master's project, an institutional
repository is implemented with DSpace and Vufind, where
DSpace works on the "backend" and Vufind on the frontend.
Institutional repositories are becoming increasingly necessary,
especially due to the "open Access" movement, but it is difficult
to find trained personnel among documentalists to install the
applications involved, having to resort in most cases to
specialized personnel, which is why it is A digital literacy is
necessary in this regard. DSpace, for its part, meets the
requirements of gratitude (open source), adaptability,
interoperability (through OAI-PMH), continuous development and
ease of use, while Vufind stands out for its ability to serve as a
universal search engine, replacing the traditional OPAC . With
this work, the aim is to provide documentalists with a guide that
details the architecture and infrastructure necessary for the

iii
installation of DSpace and Vufind, as well as to provide them with
the necessary steps for their successful completion.
Descripción: Trabajo de Fin de Máster en Sistemas de Información
Digital, curso 2021-2022

iv
TABLA DE CONTENIDOS
INTRODUCCION........................................................................................................................ 1
JUSTIFICACION DEL PROYECTO Y OBJETIVOS ............................................................. 2
Justificación del proyecto ...................................................................................................... 2
Objetivos .................................................................................................................................. 3
Objetivos generales............................................................................................................ 3
Objetivos específicos ......................................................................................................... 3
METODOLOGÍA Y MATERIALES ........................................................................................... 3
Metodología ............................................................................................................................. 3
Materiales ................................................................................................................................ 4
DISPOSICIONES LEGALES, NORMAS Y REFERENCIAS ............................................... 5
Leyes ........................................................................................................................................ 5
Normas ..................................................................................................................................... 5
Referencias ............................................................................................................................. 5
DEFINICIONES Y ABREVIATURAS....................................................................................... 5
REQUISITOS FUCIONALES Y NO FUNCIONALES ........................................................... 6
Requisitos funcionales ........................................................................................................... 6
Casos de uso del repositorio digital ................................................................................. 7
Requisitos no funcionales ..................................................................................................... 8
ALCANCE Y RESTRICCIONES .............................................................................................. 8
Alcance del proyecto.............................................................................................................. 8
Restricciones del proyecto .................................................................................................... 8
ESTUDIO DE ALTERNATIVAS ............................................................................................... 8
Estudio de alternativas .......................................................................................................... 8
Estudio de viabilidad .............................................................................................................. 9
Viabilidad técnica ................................................................................................................ 9
Viabilidad económica ......................................................................................................... 9
Viabilidad legal .................................................................................................................... 9
ANALISIS DE RIESGOS ........................................................................................................... 9
ORGANIZACIÓN Y GESTIÓN DEL PROYECTO ............................................................... 10
PROGRAMACION TEMPORAL ............................................................................................ 11
PRESUPUESTO....................................................................................................................... 11
SOLUCION PROPUESTA ...................................................................................................... 12
Prototipo funcional del repositorio digital .......................................................................... 12
Arquitectura del sistema .................................................................................................. 12
Infraestructura del sistema .............................................................................................. 13
Prototipo conceptual avanzado del repositorio digital. ................................................... 14

v
Arquitectura del sistema .................................................................................................. 14
Infraestructura del sistema .............................................................................................. 14
RESULTADOS.......................................................................................................................... 15
DSpace Backend .................................................................................................................. 15
DSpace Frontend ................................................................................................................. 16
VuFind .................................................................................................................................... 17
Integración deDSspace y VuFind mediante el protocolo OAI-PMH ........................................ 17
Cosechando en DSpace con OAI-PMH desde el repositorio USAL GREDOS ....................... 18
Cosechando con OAI-PMH desde VuFind al “Repositorio Insitucional de la
Universidad de Huelva”. .................................................................................................. 22
CONCLUSIONES Y TRABAJOS FUTUROS....................................................................... 26
Conclusiones ......................................................................................................................... 26
Dificultades encontradas ................................................................................................. 26
Aportaciones del proyecto ............................................................................................... 26
Trabajos futuros .................................................................................................................... 27
BIBLIOGRAFÍA ......................................................................................................................... 27
ANEXOS .................................................................................................................................... 28
Anexo 1: Proceso de instalación de DSpace............................................................................ 28
Instalación de DSpace Backend ........................................................................................... 28
Instalación de DSpace-frontend ..................................................................................... 44
Anexo 2: Proceso de instalación de Vufind. ..................................................................... 52
Anexo 3: Proceso de integración de DSpace con VuFind ........................................................ 61
Configuración del protocolo OAI-PMH en VuFind .............................................................. 61

vi
ÍNDICE DE FIGURAS

Figura 1: Comunicación entre el autor y tutor. ..................................................................... 11


Figura 2. Arquitectura simple del sistema. ........................................................................... 13
Figura 3. Infraestructura simple del sistema............................................................................... 13
Figura 4. Arquitectura avanzada del sistema....................................................................... 14
Figura 5. Infraestructura avanzada del sistema. ................................................................. 15
Figura 6. Interfaz Rest de DSpace backend
(http://192.168.1.42:8080/server/#/server/api)..................................................................... 16
Figura 7. Interfaz OAI-PMH Data Provider de DSpace backend
(http://192.168.1.42:8080/server/oai/request?verb=Identify)............................................. 16
Figura 8. Interfaz web de DSpace tras finalizar la instalación. ......................................... 17
Figura 9. Interfaz web de Vufind tras finalizar la instalación. ............................................ 17
Figura 10. Colección “Servicios de la USAL”. Fuente:
https://gredos.usal.es/handle/10366/3812............................................................................ 18
Figura 11. Edición de la fuente de contenido de la colección a cosechar....................... 19
Figura 12. Colección "Servicios de la USAL" cosechada desde GREDOS. ................... 20
Figura 13. Cosechado de la colección "Sociedad y Valores Cívicos" de la UA. ............ 21
Figura 14.Coleccion local "Sociedad y Valores Cívicos" cosechada desde el repositorio
de la Universidad de Alicante. ................................................................................................ 21
Figura 15. Metadatos de un artículo de la colección cosechada "Servicios y Valores
Cívicos”. ..................................................................................................................................... 22
Figura 16. VuFind con contenido de las colecciones cosechadas mediante OAI-PMH.
..................................................................................................................................................... 23
Figura 17. VuFind utilizando autocompletar para mostrar varios artículos relacionados con la
búsqueda. .................................................................................................................................... 23
Figura 18. Resultado de la búsqueda de "internet" por el catálogo de VuFind. ............. 24
Figura 19. Datos indexados desde el portal de la USAL "https://www.usal.es". ........................ 25
Figura 20. Búsqueda en Google desde VuFind. ................................................................. 25
Figura 21. Resultado de la búsqueda de "metadatos" en VuFind a través de Google. 26
Figura 22. Actualización del sistema operativo ................................................................... 29
Figura 23. Instalación de Git ................................................................................................... 29
Figura 24. Instalación de OpeJDK, versión 11. ................................................................... 30
Figura 25. Configuración de la variable de entorno JAVA_HOME ................................... 30
Figura 26. Instalación de Apache Maven y Apache Ant ................................................... 31
Figura 27. Instalación de PostgreSQL .................................................................................. 32
Figura 28. Instalación de PGCripto........................................................................................ 32
Figura 29. Creación de contraseña para el usuario postgres ........................................... 33
Figura 30. Asegurar que postgresql escucha en el localhost ............................................ 33
Figura 31. Restringir la seguridad de acceso a la base de datos. .................................... 34
Figura 32. Instalción JDBC para postgresql ......................................................................... 34
Figura 33. Instalación de paquetes necesarios para Apache Solr ................................... 35
Figura 34. Descarga del paquete Solr .................................................................................. 35
Figura 35. Instalación de Solr ................................................................................................. 36
Figura 36. Instalación de Apache Tomcat 9 ......................................................................... 36
Figura 37. Dar Permisos al usuario Tomcat sobre el directorio DSpace......................... 37
Figura 38. Aumento de la memoria de JVM (java virtual machine) .................................. 37
Figura 39. Fichero de configuración del servidor Tomcat 9............................................... 38
Figura 40. Descarga de DSpace Backend 7.2..................................................................... 38
Figura 41. Creación de la base de datos DSpace y usuario dspace. .............................. 39
Figura 42. Creación del fichero de configuración a partir del fichero ejemplo. ............... 39

vii
Figura 43. Fichero de configuración de DSpace Backend................................................. 40
Figura 44. Continuación del fichero de configuración de DSpace backend. ............................... 41
Figura 45. Compilación de DSpace Backend con la herramienta Maven ....................... 42
Figura 46. Instalación de DSpace Backend con Apache Ant ............................................ 43
Figura 47. Inicializar la base de datos de DSpace .............................................................. 43
Figura 48. Creación del usuario administrador de DSpace. .............................................. 44
Figura 49. Copiado de webapps de DSpace a Tomcat...................................................... 44
Figura 50. Copiado de los "Cores" de Solr ........................................................................... 44
Figura 51. Instalación de NVM (node version manager).................................................... 45
Figura 52. Listado de las versiones de nodejs disponibles para instalar. ....................... 45
Figura 53. Instalacion de la ultima version LTS de NodeJS .............................................. 46
Figura 54. Instalación de Yarn y PM2 ................................................................................... 46
Figura 55. Descarga de DSpace Frontend........................................................................... 47
Figura 56. Instalación de DSpace frontend mediante Yarn ............................................... 47
Figura 57. Continuación de instalación de DSpace frontend mediante Yarn. ............................ 47
Figura 58. Creación del fichero de configuración de DSpace Frontend .......................... 48
Figura 59. Fichero de configuración de DSpace Frontend ................................................ 48
Figura 60. Compilación de DSpace frontend ....................................................................... 49
Figura 61. Continuación de la compilación de DSpace ............................................................... 49
Figura 62. Fichero de configuración de arranque de DSpace Frontend con PM2 ......... 50
Figura 63. Arranque de DSpace frontend con PM2 ............................................................ 50
Figura 64- Página web de Dspace frontend. ............................................................................... 50
Figura 65. Login de DSpace frontend ................................................................................... 51
Figura 66. Descarga de VuFind 8.04 .................................................................................... 53
Figura 67. Instalación de VuFind 8.0.4 ................................................................................. 54
Figura 68. Arreglo de las dependencias faltantes en la instalación de VuFind. ............. 55
Figura 69. Continuación con el arreglo de dependencias faltantes. ........................................... 56
Figura 70. Interfaz web de instalación de Configuración de VuFind. ............................... 57
Figura 71. Arreglo de base de datos. .................................................................................... 58
Figura 72. Base de datos arreglada. ............................................................................................ 58
Figura 73. Configuración de Vufind para utilizar el puerto 8984 ....................................... 59
Figura 74. Configuración del script de arranque de Solr para usar el puerto 8984. ...... 59
Figura 75. Dependencias básicas de VuFind instaladas. ............................................................. 60
Figura 76. Portal de Vufind tras la instalación. .................................................................... 60
Figura 77. Configuración de cosechado de colecciones en VuFind. ............................... 61
Figura 78. Descarga de información de cosechado mediante OAI-PMH ........................ 62
Figura 79. Integración de la colección cosechada desde el reposotirio DSpace local a
VuFind. ....................................................................................................................................... 62
Figura 80. Integración de la colección cosechada desde el repositorio de la
Universidad de Huelva a VuFind. .......................................................................................... 63
Figura 81. Resultado de búsqueda de todos los objetos digitales cosechados en
VuFind. ....................................................................................................................................... 63
Figura 82. Fichero de configuración de las páginas web cuyo contenido se va a
indexar en VuFind. ................................................................................................................... 64
Figura 83. Ficheo de configuración de las fuentes de búsqueda que aparecen en la
web de VuFind. ......................................................................................................................... 64
Figura 84. Fichero de configuración de "facet" para refinar los resultados de la búsqueda. ..... 65
Figura 85. Incorporación de “No autor” como “facet” para filtrar artículos sin autores............ 65
Figura 86. Fichero de configuración general de VuFind. ............................................................. 66
Figura 87. Fichero de configuración del extractor de metadatos para indexación de páginas
web. ............................................................................................................................................. 66

viii
ÍNDICE DE TABLAS

Tabla 1. Acceso al repositorio digital....................................................................................... 7


Tabla 2. Subir contenido al repositorio digital. ....................................................................... 7
Tabla 3: Matriz de riesgos. Fuente: https://en.wikipedia.org/wiki/Risk_matrix. .............. 10
Tabla 4. Presupuesto orientativo del proyecto. ................................................................... 12

ix
INTRODUCCION
La sociedad de la información y comunicación está basada en el uso de las
tecnologías de información y comunicación para las interacciones humanas. En
lugares donde dicha sociedad de la información ha madurado, ha dado lugar a otro
fenómeno que es la sociedad del conocimiento, donde las personas no solo consumen
información para aplicar conocimiento, sino que también lo comparten. La necesidad
de compartir conocimientos ha dado lugar al movimiento “open access”, lo cual ha
aumentado la demanda de creación de repositorios digitales. Pues debido a la
naturaleza anárquica de internet los repositorios digitales sirven como punto de acceso
a información fiable, ofrecida por una institución conocida y en que se puede confiar.
La puesta en funcionamiento de estos repositorios digitales no es asumible para
cualquiera y requiere de algunos conocimientos especializados de informática que
permitan la integración de todos los componentes involucrados, tanto a nivel de
infraestructura como arquitectura, teniendo en cuenta la satisfacción del usuario final,
que en última instancia determina la calidad. En este sentido, este trabajo final de
Máster en Sistemas de Información Digital trata de lo necesario para poner en marcha
un repositorio digital con DSpace y su integración con Vufind a través del protocolo
OAI-PMH; la función de Vufind es servir como buscador universal, una ventana única
de acceso a la información debido a su capacidad de buscar en repositorios
institucionales, revistas digitales, bibliotecas digitales y otros recursos. Desde luego
que existen otras aplicaciones informáticas para repositorios, entre los más
destacados están EPrints y Fedora Commons; pero DSpace sobresale por reunir
requisitos de gratitud, adaptabilidad, interoperabilidad, continuo desarrollo y facilidad
de uso, además de poseer el mayor número de implementaciones y comunidad de
usuarios, (Soler Bernal & Villadóniga Gómez, 2009).
La estructura del trabajo incorpora elementos del método científico y el método de
ingeniería, siendo éste último una estrategia para producir el mejor cambio con los
recursos disponibles. Si bien el método científico planeta una hipótesis a verificar, el
método de ingeniería produce un prototipo a analizar; el método de ingeniería consiste
en siete pasos, cuales son la identificación del problema, recolección de la información
necesaria, búsqueda de soluciones creativas, diseño preliminar, evaluación y
selección de la solución, preparación de especificaciones e implementación del diseño
(Calameo, 2021). Dicha estructura es la siguiente:
 Introducción: donde se explica el contexto actual de los repositorios
institucionales y las tecnologías involucradas.
 Justificación del proyecto y objetivos: donde se explican las razones que
han llevado a realizar este trabajo y las metas a conseguir.
 Metodología y materiales: donde se explica el método seguido para realizar el
trabajo y los recursos materiales involucrados.
 Normas y referencias: donde se explican las normas de obligado
cumplimiento y las recomendaciones a tener en cuenta a la hora de realizar
este trabajo.
 Definiciones y abreviaturas: aclaración de algunos términos o herramientas
que se usan en este trabajo.
 Estudio de alternativas y viabilidad: donde se expone un análisis de las
diferentes aplicaciones informáticas que pueden servir para la implementación
de un repositorio digital y justificación de la elegida para su implementación.
 Requisitos funcionales y no funcionales: donde se establece las
funcionalidades básicas que se esperan del sistema y su desempeño para
satisfacer los objetivos establecidos.

1
 Alcance y restricciones: donde se describe lo que se va abarcar o no, según
los recursos disponibles.
 Análisis de riesgos: donde se analiza los contratiempos que pueden surgir
durante la realización del proyecto y lo que se hará al respecto para finalizar el
proyecto en el tiempo previsto.
 Programación temporal: donde se especifica el tiempo necesario para
cumplimentar las etapas correspondientes.
 Presupuesto: donde se calcula los recursos económicos necesarios para
culminar el proyecto en el tiempo previsto.
 Solución propuesta: se exponen las soluciones tecnológicas adoptadas para
implementar un repositorio digital.
 Discusión de resultados: se discuten los resultados obtenidos.
 Conclusiones y trabajos futuros: se exponen las conclusiones y los trabajos
que se pueden realizar en el futura para mejorar el sistema o integrarlo con
otros.
 Bibliografía: se presenta un listado de las referencias bibliográficas
consultadas.
 Anexos: se exponen documentación adicional relevante para el proyecto que
no cabe en los apartados anteriores, para su consulta en caso necesario por
los interesados. En esta sección se detallan los procesos de instalación de las
aplicaciones que conforman el repositorio digital. También se exponen los
resultados de la evaluación de un repositorio digital del Instituto Biomédico de
Salamanca, el “Atlas de Genética oncológica”, que ha sido uno de los
motivadores de realizar este proyecto.

JUSTIFICACION DEL PROYECTO Y OBJETIVOS


Justificación del proyecto
Muchas instituciones académicas, de investigación, culturales e incluso
administrativas, necesitan de repositorios digitales, ya sea para dotar de colecciones
de documentos a su comunidad de usuarios o para cumplir con la ley de reutilización
de datos de instituciones públicas (Ley 37/2007, de 16 de noviembre, sobre
reutilización de la información del sector público, DIRECTIVA (UE) 2019/1024 DEL
PARLAMENTO EUROPEO Y DEL CONSEJO de 20 de junio de 2019 relativa a los
datos abiertos y la reutilización de la información del sector público), en general, y en
particular con el artículo 37 de la ley 14/2011 de la ciencia, la tecnología e innovación,
la cual obliga a “Los agentes públicos del Sistema Español de Ciencia, Tecnología e
Innovación” a impulsar el desarrollo de repositorios, propios o compartidos, de acceso
abierto a las publicaciones de su personal de investigación y establecer sistemas que
permitan conectarlos con iniciativas similares de ámbito nacional e internacional”,
(BOE, 2011); la fundación española para la ciencia y la tecnología, en anagrama
FECYT, es la encargada de velar por el cumplimiento con esta ley y dispone de su
comisión de seguimiento sobre el grado de cumplimiento del artículo 37 de la ley de la
ciencia; dicha comisión elabora informes periódicos, (FECYT, 2016), así como
recomendaciones para su implementación, (FECYT, 2014).

Otra de las razones que han motivado al autor a realizar es la experiencia vivida
durante su estancia de “prácticas en empresa” en el Instituto Biomédico de
Salamanca, donde tuvo que participar en la migración de un repositorio digital, “Atlas
of Genetics and Cytogenetics in Oncology and Haematology”, desde su versión
antigua que data desde 1997, https://atlasgeneticsoncology.com, a la nueva,
https://atlasgeneticsoncology.org. Durante la migración, el autor realizó la evaluación
del repositorio, basándose en las directrices de la “guía para la evaluación de
repositorios institucionales de investigación”, (Cristina, Bernal, & Gómez Castaño,

2
2021); dicha evaluación determinó que el repositorio incumple con gran parte de los
requisitos.

Esta necesidad de disponer de un repositorio digital está presente en una diversidad


de instituciones independientemente de su tamaño y contexto y abarca escuelas,
institutos, universidades, centros de investigación, museos, ayuntamientos, órganos
del gobierno, etc. Todos ellos tienen documentos que compartir, pero en ocasiones se
ven limitados en su capacidad de invertir en un repositorio digital y de allí la necesidad
de no sólo poder disponer de un software de código abierto, sino también de un
personal técnico con conocimientos para instalarlo. Pues, a parte de la descripción a
través de metadatos, y la recuperación y acceso por parte de los usuarios, una parte
fundamental de un repositorio la constituye el software que va a gestionar el
almacenamiento de los documentos digitales. El autor de este trabajo siempre ha
querido saber los sistemas que están detrás de grandes repositorios institucionales
como “Gredos de la USAL” (https://gredos.usal.es) y “Dialnet”
(https://dialnet.unirioja.es), ambos muy utilizados por los alumnos de la Universidad de
Salamanca como fuentes de información bibliográfica.

En este trabajo partimos de la hipótesis de que la falta de proliferación de repositorios


digitales, que son muy necesarios para las instituciones, se debe a la dificultad que
conlleva su instalación, mantenimiento y actualización; por lo tanto, este problema se
podría solventar facilitando a los especialistas de la rama del sector de “Información y
Documentación” una guía de instalación de estos programas que en su mayoría son
de código abierto y disponibles libremente por internet.
La disponibilidad de un repositorio institucional ayudará también a los autores que
opten por la “ruta verde” a publicar sus artículos con facilidad y contribuir a la sociedad
del conocimiento.

Objetivos
Objetivos generales
El objetivo general de este trabajo es implementar un repositorio DSpace funcional
integrado con el buscador VuFind a través del protocolo OAI-PMH.

Objetivos específicos
Los objetivos específicos son:

 Instalar DSpace en un servidor Debian 11.


 Instalar Vufind en un servidor Debian 11.
 Integrar DSpace con Vufind mediante el protocolo OAI-PMH.

METODOLOGÍA Y MATERIALES
Metodología
Este trabajo abarca investigación científica e ingeniería, por lo tanto combina el
método científico, consiste en la observación sistemática, medición, experimentación y
la formulación, análisis y modificación de hipótesis, y el método de ingeniería, que
consiste en la identificación del problema, recolección de la información necesaria,
búsqueda de soluciones creativas, pasar de la idea principal al diseño preliminar,
evaluación y selección de la solución, preparación de reportes, planos y
especificaciones, y la implementación del diseño. Por lo tanto la metodología y
estructura del trabajo debe combinar ambos métodos.

3
La metodología a seguir para conseguir los objetivos arriba propuestos es:
 Revisión bibliográfica sobre los repositorios digitales y el software involucrado
para su implementación. Dicha información se obtienen a través de los
repositorios institucionales y motores especiales de búsqueda:
o Google Académico, https://scholar.google.es, el buscador de
bibliografía científico académica.
o Scielo: https://scielo.org/es/. Librería electrónica científica en línea.
o Usal Gredos: https://gredos.usal.es. Repositorio documental de la
Universidad de Salamanca.
o Dialnet: https://dialnet.unirioja.es. Portal que integra la búsqueda en
varios repositorios documentales, gestionado por la Universidad de la
Rioja.
 Análisis de requisitos funcionales y no funcionales.
 Diseño de la arquitectura e infraestructura.
 Implementación del prototipo funcional.
 Discusión de resultados.
 Conclusiones.
 Recomendaciones y trabajos futuros.
Materiales
Los materiales que que utilizan en este trabajo son:

 Servidor (Máquiina virtual XenServer), sistema operativo Linux (versión Debian


11).
 Dspace. Gestor de repositorios digitales.
 Vufind. Buscador universal.
 Apache Solr. Servidor de indexación.
 Apache Tomcat. Servidor
 OpenJDK 11. Java development Kit, necesario para creación de aplicaciones
java.
 Apache Maven. Para compilar aplicaciones java y crear paquetes ejecutables.
 Apache Ant. Para empaquetar ejecutables java en una estructura predefinida
para su instalación en el sistema operativo correspondiente.
 Microsoft Word. Para redactar el proyecto.
 Microsoft PowerPoint. Para realizar la presentación para la defensa del
proyecto.
 Putty (SSH Client). Para acceso remoto al servidor mediante el protocolo
“SSH”.
 FileZilla Client. Para subir archivos al servidor.
 Google Chrome. Para explorar la web en busca de información, así como
acceder a las páginas de DSpace y VuFind del sistema prototipo.
 Maquinas virtual de XenServer. Este es el servidor sobre el que se
 Implementa sistema prototipo del proyecto.
 Dia diagram software (http://dia-installer.de). Es una herramienta de creación
de diagramas similar a “Microsoft Visio”. Se utiliza en este proyecto para crear
diagramas de red, diagramas de clases, diagramas conceptuales, etc.
 Pencil, https://pencil.evolus.vn. Es una herramienta de prototipo de interfaces
de usuario y se utiliza para tales fines en este proyecto.
 Zotero, https://www.zotero.org. Es un gestor de referencias bibliográficas y se
ha utilizado en este proyecto para tales fines.

4
DISPOSICIONES LEGALES, NORMAS Y REFERENCIAS
Este trabajo, como todo proyecto destinado a ser utilizado por los ciudadanos, debe
estar sujeto a una serie de leyes, normas y referencias de buenas prácticas.

Leyes
 El Reglamento General de Protección de Datos (RGPD). Es el reglamento
europeo relativo a la protección de las personas físicas en lo que respecta al
tratamiento de sus datos personales y a la libre circulación de estos datos.
España, al ser miembro de la Unión Europea está suscrito a este reglamento,
(Agencia Española de protección de datos, 2022).
 Ley 37/2007, de 16 de noviembre, sobre reutilización de la información del
sector público, (Jefatura de Estado, 2007), (BOE, 2007).
 Ley 14/2011, de 1 de junio, de la Ciencia, la Tecnología y la Innovación, (BOE,
2011). En su artículo 37 trata de la difusión en acceso abierto.
 DIRECTIVA (UE) 2019/1024 DEL PARLAMENTO EUROPEO Y DEL
CONSEJO de 20 de junio de 2019 relativa a los datos abiertos y la reutilización
de la información del sector público, (DIRECTIVA (UE) 2019/1024 DEL
PARLAMENTO EUROPEO Y DEL CONSEJO, 2019).

Normas
Las normas aplicables al desarrollo de este proyecto son:

 Norma CCII-N2016-02: Norma Técnica para la realización de la


Documentación de Proyectos en Ingeniería Informática, (CCII, 2016), del
“Consejo de colegios de ingenieros en informática, www.ccii.es. Esta normativa
deriva de otras normas tales como:
o Norma UNE 157001:2014 : “Criterios generales para la elaboración
formal de los documentos que constituyen un proyecto técnico”.
o UNE 157801:2007: Criterios Generales para la elaboración de
proyectos de Sistemas de Información.
o UNE - ISO 21500:2013: Directrices para la dirección y gestión de
proyectos.
 Pautas para la realización del TFM del Máster en Sistemas de Información
Digital, (USAL, 2021). Contiene las normas de estilo, estructura y extensión de
los Trabajos de Fin del Máster en Sistemas de Información Digital, elaborado
por la “Comisión académica”, en base al “Reglamento sobre Trabajos Fin de
Máster” de la Universidad de Salamanca.

Referencias
 Sistema de información de archivo abierto (OAIS, Open Archival Information
System), (Cruz Mundet & Díez Carrera, 2016)
 Guía para la evaluación de repositorios institucionales, (Cristina, Bernal, &
Gómez Castaño, 2021).
 Recomendaciones para la implementación del artículo 37 Difusión en Acceso
Abierto de la Ley de la Ciencia, la Tecnología y la Innovación, (FECYT, 2014).

DEFINICIONES Y ABREVIATURAS

Repositorio institucional: es un archivo en línea donde se depositan, en forma


digital, materiales derivados de la producción científica o académica de una institución,
con el fines de publicación, difusión y preservación (Wikipedia, 2021).

5
Documento digital: es la representación digital (información codificada en modo
binario mediante bits) de un documento, contenido, textos, imágenes, videos y
sonidos. Es un objeto inteligible para las máquinas y no para los humanos, los cuales
necesitan de dispositivos electrónicos para su interpretación.

Dspace: DSpace es un software de repositorio digital, creado en 2002 por MIT


(Massachusetts Institute of Technology) y los laboratorios de HP (Hewlett Packard),
para ayudar a las instituciones académicas y científicas a crear sus propios
repositorios de documentos digitales, basado en una filosofía de acceso abierto y
compatible con el protocolo OAI-PMH. Una de sus ventajas es que permite depositar
prácticamente cualquier tipo de archivo, tales como textos, imágenes, sonidos, vídeos,
y conjuntos de datos, (Soler Bernal & Villadóniga Gómez, 2009).

Vufind: El objetivo de VuFind es permitir a sus usuarios buscar y navegar a través de


todos los recursos de la biblioteca mediante la sustitución de las tradicionales OPAC.
Prácticamente puede indexar información de varias fuentes, como repositorios
digitales, páginas web, archivos en formato bibliográfico “MARC”, catálogos
bibliográficos de los sistemas integrados de gestión bibliotecaria, archivos en formato
“XML”, Google, etc.

Protocolo OAI-PMH: AI-PMH (Open Archives Initiative – Protocol for Metadata


Harvesting) es un protocolo utilizado como estándar la interoperabilidad de contenidos
web en Internet.

Dublin Core: es un modelo de metadatos elaborado y auspiciado por la DCMI (Dublin


Core Metadata Initiative, https://www.dublincore.org), para describir recursos
electrónicos. Consta de quince definiciones semánticas descriptivas que pretender
servir como vocabulario para proporcionar información descriptiva básica sobre
cualquier recurso, sin que importe el formato de origen, el área de especialización o el
origen cultural.

Software de código abierto: Programa informático cuyo código fuente puede ser
distribuido, modificado y utilizado libremente.

Escalamiento horizontal. Capacidad de crecimiento proporcional a las necesidades


de rendimiento, mediante la incorporación de más recursos computacionales sin
necesidad de interrumpir el funcionamiento del sistema.

RF: requisito funcional que el software debe satisfacer para considerarse útil de cara al
usuario final.

RNF: requisito no funcional que el software debe cumplir para satisfacer sin
interrupción las demanda de los usuarios.

Cosechador o “Harvester”: Repositorio cliente u otra herramienta capaz de


recuperar información (metadatos) sobre colecciones de objetos digitales desde otros
repositorios, utilizando el protocolo OAI-MPH.

REQUISITOS FUCIONALES Y NO FUNCIONALES


Requisitos funcionales
RF01: Creación, edición o eliminación de comunidades y sub-comunidades.

RF02: Creación, edición o eliminación de de colecciones dentro de una comunidad.

6
RF03: Registro, edición o eliminación de objetos digitales dentro de una colección.

RF04: Búsqueda unificada de información sobre objetos digitales sobre colecciones


que pertenecen a comunidades de uno o varios repositorios digitales.

RF05: Cosechar objetos digitales de colecciones de otros repositorios digitales locales


o remotos, el protocolo OAI-MPH.

RF06: Servir objetos digitales a otros repositorios o “cosechadores” locales o remotos,


a través del protocolo OAI-PMH.

Casos de uso del repositorio digital

La tabla 1 representa el caso de uso de acceso de un usuario al repositorio digital.


Tabla 1. Acceso al repositorio digital.

Versión 1.0
Precondición El usuario debe estar dado de alta en el sistema. El sistema
debe haber aceptado las credenciales del usuario.
Descripción El sistema debe comportarse como se describe en el siguiente
caso de uso cuando el usuario ejecuta la búsqueda de
información sobre objetos digitales.
Secuencia Normal 1 El usuario solicita ejecuta una búsqueda simple o
avanzada sobre objetos digitales.

2 El sistema devuelve información (metadatos)


sobre objetos digitales localizados en diferentes
repositorios digitales locales o remotos.
3 El usuario solicita visualizar el contenido del objeto
digital y el sistema.
4 El sistema abre el sistema recupera el contenido
local o remoto del objeto digital y lo presenta al
usuario.
Post-condición El usuario interactúa con el contenido del objeto digital
mediante la aplicación que ha realizado la apertura.

La tabla 2 representa el caso de uso de subir contenido al repositorio digital.


Tabla 2. Subir contenido al repositorio digital.

Versión 1.0
Precondición El usuario debe estar dado de alta en el sistema. El sistema
debe haber aceptado las credenciales del usuario.
El usuario debe haber creado la comunidad y colección que
va a contener el objeto digital.
Descripción El sistema debe comportarse como se describe en el siguiente
caso de uso cuando el usuario procede a registrar un objeto
digital en el repositorio.
Secuencia Normal 1 El usuario solicita registrar un objeto digital.

2 El sistema le devuelve un formulario para rellenar


la información sobre el objeto digital.
3 El usuario facilita la información y sube el
contenido del objeto digital.
4 El deposita el objeto digital en la colección
correspondiente.

7
Post-condición El usuario sincroniza el “cosechador” para actualizar la
información de la colección correspondiente, con el fin de que
el nuevo objeto digital registrado aparezca en las búsquedas.

Requisitos no funcionales
 RNF01 Rendimiento. El sistema debe ser capaz de ejecutar las búsquedas con
rapidez y sin mucha demora.
 RNF02 Escalabilidad y crecimiento horizontal. El sistema debe ser capaz de
crecer horizontalmente, sin necesidad de interrumpir sus servicios.
 RNF04 Seguridad. La comunicación entre los navegadores de los usuarios y el
portal web está protegida mediante encriptación HTTPS.

ALCANCE Y RESTRICCIONES
Alcance del proyecto
Este proyecto se centra en el diseño e implementación de un repositorio digital con
DSpace, el cual puede compartir información sobre sus colecciones con VuFind, que
es un cosechador/buscador capaz de servir de punto unificado de búsqueda para
múltiples repositorios remotos, a través del protocolo OAI-PMH.

Los entregables de este proyecto son:

 Memoria del proyecto.


 Prototipo funcional del sistema.

Restricciones del proyecto


El proyecto presenta las siguientes restricciones:

 El proyecto dispone de una sola máquina virtual que actúa de servidor con
sistema operativo “Debian 11”, donde se han instalado todos los servicios. Por
lo tanto no puede garantizar el cumplimiento con los requisitos no funcionales
RNF01 y RNF02.
 La implementación del prototipo funcional se realiza en un servidor no
accesible desde internet, sino desde la intranet de la Universidad de
Salamanca. Por lo tanto no se contempla implementar HTTPS y las
comunicaciones están inseguras.
 No es objetivo del trabajo cumplir con los requisitos de accesibilidad. Solo
pretende servir como guía de instalación. Las capacidades de accesibilidad
web están limitadas a las de DSpace y VuFind. No se elaboran capacidades
adicionales.

ESTUDIO DE ALTERNATIVAS
Estudio de alternativas
Existen varias aplicaciones informáticas para implementar repositorios digitales, cuyas
características vamos a analizar en este apartado. Aunque existen otros, como
Omeka e Invenio, que también gozan de gran popularidad, para este trabajo, solo
analizamos los más populares, cuales son:

 Eprints: https://www.eprints.org/uk/index.php/eprints-software.
 Fedora Commons (Flexible Extensible Digital Object Repository Architecture):
https://duraspace.org/fedora.
 DSpace: https://duraspace.org/dspace.

8
Tras un análisis de sus características, se observa que DSpace sobresale en muchos
aspectos que lo convierten el mejor software para implementar repositorios digitales,
de entre las cuales destacamos:

 Posibilidad de organizar el contenido en una jerarquía de comunidades.


 Desacoplamiento entre el “Frontend” y el “Backend”, mejorando la
escalabilidad.
 Posibilidad de albergar contenido digital de diferentes formatos, incluido
multimedia.
 Posibilidad de conectar con sistemas de almacenamiento tipo “Amazon S3”,
cuando se requiere de grandes volúmenes de almacenamiento de alto
rendimiento.
 Capacidad de actuar como servidor y cosechadora de metadatos, mediante el
protocolo OAI-PMH, a través de una interfaz de configuración intuitiva.

Estudio de viabilidad
Viabilidad técnica
Este proyecto es viable técnicamente porque se dispone de equipo con el
correspondiente sistema operativo en forma de máquina virtual proporcionado por el
departamento de informática y automática de la Universidad de Salamanca, para el
desarrollo de este proyecto fin de máster. Igualmente también el autor dispone de
suficientes conocimientos informáticos para su implementación. El software necesario
también está disponible en internet y libre de licencias.

Viabilidad económica
La realización de este proyecto no requiere de grandes sumas económicas ya que los
recursos hardware y software necesario para su implementación están disponibles y
libres de pagos.

Viabilidad legal
La realización de este proyecto no infringe ninguna ley, sino al contrario, da
capacitación para que las instituciones puedan cumplir con la ley RISP (reutilización
de la información del sector público” (BOE, 2007), que obliga compartir los resultados
de investigaciones financiados por el estado a través de repositorios institucionales,
así como con el artículo 37 de la Ley de la Ciencia, tecnología e innovación (BOE,
2011).

ANALISIS DE RIESGOS
Durante el desarrollo de este trabajo se podrían producir incidentes asociados a
potenciales riesgos que requieren un análisis con el fin de adoptar planes de
mitigación. Para determinar la probabilidad y grado de impacto de estos riesgos se
toma como base referencial a la matriz de riesgos de la tabla 3.

9
Tabla 3: Matriz de riesgos. Fuente: https://en.wikipedia.org/wiki/Risk_matrix.

Se han identificado los siguientes riesgos:

1) Falta de suministro eléctrico: si falta electricidad no pueden funcionar los


ordenadores y por lo tanto se retrasará el proyecto. Ante la falta de una fuente
alternativa de energía la solución es aceptar el riesgo.

2) Indisponibilidad de uno de los miembros del equipo del proyecto: si falta algún
miembro del proyecto, tanto por parte del autor, como de la tutoría, por razones de
enfermedad o accidente, el proyecto se retrasará. La solución es llevar una dieta sana
y evitar desplazamientos innecesarios para minimizar la posibilidad de accidentes.

3) Confinamiento debido a la pandemia del Covit-19: la situación de confinamiento


dificulta el uso de espacios compartidos como la sala de informática. La solución será
trabajar desde casa, de forma remota.

4) Falta de acceso a internet: sin internet no se puede buscar información sobre


alternativas de solución del problema, lo cual retrasará el proyecto. La solución es
buscar alternativas de acceso.

5) Problemas con el ordenador utilizado para elaborar el proyecto: si el ordenador se


estropea, puede darse la situación de pérdida de información sobre el proyecto. La
solución es guardar una copia del proyecto en el pen-drive y en la nube, para poder
seguir con el proyecto en otro ordenador, como los disponibles en la sala de
informática.

ORGANIZACIÓN Y GESTIÓN DEL PROYECTO


Para la realización de este proyecto, se cuenta con dos equipos, por una parte el autor
del proyecto, y por otra el tutor; ambos equipos interactúan mediante canales de
comunicación.

El autor del proyecto, Pastor Nso Mangue, se encarga de buscar información y


redactarlo, mientras que tutores “José Luis Alonso Berrocal y Carlos García de

10
Figuerola Paniagua”, se encarga de guiar al autor, corregir los errores y aprobar el
proyecto una vez finalizado.

Los canales de comunicación verbal y escrita utilizados para la interacción del autor y
el tutor para interactuar durante la realización del proyecto son los siguientes:

 Tutorías presenciales en el despacho.


 Correo electrónico.

Se pretende que la comunicación sea efectiva y para ello el tutor se responsabiliza de


que la comunicación transmitida sea clara y completa y el alumno deben hacerse
responsable de cerciorarse de que la información sea recibida en su totalidad,
comprendida correctamente y confirmada (mediante retroalimentación).
Figura 1: Comunicación entre el autor y tutor.

PROGRAMACION TEMPORAL
La elaboración de este trabajo se aborda en fases, cuales son:

 Introducción, objetivos, metodología y herramientas: del 1 de Enero al 30 de


Marzo.
 Desarrollo: del 1 de Abril al 4 de Mayo de 2022.
 Revisión con el tutor: Mayo 2022.
 Correcciones: finales de Mayo de 2022.
 Revisión final: 14 de Junio 2022.
 Entrega: 27 de Junio de 2022.

PRESUPUESTO
El presupuesto que aquí se presenta es orientativo y se compone de tres partes:

 Coste del hardware. Es el coste de todos los equipos de computación


involucrados, sobre todo los servidores.
 Coste del software. La mayoría del software utilizado en este trabajo esta
libremente disponible en internet. Solo el sistema operativo “Windows 10” y el
paquete ofimático “Microsoft Office” son comerciales.
 Coste de la mano de obra. Consiste en honorarios del analista/instalador, que
rondan los dos mil euros mensuales.

La tabla 4 ilustra el presupuesto global y sus partes.

11
Tabla 4. Presupuesto orientativo del proyecto.

Orden Componente Descripción Precio Cantidad Total


unitario(euros)

1 Servidor virtual 2,4 Ghz de 600 1 600


procesador, 8 de
RAM, 80
Gibabytes de
disco

2 Windows 10 profesional Licencia del 200 1 200


Sistema operativo
Windows 7
Profesional

3 Paquete “Microsoft Office” Licencia Microsoft 600 1 600


Office 2007

4 Mano de obra Honorarios del 3000 3 9.000


analista/instalador

TOTAL 10.400 Euros

SOLUCION PROPUESTA
Prototipo funcional del repositorio digital
Arquitectura del sistema
En la figura 2 se muestra la arquitectura del repositorio digital que sirve de prototipo
funcional para este proyecto.

12
Figura 2. Arquitectura simple del sistema.

En esta arquitectura, los usuario pueden realizar búsqueda bibliográfica en el interfaz


de VuFind, que a su vez cosecha información bibliográfica del servidor DSpace. Por
otra parte, el administrador puede administrar el servidor “backend” de DSpace a
través del “frontend” de DSpace para subir, modificar, borrar y cosechar de otros
repositorios. El servidor “backend” de DSpace también puede ser remoto y no solo
local, ya que la comunicación entre VuFind y DSpace se realiza a través del protocolo
OAI-PMH.

Infraestructura del sistema


En la figura 3 se muestra la infraestructura necesaria para implementar la arquitectura
del sistema de la figura 2.
Figura 3. Infraestructura simple del sistema.

13
Básicamente consiste en un “router” con acceso a internet, al cual está conectado el
“switch de núcleo o core switch” que conecta con el servior. Lo ideal sería disponer de
tres servidores para este prototipo, uno para VuFind, otro para “DSpace backend” y
otro para “DSpace frontend”. Pero por precariedad de recursos se ha instalado todo en
un solo servidor virtual.

Prototipo conceptual avanzado del repositorio digital.


Por razones de no disponer de suficientes recursos informáticos, este prototipo no
puede ser implementado, pero se presenta aquí de manera conceptual para poner de
relieve los requisitos funcionales y no funcionales de su arquitectura e infraestructura.

Arquitectura del sistema


En la figura 4 se ilustra la arquitectura del prototipo avanzado.
Figura 4. Arquitectura avanzada del sistema

Esta arquitectura avanzada incorpora balanceadores de carga, servidores redundantes


que funcionan en modo tolerante a fallos y que ofrecen alta disponibilidad.

Infraestructura del sistema


La infraestructura requerida para implementar la arquitectura del prototipo avanzado
se muestra en la figura 5.

14
Figura 5. Infraestructura avanzada del sistema.

Dicha arquitectura incorpora servidores de balanceo de carga web y clusters de


servidores que funcionan en un entorno de virtualización con almacenamiento
compartido “NAS” (network Access storage), como puede ser Ovirt
(https://www.ovirt.org), Proxmox (https://www.proxmox.com), XCP-NG (https://xcp-
ng.org), o incluso una nube privada con OpenStack (https://www.openstack.org) o
CloudStack (https://cloudstack.apache.org).

RESULTADOS
Los resultados que aquí se presenten derivan de las instalaciones descritas en los
anexos.

DSpace Backend
Las figures 6 y 7 muestran las interfaces de los servicios “servidor api” y “servidor OAI-
PMH“ de “DSpace backend”.

15
Figura 6. Interfaz Rest de DSpace backend (http://192.168.1.42:8080/server/#/server/api)

Figura 7. Interfaz OAI-PMH Data Provider de DSpace backend


(http://192.168.1.42:8080/server/oai/request?verb=Identify).

DSpace Frontend
La figura 8 ilustra la interfaz de gestión de “DSpace frontend”.

16
Figura 8. Interfaz web de DSpace tras finalizar la instalación.

VuFind
La figura 9 muestra la interfaz de VuFind recién instalado, aún sin configuraciones
adicionales.
Figura 9. Interfaz web de Vufind tras finalizar la instalación.

Integración deDSspace y VuFind mediante el protocolo OAI-PMH

El tipo de contenido a cosechar puede ser:

 Metadatos.
 Metadatos y referencias a los ficheros.
 Metadatos y ficheros (con su contenido).

17
Debido a la poca potencia del servidor virtual con el que se dispone, solo se cosechará
los “metadatos y referencias a los ficheros”, para no tener que descargar el contenido
de los archivos durante el cosechado.

Cosechando en DSpace con OAI-PMH desde el repositorio USAL GREDOS


El proceso de cosechado de metadatos en DSpace abarca los siguientes pasos:

 Identificación del repositorio servidor OAI-PMH: en este caso se trata del


repositorio institucional de la Universidad de Salamanca
(https://gredos.usal.es).
 Localización del contenido a cosechar: el contenido a cosechar es la colección
“Servicios de la USAL”. La figura 10 muestra una colecciones del “Repositorio
GREDOS” cosechables.
Figura 10. Colección “Servicios de la USAL”. Fuente: https://gredos.usal.es/handle/10366/3812

 Chequeo de compatibilidad del servicio OAI-PMH. La información sobre el


repositorio se consigue a través del “directorio de repositorios de acceso
abierto” (https://v2.sherpa.ac.uk/id/repository/5517). El repositorio es
compatible con metadatos “Dublin Core” y la URL de su servidor OAI-PMH es
http://gredos.usal.es/oai/request.
 Cosechado de metadatos en el repositorio. Para conocer el código de la
colección, se accede a la URL “https://gredos.usal.es/oai/request” de OAI-PMH
del repositorio “Gredos” de la USAL; se elige el contexto por defecto.
 A continuación se busca el código que está asignado a la colección “Servicios
de la USAL”, desde el listado de colecciones obtenidas desde la URL
https://gredos.usal.es/oai/request?verb=ListSets. En este caso le corresponde
el código “com_10366_3812”.

18
Para que finalmente se coseche la colección en el repositorio local, se procede como
sigue:

 Se crea una nueva comunidad, que en este caso se llamará “Repositorio


GREDOS”, bajo la cual se creará la colección a cosechar. A continuación se
procede a editar la “fuente de contenido de la colección en cuestión”, donde se
introduce los datos de cosechado de la colección desde “Usal GREDOS”, como
se muestra en la siguiente 11.
Figura 11. Edición de la fuente de contenido de la colección a cosechar.

Una vez finalizado el proceso de cosecha, la nueva colección se llena del contenido de
su homólogo de “USAL GREDOS”, como se muestra en la figura 12.

19
Figura 12. Colección "Servicios de la USAL" cosechada desde GREDOS.

A continuación se procede al cosechado de la colección “Sociedad y Valores Cívicos”,


desde el repositorio de la Universidad de Alicante, como se muestra en la figura 13.

20
Figura 13. Cosechado de la colección "Sociedad y Valores Cívicos" de la UA.

Los resultados de la cosecha se muestran en la figura 14.


Figura 14.Coleccion local "Sociedad y Valores Cívicos" cosechada desde el repositorio de la
Universidad de Alicante.

21
En la siguiente 15 se puede observar la presencia de todos los metadatos en un
artículo de la colección cosechada.
Figura 15. Metadatos de un artículo de la colección cosechada "Servicios y Valores Cívicos”.

Cosechando con OAI-PMH desde VuFind al “Repositorio Insitucional de la


Universidad de Huelva”.
Como ejemplo, se procede al cosechado de la colección “Sociedad y Valores Cívicos”
del repositorio local, así como la colección “Proyectos de Innovación Docente e
Investigación Educativa” del “Repositorio Institucional de la Universidad de Huelva”
(http://rabida.uhu.es/dspace/), cuyo servidor OAI-PMH es
“http://rabida.uhu.es/oai/request” y su código “com_10272_3427”. Los resultados del
cosechado se muestran en la figura 16.

22
Figura 16. VuFind con contenido de las colecciones cosechadas mediante OAI-PMH.

VuFind tiene capacidad de autocompletar y mostrar los nombres de los objetos


digitales que contienen términos relacionados con el fin de acceder directamente,
como se muestra en la figura 17. También tiene la capacidad de buscar a través de
varias fuentes como OAI-PMH, archivos “sitemap.xml” de páginas web, Google, etc.
Las configuraciones pertinentes se realizan a través de varios archivos de
configuración como se explica en el “Anexo 3”.
Figura 17. VuFind utilizando autocompletar para mostrar varios artículos relacionados con la búsqueda.

23
En la figura 18 se muestra los resultados de la búsqueda del término “internet” en el
catálogo de VuFind. Se puede observar por la derecha los “facet” que permiten refinar
la búsqueda, ya sea por idioma (lenguaje), formato de archivo, autor, institución al que
pertenece, documentos que carecen de autor, etc. Se puede incorporar nuevos “facet”
configurando el archivo “facets.ini”.

Figura 18. Resultado de la búsqueda de "internet" por el catálogo de VuFind.

VuFind es capaz de indexar información a partir de los “sitemap.xml” de las páginas


web. En la figura 19 se presentan los datos indexados del portal web de la Universidad
de Salamanca (https://www.usal.es/files/sitemap.xml).

24
Figura 19. Datos indexados desde el portal de la USAL "https://www.usal.es".

VuFind también es capaz de buscar a través de buscadores como “Google” desde su


interfaz de búsqueda, como se muestra en la figura 20.

Figura 20. Búsqueda en Google desde VuFind.

25
Figura 21. Resultado de la búsqueda de "metadatos" en VuFind a través de Google.

CONCLUSIONES Y TRABAJOS FUTUROS


Conclusiones
DSpace es un repositorio de difícil instalación, pero muy robusto en su funcionalidad.
La dificultad de su instalación se debe a los diferentes componentes que se deben
interconectar y a la falta de una buena guía por parte de los desarrolladores.

VuFind es un buscador muy potente y versátil, capaz de actuar también como


“cosechador” de varios repositorios digitales. Es de fácil instalación y se integra
perfectamente con DSpace a través del protocolo OAI-PMH. Tiene grandes
posibilidades, entre las cuales actuar como reemplazo de OPAC de los sistemas
integrados de gestión de bibliotecas, aunque dicha funcionalidad no se abarca en este
proyecto.

Dificultades encontradas
A lo largo de la ejecución de este trabajo se han encontrado varias dificultades, cuales
son:

 La guía oficial de instalación de DSpace no es suficiente para poder realizar


una instalación fructífera. El autor ha tenido que acudir a varios videos de
“youtube” y documentación en línea para poder realizar la instalación, tras
varios intentos fallidos.
 Se ha tenido que correr dos instancias de Solr en la misma máquina virtual,
una para DSpace y otra para VuFind, lo cual ha supuesto una curva de
aprendizaje adicional para el autor.

Aportaciones del proyecto


Este proyecto aporta las siguientes mejoras:

26
 Una guía de instalación e integración de DSpace 7.2 y VuFind 8.04, para
aquellos que no poseen grandes conocimientos de Linux y los paquetes
involucrados en los procesos de instalación de estas aplicaciones.
 Prototipo de repositorio virtual para cumplir con la legislación vigente en
materia de acceso abierto y reutilización de información del sector público.

Trabajos futuros
 Integracion de Vufind con “Matomo Analytics” o “Google Analytics” para
obtener estadísticas que sirvan para medir el desempeño del repositorio.
 Integracion de Vufind con Koha, con el fin usar Vufind como sustituto de la
OPAC de Koha u otro sistema integrado de gestión de bibliotecas.
 Automatizar el cosechado a través de OAI-PMH mediante programadores de
tareas (“Cron jobs”).
 Personalizar el comportamiento de VuFind según las necesidades de los
usuarios.
 Construir un portal web para el repositorio, compatible con los requerimientos
de accesibilidad, que incluya búsqueda exploratorio a través de DSpace y
búsqueda a través del catálogo de VuFind, facilitando la interacción del usuario
con el sistema.

BIBLIOGRAFÍA
Agencia Española de protección de datos. (Marzo de 2022). Obtenido de
https://ayudaleyprotecciondatos.es/guia-rgpd/

BOE. (2007). Obtenido de Ley 37/2007, de 16 de noviembre, sobre reutilización de la


información del sector público: https://www.boe.es/buscar/act.php?id=BOE-A-2007-19814

BOE. (Junio de 2011). BOE. Obtenido de Ley 14/2011, de 1 de junio, de la Ciencia, la Tecnología
y la Innovación: https://www.boe.es/buscar/pdf/2011/BOE-A-2011-9617-consolidado.pdf

BOE. (Junio de 2011). Ley 14/2011, de 1 de junio, de la Ciencia, la Tecnología y la Innovación.


Obtenido de https://www.boe.es/buscar/pdf/2011/BOE-A-2011-9617-consolidado.pdf

Calameo. (2021). Métodos para resolver problemas de ingeniería. Obtenido de


https://es.calameo.com/books/0016750168f321f85745a

CCII. (Mayo de 2016). Norma Técnica para la realización de la Documentación de Proyectos en


IngenieríaInformática. Obtenido de https://www.inf.upv.es/www/etsinf/wp-
content/uploads/2018/05/norma.pdf

Cristina, A., Bernal, I., & Gómez Castaño, J. (2021). Guía para la evaluación de repositorios
institucionales. Obtenido de
https://www.recolecta.fecyt.es/sites/default/files/contenido/documentos/2021GuiaEvaluacio
nRecolecta_vf.pdf

Cruz Mundet, J. R., & Díez Carrera, C. (Septiembre de 2016). Sistema de Información de Archivo
Abierto (OAIS): luces y sombras de un modelo de referencia. Obtenido de
http://www.scielo.org.mx/scielo.php?script=sci_arttext&pid=S0187-358X2016000300221

DIRECTIVA (UE) 2019/1024 DEL PARLAMENTO EUROPEO Y DEL CONSEJO. (Junio de 2019).
Obtenido de https://eur-lex.europa.eu/legal-
content/ES/TXT/PDF/?uri=CELEX:32019L1024&from=ES

27
FECYT. (Junio de 2016). INFORME DE LA COMISIÓN DE SEGUIMIENTO SOBRE EL GRADO DE
CUMPLIMIENTO DEL ARTÍCULO 37 DE LA LEY DE CIENCIA. Obtenido de
https://www.fecyt.es/es/publicacion/informe-de-la-comision-de-seguimiento-sobre-el-grado-
de-cumplimiento-del-articulo-37-de

FECYT. (Octubre de 2014). Recomendaciones para la implementación del artículo 37 Difusión


en Acceso Abierto de la Ley de la Ciencia, la Tecnología y la Innovación. Obtenido de
https://www.fecyt.es/es/publicacion/recomendaciones-para-la-implementacion-del-articulo-
37-difusion-en-acceso-abierto-de-la

Jefatura de Estado. (Noviembre de 2007). BOE. Obtenido de Ley 37/2007, de 16 de noviembre,


sobre reutilización de la información del sector público.:
https://www.boe.es/eli/es/l/2007/11/16/37/con

Randhawa, S. (Enero de 2008). Open Source Software and Libraries. Obtenido de


http://eprints.rclis.org/13172/1/Open_Source_Software_and_Libraries.pdf

Soler Bernal, M., & Villadóniga Gómez, J. C. (Noviembre de 2009). APLICACIÓN DE DSPACE
COMO GESTOR DE REPOSITORIOS EN LA UNIVERSIDAD DE HUELVA. Obtenido de
http://rabida.uhu.es/dspace/bitstream/handle/10272/1652/Bernal%20Soler%2c%20Montserr
at.pdf?sequence=1

USAL. (2021). Pautas para la realización del TFM. Obtenido de


https://studium.usal.es/pluginfile.php/634567/mod_resource/content/1/Normas%20de%20es
tilo.pdf

VuFind. (2020). How to index DSpace with VuFind. Obtenido de


https://vufind.org/wiki/indexing:dspace?s[]=dspace

Wikipedia. (2021). Repositorio Institucional. Obtenido de


https://es.wikipedia.org/wiki/Repositorio_institucional

ANEXOS
Anexo 1: Proceso de instalación de DSpace.

El proceso de instalación que aquí se describe está basado en la guía que se


encuentra en página web con URL

https://wiki.lyrasis.org/display/DSDOC7x/Installing+DSpace

Instalación de DSpace Backend

Actualización del sistema, mediante el comando

apt-get update

28
Figura 22. Actualización del sistema operativo

Instalación de Git, mediante el comando

apt-get install git


Figura 23. Instalación de Git

Instalación de Java development kit (open-jdk), mediante el comando

apt-get install openjdk-11-jdk

29
Figura 24. Instalación de OpeJDK, versión 11.

Configuración de la variable de entorno JAVA_HOME

Editamos el fichero “/etc/environments”.


Figura 25. Configuración de la variable de entorno JAVA_HOME

Instalación de Apache Ant y Apache Maven

Apache Maven realiza la compilación de los paquetes de DSpacer y Apache Ant


instala DSpace el entorno de producción.

30
Figura 26. Instalación de Apache Maven y Apache Ant

Instalación del gestor de base de datos Postgresql Server and Client.

31
Figura 27. Instalación de PostgreSQL

Instalar paquete “postgresql-contrib”. Este paquete es necesario para Pgcripto


Figura 28. Instalación de PGCripto

Inicializamos postgresql.

pg_ctlcluster 13 main start

Crear una contraseña para postgresql:

passwd postgres

Password: Salamanca123

32
Figura 29. Creación de contraseña para el usuario postgres

Asegurarse de que postgresql escucha en localhost; para ello editamos el fichero


“postgresql.conf”, el cual se encuentra en el directorio” /etc/postgresql”.
Figura 30. Asegurar que postgresql escucha en el localhost

Poner seguridad al acceso de la base de datos de DSpace.

33
Figura 31. Restringir la seguridad de acceso a la base de datos.

Instalar la librería JDBC para Java.

Figura 32. Instalción JDBC para postgresql

Instalar el indexador Apache Solr.

Primero instalamos las dependencias

34
Figura 33. Instalación de paquetes necesarios para Apache Solr

Se procede con la descarga del binario Solr, desde la página oficial de Solr.
Figura 34. Descarga del paquete Solr

Unzip and install: Se procede con la instalación con el comando “bash solr-
8.11.1/bin/install_solr_service.sh solr-8.11.1.tgz”.

35
Figura 35. Instalación de Solr

Instalación de Apache Tomcat 9.


Figura 36. Instalación de Apache Tomcat 9

Dar permisos a Tomcat9 sobre DSpace. Modificar el fichero tomcat9.service,


localizado en el directorio “/lib/systemd/system”.

36
Figura 37. Dar Permisos al usuario Tomcat sobre el directorio DSpace.

Aumentar la memoria de Java para que Tomcat tenga suficiente para su ejecución.
Figura 38. Aumento de la memoria de JVM (java virtual machine)

Ajustar directivas en el fichero “server.xml” de Tomcat9. El fichero está localizado en


“/etc/tomcat9”.

37
Figura 39. Fichero de configuración del servidor Tomcat 9

Dar permisos a tomcat sobre el directorio /dspace.

chown -R tomcat:tomcat /dspace

Reiniciar Tomcat9:

Systemctl restart tomcat9

Descargar DSpace Backend.


Figura 40. Descarga de DSpace Backend 7.2

38
Descomprimir con “Unzip”

Crear la base de datos dspace y su usuario con privilegios exclusivos, así como la
extensión “pgcrypto”.
Figura 41. Creación de la base de datos DSpace y usuario dspace.

Crear la configuración local de DSpace. El fichero está localizado en “/opt/DSpace-


dspace-7.2.1/dspace/config”.
Figura 42. Creación del fichero de configuración a partir del fichero ejemplo.

39
Figura 43. Fichero de configuración de DSpace Backend

40
Figura 44. Continuación del fichero de configuración de DSpace backend.

Compilación de DSpace Backend con “maven”, desde dentro del directorio


“/opt/DSpace-dspace-7.2.1”, con el comando:

mvn package

41
Figura 45. Compilación de DSpace Backend con la herramienta Maven

Instalar DSpace backend con la herramienta “Apache Ant, desde el directorio


“/opt/DSpace-dspace-7.2.1/dspace/target/dspace-installer”.

42
Figura 46. Instalación de DSpace Backend con Apache Ant

Inicializar la base de datos Dspace, desde el directorio “/dspace/bin”.


Figura 47. Inicializar la base de datos de DSpace

Crear Usuario administrador de DSpace

/dspace/bin/dspace create-administrator

43
Figura 48. Creación del usuario administrador de DSpace.

Copiar la carpeta de aplicaciones web de DSpace a Tomcat


Figura 49. Copiado de webapps de DSpace a Tomcat

Copiamos los “CoreSets” de DSpace a Solr y reiniciamos el servicio “solr”. Los ficheros
de configuración de solr se encuentran en “/var/solr/data”.
Figura 50. Copiado de los "Cores" de Solr

Dar privilegios de propietario al usuario “solr” sobre “/var/solr/data” (el home directory
de solr).

chown -R solr:solr /var/solr/data/

Instalación de DSpace-frontend
Instalación de nvm (node versión manager).

44
Figura 51. Instalación de NVM (node version manager)

Listar las versiones de nodejs disponibles para instalar, mediante el comando “nvm ls-
remote”.

Figura 52. Listado de las versiones de nodejs disponibles para instalar.

45
Se instala la última versión LTS (long term support), v16.15.0
Figura 53. Instalacion de la ultima version LTS de NodeJS

Se instala yarn y pm2


Figura 54. Instalación de Yarn y PM2

Se descarga Dspace front-end (angular dspace).

46
Figura 55. Descarga de DSpace Frontend

Una vez descomprimido con el comando “unzip dspace-7.2.zip”, se procede a instalar


todas las dependencias con “yarn install”. Hay que asegurarse de que el usuario tiene
permiso de escritura en el directorio de dspace front-end.
Figura 56. Instalación de DSpace frontend mediante Yarn

Figura 57. Continuación de instalación de DSpace frontend mediante Yarn.

47
Create dspace angular config file “config.prod.yml”
Figura 58. Creación del fichero de configuración de DSpace Frontend

Editamos “config.prod.yml” con el editor nano


Figura 59. Fichero de configuración de DSpace Frontend

Corremos “yarn run build:prod” para compilar y crear un entorno de producción.

48
Figura 60. Compilación de DSpace frontend

Figura 61. Continuación de la compilación de DSpace

49
Fichero de configuración de arranque de DSpace Frontend con PM2.
Figura 62. Fichero de configuración de arranque de DSpace Frontend con PM2

Figura 63. Arranque de DSpace frontend con PM2

Página web frontend de DSpace, accesible en el puerto 4000.

Figura 64- Página web de Dspace frontend.

50
Figura 65. Login de DSpace frontend

Creación de comunidad MÁSTER SID y colección TFM en DSpace

51
Subida de un archive PDF a la colección TFM

Anexo 2: Proceso de instalación de Vufind.

El proceso de instalación de Vufind que se detalla a continuación está basado en la


guía que se encuentra en la página web con URL
https://vufind.org/wiki/installation:ubuntu

Descarga de Vufind, mediante el comando

wget https://github.com/vufind-org/vufind/releases/download/v8.0.4/vufind_8.0.4.deb

52
Figura 66. Descarga de VuFind 8.04

Instalar el paquete “debian”, mediante el comando

sudo dpkg -i vufind_8.0.4.deb

53
Figura 67. Instalación de VuFind 8.0.4

Los errores de dependencia listados en la figura anterior se corrigen con el comando

sudo apt-get install –ef

54
Figura 68. Arreglo de las dependencias faltantes en la instalación de VuFind.

55
Figura 69. Continuación con el arreglo de dependencias faltantes.

Acceder a la interfaz web de instalación de VuFind

http://localhost/vufind/install/home

56
Figura 70. Interfaz web de instalación de Configuración de VuFind.

Repetimos el proceso de instalación para arreglar el error de base de datos.

Al ser la instalación bajo debían 11, debemos proceder a instalar manualmente mysql
o mariadb

sudo apt update

sudo apt install -y mariadb-server mariadb-client

Después se asegura la instalación del servidor de “mariadb” mediante el siguiente


comando “sudo /usr/bin/mysql_secure_installation”.

57
Figura 71. Arreglo de base de datos.

Figura 72. Base de datos arreglada.

58
Al tener instalados Vufind y DSpace en el mismo servidor, hay que cambiar el puerto
de “solr” de Vufind a “8984” para evitar conflictos. El fichero está localizado en
“/usr/local/vufind/config/vufind”.
Figura 73. Configuración de Vufind para utilizar el puerto 8984

Figura 74. Configuración del script de arranque de Solr para usar el puerto 8984.

59
Una vez actualizado correctamente ste fichero, que está localizado en
“/usr/local/vufind”, se inicializa la segunda instancia de “Solr” para VuFind en el puerto
8984, mediante el comando “./solr start”.

No se tiene conexión a un sistema integral de gestión de bibliotecas, por eso se deja


sin resolver.
Figura 75. Dependencias básicas de VuFind instaladas.

Una vez arreglado todas las incompatibilidades, se puede acceder a la página de inicio
de “vufind”.

Figura 76. Portal de Vufind tras la instalación.

60
Anexo 3: Proceso de integración de DSpace con VuFind

Configuración del protocolo OAI-PMH en VuFind


Para configurar OAI-PMH en VuFind, editamos el fichero oai.ini, localizado en el
directorio “/usr/local/vufind/local/harvest”. Se ha configurado el cosechado de dos
colecciones en dos repositorios diferentes, uno local y el “Repositorio Institucional de
la Universidad de Huelva”. Dicha configuración se muestra en la figura 77.
Figura 77. Configuración de cosechado de colecciones en VuFind.

Para procesar el cosechado de las colecciones configuradas se procede a ejecutar


dos comandos, desde el directorio “/usr/local/vufind/harvest/”:

 php harvest_oai.php

61
Figura 78. Descarga de información de cosechado mediante OAI-PMH

 ./batch-import-xsl.sh DSpace dspace.properties


Figura 79. Integración de la colección cosechada desde el reposotirio DSpace local a VuFind.

Es importante garantizar que todas las nuevas incorporaciones de objetos digitales en


DSpace estan disponibles para el servidor OAI-PMH, para ello se debe ejecutar en
“/dspace/bin” el comando “./dspace oai import -o -c” antes de proceder con el
cosechado de estos objetos digitales en VuFind, como se instruye en la guía (VuFind,
2020) .

62
Figura 80. Integración de la colección cosechada desde el repositorio de la Universidad de Huelva
a VuFind.

Para garantizar que las todas las colecciones de DSpace estan actualizadas en el
servidor OAI-PMH es recomendable ejecutar el comando “./dspace oai import -o –c ”
comando en el directorio “/dspace/bin”.

El resultado del cosechado de esas dos colecciones se muestra en la siguiente figura


81, sumando un total de 12 artículos.
Figura 81. Resultado de búsqueda de todos los objetos digitales cosechados en VuFind.

63
Vufind también puede cosechar de páginas web, a través del contenido de su
“sitemap.xml”. Para extraer información de las páginas web hace uso de “Apache
Tika”. A continuación mostramos los ficheros de configuración involucrados.
Figura 82. Fichero de configuración de las páginas web cuyo contenido se va a indexar en VuFind.

Figura 83. Ficheo de configuración de las fuentes de búsqueda que aparecen en la web de VuFind.

Este fichero “searchbox.ini” puede contener varias fuentes de búsqueda, incluido


WorlCat, EBSCO, Overdrive, etc. Pero aquí solo tiene tres fuentes donde buscar
información, que son los objetos indexados mediante el protocolo OAI-PMH, los
indexados mediante “sitemap.xml” de las páginas web y las búsquedas por Google.

64
Figura 84. Fichero de configuración de "facet" para refinar los resultados de la búsqueda.

Los “facet” que aparecen en la parte derecha del catálogo se configuran en el fichero
“facets.ini”. Se ha añadido un “facet” para filtrar el resultado con artículos que no tienen
autor, como se muestra en la siguiente figura.
Figura 85. Incorporación de “No autor” como “facet” para filtrar artículos sin autores.

65
Figura 86. Fichero de configuración general de VuFind.

Los “tabs” que aparecen encima de la caja de búsqueda, que son “Catalog” y
“Websites” se configuran este fichero “config.ini”.
Figura 87. Fichero de configuración del extractor de metadatos para indexación de páginas web.

Este fichero “fulltext.ini” configura el extractor de metadatos para indexación de páginas web.

66

También podría gustarte