>

20 preguntas para la correcta gestión de los datos de investigación


Estas 20 preguntas pretenden ayudar al investigador cuando se plantea la gestión de sus datos de investigación al inicio de un proyecto y así preservarlos y describirlos para permitir su futura recuperación y reutilización. Las respuestas que se proponen no son más que una orientación sobre el tipo de información que debe tenerse en cuenta. En caso de no tener respuesta a estas preguntas, la biblioteca podrá asesorarle para responderlas.



Sobre la naturaleza de tus datos

1. ¿Cuál es la disciplina con la que están relacionados tus datos?

Respuestas posibles:

  • Historia de la medicina
  • Dialectología
  • Demografía
  • Documentación

2. ¿Cuál es la naturaleza exacta (ámbito, rango) de los datos de investigación?

Respuestas posibles:

  • Manuscritos del siglo XV de farmacología y medicina en España
  • Evolución y permanencia del leonés en los siglos XX y XXI: fonética y vocabulario
  • Fertilidad en las áreas con mayor índice de despoblación en Europa
  • Endogamia editorial: editoriales universitarias y manuales universitarios en Iberoamérica por países

3. ¿En qué formato(s) almacenará sus datos a corto plazo?

Respuestas posibles:

  • Base de datos de registros bibliográficos e imágenes de manuscritos
  • Base de datos de registros sonoros (entrevistas) y transcripción fonética de los mismos
  • Datos históricos tomados de las bases de datos del INE y recogida de datos directa
  • Cuestionarios dirigidos a bibliotecas y editoriales universitarias y librerías

4. ¿Quién es el propietario de los datos obtenidos de su investigación y de los derechos de propiedad relacionados con ellos?

Respuestas posibles:

  • El centro de investigación del IP del proyecto
  • La Fundación XXX y la Junta de Castilla-León
  • INE y Ministerio de Economía y empresa
  • Unión de Editoriales Universitarias Españolas

Descripción de los datos y de los conjuntos de datos (datasets)

5. ¿Cómo se van a estructurar los datos obtenidos en la investigación?

Respuestas posibles:

  • Los datos se describirán en texto libre que se recogerán manualmente en un documento personal
  • Se recogerán los datos estructurados en un excel sin utilizar un estándar, dependiendo de las necesidades del proyecto
  • Se recogerán los datos estructurados, siguiendo los estándares más frecuentes en mi área en el momento de la obtención de los datos, usando un formulario para metadatos.

6. ¿Cómo se va a describir el conjunto de datos?

Respuestas posibles:

  • La única descripción serán los nombres de los ficheros en mi ordenador personal
  • La única descripción serán los nombres de las columnas y las filas de mi fichero Excel
  • Los datos estarán descritos en un documento personal al que solo tengo acceso yo
  • Un documento electrónico que se incluirá en el repositorio de mi institución, recogerá los metadatos que describen mis ficheros de datos. Los miembros de mi equipo podrán tener acceso a este documento

Compartir los datos

7. ¿Con quién compartirá los datos de su investigación a corto plazo, antes de que se publiquen los artículos en los que se utilizan?

Respuestas posibles:

  • Solo con el IP
  • Con miembros de mi grupo de investigación y algunos colaboradores externos de confianza
  • Con cualquiera que los solicite
  • Con todo el mundo, publicando los datos online, puesto que nuestra comunidad de investigación está muy comprometida con la idea de compartir los resultados lo antes posible

Almacén de datos y copias de seguridad

8. ¿Dónde almacenará sus datos a corto plazo?

Respuestas posibles:

  • En mi ordenador personal
  • En el ordenador que se esté utilizando para recopilar los datos
  • En el servidor o espacio del servidor asignado por mi institución al mi grupo de investigación

9. ¿Quién es responsable de la gestión y almacenamiento diario de los datos y de realizar copias de seguridad?

Respuestas posibles:

  • Yo lo haré personalmente
  • El gestor de datos de mi grupo de investigación
  • El personal técnico de nuestro centro a cargo del mantenimiento del servidor

10. ¿Con qué frecuencia se harán copias de seguridad para la protección de los datos a corto plazo?

  • No sé
  • Cuando sea posible
  • Cada noche, al mismo tiempo que se hace la copia de seguridad de todos los servidores de la institución

Archivo de los datos

11. ¿Dónde se archivarán sus datos para su preservación a largo plazo?

Respuestas posibles:

  • Los datos seleccionados irán incluidos solamente en las tablas y gráficos de los artículos que publique mi grupo de investigación
  • Los datos completos se publicarán como archivos suplementarios a los artículos en la web de la revista/editorial en la que aparezcan
  • En el banco de datos de mi institución con acceso a través de la intranet
  • En el repositorio de mi institución o en otro repositorio que sea leído por herramientas como OpenAire

12. ¿Cuándo se trasladarán sus datos a un archivo seguro para su preservación a largo plazo y publicación?

Respuestas posibles:

  • Nuestros datos de investigación ya están almacenados en un servidor institucional
  • Cada noche
  • Una vez que se haya completado cada una de las fases de la recogida de datos
  • Inmediatamente después de publicar los artículos en los que se han utilizado los datos

13. ¿Quién decide cuáles de sus datos deben ser preservados?

Respuestas posibles:

  • Yo personalmente
  • El IP del proyecto
  • El IP del proyecto y los miembros del proyecto
  • La entidad financiadora

14. ¿Cómo transferirán (física o electrónicamente) sus datasets de investigación para su archivo a largo plazo bajo el cuidado de un tercero, por ejemplo, un repositorio?

Respuestas posibles:

  • Utilizando discos duros que llevaré a la Oficina técnica del repositorio institucional para su archivo
  • Enviando los archivos por correo electrónico a la Oficina técnica del repositorio institucional
  • Completando el formulario web del repositorio para archivar los datasets y subiendo los archivos vía web
  • De forma automática desde la herramienta de almacenamiento de datos de la que dispone mi grupo de investigación (dropbox, wetransfer, etc.)

Publicación de los datos

15. ¿Durante cuánto tiempo tendrá embargados sus datos antes de publicarlos para que otros los vean y utilicen?

Respuestas posibles:

  • Permitiremos el acceso público a los datos de forma inmediata porque estamos comprometidos con la reutilización libre de datos
  • Permitiremos el acceso público a los datos de forma inmediata porque estamos obligados a ello por la entidad financiadora
  • Estarán embargados un año para que los podamos explotar primeramente nosotros
  • Estarán embargados hasta que se publique el/los artículo(s) en los que se describen los datos

16. ¿Por qué tienen sus datos acceso restringido, en caso de que lo tengan?

Respuestas posibles:

  • Contienen datos confidenciales protegidos por la ley de protección de datos
  • Contienen datos confidenciales protegidos por el código ético de la disciplina
  • Se trata de un cuestionario de datos confidenciales. Se publicarán los datos generales anonimizados
  • Los datos no se pueden hacer públicos por el acuerdo que ha firmado mi grupo de investigación con la entidad financiadora
  • Intentamos pedir una patente y debemos evitar que los datos sean públicos

17. ¿Qué licencia utilizará para compartir sus datos de investigación?

Respuestas posibles:

  • Utilizaré una licencia Open Data Commons Public Domain Dedication and Licence (PDDL), para dominio público puesto que mis datos no están sometidos a copyright y quiero sean utilizados libremente, modificados y compartidos por cualquiera con cualquier propósito (https://opendefinition.org/)
  • Utilizaré una licencia Open Data Commons Atribución (ODC BY)
  • Desconozco las licencias que puedo utilizar y cómo hacerlo

18. ¿Qué identificadores persistentes se utilizarán para permitir la correcta citación de sus datasets?

Respuestas posibles:

  • No sé qué identificadores persistentes puedo utilizar
  • Me gustaría utilizar un DOI, pero no sé cómo obtenerlo
  • Utilizaré el DOI y el Handle que proporciona el repositorio de mi institución

19. ¿Qué metadatos descriptores del archivo se publicarán con los datos para permitir su correcta interpretación y reutilización?

Respuestas posibles:

  • No se publicará ningún tipo de metadatos para describir el archivo
  • El archivo de los datos (base de datos, tabla Excel, etc.) será descrito en la revista que publique el artículo en el que se utilizan de los datos, pero no se publicarán más metadatos que los exigidos por el repositorio
  • Se creará un documento con la descripción de los datos utilizados (siguiendo los estándares del área, si existen) que se entregará al repositorio junto con los archivos de datos

Gestión futura de los datos

20. ¿Quién será responsable de sus datos una vez que haya usted abandonado su grupo de investigación actual?

Respuestas posibles:

  • No me he planteado esta cuestión de momento
  • Lo harán otros miembros de mi grupo de investigación, mientras este exista
  • Espero que la revista en la que se publica el artículo y los datasets utilizados mantendrá el acceso a esta información suplementaria
  • Mi institución asumirá la responsabilidad a largo plazo sobre los datos que he decidido preservar en su repositorio

Contacto y Redes Sociales

Dirección

Biblioteca Tomás Navarro Tomás
Centro de Ciencias Humanas y Sociales del CSIC
C/ Albasanz 26-28
Madrid 28037

Teléfono: 91 602 26 99
Fax: 91 602 29 71

cchs_biblioteca.tnt@cchs.csic.es
http://biblioteca.cchs.csic.es

Accesos: Metro de Madrid Ciudad Lineal, Suances (L5)
EMT 77, 104, 105


Tríptico de emergencias del CCHS

Horarios

Horario de la biblioteca: de 9:00 a 18:00 horas de lunes a viernes.
Permanecerá cerrada los siguientes días:
1, 6 y 7 de enero
9 y 10 de abril
1 y 15 de mayo
12 de octubre
2 y 9 de noviembre
7, 8, 24, 25 y 31 de diciembre