Codificación de bases de datos y Flujo de trabajo – Otoño de 2020

Diciembre 2020 • Natalia Mora, Chloe Juriansz, Federico Perelmuter

Natalia: Trabajar en la base de datos este semestre ha sido una continuación del trabajo de verano de Chloe. Comenzamos el semestre con Chloe poniéndonos al día con el trabajo que había hecho, todo se hizo a través de tutoriales por Chloe compartiendo su pantalla por Zoom. Estos tutoriales fueron para que pudiéramos entender su proceso y hacer preguntas. El proceso de codificación de Chloe fue en su mayor parte sencillo, sin embargo, decidimos que sería mejor crear un documento de flujo de trabajo para otros que podrían trabajar en o con la base de datos. El documento de flujo de trabajo se basó en las preguntas que surgieron durante los tutoriales de Chloe. El próximo paso es traducir el documento a español.

La codificación se centra en recopilar los datos que se encuentran en los casos de las víctimas. Los datos de las víctimas incluyen el género, la participación en algún grupo, el trabajo, su religión, y muchos datos más. Nos han surgido muchas preguntas sobre cómo categorizar algunos casos de desaparición a medida que ha avanzado el semestre. Comenzamos a agregar nuevas categorías pero somos conscientes que en los casos que Chloe trabajó este verano no se tenían estas categorías en mente. Esperamos tener tiempo suficiente para volver a estos si podemos terminar una primera pasada por todo el archivo.

También continuamos usando una hoja de cálculo creada por Chloe durante el verano que marca los casos que muestran inconsistencias dentro del archivo. Estamos tomando nota de cosas como errores ortográficos de nombres, fecha incorrecta de desaparición, diferentes nombres en los casos y muchas otras cosas. Recientemente, también hemos encontrado problemas con el sitio de archivo que no carga imágenes, lo que podría requerir un nuevo escaneo si no se encuentran las imágenes.

Chloe: Este semestre, seguí trabajando en el proceso de clasificación demográfica en el archivo que empecé el año pasado y en el que me concentre este verano. Este proceso ha involucrado abriendo cada caso en el archivo y tomando notas sobre información demográfica de la persona desaparecida, como su género, religión y trabajo. Porque abrí cada caso, este trabajo también me presentó la oportunidad de ver cuales entradas en el sitio web del archivo pueden necesitar ser “arregladas” (ej. errores de ortografía, preguntas de fecha, enlaces que no funcionan, preguntas de búsqueda). Anteriormente, estaba haciendo comentarios en un Google Doc pero me di cuenta de que era difícil llevar un registro de los comentarios de todos los casos, y por eso decidí crear un documento grande para anotar los comentarios en una manera que sea más fácil de entender.

Este semestre también ha involucrado un proceso de hacer que mi trabajo y mis comentarios sean más comprensibles para que los otros compañeros puedan ayudarme a trabajar en el proceso de codificación. Porque fui una de las únicas personas trabajando en este proceso, habían muchas cosas que había aprendido y abreviaturas que había creado que tienen sentido para mí ya que he trabajado con casi 2.000 casos, pero esta información no es útil si solo yo puedo entenderla. Esto fue un proceso que me ayudó mucho porque requirió que pensara si lo que está haciendo tiene sentido en el contexto del trabajo que he hecho y en el contexto de las metas del GAM y su colaboración con Haverford.

En el semestre que viene, voy a continuar trabajando en este proceso de codificación con el resto de los compañeros. Nuestra meta es terminar este proceso en todo el archivo y con optimismo crear unas visualizaciones de esta información que puedan ser útiles para futuros compañeros.

Federico: Trabajar en la base de datos ha sido más difícil de lo que habría esperado de una tarea que inicialmente parece consistir simplemente en la entrada de datos. La cantidad de lectura requerida es ciertamente considerable, y puede ser agotador mirar carpeta tras carpeta, narrativa tras narrativa, formulario tras formulario, tratando de seleccionar información específica para poner en una hoja de cálculo. Lo que hace que este trabajo sea interesante para mí es su profunda importancia: alguien tiene que revisar la totalidad de la base de datos y catalogar su contenido para que futuros investigadores puedan comprender parte de la información que contiene, esa información que se presta a la cuantificación o análisis de un sí/ no. Además, revisar los datos un archivo a la vez nos ayuda a encontrar fallas en su construcción (nombres mal escritos, fechas faltantes, transcripciones incompletas, imágenes ausentes, enlaces rotos) que nos ayudan a corregir problemas dentro de la base de datos que dificultan la investigación por: por ejemplo, impidiendo la búsqueda del archivo. El trabajo de la base de datos facilita la investigación futura y se niega a aceptar al archivo como un objeto estático, en lugar lo enmarca como uno que se transforma, mejora y es corregido continuamente.