El fin de semana del 8 al 11 de noviembre estuve en la WikiConference North America, que este año tocó en Boston. Hacía tiempo que no aprendía tanto en una conferencia, y la verdad fue bastante interesante.

Presenté algo breve el viernes sobre la Declaración de Acceso Abierto para el Patrimonio Cultural, junto con Alex Stinson y Andrew Lih, e hice lo mismo el sábado (las diapositivas, acá). El viernes hubo mucho interés sobre algunos aspectos específicos de la declaración, sobre todo alrededor de las licencias Creative Commons y la relación entre las licencias y el dominio público. Al final de la conferencia terminé con la sensación de que una charla específica sobre el tema de derecho de autor y licencias CC hubiera sido más útil de lo que yo pensaba.

 

 

Por lo demás, la conferencia es impresionante porque es un espacio de intercambio real sobre experiencias, herramientas y aprendizajes.

Fui a varias charlas, pero algunas de las cosas que me llevé como conceptos fueron estas:

¿Cómo sabemos lo que no sabemos? Hacia la lista definitiva

El sábado participé de una conversación sobre “cómo identificar brechas de conocimiento en Wikipedia“. En esta charla no llegamos a ninguna conclusión, pero fue interesante ver cómo personas que están muy adentro de Wikipedia están tratando de resolver uno de sus mayores desafíos: ¿cómo hacemos para descubrir lo que no sabemos? ¿Cómo sabemos lo que no sabemos?

Hay varios proyectos que van en esta dirección, como WikiWomen in Red. Uno de sus principales valores es que tienen su “Redlist index“, una lista donde están todas las mujeres en rojo (es decir, que son artículos que hay que crear). Sí, después de mucho tiempo de conocer el proyecto WikiWomen in Red caía en la cuenta que el “en rojo” se refería al link rojo que aparece en los artículos de Wikipedia cuando falta una página (vean un ejemplo acá). Me sentí la persona más boluda del planeta, pero creo que ejemplifica bien cómo a veces damos por sentado que estamos todos en la misma página sobre un tema cuando en realidad no tiene por qué ser así. Mi asociación de “WikiWomen in Red” venía más por el lado simbólico (la mujer como símbolo de la pasión y por eso en rojo, flasheé cualquiera).

500px-Women_in_Red_logo.svg
El logo de WikiWomen in Red, así que ALGO tengo a mi favor respecto de la conexión simbólica entre el rojo y la pasión.

En fin, fue una conversación interesante porque construir las listas tener las listas disponibles son dos tareas fundamentales para entender qué es lo que falta. Acá es donde la conversación se conecta con el otro proyecto (poderosísimo) de Wikimedia, que es Wikidata. Si todavía no escucharon hablar de Wikidata es un buen momento para entrar al mundo de “los datos abiertos enlazados“. En corto, es una base de datos que conecta entidades (ítems) con propiedades, declaraciones sobre esos ítems y valores.

En Wikidata es donde obtenemos datos sobre esos ítems: por ejemplo, podemos ver una serie de propiedades y declaraciones sobre la tierra, pero también sobre la escritora argentina Elvira Aldao de Díaz, incluyendo que era una escritora, nacida en Argentina, su fecha de nacimiento, fallecimiento, quién fue su papá, etc. Wikidata funciona bajo el mismo principio que Wikipedia: está abierta a cualquier contribución y algunos datos tienen que tener referencias.

Sin meterme demasiado en cómo funciona Wikidata, una de las cosas que permite hacer muy bien es interrogar a esta base de datos alrededor de preguntas específicas sobre las entidades que están albergadas en la base de datos usando el servicio SPARQL de Wikidata. Acá Alex lo demostró (en inglés) con una query sobre “mujeres escritoras en Túnez”.

Para resumir la historia, lo importante es que cuando uno hace ese interrogatorio usando el servicio SPARQL, se le pueden hacer preguntas del tipo “devolveme todas las mujeres cuya ocupación sea escritoras y sean ciudadanas de Argentina que no tengan artículo en Wikipedia”.

Así luce semejante pregunta:

sparql=SELECT ?item ?linkcount WHERE
{ ?item wdt:P106 ?occ . # occuption as specified in the Values list
VALUES ?occ {
wd:Q36180 # writer
}
?item wdt:P27 wd:Q414 . # country of citizenship: Argentina
?item wdt:P21 wd:Q6581072 . # gender:female
?item wdt:P31 wd:Q5 . # instance of: human
OPTIONAL {?item wikibase:sitelinks ?linkcount .} # count of sitelinks
FILTER NOT EXISTS { ?wen schema:about ?item; schema:isPartOf <https://es.wikipedia.org/&gt; . }

Ahora, quiero aclarar algo. No se piensen ni allí que yo armé esta query. ¿Saben qué hice? Simplemente fui a las queries que ya estaban escritas en el “Redlist index” de WikiWomen in Red y modifiqué algunos de los valores para que me devolviera la lista. Para eso fui a esta lista de mujeres escritoras de Argentina y cambié la frase: schema:isPartOf<https://en.wikipedia.org&gt; por schema:isPartOf<https://es.wikipedia.org&gt;, porque a mí me interesaba ver las que no estaban en español. Y así armé esta lista de escritoras argentinas que no tienen artículo en Wikipedia.

sitelinks
Si van al ítem de Wikidata de Agustina Palacio de Libarona, van a ver que al final les aparece este cuadro donde sólo tiene un link a WikiSource, pero no tiene artículo en Wikipedia.

Por cierto, esta lista está de por sí bastante incompleta. Sabemos por el trabajo en la base de datos de autores (que por diferentes razones viene avanzando lentamente) que hay muchas más mujeres escritoras que las que aparecen en esa lista y que no tienen artículo en Wikipedia.

¿Cómo reconciliar esos datos? Bueno, ahí es donde entra Wikidata de nuevo: creando los ítems en Wikidata. La base de datos de autores se puede importar automáticamente a Wikidata utilizando una herramienta de reconciliación llamada OpenRefine, y eso estuve haciendo este fin de semana, pero eso prácticamente amerita otro post. Hice una primera prueba con unos 100 autores que resultó bastante bien.

En síntesis, lo que me parecía interesante era mostrar algo que me parece crucial:

  • para entender cuáles son nuestros sesgos, necesitamos ser capaces de interrogar sobre qué o quiénes están faltando;
  • para eso, tenemos que hacer más esfuerzos para construir listados más consistentes.

En esa misma línea (sobre cómo construir listas) fue una presentación de Mandiberg de Art+Feminism sobre convertir cadenas de texto en ítems de Wikidata mediante una herramienta llamada QuickSheets.

Wikidata y GLAM (Galerías, Bibliotecas, Archivos y Museos)

La otra presentación a la que fui fue una de Andrew Lih. Andrew es bastante pedagógico y sus diapositivas ofrecen un montón de información incluso si uno no pudo estar ahí mientras él presentaba. En particular, estas herramientas son muy útiles:

En fin, hubo un montón de herramientas interesantes en esa presentación; algunos ameritan más explicación, pero quería presentarlas a modo de resumen para no olvidarme.

Otros aprendizajes: documentar no tiene nada que ver con enseñar y tener referencias no siempre implica validez o veracidad

Como anuncio, vale la pena mencionar que habló Mark Graham de Internet Archive, ya que justo esa semana lanzaron un proyecto para que los libros disponibles en Internet Archive linkearan a sitios en Wikipedia (ya vienen haciendo la inversa, permitiendo que los libros que están disponibles en Internet Archive se puedan ver en Wikipedia).

Otra charla espectacular fue la de Amanda Rust, sobre cómo a veces las fuentes secundarias (o referencias) terminan siendo problemáticas. Como quizás sepan, uno de los pilares de Wikipedia es que la mayoría de las afirmaciones que se hacen en Wikipedia tienen que tener algún tipo de referencia, es decir, un link a una fuente primaria de donde se extrajo la información (puede ser un sitio web, un libro, otra enciclopedia, etc.). En este caso, Amanda mostró un artículo sobre un famoso esclavista norteamericano donde se enfatizó su carácter de “buen esclavista” tomando como referencias a las fuentes secundarias. Fue una charla espectacular, pero por desgracia no subió las diapositivas. Fue muy buena para remarcar que no solamente cuentan las citas sino que también hay que ser criterioso con la forma en que se construye esa información.

La otra charla fue de Will Kent, quien trabaja en la Fundación WikiEdu y quien estuvo a cargo de una sesión sobre cómo construir un currículum para enseñar Wikidata. La sesión fue muy buena, pero me encantó sobre todo una frase que dijo Will: “documentar no tiene nada que ver con enseñar“.

OLYMPUS DIGITAL CAMERA
Will Kent en su charla, hasta tiene cara de bueno y todo. Foto de Rhododendrites en Wikimedia Commons CC BY SA 4.0.

Viniendo del mundo del software libre y la cultura libre y el “do it yourself” permanente, me pareció una gran frase. En el mundo del software libre muchas veces cuando hacés una pregunta la respuesta es (o solía ser): “RTFM”, que quiere decir “Read The Fucking Manual” (leé el maldito manual).

Me parece que la frase de Will da en el clavo con las dificultades que a veces tenemos para navegar este mundo donde están pasando cosas fascinantes pero tenemos muchas dificultades para hacerlo visible para los demás, incluyendo a nuestros aliados y a quienes trabajan en la producción de conocimiento. Espero que este blog contribuya su granito de arena con hacer más fáciles algunas de estas cuestiones.