Este es el tercero de una serie de posts sobre creación de listas en el movimiento Wikimedia. En el post anterior, hablé de los enfoques que usan las comunidades wiki para crear listas de tareas dentro de las actividades habituales en las wikis de Wikimedia. Este post destaca el uso cada vez mayor de Wikidata para cumplir con el mismo objetivo. Si quieres saber más sobre esta serie, comienza por el primer post.

Si aún no lo conocés: Wikidata es un proyecto hermano de Wikipedia. Almacena metadatos clave sobre conceptos utilizados en los proyectos de Wikimedia, como los datos presentes en las fichas de información de Wikipedia. Wikidata ha revolucionado la forma en que el ecosistema de Wikimedia piensa en sus datos, creando un lugar centralizado para compartir, traducir y actualizar datos clave sobre entidades, en lugar de actualizar los cuadros de información dentro de las wikis.

Además, Wikidata utiliza un servicio de consulta y una API para permitir a las personas usuarias hacer preguntas complejas sobre esos datos. Al permitir combinaciones de conceptos no planificadas, Wikidata nos lleva de conjuntos jerárquicos de conocimiento (es decir, los conjuntos creados por listas manuales o categorías que describí en el post anterior) hacia un agrupamiento de temas más orgánico y natural, similar a la manera en que asociamos los temas en el pensamiento y en el aprendizaje.

Tabla generada a partir de Wikidata, que enlaza con subpáginas para listas de autores en Wikidata por idioma usando la herramienta InteGraality. Sin elementos de Wikidata «completos» que tengan propiedades que cubran las facetas centrales del elemento, es difícil crear listas usando Wikidata.

El valor que aporta Wikidata para hacer listas es particularmente visible si planeamos crear una gama de contenido representativa y accesible de manera más equitativa en nuestras plataformas como parte de la estrategia de Wikimedia 2030. Con las listas impulsadas por Wikidata, es mucho más fácil comprender las oportunidades para intercambiar conocimiento entre nuestras comunidades multilingües y multiculturales. Además, Wikidata tiene una serie de flujos de trabajo impulsados ​​por la creación de listas. Recientemente, mis colegas de Wikimedia Alemania completaron un pequeño estudio de investigación que destacó la importancia de las listas en los flujos de trabajo complejos existentes en Wikidata.

En este post describiré tres métodos principales para aprovechar Wikidata para crear listas. Voy a suponer que quien lee tiene una cierta familiaridad con el funcionamiento de Wikidata. Si no conocés Wikidata, te recomiendo que consulte este webinario, este curso autoguiado o la documentación de Wikidata.

Creando una lista dinámica a través de Wikidata Queries

El método básico para hacer una pregunta a Wikidata es el Wikidata Query. El primer paso para crear una lista de Wikidata es determinar la pregunta correcta para Wikidata y formularla. Hacemos esto con una herramienta llamada Wikidata Query Service. Si nunca escribiste una consulta a Wikidata, podés leer mi publicación anterior sobre cómo encontrar mujeres escritoras del norte de África (en inglés). Una vez que tenés una consulta, podés hacer diferentes cosas con ella, que exploraremos a continuación.

Si tu objetivo es crear contenido en proyectos de Wikimedia, podés ampliar una consulta de Wikidata ya existente para encontrar temas faltantes en cualquier otro idioma de Wikipedia (u otro proyecto de Wikimedia) y crear una lista de enlaces rojos. La línea crítica del lenguaje de consulta SPARQL para agregar es:

 FILTER NOT EXISTS {             # has no en.wikipedia sitelink    

     ?wiki schema:about ?item .  

     ?wiki schema:isPartOf <https://en.wikipedia.org/&gt; .

}

El código pregunta al modelo de datos de Wikidata si una página de Wikipedia en inglés está adjunta a los elementos de Wikidata invocados en la consulta. Al modificar la URL después de “schema:isPartOf”, podés solicitar listas de temas de cualquier otro idioma de Wikipedia (u otros proyectos). Si elegís crear listas locales de enlaces rojos en tu wiki con Listeriabot para esta consulta, no olvides agregar la variable «?wiki» (o el equivalente en tu consulta) al output.

No todos los temas de Wikidata son relevantes para Wikipedia, por lo que algunas de las listas de Women In Red también han agregado otra característica a sus consultas: un recuento de todos los enlaces a otros proyectos de Wikimedia:

 OPTIONAL {?item wikibase:sitelinks ?linkcount .} # count of sitelinks   

Al contar la cantidad de enlaces a otros proyectos de Wikimedia, desarrollamos un proxy aproximado para «probablemente el tema es notable porque está cubierto en otra wiki». Es importante tener cuidado y no asumir que todos los temas cubiertos en otras wikis son automáticamente fáciles de escribir o traducir. Diferentes wikis tienen diferentes estándares sobre relevancia y sobre investigación original. Sin embargo, en su mayor parte, la cobertura en otras wikis sugiere que los wikimedistas consideran que vale la pena incluir ese elemento en Wikipedia.

Una lista de mujeres faltantes en el Wikiproyecto Mujeres sobre bibliotecarias, ordenada por el número de enlaces a otras Wikipedias para encontrar bibliotecarias notables.

Las consultas a Wikidata se actualizan automáticamente a medida que cambia el conjunto de datos en Wikidata, por lo que una vez que se escribe una consulta, continuarás encontrando contenido en Wikidata que se ajusta a tus criterios. Además, si algo ya no encaja en la consulta, se elimina de la lista. Esto hace que las consultas de Wikidata sean dinámicas, fluidas y útiles para encontrar lagunas en Wikipedia. El lado negativo de esto es que, con la mayoría de las consultas a Wikidata, no se puede mantener una lista concreta que se desea «terminar» (en las próximas secciones ofreceremos algunas soluciones).

Una vez que hayas generado una consulta de Wikidata, esta puede alimentar a otras herramientas que se pueden usar para llamar a la acción a los miembros de la comunidad. Si tenés interés en traducir etiquetas de Wikidata, por ejemplo, la herramienta Tabernacle proporciona una interfaz para traducir y agregar datos manualmente a un lote. O ListeriaBot es la herramienta con que Women in Red y otros proyectos crean “listas de enlaces rojos” que se mantienen automáticamente.

Estas consultas también se pueden combinar con herramientas wiki que ayudan a las personas recién llegadas en la redacción de nuevos artículos. Por ejemplo, en Wikipedia en inglés, la asociación GLAM del Museo Metropolitano adoptó la plantilla Preloaddraft para crear borradores de artículos en Wikipedia en función de la información en Wikidata mediante la integración de la plantilla en los resultados de la consulta. Esta plantilla genérica, creada originalmente como apoyo a una editatón de mujeres antárticas para ayudar a nuevos editores a comprender qué se debe incluir en un artículo de Wikipedia, puede ayudar a iniciar artículos en una gran cantidad de áreas diferentes. He visto usar esta misma táctica para ayudar a las personas sin experiencia a escribir artículos nuevos durante una reciente editatón organizada por Wikimedia D.C. con el Festival de Literatura Asiática Americana: combinaron esta plantilla con los resultados de la lista de artículos de la editatón para generar borradores de artículos para las personas sin experiencia (aquí un ejemplo).

Otra posibilidad, si estás llevando a cabo una iniciativa de traducción, es conectar la consulta de Wikidata directamente con las herramientas de traducción de contenido, modificando la consulta para a) identificar si el artículo existe en otras wikis, y b) vincular la traducción potencial en una URL sobre la que los traductores puedan hacer clic para ingresar al flujo de trabajo de traducción. Experimentamos con esta estrategia para #WikiForHumanRights en enero de 2020 (ver página del experimento), y nos permitió solicitar, muy rápidamente, con poco trabajo manual, traducciones del artículo de Wikipedia sobre la Declaración Universal de los Derechos Humanos.

La tabla de traducción de todas las wikis que aún no tienen artículos sobre la Declaración Universal de los Derechos Humanos.

Generando una lista que mezcla diferentes datos

Combinar datos entre wikis puede ser una tarea bastante compleja en los ecosistemas de Wikimedia. Con frecuencia se ven este tipo de remixes de datos hechos con herramientas personalizadas que extraen datos sobre un área temática específica (por ejemplo, Monumental para el conjunto de datos Wiki Loves Monuments, Crotos para el conjunto de datos Sum of All Paintings, Scholia para datos bibliográficos o el módulo CEE Table utilizado para CEESpring), para una acción específica (por ejemplo, Citation Hunt, que se enfoca en las declaraciones de cita requerida, o WikiShootme, una herramienta para capturar imágenes de elementos con coordenadas geográficas en Wikidata pero sin imagen), o para el procesamiento en lote complejo realizado para facilitar la edición por lotes con bots o con AutoWikiBrowser, por ejemplo.

La herramienta genérica más flexible para crear intersecciones de datos es Petscan. Petscan permite reunir o recuperar datos mediante todos los métodos de recopilación que he descrito hasta ahora en esta serie de posts (listas de enlaces en páginas, plantillas, categorías y consultas de Wikidata) para crear diferentes intersecciones de esos datos con las funciones AND/OR/NOT. Esto permite producir listas que son a la vez complejas y conceptualmente interesantes, pero también muy útiles para diversas formas de mantenimiento y para contribuciones específicas.

Por ejemplo, recientemente descubrí las consultas de mantenimiento de Petscan en la plantilla Image template notice de Commons que se utiliza en las categorías de Wiki Loves Monuments. Para mis flujos de trabajo personales, este tipo de consultas pueden ser excepcionalmente útiles. Por ejemplo, cuando viajé a Ghana para la investigación sobre organizadores del movimiento, me di cuenta de que la comunidad local estaba creando artículos de Wikipedia con categorías, pero no siempre creaban elementos de Wikidata con propiedades. Ahora tengo una lista de trabajo actualizable para priorizar el contenido de Wikidata a enriquecer.

Petscan puede ser la base de varias acciones diferentes: por ejemplo, se puede implementar una lógica de tipo QuickStatements a través de la herramienta Petscan para agregar o eliminar declaraciones en Wikidata. O una vez que se han creado estos conjuntos de datos, la herramienta «Pagepile» de Magnus puede ser usada para generar los datos en un formato de lista semipermanente que se puede usar con otras herramientas fuera de la wiki, como Tabernacle o Wikihub, la herramienta de creación de listas de trabajo creada el año pasado durante Google Summer of Code.

La interfaz de «personalización» en Citation Hunt para agregar una consulta de Petscan a una campaña.

Las listas de Petscan se pueden utilizar para fortalecer otras herramientas y flujos de trabajo. A partir de los comentarios sobre #1lib1ref, implementamos una función de Petscan en Citation Hunt que permite hacer colas personalizadas de declaraciones de «cita requerida» para editatones. Otro ejemplo: el Programs & Events Dashboard permite poner en seguimiento una ID de Petscan en eventos que están enfocados en un conjunto específico de artículos, de manera que se haga un seguimiento automático únicamente de las contribuciones a un subconjunto de datos. Otros formatos de datos en tablas wiki, como CSV y otros, pueden ser la base para otros tipos de herramientas que pueden usar la misma lista de Petscan en otras aplicaciones. La nueva herramienta de Commons AC/DC es capaz de tomar un resultado de Pagepile y agregar declaraciones en los datos estructurados de Commons (algo similar a los Quickstatements de Wikidata).

A pesar de lo asombrosamente poderosas que son estas listas de datos tomados de diferentes lugares, creo que aún nos faltan muchas aplicaciones para estas «listas de datos mixtos generadas por máquinas», dado que es bastante difícil usarlas sin las herramientas personalizadas descritas en el primer párrafo de esta sección o sin una herramienta que use PagePiles fuera de la wiki. Esto significa que el organizador de actividades de Wikimedia «promedio» que desea usar o mantener una lista en su espacio de trabajo debe superar varias barreras de aprendizaje. Las listas wiki son más fáciles porque no es necesario comprender el complejo ecosistema de herramientas de Wikimedia para replicar lo que se siente que debería ser una función incorporada. Recientemente he abierto un ticket de Phabricator sobre este tema; si tenés ideas o ejemplos de uso, por favor compartilos.

Si estás buscando formas divertidas, inspiradoras o sencillas de aprovechar estas listas, o de usar Wikidata en general, mi colega Sandra Fauconnier escribió un post maravilloso en marzo de 2018 sobre el uso de las listas para editar en el Mes de la Historia de la Mujer.

Crear una lista personalizada en Wikidata

Una de las técnicas más nuevas y no completamente exploradas para la «construcción de listas» es el uso de una propiedad P5008 («lista de interés para el proyecto Wikimedia»). Esta propiedad se creó para facilitar las listas que se necesitan para los esfuerzos de la comunidad pero que no tienen formas «obvias» de quedar coherentes mediante una consulta de Wikidata (es decir, las propiedades existentes no facilitan la consulta, pero pueden agruparse en alguna forma abstracta).

El primer uso importante de la propiedad fue para la lista de artistas de Black Lunch Table. La etnicidad para las comunidades afrodescendientes, tanto dentro como fuera de la diáspora africana, es un desafío: es algo que la sociedad puede inscribir socialmente en las personas o puede ser algo que las personas determinan por sí mismas. El uso de una propiedad de Wikidata como “etnicidad” no era apropiado para los organizadores de Black Lunch Table. Necesitaban confeccionar una lista que describiera el alcance de su trabajo (artistas “negros”) sin describirlos prescriptivamente con un postulado como “etnicidad”. Por esta razón, la comunidad de Wikidata desarrolló P5008 y Black Lunch Table creó las listas de artistas que se ajustaban al alcance de su proyecto.

P5008 se aplica a elementos para resaltarlos como «parte de la lista» en la que están trabajando una o varias comunidades diferentes. Hasta ahora, no ha habido un uso profundo de calificadores para modificar estas declaraciones y crear subconjuntos dentro de los proyectos, pero, por ejemplo, Black Lunch Table crea subconjuntos geográficos con calificadores para los lugares en los que se enfocan: esto puede verse, por ejemplo, en Zora J Murff. Podríamos imaginar muchos otros tipos de listas potenciales en las que, por ejemplo, grupos como el Observatorio de Diversidad de Wikipedia alimenten temas faltantes o temas de alto impacto para diferentes comunidades a través de declaraciones P5008 y usen calificadores para determinar un punto en el tiempo (P585) de creación de la recomendación, el método de determinación (P459), el tema principal (P921), etc. Hemos creado recientemente un wikiproyecto para discutir el uso de P5008 y otras propiedades para identificar brechas como esta.

Recientemente, he estado experimentando con el uso de la propiedad P5008 para identificar y representar el contenido del wikiproyecto Derechos Humanos con el objetivo de comprender mejor las oportunidades de trabajo conjunto con la Oficina del Alto Comisionado de las Naciones Unidas para los Derechos Humanos. Por ejemplo, con esta propiedad, pude aprovechar el conjunto de elementos existentes en el wikiproyecto Derechos Humanos en Wikipedia en inglés, para identificar esos mismos elementos en Wikidata. Con esto, es posible comenzar a hacer varios tipos de análisis (por ejemplo, qué tipos de artículos están siendo cubiertos en el wikiproyecto, o cuál es la representación de diferentes países en los artículos de personas del wikiproyecto en comparación con las personas cuya ocupación está definida como «activista de derechos humanos» o alguna subclase de esta). Al aprovechar Wikidata, es bastante fácil ver que la profundidad relativa de la cobertura de los temas de derechos humanos favorece a los países anglófonos.

Tabla que explora la cobertura de activistas de derechos humanos en Wikidata.

En cierto modo, las «listas» P5008 combinan las mejores características de Wikidata con las listas de datos mixtos y las listas manuales. Al ser una propiedad de Wikidata, puede ser consultada y creada con herramientas de creación de listas como Petscan y Listeria. Identificar y “agregar” elementos a la lista es sencillo: solo hay que encontrar los elementos y agregarles la propiedad P5008, ya sea manualmente o por lotes. Y dado que la declaración está vinculada directamente al número Q del proyecto, es muy poco probable que se «pierda» una declaración P5008 a menos que el tema se haya agregado por error. P5008 brinda la posibilidad de hacer un llamado a la acción coherente y transparente.

¿Qué sigue?

Wikidata abre muchas formas poderosas e interesantes de generar listas utilizando la infraestructura existente en la comunidad. Sin embargo, al igual que muchos otros usos de Wikidata para datos enlazados, todavía es muy emergente. Puede imaginarse el potencial y las aplicaciones iniciales están resultando bastante interesantes, pero generalmente no es posible desarrollar las prácticas de creación de listas de manera consistente si se cuenta con poca experiencia en tecnología.

Sin embargo, al mismo tiempo, Wikidata está comenzando a apuntar hacia un futuro mucho más emocionante: generar listas con múltiples formas de input y que sirvan de diferentes maneras. ¿Qué pasaría si las personas no tuvieran que «saber» por completo lo que pertenece a la lista para encontrarlo? ¿Qué pasaría si el ecosistema de Wikimedia pudiera “sugerir” temas que pertenecen a una lista con poco o ningún conocimiento previo sobre el tema por parte de los editores?

Con el uso cada vez mayor del aprendizaje automático en los proyectos de Wikimedia, espero que el futuro de la creación de listas reciba una inyección de sugerencias de temas asistidas por inteligencia artificial.

¿Te gusta esta serie de posts sobre listas? Necesitamos tu ayuda para documentar las prácticas de creación de listas e imaginar formas nuevas y más poderosas de aprovechar las prácticas de creación de listas que tenemos hasta ahora en la comunidad: ¿cómo harías que las listas fueran más transportables?, ¿qué tipo de listas o datos te gustaría recopilar? Si hacés algo que aún no he cubierto, hacémelo saber comunicándote directamente a través de astinson@wikimedia.org, dejando un comentario en este post o compartiendo los ejemplos en la página de discusión del esquema para organizadores que organizan campañas.


Si todavía no lo leíste, esta es la última parte sobre la creación de listas en el movimiento Wikimedia. La parte 1 está disponible en «Listas en el movimiento Wikimedia: ¿Qué? ¿Por qué?« y la parte 2 está disponible en «Listas en el movimiento Wikimedia: Construyendo listas manuales utilizando las prácticas editoriales de la comunidad«. Esta es una traducción del original en inglés escrito por Alex Stinson, Senior Program Strategist de la Fundación Wikimedia. Traducción por Jorge Gemetto bajo una licencia CC BY.