Business Intelligence – Un cas pràctic – OVIM

Context

Observatori de Violències Institucionals Masclistes (OVIM) (https://ovim.org/ca/) és una plataforma de la societat civil, d’incidència política i social, que vetlla perquè les institucions actuïn amb diligència deguda i garanteixin el dret a una vida lliure de violències masclistes i discriminacions contra les dones, nenes, nens i adolescents.

Les entitats que han impulsat aquesta plataforma són: Almena cooperativa feminista (https://almenafeminista.org) i Hèlia (https://heliadones.org/)

A la plataforma, les dones que han patit violència institucional masclista, el seu entorn, o organitzacions professionals o d’activistes, poden registrar el seu cas, de forma anònima.

 

Un cop registrat el cas, l’equip d’Almena i Hèlia s’encarrega d’omplir un altre formulari, més extens, classificant cada cas en diferents indicadors, segons la informació que han introduït en el relat.

Un cop classificats els relats es volen poder extreure estadístiques sobre la tipologia de les violències institucionals masclistes registrades.

Execució del projecte

En aquest projecte, a banda de la part d’analítica de dades, també s’han hagut de generar dos formularis, el d’introducció de dades per part de les persones i l’analític. Era molt important que aquests formularis, sobretot el d’introducció de dades per part de les persones, tingués el mateix aspecte que la resta de la web.

Aquests formularis s’han fet amb django i s’han desplegat al mateix servidor on hi ha la base de dades analítica. El desplegament s’ha pogut automatitzar dins del servidor analític a través del mateix provision d’ansible que crea tota la infraestructura de business intelligence (base de dades, ETLs amb DBT, Airflow, Superset, etc.).


Un cop tenim les dades a la base de dades de l’aplicació django, s’han mapejat les taules amb Foreign Data Wrapper al datawharehouse i s’han persistit els datasets amb DBT.

Una característica especial de la base de dades d’OVIM és que té poques files (uns quants centenars de casos), però, en canvi també moltes columnes diferents per on analitzar les dades. També té moltes relacions many-to-many, que al desnormalitzar-les a base de dades, fa que el nombre de files s’incrementi. El fet de tenir moltes columnes diferents fa que tingui especial importància en la definició dels datasets de Superset quins noms es posen a cada dimensió, per tal que sigui fàcilment localitzable a l’hora de mostrar les dades.


Un cop definits els datasets al Superset es van poder crear diferents dashboards per a analitzar les dades, que han servit, entre altres coses, per a generar l’informe anual de violències institucionals masclistes de 2024 (https://ovim.org/wp-content/uploads/OVIM_Informe_CAT_v3_web.pdf )

Per al treball de la definició de la base de dades i dels datasets de Superset ha estat necessari un treball molt constant amb l’equip d’Alemena i Hèlia, ja que no existeixen estudis sobre VIM, i calia definir el procés vigilant d’analitzar el màxim de variables possibles, simplificant al màxim el procés per a les persones que han d’introduir les dades. També calia poder anomenar de la forma més entenedora possible els camps del dataset, per tal que des d’Almena i Hèlia poguessin crear els seus propis anàlisis.

Següents   passos

Les dades que es volen analitzar de violències institucionals masclistes, sobretot en els primers mesos de vida del projecte, van canviant a mesura que es fan noves ​ anàlisis, amb el que cal modificar el formulari analític i els datasets de Superset, sempre mantenint també l’estructura original per evitar la pèrdua de dades. Cal mantenir el projecte perquè sigui fàcil afegir aquesta nova informació, tant en l’entrada de dades, com a la visualització.

En la darrera part del projecte s’han definit alguns gràfics a la web pública (https://ovim.org/ca/datos/), però encara en són pocs. L’objectiu futur és poder crear una visualització dinàmica, via web, que mostri i expliqui les dades de violències institucionals masclistes.


Com sempre, podeu trobar tot el codi utilitzat al nostre Gitlab: https://git.coopdevs.org/coopdevs/bi/ovim

Espai de Dades per a l'ESS
Transparència, creixement i presa de millors decisions gràcies a la compartició de dades