Elecciones del 21D: Análisis de los tópicos tratados por ocho candidatos políticos en twitter a través de MIRA Analytics

Este trabajo tiene por objetivo mostrar el discurso político en Twitter de los líderes de los partidos que se presentan a las elecciones del 21 de diciembre en Cataluña. Para ello se ha analizado  el contenido de los mensajes que han publicado desde el mes de septiembre y se han clasificado según  unos tópicos definidos.  Para el análisis se empleó la herramienta Mira Analytics capaz de filtrar y visualizar los datos a través de unos grafos de redes. Mediante estos filtros es posible tener distintas vistas de las relaciones entre los tópicos y los candidatos así como ver su evolución en el tiempo. Además de proporcionar datos sobre los candidatos en forma global y evolutiva, el trabajo termina con unas observaciones y conclusiones sobre el debate actual.

2. Metodología

Los datos se han obtenido desde la APi de Twitter, obteniendo los últimos 3.200 mensajes de los perfiles de los siguientes candidatos: Carles Puigdemont Casamajó​ de Junts per Catalunya (@KRLS), Oriol Junqueras i Vies de ERC (@junqueras),  Carles Riera i Albert de la CUP (@carlesral), Inés Arrimadas García de Ciutadans (@InesArrimadas), Xavier García Albiol del PPC (@Albiol_XG), Miquel Iceta Llorens del PSC (@miqueliceta), Xavier Domènech Sampere de CatEnComu_Podem (@XavierDomenechs) y Nuria Fabelo de RecortesCero (@nuriafabelo). La descarga de los datos se realizó el día 10 de diciembre del 2017 acotándose la fecha inicial al 01 de septiembre del 2017.  Durante este periodo el número total de mensajes publicados en twitter por los perfiles analizados fue de  8776.

El análisis cuantitativo de los contenidos del los tuits y de sus metadatos se basó en la herramienta Mira Analytics (www.mira-analytics.com). Esta herramienta ha sido diseñada con el fin de calcular el número de veces que los conceptos han sido mencionados en el cuerpo del tuit (frecuencia)  y las veces que los conceptos han sido mencionado entre ellos (concurrencia). Gráficamente estos dos resultados se muestran con nodos (nodes) y relaciones (edge) respectivamente.

A partir de un ranking de 724 palabras más frecuentes  empleadas en los tuits (un total de 30.451 palabras), hemos agrupados 346 palabras en 16 topics. De la lista de palabras más frecuentes se eliminaron algunos sustantivos, adjetivos y verbos que pudieran ser ambiguos o carecer de un significado concreto.  Tanto la revisión de las palabras como la clasificación de las mismas en los diferentes  tópicos se realizó a mano.  Los tópicos y el número de palabras relacionadas son: “Reivindicaciones” (96), “Política” (83), “Ciudadanía” (41), “Territorios” (29), “Justicia” (23), “Seguridad” (22), “Medios / Prensa” (16), “Economía” (16), “Empleo” (8), “Educación y Cultura” (6), “Sanidad” (1), “Innovación” (1), “Medioambiente” (1), “Energía” (1), “Infraestructura” (1) y “Fiscal” (1).  Para poder analizar los contenidos de los tuits, hemos creado una taxonomía que está formada por dos grupos de palabras una titulada con el nombre  “Conceptos”  que agrupa las 346 palabras y otra llamada “Tópicos” que agrupa los 16 temas.

Los tuits, además de incluir el texto (el Tuit) tienen asociados  unos “metadatos”. Es decir unos datos únicos y que pueden ser analizados en conjunto o por separado. En concreto, los metadatos empleados por este trabajo han sido El perfil que publica el tuit (candidato), las menciones, los hashtag y la fecha. La fecha  puede servir para filtrar y por tanto focalizar el análisis a un período concreto en vez de analizar el periodo total .  

La herramienta Mira Analytics utiliza metadatos para definir las relaciones entre ellos con el fin de mostrar un grafo de redes. Este análisis está enormemente enriquecido por  las taxonomías que analiza el texto de los tuits y lo relaciona tanto con los metadatos como con las otras categorías empleadas en la taxonomía y en este caso los conceptos y tópicos. Tanto los metadatos y las categorías tiene asignados un color específico (codificación hexadecimal) para poderlos distinguir entre ellos en los grafos.

 

3. El Ecosistema de los candidatos

Al relacionar todas las cuentas de los candidatos con los hashtags y menciones es posible crear un complejo ecosistema donde es posible ver múltiples conexiones entre los tres elementos. Este ecosistema se nutre de los casi 9000 tuits de los ochos candidatos (color morado) y muestra unas 1722 menciones (color amarillo)  y unos 999 hashtag (color azul) (figura 1.1, 1.2 y 1.3).  

Figura 1.1 – Ecosistema de los candidatos del 21D.

 

 


Figura 1.2 
– Menciones del Ecosistema.

Figura 1.2 – Hashtags del Ecosistema.


Aunque estos gráficos resultan ser muy atractivos desde el aspecto visual, para poder obtener algunos elementos relevantes de cara al análisis de los candidatos, es necesario aplicar unos filtros como por ejemplo eliminar las menciones (color amarillo) y hashtags (color azul) que tienen únicamente una (1) publicación y que por lo tanto pueden ser considerados insignificantes sobre la base del número total de tuits (8776). Al eliminar estos elementos el grafo redujo enormemente el número de relaciones y nodos y, por consequentemente, su complejidad. El grafo final resultó con un total de 29 menciones y 19 hashtags (figura 2.1).

Figura 2.1 – Ecosistema filtrado: Candidatos con sus principales Menciones y Hashtags.

A partir de este resultado es posible observar lo siguiente:

  • Las Menciones:  Todos los candidatos tienen sus preferencias en cuanto a mencionar  cuentas personales o cuenta de sus respectivos partidos en los tuits. Sin embargo, existen candidatos que mencionan conjuntamente a periódicos  “La Vanguardia” o “El Periódico” y el medio “324 Cat”. Las cuentas de twitter que más menciones recibieron por parte de los candidatos ha sido @socialistes_cat, @recortecero y @cupnacional con unos 345, 341 y 330 tuits respectivamente, seguido por los periódicos como @LaVanguardia, @el_pais y @elperiodico con un total de 202, 199, y 113 tuits respectivamente. En cambio los periódicos  @Naciodigital”, @Europapress, @elConfidencial o @eldiaridegirona obtuvieron un número menor de menciones con 24, 18, 15 y 15 menciones respectivamente.
  • Hashtag:  En cuanto a los hashtag, es posible ver que el uso de este elemento en los tuits es mucho menor de las menciones aunque de forma similar. El hashtag más importante es el #1oEstafaAntidemocratia que ha sido mencionado en 116 tuits todos desde la cuenta de @nuriafabelo. Destacan el hashtag  #21D (75 tuits) vinculado a las cuentas @Albiol_XG, @KRLS y @juqueras y #Oct 01 (58 tuits) vinculado a las cuentas @KRLS y @carlesral.
  • OBSERVACIÓN 1: La ausencia de las relaciones entre candidatos muestra claramente que cada uno no menciona a otro.  Es decir que los candidatos no contestan los tuits de sus contendientes.  Por último, existen hashtag y menciones que aparecen vinculados ya que hay tuits que incluyen cuentas y hashtag conjuntamente en su texto.

4. Análisis global de los Tópicos

Un primer análisis global de los tópicos muestra las relaciones de los candidatos (color morado) y los tópicos (color verde) siendo el tamaño de los nodos directamente proporcional al número de ocurrencias que tengan (figura 3.2  3.3). El tamaño destaca  los tópicos más empleados, así  los  más utilizados son: “Política” (4640 tuits), “Territorios” (4053 tuits), “Reivindicaciones” (3139 tuits), y “Ciudadanía” (2113 tuits). Siguen los tópicos “Justica”  (1004 tuits), “Medios/Prensa” (915 tuits) y “Seguridad” (829 tuits). Mucho menos relevantes  tenemos Economía (527 tuits), “Educación y Cultura” (215 tuits), “Empleo” (158 tuits), “Fiscal” (49 tuits) y por ultimo “Sanidad” (23 tuits) (figura 3.1).


Figura 3.1 – Red entre Cuentas y Tópicos.

 
Figura 3.2 – Concurrencia entre Tópicos. Figura 3.2 – Cuentas ochos Candidatos.

 

  • OBSERVACIÓN 2: Sobre la base del análisis global de los tuits, es posible afirmar que los candidatos hablan mayoritariamente sobre temas políticos (figura 3.1 y 3.2), territoriales y de reivindicaciones dejando a un lado temas  socioeconómicos. Este resultado está respaldado por el hecho que los tópicos que más conceptos incorporan tienden a ser los más  destacados. En este caso  “Reivindicaciones” y “Política” son los dos tópicos que agrupan el más alto número de conceptos utilizados por los candidatos y tienen el doble de conceptos incorporados en su taxonomía (96 y 83 palabras respectivamente) con referencia al tercer tópico que incorpora  más palabras como lo de “Ciudadanía” (41 palabras).  Aún así es notable la diferencia entre los tópicos dominantes y los que resultan ser menos tratados en los tuits. Si miramos únicamente a los tópicos más tratados (valor de las relaciones entre cuentas y tópicos) es posible ver que existen 7 candidatos muy activos (figura 4.1).

Figura 4.1 – Candidatos más activos en los tópicos principales.

“Política”, “Reivindicaciones” y “Territorios” son los tópicos que están tratados por la mayoría de los candidatos (figura 5.1, 5.2 y 5.3). Estos tres tópicos también aparecen conjuntamente (concurren) en buena medida entre los tuits. Por ejemplo, “Reivindicaciones” y “Territorios” concurren  en casi 1600 tuits (figura 5.4).

 
Figura 5.1 – Relaciones del tópico “Politica”. Figura 5.2 – Relaciones del tópico “Reivindicaciones”.

 

 

 
Figura 5.3 – Relaciones del tópico “Territorios”. Figura 5.4 – Concurrencia entre tópicos Principales.

En un segundo grupo, hay tópicos que aparecen en menor cantidad. Si analizamos únicamente aquellos tópicos que han sido tuiteados por debajo de las 1000 veces, es decir con menor frecuencia, es posible ver que los tópicos como “Economía”, “Empleo” o “Educación y Cultura”. que han sido tratados por todos los candidatos aunque en menor frecuencia. De este grupo “Prensa/Medios” sale como lo más destacado  (figura 6.1).

Figura 6.1 – Conversaciones de los Candidatos sobre tópicos menos frecuentes.

En cambio, hay tópicos como por ejemplo “Medioambiente”, “Innovación”, “Energía” o “Infraestructura” que solamente algunos candidatos han hablado de ellos y de forma esporádica. Por ejemplo, “Medioambiente” (figura 6.2) ha sido mencionado 1 vez por parte de @inesarrimadas e “Innovación” (figura 6.3) solamente 4 veces por @inesarrimadas, @junqueras y @albiol_XG .

Figura 6.2 – Conversaciones de los Candidatos sobre “Medioambiente”.


Figura 6.3 – Conversaciones de los Candidatos sobre “Innovación”.

  • OBSERVACIÓN 3: Una minoría de los candidatos y de forma muy distinta habla de aspectos que tienen impacto social, económico, tecnológico/innovación y medioambiental en la sociedad. @InesArrimadas es la única candidata que ha tratado estos puntos aunque siempre en su minoría.
  • OBSERVACIÓN 4: El análisis de los tópicos resulta en una visualización polarizada de los candidatos (figura 7.1 y 7.2). Aunque los candidatos no tienen ninguna vinculación entre ellos, a lo contrario de los tópicos, es posible observar que existe una afinidad liviana entre los candidatos en base a los tuits publicados.  Esta afinidad se calcula en base al número de veces que cada candidato ha utilizado las palabras de cada tópicos.  La similitud entre los candidatos puede ser calculada a partir de los tópicos menos tratados.  Por ejemplo, el grupo de candidatos compuesto por @InesArrimadas, @junqueras @XavierDomenechs, @Albiol_XG y @nuriafabelo se distinguen por hablar un poco más sobre “innovación”, “Sanidad”, “Energía”,  “Educación y Cultura” o “Empleo” que los otros candidatos (Figura 5.1). En cambio los candidatos @carlesral, @KRLS y @miqueliceta dejan a un lado los temas socioeconómicos (figura 7.2).

Figura 7.1 – Conversaciones agrupadas candidatos que emplean más tópicos socioeconómicos.

Figura 7.2 – Conversaciones agrupadas candidatos que emplean menos tópicos socioeconómicos.

 

5. Análisis Tópicos por Candidato
En cuanto a los tópicos de vistas por candidatos, hemos considerado oportuno agrupar estas vistas en tres grupos según la posición de los candidato sobre la independencia de Cataluña. Los grupos con sus candidatos y conversaciones se muestran a continuación.

5.1 Grupo Independentista: Carles Puigdemont Casamajó​ de Junts per Catalunya (@KRLS), Oriol Junqueras i Vies de ERC (@junqueras) y  Carles Riera i Albert de la CUP (@carlesral) (figura 8.2 y 8.3).

 Figura 8.1 – Tópicos de @KRLS.

 
Figura 8.2 – Tópicos de @junqueras. Figura 8.3 – Tópicos de @carlesral.


5.2 Grupo Constitucionalista:
Inés Arrimadas García de Ciutadans (@InesArrimadas), Xavier García Albiol del PPC (@Albiol_XG) y  Miquel Iceta Llorens del PSC (@miqueliceta) (figura 9.1, 9.2 y 9.3).

Figura 9.1 – Tópicos de @InesArrimadas.

Figura 9.2 – Tópicos de @Albiol_XG. Figura 9.3 – Tópicos de @miqueliceta.


5.3 Grupo No Alineado –
Este grupo está compuesto por Xavier Domènech Sampere de CatEnComu_Podem (@XavierDomenechs) y Nuria Fabelo de RecortesCero (@nuriafabelo) (figura 10.1 y 10.2).

   
Figura 10.1 – Tópicos de @XavierDomenech Figura 10.2 – Tópicos de @nuriafabelo

 

  • OBSERVACIÓN 5: El análisis de los tres grupos no muestra claras diferencias entre los candidatos. Es decir, en qué medida cada candidato da respuesta a aspectos de su contenido electoral (temas tratados) y en qué medida al debate Independencia-No Independencia-155. A la vista de estos resultados es posible afirmar que no hay diferencias significativa en los temas tratados y que las únicas diferencias se pueden percibir en los temas que han sido debatido en menor cantidad como los de tipo socioeconómico (ver observaciones 4 del apartado anterior). En conclusión todos los candidatos pecan lamentablemente en este campo.
  1. Análisis Evolutivo de los candidatos

Con el fin de estudiar la evolución de los tópicos en el tiempo y realizar una comparativa, hemos identificado cuatros fechas claves y que coinciden con los momentos que se han publicados ás tuits (figura 11.1). Las Fechas claves son:

  1. 06 de Septiembre de 2017: Aprobación de la Ley del referéndum de autodeterminación de Cataluña.
  2. 01 de Octubre de 2017: Celebración del referéndum sobre la Independencia en Cataluña.
  3. 10 de Octubre de 2017: Declaración de la República Catalana.
  4. 27-28 de Octubre de 2017: Votación en el Parlament y Aprobación de la aplicación del art.155 en Cataluña por el Senado.

Para realizar el análisis se utilizaron 3 días de tuit; el dia del evento y dos días posteriores

Figura 11.1 – Número de tuits totales en el tiempo.

La comparación de los tópicos principales muestra que en fecha del 01 de Octubre los tópicos “Territorios” y “Ciudadanía” han aumentado considerablemente creciendo un 36,% y 34,4% respectivamente (figura 11.2 y 11.3). En cambio  otros tópicos han disminuido sensiblemente como por ejemplo las “Reivindicaciones” o la “Justicia” (17,9% y 39,2%).  El tema político se han quedado estable. A destacar que el tema sobre la “Seguridad” ha casi triplicado pasando desde 31 a 88 menciones durante y después del eventos del referéndum (figura 11.3).

 
Figura 11.2 – Tópicos y Cuentas del 06 07 y 08 de Septiembre de 2017 – Aprobación de la Ley del referéndum de autodeterminación de Cataluña. Figura 11.3 – Tópicos y Cuentas del 01, 02 y 03 de Octubre de 2017 – Celebración del referéndum sobre la Independencia en Cataluña.


Si miramos el periodo que rodea la fecha en la cual se declara la República Catalana el número de tuits totales y relacionado a los temas disminuye notablemente. Esta reducción generalizadas de la producción de tuits y que no supera el umbral de los 100 tuits al día se queda similar hasta el 27 de Octubre. El tópico que más se redujo con respecto a la fecha del referéndum es “Ciudadanía” con una reducción porcentual del -75% seguido por “Política” con un -57,9%  (figura 11.4).

Figura 11.4 – Tópicos y Cuentas del 10, 11 y 12  de Octubre de 2017 – Declaración de la República Catalana.

A partir del  viernes 27 de Octubre, fecha en la cual el pleno del Parlament de Cataluña  votó la declaración de Independencia y la fecha del sábado 28 de Octubre, donde se aprobó la aplicación del art.155 en Cataluña por el Senado, el número de tuits crecen notablemente. En específico, los conceptos de tipo “Ciudadanía” y “Políticos” son los que más repuntan con un 76,9% y 67,0% respectivamente  de crecimientos,  seguidos por “Territorios” y “Reivindicaciones” (38,7% y 28,5%) (figura 11.5).      

Figura 11.5 – Tópicos y Cuentas del 27, 28 y 29  de Octubre de 2017 – Votación en el Parlament (27/10)  y Aprobación de la aplicación del art.155 en Cataluña por el Senado (28/10).

7. Conclusiones

Tal como se ha ido reiterando a lo largo de este documento, hay elementos destacados que se pueden observar en los tuits de los ochos candidatos. En específicos las conclusiones más importantes pueden estar resumidas en los siguientes puntos.

  1. El debate de los ochos candidatos se concentra fundamentalmente en los temas políticos.  Muy poco se habla sobre los temas socioeconómicos. En este sentido los candidatos no explotan potenciales argumentos que pueden resultar de enorme interés de cara a la sociedad catalana y demostrar que además de las reivindicaciones políticas y territoriales cada uno tiene un proyecto político con fines sociales. También se ha observado que este discurso oscila según el curso de los acontecimientos.
  2. La diferencia entre el grupo de los temas destacados (politica en general) y el grupo de los temas menos tratados (socioeconómicos) nos hace pensar que los candidatos no están aprovechando toda la potencialidad de este medio. Parece ser que Twitter no representa para los ochos candidatos el medio más adecuado para difundir los tópicos principales de sus programas electorales siendo el medio más directo pero tal vez el que menos influencia mediática pudiera tener.
  3. Los ochos postulantes del 21D utilizan twitter como medio de difusión en forma de monólogo. Es decir, que entre los candidatos no hay menciones ni siquiera para dar respuesta a tuits que podrían estar en contra de los contenidos electorales  de uno u otro candidatos, a lo contrario que ocurre en los debates o tertulias que se realizan en otros medios.
  4. A la vista de estos resultados, consideramos que twitter se emplea como un medio informal que incorpora un gran componente emocional en la comunicación con los candidatos, llegando en ocasiones tratar temas polémicos y sensibles.

9. Limitaciones y Recomendaciones

Tal como se mencionó anteriormente, existen estudios que muestran resultados distintos y que estos vienen dados por un lado por las fuentes empleadas y por otro por la metodología utilizada. Sin embargo, creemos que la limitación más destacada de este trabajo está en la fuente. Es decir, Twitter proporciona una visión parcial de los temas y conceptos que los candidatos quieren o trasmiten a la sociedad en general. Para poder reducir potenciales biases, sería recomendado, cruzar datos con otras fuentes de información como por ejemplo los comunicados de los partidos políticos.

Desde el lado de las herramienta informática, es posible afirmar que cada software emplea su propios algoritmos y por tanto el análisis de los datos pueden dar resultados distintos. Aunque este punto podría representar una limitación importante en la interpretación de los datos, consideramos  que en nuestro caso la herramienta que hemos empleado es suficientemente transparente para poder conocer al método empleado y por tanto entender su funcionamiento. De esta forma, la interpretación de los resultado de los análisis incorpora un menor error.

Otro aspecto a considerar está en el número de tuits que se tienen que analizar. Cuanto más grande es el corpus de análisis tanto más lento se hace el proceso.  Esto hace que la herramienta necesite más tiempo para calcular y visualizar los datos en tiempo real.

 

*******

Estudio realizado en colaboración con Alessandro Comai, CEO de Miniera  (@minieraIC) y Mª Luz Congosto, investigadora en la UC3M (@congosto).