Se puede detectar el paro en función de los datos de Twitter?

El trabajo que he seleccionado para la realización de este ejercicio es la conferencia de Esteban Moro Egido “Las huellas del paro en Twitter”. La conferencia se tuvo lugar el 16 de junio del 2016 en CA Madrid en el contexto de las III Jornadas de Ciberpolítica.

  


Esteban Moro Egido inicia su conferencia diciendo que continuamente realizamos actos en Internet que dejan inevitablemente una huella digital permanente. Cuando utilizamos la tarjeta de crédito o interactuamos en las redes sociales dejan un rastro de lo que compramos, donde estamos, que pensamos, que horarios tenemos. A partir de como utilizamos las redes sociales y distintas aplicaciones mediante algoritmos se puede inferir información tan variada como la situación laboral, económica, los intereses que tenemos… En definitiva pueden conocer cual es nuestro estilo de vida. El valor de la información o la huella que dejamos en la nube viene de su repetición. La información casual no genera conocimiento pero cuando las huellas que dejamos se repiten día a día se puede obtener información significativa.

Moro Egido afirma que a partir de los datos de twitter, sobre todo con los datos geolocalizados, se puede estudiar como se relacionas las personas entre ellas. Se puede conocer la hora en la que se levanta alguien o incluso si ese alguien tiene niños o no. Se pueden detectar opiniones políticas. Es conocido el uso que los departamentos de recursos humanos hacen de las redes sociales para discriminar candidatos. El uso, sin embargo, se está extendiendo a otros aspectos como estudios de movilidad, admisión de créditos,...

Como ejemplo el ponente menciona que en España hay 7,8 millones de personas que tienen una cuenta de Twitter y el tiempo promedio diario que cada usuario invierte en él es de 1,54 horas. En todo este tiempo la población española deja o comparte mucha información en Twitter que se utiliza con distintos fines.

Los investigadores del equipo de Moro han estudiado si el paro deja alguna traza característica en Twitter. Para ello han estudiado distintas cuestiones:

Por un lado han estudiado cuales son los flujos que las personas realizan diariamente y han detectado lo que el equipo a denominado las áreas funcionales de España. Estas áreas son lugares donde mayoritariamente se relacionan las personas. Se han dado cuenta que estas áreas funcionales se asemejan a las comarcas.

Se han dado cuenta que PIB y la penetración de Twitter tienen una correlación fuerte, es decir, el las áreas de mayor PIB hay mas usuarios de Twitter.

También han podido comprobar que los usuarios de Twitter que tienen mas contactos fuera de una determinada área funcional tienen mas facilidad de encontrar trabajo por lo que las personas con contactos diversos tienen una tasa de paro menor.

Han inferido, también, el nivel de estudios de cada usuario de Twitter en función de los fallos ortográficos que se realizan al escribir los twits. Han comprobado que hay una correlación muy fuerte entre los usuarios que cometen fallos ortográficos y los que están desempleados.

Se han dado cuenta que mediante sus estimaciones detectan menos paro de lo que las estadísticas oficiales presentan. Además esta diferencia es mayor en las zonas donde la economía sumergida tiene mas peso.

Moro Egea reivindica la validez de este tipo de estudios para realizar estudios poblacionales en países donde no existen institutos nacionales de estadística o no hay recursos parea realizar este tipo estudios.

Como reflexión personal diría que con información, supuestamente inocente , que compartimos por las redes sociales y con los medios adecuados se puede conseguir información relevante y significativa si personal como poblacional. Teniendo en cuenta que las redes sociales son empresas que su mayor objetivo es hacer dinero me provoca bastante miedo lo que podrían hacer y seguro que lo están haciendo con nuestra información.



Comentarios

Entradas populares de este blog

Ciencia: ¿de lo general a lo particular, o viceversa?

Inteligencia artificial: evolución continua

Los Algoritmos de Google