Este documento presenta 10 casos de estudio para identificar conversaciones de bots en Twitter. Brevemente describe cada caso, incluyendo ejemplos de cuentas y su comportamiento lingüístico, para ilustrar diferentes patrones que pueden indicar la presencia de un bot. Finalmente, resume los principales patrones que pueden usarse para detectar conversaciones bóticas.
5. El Banco Santander ganó 5.966
millones de euros en 2015, lo que
supone un aumento del 2,6% con
respecto a 2014
CONVERSACIÓN
EL PAÍS @el_pais
CATEGORÍA Medio Informativo Informativa
RASGOS LINGÜÍSTICOS
Se identifica conversación en 3ª persona con rasgos claramente informativos
6. Parece que hay problemas con el
wifi y los datos móviles de los
culés, no se lee a ninguno.
CONVERSACIÓN
Colmenero @Colmenero
CATEGORÍA Comentario de Tuitstars Irónica
RASGOS LINGÜÍSTICOS
Alto porcentaje de expresiones irónicas o de tuistars:
“Parece que”, “yo + gerundio”, “cuando + te + verbo tercera persona”, ...
7. ¡¡Enhorabuena por una final
épica!! #SeQuedaEnMadrid
CONVERSACIÓNCATEGORÍA Comentario de Empresas Empresarial
Heineken España @Heineken_ES
Banco Santander @bancosantander
EJEMPLO SERVICIO/PRODUCTO INTANGIBLE
EJEMPLO PRODUCTO
RASGOS LINGÜÍSTICOS
Uso de hashtags y campañas
RASGOS LINGÜÍSTICOS
Uso de comunicación coorporativa
positiva
#BancoSantander DIRSE se
adhiere a la Red de Cátedras
Santander de Responsabilidad
Social
8. La justicia española archiva
definitivamente el caso Humberto
Moreira. “no hay indicio para
vincularlo a los Zetas”
CONVERSACIÓNCATEGORÍA Persona u Espontáneo Personas
Carlos Quiónes @sabio28
EJEMPLO COMPARTIR OPINIÓN MEDIÁTICA
Que rica es la heineken, cuanto
tiempo sin tomarme una !!
Dr. Saturno @Edderdallacosta
EJEMPLO CONVERSACION ESPONTANEA
Ladrones, corruptos, peligro para
México La Justicia española archiva
definitivamente el caso Moreira
Carlos E. Rodriguez @gruporeyna
EJEMPLO OPINIÓN SESGADA POR MEDIO
RASGOS LINGÜÍSTICOS
Segmentar por rasgos transversales:
atención a cliente o experiencia
de producto, opinión+informativo,
sólo informativo
9. Erdogan afirma que las mujeres que no tienen hijos son "mit...
http://www.20minutos.es/noticia/2765122/0/erdogan-turquia-
mujeres-madre/ … | https://twibble.io
CONVERSACIÓNCATEGORÍA Bots Bots
Eloisa Cabrera @cabrelois
RASGOS LINGÜÍSTICOS
Semántica con estructuras repetidas.
Otros rasgos: Info demográfica, histórico, similar a otros usuarios
Los alérgicos, ante su particular 'vía crucis': el polen de... http://
www.20minutos.es/noticia/2763717/0/alergia-polen-graminea-
olivo-parietaria/ … | https://twibble.io
10. 1. Un usuario que:
• No piensa en su contenido
• No genera contenido original
• En ocasiones su comportamiento
es normal
¿Cómo definimos a un bot?
Entendemos por conversación
bótica toda aquella
conversación que no es
generada de manera natural
“
2. Su información:
• Puede ser relevante
• Debe analizarse por separado
15. Intención/informa
0% 20% 40% 60% 80% 100%
Obama
Persona relacionada
Cita declaración
Intención/anuncia
Lugar relacionado
Cita acción
Atributo
Eventos
Tema/Orden público
Federico J. Rodríguez
@tuitermann
#Tweets
259
Periodista. Redactor Jefe y Editor de programas
informativos de Fuengirola Televisión y Radio
(FTV) Antes: La Opinión de Málaga y Diario
Málaga Costa del Sol
#Retweets
0
#Tweets
259
~100% conversación es una noticia o similar
34. 0% 20% 40% 60% 80% 100%
vertele.com
formulatv.com
puromarketing.com
ift.tt
Mari Carmen Arranz
@MamenArranz
#Tweets
71
Periodista. Redactora de tv.
Buscando programa que me acoja :)
#Retweets
0
#Tweets
71
Distribución de
referencias a webs
38. Natalia Orozco KR
@nataliaorozcoro
#Tweets
69
Fans del mejor
@KEVINROLDAN
#Retweets
0
#Tweets
69
Al menos 10
cuentas de la
“misma persona”
NataliaOrozcokr
@nataorozco10
Fans del mejor @kevinroldan
@nataliaorozcoro @Nataorozcoro01 @nataorozcoro02 @Nataorozcoro03 @nataorozcoro04
@nataorozcoro05 @nataorozcoro06 @nataorozcoro07 @nataorozcoro09 @nataorozcoro08
@nataorozcoro10 @Natalia39467430 @Natha_KR @NathysKR @krmaniaca
NataliaOrozcoKr
@Nataorozcoro01
Amo la vida una mujer decidaMás de 10 cuentas
adicionales con el
mismo contenido
40. Eloisa Cabrera
@cabrelois
Cuando más obscuro está, es porque
ya no tarda en amanecer!!
● Patrones lingüísticos
● Referencia a medios
● Patrón temporal
Erdogan afirma que las mujeres que no tienen hijos son "mitad personas”
http://www.20minutos.es/noticia/2765122/0/erdogan-turquia-mujeres-madre/ …
| https://twibble.io
Los alérgicos, ante su particular 'vía crucis': el polen de gramíneas y olivos
está en su etapa álgida http://www.20minutos.es/noticia/2763717/0/alergia-
polen-graminea-olivo-parietaria/ … | https://twibble.io
Jorge Fernández ve tácticas de kale borroka "de cuando ETA asesinaba” en
Gràcia http://www.20minutos.es/noticia/2765058/0/jorge-fernandez-alerta-que-
gr-cia-hay-tacticas-kale-borroka-cuando-eta-asesinaba/ … | https://twibble.io
Nosotros proponemos el tema, tú mandas las fotos http://www.bbc.com/
mundo/video_fotos/2016/06/160603_finde_galeria_lectores_viajes_men … |
https://twibble.io
41. Yorline Nava
@yorlnav
El mundo necesita mucho
más amor de lo que crees,
vive en amor y con amor
#TransformaTuVida
Paula Figueroa
@gueropau
Mi mejor carta de
presentación es mi
sonrisa!!
Alejandra Torres
@alandtor
Sonríe, vale la pena
ser feliz!!!
Karen Sandoval
@karsandl
Cree que lo puedes
hacer y lo harás!!
Podemos propone prohibir Uber por atentar contra
los taxistas http://www.20minutos.es/noticia/
2762963/0/podemos-propone-prohibir-uber/
42. ¿Cómo detectar un bot?
● Patrones semánticos
● Patrones sintácticos
● Patrones temporales
● Mismos fuentes/links
● Trolls en grupo
● Fan Bots
● Nombres o descripciones
“bóticos”