Fake Accounts Instagram

Author

Antonio Cañete Baena

Published

May 24, 2024

Introducción

Este book recoge el proyecto realizado en la asignatura de Laboratorio de Computación Científica de la Universidad de Málaga.

El objetivo de este proyecto es el análisis de un dataset de la plataforma Kaggle para extraer el máximo conocimiento posible usando las técnicas vistas durante la asignatura.

1. DataSet:

El dataset que vamos a utilizar se llama ‘Instagram fake spammer genuine accounts’, obtenido de la web de Kaggle. Este dataset se compone de diferentes cuentas de Instagram, tanto de spammers como de usuarios genuinos.

Dicho dataset está formado por dos archivos, por un lado, test.csv, un set de 120 entradas, 60 de cuentas genuinas y 60 de cuentas de spammer. Y por otro lado, otro archivo train.csv, formado por 576 entradas, donde al igual que en el archivo anterior, la mitad son cuentas genuinas y la otra mitad son spammers.

Spammer

El «spam» es cualquier comunicación no solicitada enviada en masa.El «spamming» (que en español podría traducirse como «espamear») es el acto de enviar estos mensajes. Y la persona que envía los mensajes es un «spammer».

Enlace al DataSet