¿Qué es el “scraping”?, el motivo por el que Elon Musk le puso límites a Twitter
Twitter introdujo límites a la visualización de tuits para hacer frente a los niveles extremos de “scraping” o extracción de datos, reafirmó Elon Musk, en respuesta a un tuit que decía que la compañía de redes sociales había presentado una demanda contra cuatro entidades en Texas por “scraping” de datos.
El scraping o raspado de datos se ha vuelto muy común con el crecimiento de la Inteligencia Artificial, consiste en extraer contenido de las redes sociales para alimentar a las bases de datos. En muchos casos se ha convertido en la herramienta esencial para la recopilación de datos en línea, especialmente para los que necesitan manejar un gran caudal de información proveniente de múltiples fuentes.
El temor de los dueños de las grandes empresas tecnológicas es el uso malintencionado de esos datos. Los delincuentes cibernéticos pueden utilizar esta herramienta para recolectar automáticamente información personal que luego puede ser vendida o intercambiada en foros de la Deep Web o la Dark Web. Por ejemplo, en un caso reciente, los delincuentes lograron recopilar y almacenar datos de registro de clientes de una gran tienda.
El “scraping” es una técnica mediante la cual un programa informático extrae datos del resultado generado por otro programa con el fin de recopilar información a través de un algoritmo.
“Varias entidades intentaron hacer ‘scraping’ de todos los tuits que se han hecho en un corto periodo de tiempo. Por eso tuvimos que poner límites”, dijo Elon Musk. Sin embargo, el propietario de Twitter no confirmó, ni negó, que se hubiera presentado una demanda.
Musk ya había culpado anteriormente al “scraping” de datos de su decisión de limitar el número de tuits diarios que pueden leer varias cuentas.
Twitter ha dicho que sólo un pequeño porcentaje de las personas que utilizan la plataforma se han visto afectadas por los límites.
“Para garantizar la autenticidad de nuestra base de usuarios debemos tomar medidas extremas para eliminar el ‘spam’ y los ‘bots’ de nuestra plataforma”, dijo la compañía en su blog la semana pasada.