antonellocamilotto.com
I recenti data leak che hanno interessato piattaforme come LinkedIn, Facebook e (a meno di smentite) Clubhouse, hanno acceso il dibattito sulla pratica del web scraping e sui potenziali effetti a danno delle aziende vittime di questa pratica quando i loro dati sono utilizzati violando i termini di utilizzo delle piattaforme.
Utilizzi legali e illegali del web scraping
Va detto subito che l’attività di web scraping non è una pratica illegale, molte aziende utilizzano questa tecnica per la raccolta di informazioni con finalità lecite.
Pensiamo, ad esempio, agli spider utilizzati dai motori di ricerca che analizzano il contenuto dei siti per classificarli, oppure ai numerosi comparatori di prezzo disponibili online e ancora alle attività di marketing che usano questa metodica per scandagliare la rete e collezionare informazioni da forum e social media inerenti specifiche tematiche per analizzarne aspetti quali il sentimento degli utenti online.
Ovviamente il web scraping può essere utilizzato anche per scopi illegali quali la raccolta di contenuti protetti da copyright e successivo utilizzo per finalità non autorizzate.
Ci sono poi utilizzi di quei dati, successivi allo scraping, che violano la privacy (come detto dal nostro stesso Garante).
Esistono numerosi software online per l’attività di web scraping: si distinguono non solo per la capacità di “raccolta” (o raschiamento delle informazioni), ma anche per la loro abilità nel ricostruire i contenuti in formati e strutture che possono essere facilmente elaborate da sistemi di terze parti per le più disparate finalità.
Troviamo, quindi, bot in grado di scandagliare servizi ospitati nella rete, così come scraper in grado di estrarre le informazioni da Application Programming Interface (API) messe a disposizione dai servizi web.
Alcuni bot impiegati in attività illecite cercano di mascherare le proprie operazioni, simulando traffico legittimo attraverso la creazione di falsi user-agent tipicamente associati a noti browser o applicazioni commerciali diffuse.
Molto spesso, dietro un’attività di web scraping si nascondono organizzazioni che gestiscono botnet di notevoli dimensioni le cui macchine zombie sono distribuite in tutto il mondo.
La disponibilità di botnet di grandi dimensioni è un’arma potente nelle mani di coloro che vogliono effettuare attività di web scraping, sia per la capacità di raccolta dati sia per l’abilità di evadere sistemi a protezione dei siti presi di mira.
Come difendersi dal furto di dati online
Per fortuna, ci sono anche aziende che offrono servizi a difesa del web scraping: si tratta di società specializzate nell’analisi del traffico e nella valutazione di parametri che ne attestano la qualità.
© ๐ฏ๐ ๐๐ป๐๐ผ๐ป๐ฒ๐น๐น๐ผ ๐๐ฎ๐บ๐ถ๐น๐ผ๐๐๐ผ
Tutti i diritti riservati | All rights reserved
๏ปฟ
Informazioni Legali
I testi, le informazioni e gli altri dati pubblicati in questo sito nonché i link ad altri siti presenti sul web hanno esclusivamente scopo informativo e non assumono alcun carattere di ufficialità.
Non si assume alcuna responsabilità per eventuali errori od omissioni di qualsiasi tipo e per qualunque tipo di danno diretto, indiretto o accidentale derivante dalla lettura o dall'impiego delle informazioni pubblicate, o di qualsiasi forma di contenuto presente nel sito o per l'accesso o l'uso del materiale contenuto in altri siti.
antonellocamilotto.com
web agency and content creator
© Copyright 1996-2025 Antonello Camilotto
Tutti i diritti riservati | All rights reserved
P.Iva 01759920695
web design and development by
antonellocamilotto.com