L’ arte della copia ai tempi del web (seconda parte)

Content grabbing

Se l’attività di copia da siti web riguarda contenuti testuali piuttosto che dati strutturati si parla più comunemente di content grabbing: interi articoli o testi di vario genere vengono copiati in maniera lecita o illecita da altri siti per vari possibili scopi. Il più comune è alimentare i propri siti senza faticare a scrivere di persona i contenuti: è abbastanza diffuso il malcostume di creare blog, news feed e siti tematici semplicemente copiando i contenuti altrui.

In questo modo si diffondono ad es. le fake news e i contenuti dai titoli sensazionali, che hanno come scopo quello di aumentare le visite a un sito per generare rendite pubblicitarie oppure, nei casi peggiori, di spingere l’utente a cliccare link verso siti che hanno intenti illeciti (il cosiddetto clickbait).

Quando si parla di copiare testi altrui si entra nelle problematiche legate al plagio(1). Il problema è molto sentito nelle pubblicazioni scientifiche e, soprattutto, nell’educazione scolastica in paesi come gli Stati Uniti. Si dice che la maggior parte degli studenti superiori statunitensi ricorra al plagio per svolgere i temi assegnati negli esami(2). Forse questo è vero anche per gli italiani (vedi caso Madia(3)), ma è sicuramente più facile negli Stati Uniti visto che la stragrande maggioranza dei contenuti internet è in lingua inglese.

Strumenti e metodi

Il content grabbing si fa spesso in modo manuale e non automatico, perché si cercano contenuti specifici da inserire in modo mirato in qualche contesto diverso dall’originale. Anche in questo caso, esiste un mercato di manodopera a basso prezzo per svolgere questo compito, ma si è creato comunque spazio per lo sviluppo di tecnologie, prodotti e servizi specializzati.

La parte del leone lo fanno i servizi online per la rilevazione dei plagi, che sono in grado di analizzare testi e ricercarne su internet o su proprie basi dati la corrispondenza totale o parziale con altri documenti. Alcuni dei più importanti sono Turnitin (usato in ambito scolastico US),  Ithenticate (in ambito editoriale) e lo svedese Urkund, ma ne esistono un gran numero, anche gratuiti, che si basano per la maggior parte sui motori di ricerca usuali (ad es. Quetext e Grammarly).

E allora, come si difendono i plagiari da questi servizi anti-plagio? Come copiare senza essere beccati con le mani nella marmellata? Se il contenuto è in lingua inglese, non c’è problema: possono usare un trasformatore di testo come WordAIArticle Rewriter, Spinbot o Paraphrasing Tool. Si tratta di strumenti che rimpiazzano con sinonimi tutte le parole che possono essere sostituite, con un risultato stilisticamente criticabile ma probabilmente sufficiente a sfuggire ai motori anti-plagio.  Non riuscirebbero però a ingannare un revisore umano che avesse modo di confrontare il testo originale con la copia.

Se si tratta di testi in una lingua diversa dall’inglese, non mi risultano ci siano strumenti di supporto decenti e penso che questo sia un bene. Se proprio si vuole, si può pagare un servizio di riscrittura (come ad es. 11marketing.it).

La copia di immagini

Sarà capitato a molti di noi di copiare un’immagine, un’icona o una fotografia da internet per usarla in una mail, come propria immagine del profilo, per una presentazione o un documento.  Le stesse immagini usate nella “copertina” di questi articoli sono prelevate da internet senza preoccuparsi di chiedere l’autorizzazione agli autori e quindi saranno rimpiazzate nel momento in cui questi stessi articoli dovessero essere resi di dominio pubblico.

Si tratta in effetti del caso più comune di copia non autorizzata e preoccupa soprattutto coloro che per mestiere producono immagini, cioè fotografi, grafici e creativi in genere(4). Non è un campo in cui sono molto ferrato, per cui mi limito a segnalare che esistono mezzi per “marcare” le immagini in modo che sia più difficile utilizzarle senza autorizzazione e sia più facile rilevarne le copie non autorizzate. I due metodi principali sono il watermarking (vedi ad es. questo => articolo) e il digital watermarking, metodo di inclusione di informazioni in modo invisibile all’utente, utilizzando la tolleranza al “rumore” delle codifiche fotografiche, audio e video (vedi  ad es. l’argomento su wikipedia e i prodotti Digimark).

Per i nostri bisogni di ottenere immagini in modo legittimo, esistono comunque un gran numero di “archivi” fotografici (per la maggior parte a pagamento) contenenti centinaia di milioni di immagini (vedi lista dei più importanti in questa pagina di wikipedia). Non si può poi non citare Wikimedia Commons, che contiene circa 38 milioni di immagini caricate dagli utenti e in gran parte usabili senza particolari vincoli.

Per chi volesse controllare l’utilizzo di una determinata immagine in pagine internet, ad es. per controlli antiplagio, sono fondamentali il motore di ricerca immagini di google (sapete certamente che si possono cercare le immagini simili ad una data immagine semplicemente caricandola in images.google.com) e altri strumenti come TinEye e CopyTrack.

Conclusioni

In fondo non c’è nulla di nuovo sotto il sole: come spiega il dettagliato articolo di wikipedia sul Cut, Copy and paste, tutto è cominciato con un paio di forbici e della colla; poi nel 1983 è intervenuta l’Apple introducendo le combinazioni di tasti cmd-C e cmd-V; da lì in poi non ci siamo più fermati.

 

Note e riferimenti

(1) una breve spiegazione del tema si può trovare qui: http://www.marchiebrevettiweb.it/angolo-del-professionista/2660-plagio-di-immagini-e-contenuti-web-strumenti-di-tutela.html

(2) http://www.plagiarism.org/resources/facts-and-stats/

(3) http://www.ilfattoquotidiano.it/premium/articoli/madia-dottorato-con-4-mila-parole-copiate-nella-tesi/

(4) http://www.fotografiaprofessionale.it/il-plagio-e-il-furto-in-fotografia-come-difendersi-13

2 commenti
  1. fra.editor
    fra.editor dice:

    Aggiungo alcuni strumenti che sicuramente molti di voi conosceranno per la ricerca di immagini libere da qualsiasi licenza (utilizzabili senza alcun tipo di licenza, per scopi commerciali e non):
    • Google Immagini –> Strumenti –> Diritti di utilizzo –> contrassegnate per essere riutilizzate
    • Unsplash –> https://unsplash.com
    • Gratisography –> http://gratisography.com
    • Pixabay –> https://pixabay.com
    • Pexels –> https://www.pexels.com (il più completo secondo me)
    • FFCU –> http://freeforcommercialuse.net
    • Raumrot –> http://raumrot.com

    Rispondi
  2. Andrea
    Andrea dice:

    Interessante approfondimento sul tema.
    Il confine tra “citazione delle fonti”, “ispirazione” e plagio, è sempre stato sottile e oggetto di accesi dibattiti. Ma rimanendo nella sfera del web, fatto di un interminabile flusso di coscienza autoreferenziale, sempre alimentato da “re-Tweet” , condivisioni virali, meme e altri fenomeni partoriti dalla rete, mi chiedo se l’attribuzione di originalità possa restituire un vero valore qualitativo ad un contenuto o se quel valore non venga generato proprio dal suo grado di “condivisibilità” o dalla possibilità di poterlo rimaneggiare, smembrare, ricomporre e, infine, plagiare e ripubblicare (qualcuno l’ha definita “imitazione creativa”). Personalmente non condivido questa interpretazione. E’ vero, come sosteneva Einstein, che l’originalità è l’arte di nasconere le proprie fonti, ma credo anche che la rete abbia dato a tutti (a molti!) la possibilità di poter manifestare pensieri, competenze, idee. Un’opportunità troppo grande per sprecarla col copia e incolla.

    Io per i miei articoli utilizzo:
    http://www.copyscape.com/
    http://www.copygator.com/
    https://www.duplichecker.com/

    Rispondi

Lascia un Commento

Vuoi partecipare alla discussione?
Fornisci il tuo contributo!

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *