Sapere il giorno di pubblicazione di un post o una pagina web può essere utile in casi di contenzioso per violazione di copyright o perché magari abbiamo necessità di verificare una fonte per compilare una bibliografia che includa anche siti internet.
Esistono tre diverse tipologie di data per una pagina web
Innanzitutto, partiamo da un concetto fondamentale e cioè che una pagina web o un post può avere fino a tre diverse date di riferimento:
- la data di pubblicazione, cioè il giorno in cui l’autore ha pubblicato la pagina o il post sul blog;
- la data della scoperta, ovvero quella relativa al giorno in cui il crawler del motore di ricerca ha individuato la pagina;
- la data della cache, praticamente quella in cui è stata effettuata l’ultima scansione dal motore di ricerca. Ciò significa che una pagina o un post potrebbe aver subito modifiche da parte dell’amministratore del sito, ma il motore di ricerca non l’ha ancora scoperto.
Leggere la data nei metadati di un post
In molti casi è semplice individuare la data perché, se per esempio si tratta di un post del blog, potremmo visualizzarla nei metadati sotto il titolo. Teniamo presente, però, che in alcuni casi quella data potrebbe non essere la data di pubblicazione, ma quella di modifica o di aggiornamento.
Individuare quando è stata pubblicata una pagina web dall’URL
Nel caso fossimo interessati a un post di blog, una possibilità per scoprire la data di pubblicazione è osservare l’URL. WordPress, uno dei più diffusi CMS con cui vengono realizzati e gestiti i blog, per esempio prevede diverse modalità di generazione dei permalink, ovvero dei collegamenti permanenti ai quali corrispondo le rispettive pagine in maniera univoca. Quella di default prevede che nell’URL vi siano anno e mese:
https://miosito.com/2020/02/titolo-post
Naturalmente il discorso cambia se non si tratta di un post ma di una pagina, perché solitamente la data non è visibile, in quanto non viene riportata sotto il titolo.
Quindi i due metodi appena visti non ci sono di aiuto, ma possiamo provare a utilizzare uno dei metodi seguenti.
Controllare il codice sorgente per vedere se è riportata la data della pagina
Possiamo vedere il codice sorgente di una pagina cliccando con il tasto destro del mouse e selezionando l’apposito comando, oppure con la combinazione dei tasti sulla tastiera CRTL + U.
Una volta visualizzato la sorgente della pagina, tramite il comando CTRL + F possiamo cercare parole come:
- “date“
- “datePublished“
- “dateModified“
Così potremo individuare stringhe come queste:
"datePublished":"2020-01-01T07:20:15+00:00","dateModified":"2020-01-01T21:04:52+00:00"
Trovare la data di pubblicazione dell’articolo consultando la Sitemap XML del sito
Per trovare la data di pubblicazione di un post o una pagina web è possibile anche consultare la Sitemap XML del sito web.
Solitamente l’URL per accedere alla mappa del sito è:
miosito.it/sitemap.xml
Consultare l’Internet Archive per individuare la data di pubblicazione di una pagina web
L’archivio di internet raccoglie la cronologia della quasi totalità delle pagine web visibili e disponibili al pubblico, attraverso l’indicizzazione di un’istantanea.
Consultandolo non saremo certi che la data indicata sia quella effettiva di pubblicazione, ma potrebbe essere molto vicina ad essa.
Stabilire la data di creazione di una pagina web con l’operatore di ricerca inurl
Nel caso specifico, il motore di ricerca in questione è Google e la modalità per tentare di risalire alla data di una pagina o un post è effettuare una ricerca con l’operatore inurl.
Di seguito la sintassi di ricerca da utilizzare:
inurl:https://miosito.com/titolo-pagina/&as_qdr=y20
Nei risultati di ricerca potremo visualizzare la pagina relativa all’URL cercato insieme alla data.
La presenza del parametro as_qdr aggiunto come suffisso dell’URL consente di specificare la finestra temporale desiderata: nel nostro esempio abbiamo chiesto a Google di cercare la pagina web specificata tra tutte quelle che sono state indicizzate negli ultimi venti anni. Infatti, la lettera “y” è l’iniziale di years, che in inglese significa “anni”.
Se avessimo digitato as_qdr=m20 la richiesta a Google sarebbe stata relativa agli ultimi venti mesi (“m”: months, “mesi” in inglese).
Con as_qdr=d20 la ricerca avrebbe interessato gli ultimi venti giorni, poiché d” sta per days, ovvero “giorni” in inglese.