Covid, recuperate le prime sequenze del virus di Wuhan, cancellate misteriosamente

di Silvia Turin

Nuovi tasselli si aggiungono al rebus sull’origine del SARS-CoV-2: ricostruiti alcuni genomi presi da un archivio ambulatoriale dell’Universit� di Wuhan precedente al dicembre 2019 e in seguito fatto sparire dalla Rete. La conferma: il mercato ittico non � stato all’origine dell’epidemia

Un ricercatore di Seattle, Jesse Bloom, virologo presso il Fred Hutchinson Cancer Research Center, ha recuperato nei meandri di internet 13 sequenze del primissimo SARS-CoV-2 di Wuhan appartenenti a un set di oltre 200 campioni di virus dei primi casi di COVID-19 raccolti presso il Renmin Hospital di Wuhan, successivamente scomparsi da un database scientifico online.

Le scoperte sull’origine del virus

Dalle analisi fatte dal ricercatore sulle sequenze, emerge come i ceppi virali isolati al mercato ittico di Wuhan fossero successivi a quelli raccolti con tampone nasale dai pazienti ambulatoriali, il che suggerisce che il mercato ittico non sia stata l’origine dell’epidemia da COVID-19 (cosa che gi� era emersa in altre analisi, ma poi nuovamente confermata dall’indagine congiunta Oms-Cina), ma anche che i primissimi casi sono precedenti al dicembre 2019 e le sequenze analizzate addirittura in Paesi fuori dalla Cina (tra cui l’Italia) sono pi� vicine al progenitore-virus dei pipistrelli rispetto a quelle del �famoso� mercato ittico.

Gli interrogativi aperti

Il tema, gi� molto interessante dal punto di vista scientifico, apre a nuovi interrogativi sull’origine del virus (al di l� della provenienza o meno da un laboratorio, tema su cui il lavoro di Bloom non pu� far luce): perch� ci sono una serie di dati cos� importanti cancellati dalle banche dati disponibili a tutti gli scienziati? Perch� gli scienziati cinesi hanno deciso di cancellarli?
Sono domande ancora senza risposta, ma che si arricchiscono di alcuni particolari degni di una spy story.

Il percorso dello scienziato fino al Cloud

Partiamo dall’analisi pi� approfondita dello studio pubblicato da Jesse Bloom, un documento non ancora sottoposto a revisione paritaria o pubblicato su una rivista scientifica. Cercando all’interno del National Institutes of Health (NIH) Usa che contiene a sua volta il Sequence Read Archive (sito dove gli scienziati di tutto il mondo depositano dati di sequenziamento), Bloom ha notato un foglio di calcolo appartenente a uno studio cinese pubblicato a maggio 2020 sulla rivista PeerJ che conteneva le sequenze iniziali di SARS-CoV-2 a partire dal 31 marzo 2020. La maggior parte delle sequenze provenivano da un progetto di ricerca dell’Universit� di Wuhan chiamato PRJNA612766. Pensando di trovarle complete sul Sequence Read Archive, lo scienziato americano ha scoperto che erano state eliminate. Ha ricostruito che i dati cancellati corrispondevano a quelli presenti in uno studio che ha parzialmente sequenziato 45 campioni nasofaringei di pazienti ambulatoriali di Wuhan con sospetta COVID-19 nelle prime fasi dell’epidemia. Ha utilizzato delle funzioni di storage di Google Cloud per ritrovare i file ed � riuscito a recuperare 34 sequenze con le quali ha ricostruito le sequenze virali parziali di 13 di questi campioni.

Le 13 sequenze pi� antiche del primo genoma sequenziato

�Tutti concordano che gli antenati del SARS-CoV-2 siano i coronavirus dei pipistrelli — scrive Bloom analizzando le sue scoperte —. Pertanto, ci aspetteremmo che le prime sequenze siano pi� simili ai coronavirus dei pipistrelli e che queste, col passare del tempo (dato che il virus si evolve), diventino man mano pi� divergenti da questi antenati. Invece, i primi virus provenienti dal mercato ittico di Wuhan sono maggiormente diversi dai coronavirus dei pipistrelli rispetto ai virus raccolti successivamente in Cina e persino in altri Paesi del mondo�. I virus del mercato del pesce hanno tre mutazioni extra che mancano dai campioni SARS-CoV-2 raccolti settimane dopo. Le sequenze cancellate recuperate dal Cloud mancano di quelle mutazioni extra e sono pi� simili ai coronavirus dei pipistrelli rispetto ai virus del mercato del pesce.

I progenitori del virus e l’Italia

Analizzando le sequenze e �risalendo all’indietro� nella evoluzione dei ceppi di coronavirus, Bloom identifica due presunti progenitori pi� simili al coronavirus dei pipistrelli rispetto agli altri isolati virali. Uno � il capostipite di cui parla uno studio dell’Universit� di Temple che pone le origini del salto di specie alla fine di settembre 2019 e ricorda un frammento di proteina spike identico al ceppo Wuhan-Hu-1 (il primissimo isolato al mondo da un paziente cinese ammalatosi di polmonite a dicembre) trovato all’inizio di dicembre in Italia che �pu� solo confermare l’esistenza di un antenato comune prima del primo rilevamento del coronavirus in Cina�; l’altro � una sequenza che presenta tre mutazioni (C8782T, T28144C e C29095T) rispetto a Wuhan-Hu-1. Entrambi i progenitori suggeriscono che il SARS-CoV-2 circolasse a Wuhan prima dello scoppio di dicembre al mercato del pesce.

La cancellazione di oltre 200 sequenze cinesi

E veniamo alla storia della cancellazione dei dati e alle relative implicazioni: �Non c’� una ragione scientifica plausibile per la cancellazione dei dati — scrive Bloom nella sua relazione e conclude —, sembra probabile che le sequenze siano state cancellate per oscurare la loro esistenza�. Bloom ricorda che molti laboratori in Cina hanno ordinato di distruggere i primi campioni di Covid-19 e che un ordine del Consiglio di Stato cinese richiede a tutti gli scienziati l’approvazione centrale di tutte le pubblicazioni inerenti. Non � chiaro perch� queste informazioni siano scomparse. Gli scienziati possono richiedere l’eliminazione dei file in ogni momento, semplicemente inviando un’e-mail ai gestori dell’archivio. In questo caso la National Library of Medicine, che gestisce l’archivio in questione, ha dichiarato tramite una portavoce al New York Times che le 13 sequenze sono state rimosse la scorsa estate. La persona che ha richiesto la rimozione era la stessa che le aveva inserite e ha dichiarato ai gestori dell’archivio che le sequenze erano in fase di aggiornamento e sarebbero state aggiunte a un database diverso. La National Library of Medicine non ha fornito il nome di questa persona. Il dottor Bloom ha cercato in tutti i database di cui � a conoscenza e non ha ancora trovato le sequenze sparite, invece, tramite un anonimo su Twitter ha scoperto che �la menzione del progetto di sequenziamento in questione (PRJNA612766) � scomparsa anche dalla China National GeneBank (CNGB) poco dopo essere stata rimossa dal NIH-Sequence Read Archive�.

I campioni che ha esaminato l’Oms non sono rappresentativi

Sebbene le sequenze complete non siano pi� nell’archivio, le informazioni chiave sono ancora visibili da oltre un anno e contengono l’elenco delle singole mutazioni che i ricercatori di Wuhan hanno trovato nei loro test. Alcuni scienziati sono pertanto scettici sul fatto che ci sia qualcosa di sinistro dietro la rimozione delle sequenze: le informazioni sono rimaste, ma in un �formato difficile� da trovare, tanto che finora nessuno le aveva notate. �Non possiamo davvero dire perch� siano state rimosse — ha riconosciuto il dottor Bloom in un’intervista —, ma la conseguenza pratica della loro rimozione � stata che le persone non si sono accorte della loro esistenza�. Bloom insiste sul fatto che la sua ricerca dimostra che i primi campioni esaminati a Wuhan al centro della maggior parte degli studi (tra cui il rapporto congiunto OMS-Cina) non sono completamente rappresentativi dei virus effettivamente presenti a Wuhan in quel momento. Le ricerche devono proseguire, esorta Bloom e suggerisce �un’attenta rivalutazione di altri dati archiviati che potrebbero gettare ulteriore luce� sulle fasi precoci del virus. �Idealmente, dobbiamo cercare di trovare il maggior numero possibile di altre sequenze iniziali — ha dichiarato e ha concluso —. Penso che questo studio suggerisca che dovremmo cercare ovunque�. Le indagini potrebbero essere condotte a questo punto sorpassando la collaborazione cinese e partendo dalla Rete, dove, come si dice spesso, le notizie e i dati condivisi una volta rimangono �per sempre�, anche quando non sono pi� visibili.

24 giugno 2021 (modifica il 25 giugno 2021 | 00:10)

Più popolari

In evidenza

Cook

Cronache

Podcast

Dizionari

Opinioni

Economia

LOGIN: TECNOLOGIA E INNOVAZIONE

Spettacoli

Cook

Salute

Sport

Motori

Politica

Esteri

Cultura

Scuola

La27ora

Moda

Animali

Magazine

Video - Corriere TV

Meteo

Oroscopo

Covid, recuperate le prime sequenze del virus di Wuhan, cancellate misteriosamente

Le scoperte sull’origine del virus

Gli interrogativi aperti

Il percorso dello scienziato fino al Cloud

Le 13 sequenze pi� antiche del primo genoma sequenziato

I progenitori del virus e l’Italia

La cancellazione di oltre 200 sequenze cinesi

I campioni che ha esaminato l’Oms non sono rappresentativi

SCRIVI ALLA REDAZIONE

Corriere della Sera
può essere ancora più tuo

Per avere contenuti personalizzati, dai il tuo ok alla lettura
dei dati di navigazione.

Covid, recuperate le prime sequenze del virus di Wuhan, cancellate misteriosamente

Le scoperte sull’origine del virus

Gli interrogativi aperti

Il percorso dello scienziato fino al Cloud

Le 13 sequenze pi� antiche del primo genoma sequenziato

I progenitori del virus e l’Italia

La cancellazione di oltre 200 sequenze cinesi

I campioni che ha esaminato l’Oms non sono rappresentativi

Partecipa alla discussione