From the blog

COVID-19: Cum se pot testa toți românii cu doar 200.000 de teste?

October 23, 2020 News

Află cum matematica, mai precis statistica, poate reduce semnificativ numărul necesar de teste.

România a cheltuit până acum peste 400 de milioane de lei pentru aproximativ 3.2 milioane de teste pentru diagnosticarea COVID-19. 

Cea mai comună și eficientă metodă de testare utilizează reacția de polimerizare în lanț, pe scurt PCR, pentru a identifica prezența ARN-ului viral în probele preluate de la pacienții suspecți. Eficiența acestui test este aproape de 100% în cazurile în care sunt respectate cu strictețe toate protocoalele. 

Cu toate acestea costul ridicat si timpul necesar efectuării testului PCR sunt o piedică importantă când vine vorba de diagnosticarea si tratarea în timp util a tuturor celor infectați cu acest virus.

În acest articol propunem o serie de metode statistice care dacă sunt adoptate de către statul român oferă două oportunități ce pot fi decisive pentru încheierea pandemiei:

  1. Reducerea drastică a cheltuielilor necesare pentru a testa pe toți cei suspecți de COVID. 
  2. Posibilitatea de a testa întreaga populație în cadrul unei singure săptămâni și de a izola pe toți cei care sunt infectați cu SARS-CoV-2, punând capăt pandemiei într-un timp foarte scurt. 

Despre PCR

O reacție PCR este formată din n cicluri( între 25 și 40), în fiecare ciclu fiind parcurse 3 etape principale: 

  •  denaturarea termică a matriței, adica desfacerea dublului helix ADN
  •  atașarea primerilor de secvența de ADN pe care vrem să o replicăm
  •  polimerizarea propriu-zisă, unde acizii nucleici se atașează în continuarea primerilor pentru a crea o replică a ADN-ului original

La terminarea unui ciclu de replicare, cantitatea de ADN rezultată este dublă față de cea inițială. Această amplificare are ca rol detectarea cu ușurință a unei secvențe de ADN într-o soluție. În cazul COVID-19 secvența ce se dorește detectată este ARN-ul din componența SARS-CoV-2.

Cea mai simplă metodă statistică de a reduce numărul necesar de teste.

Prima observație este aceea că numărul de persoane care au COVID-19 este mult mai mic decât numărul total de persoane din România. Chiar și în plină pandemie, în judțele cele mai afectate rata de infectare este în jur de 5 la 1000 de locuitori. Din punct de vedere statistic dacă e să alegi o persoană la întâmplare, probabilitatea ca această să nu fie infectată cu SARS-CoV-2 este de p=0.005.

Să presupunem că N = 100 de persoane dintr-o localitate unde rata de infectare este 5 la 1000 trebuie testate. Probabilitatea ca cel puțin o persoană să aibă coronavirus este de:

Acest lucru înseamnă că dacă am amesteca probele provenite de la 100 de persoane și am testa compozitia, în peste 60% din cazuri testul ar ieși negativ. Inițial pare nebunesc să amestecăm probele de la 100 de persoane, dar statistica ne spunem că dacă facem asta, în 60.6% din cazuri putem diagnostica 100 de persoane cu un singur test. În acest scenariu eficiența crește de 100 de ori, adica cu 10.000%

Ce facem totuși în situația în care testul iese pozitiv? O soluție simplă ar fi să testăm individual cele 100 de persoane. Chiar dacă în acest caz am irosit un test, raportul dintre 101 și 100 de teste ne indică o pierdere a eficienței de doar 1%. Pare un compromis bun considerând perspectiva în care testul iese negativ.

Coeficientul de reducere a numărului de teste necesar este raportul dintre numărul de teste folosind metoda tradițională, N, și numărul de teste necesar după aplicarea metodei propuse, N’ :

Observăm că din punct de vedere statistic e nevoie de un număr de 2.47 ori mai mic de teste pentru a testa același număr de oameni. 

Putem mai bine de atât?

Un coeficient de aproape 2.5 e destul de impresionant având în vedere ca se pot economisi aproximativ 250 de milioane de lei folosind o metodă atât de simplă, dar sigur putem mai bine de atât. Cum?

În primul rând numărul de 100 de teste pe care l-am ales ca dimensiunea a grupului pare destul de aleator, și într-o măsură așa este. Putem afla mărimea ideală a grupurilor în care să împărțim pacienții dacă găsim o metodă prin care probabilitate ca un grup să fie pozitiv sau negativ se apropie cât mai mult de 50%.

Dacă reprezentăm grafic C în funcție de N (roșu) și derivata în funcție de N a acestuia (albastru), putem observa că valoarea maximă e între 14 și 16. Pentru că N trebuie să fie un număr întreg alegem dimensiunea grupului de 15.

Pentru dimensiunea grupului de 15, coeficientul C este:

Observăm că metoda noastră simplă poate fi eficientizată condsiderabil dacă alegem o dimensiunea a grupului relevantă pentru situția existentă.

Cum putem îmbunății metoda și mai mult?

Putem observa că deși alegem o dimensiune ideală a grupului in funție de incidența bolii, pare o irosire să testăm individual pe toți din acel grup în cazul în care primul test e pozitiv. Deși știm cu siguranță că cel puțin unul dintre cei din acel grup este infectat, probabilitatea să existe un al doilea e relativ mică:

Ideea este ca în loc să testăm toți pacienții, să aplicăm o testare tip matrice în care pacienții sunt așezați aleator pe A rânduri și B coloane astfel încât A*B = N. O să vedem că ideal ar fi ca A și B să fie cât mai aproape de rădăcină pătrată din N. O să fie testate soluțiile formate din amestecarea probelor pe fiecare rând și coloană, rezultând într-un număr A +B  de teste în loc de A*B ca în cazul în care am testa toți pacienții. Dacă în acel grup se află doar un pacient infectat cu SARS-CoV-2, atunci vom putea extrapola direct coordonatele acelui pacient pe matrice:

În cazul în care vom avea k cazuri, unde k este mai mare ca 2, va fi nevoie de un număr maxim de teste egal cu minimul dintre k la pătrat și N. 

Dacă 2 cazuri se află pe același rând sau coloană numărul necesar de teste poate fi mai mic, dar să presupunem că suntem ghinioniști. Considerânt toate acestea putem calcula numărul așteptat de teste care trebuie efectuate pentru un număr N de pacienți.

Acum, dacă introducem valoarea așteptată pentru N în expresia coeficientului C obținem următoarea expresie:

Aceeași metoda se poate utiliza pentru o matrice 3D în loc de una 2D.

Simulări numerice  

Problema devine intractabilă din punct de vedere analitic, dar din fericire exista metode numerice pentru a determina coeficientul maxim in functie de probabilitatea p și dimensiunea grupului N. Am utilizat limbajul de programare Python pentru a calcula numeric coeficientul maxim C și dimensiunea grupului N. Mai mult decât atât am comparat rezultatele cu limita teoretică dată de 

Iată câteva dintre rezultate:

Rata de infectare: 0.0005
Coeficientul maxim:  79.4

Rata de infectare:  0.001
Coeficientul maxim: 47.8

Rata de infectare:  0.002
Coeficientul maxim:  28.7

Rata de infectare: 0.005
Coeficientul maxim: 14.6

Rata de infectare: 0.01
Coeficientul maxim: 8.8

Concluzii

Folosind metode statistice se poate reduce drastic numărul de teste și implicit economisi sute de milioane de lei. 

Adevărata eficiență a metodei este pusă în valoare în contextul unei testări în masă. Această idee de a testa toată populația unei țări sau a unei zone a fost discutată de mai multe state printre care Slovacia și UK unde s-a implementat o testare masiva la nivel de populație, respectiv la nivel de circumscripție. O metodă eficientă de ținere în control a virusului ar fi testarea repetată la intervale fixe a întregii populații până la înăbușirea pandemiei.

În testarea pe bază de simptom, rata de infectare este mult mai mare, dar până și la o rată de 10% se pot folosi metode statistice care reduc numărul necesar de teste. 

O critică adusă des metodelor de testare statistice este secvențierea testării în mai multe etapeMetoda propusă de noi are o secvențiere foarte redusă, de 1, 2 sau 3 etape, în funcție de rezultat. Iar probabilitatea ca să fie necesară o singură etapă este mai mare decât probabilitatea să fie necesare 2, aceasta fiind la rândul ei mult mai mare decât probabilitatea ca experimentul să necesite 3.

Pentru o rată de infectare de 0.5 la mie, adică în fazele incipiente pandemiei se poate testa toată populația României cu aproximativ 210.000 de teste economisind aproximativ 2 miliarde de lei. Sau la aceeași rată cheltuind cât a cheltuit până acum România ar fi putut testa toată populația de nu mai puțin de 15 ori.

Chiar și la o rată de 5 la mie valoare regăsită în jurul maximului pandemiei, metoda noastră reduce numărul necesar de teste de 14.6 ori, suficient pentru a testa populația României de 3 ori cu același număr de teste efectuat până acum.

Share with your friends

Leave a Reply

Your email address will not be published. Required fields are marked *

subscribe to synaptiq

Newsletter

By subscribing to our newsletter, you provide us your personal data. We will use your personal data (e-mail address) only with the purpose of keeping in touch and sending updates about our product. You may unsubscribe at any time. By joining our newsletter you acknowledge that your personal data will be processed as stated in the Privacy Policy.