Breaking News:

latest

DỊCH BỆNH LÀ NHỮNG CON SỐ 𝟏𝟒, 𝟏.𝟒, 𝟏𝟐𝟔,𝟎𝟎𝟎

DỊCH BỆNH LÀ NHỮNG CON SỐ   𝟏𝟒 , 𝟏 . 𝟒 , 𝟏𝟐𝟔𝟎𝟎𝟎𝟎   Trên phương diện khoa học, dịch bệnh là vấn đề của con số. Và, phải nói l...


DỊCH BỆNH LÀ NHỮNG CON SỐ  𝟏𝟒, 𝟏.𝟒, 𝟏𝟐𝟔𝟎𝟎𝟎𝟎 
Trên phương diện khoa học, dịch bệnh là vấn đề của con số. Và, phải nói là chưa bao giờ những con số có vai trò rất quan trọng trong việc hoạch định chánh sách và ảnh hưởng đến hàng tỉ người trên thế giới như hiện nay. Đó là những con số như 14 ngày cách li, là hệ số lây lan 1.4 - 2.5, là con số 126000 ca tử vong làm cư dân mạng Việt Nam giật mình. Vậy đằng sau những con số này là gì, xuất phát từ đâu, đúng hay sai? Cái note này cố gắng giải thích để các bạn nào quan tâm hiểu hơn, coi như là một thể thao tâm trí vậy.
𝐂𝐨𝐧 số𝟏𝟒
Trước hết là con số 14. Đó là 14 ngày cách li. Hầu hết các quốc gia trên thế giới đều áp dụng làm thời gian cần thiết để cách li hành khách trở về nước từ nước ngoài, hay những người có nguy cơ lây nhiễm virus Vũ Hán (mà TT Trump nay gọi là 'Chinese virus', mà tôi nghĩ đáng lí ra là 'China virus'). Con số 14 ngày là thời gian ủ bệnh (hay 'incubation period' trong thuật ngữ dịch tễ học). Thời gian ủ bệnh tính từ lúc bị nhiễm virus đến lúc có triệu chứng như sốt, ho, đau cơ.
Con số 14 đến từ đâu? Lúc ban đầu khi dịch mới khởi phát, các nhà dịch tễ học quan sát rằng thời gian ủ bệnh của một số bệnh nhân Vũ Hán là dao động từ 2 đến 7 ngày, nhưng vài trường hợp thì lên đến 14 ngày. Vậy là các giới chức y tế lập tức dùng con số 14 như là giới hạn cao nhứt để cách li bệnh nhân hay người nghi/có nguy cơ cao.
Nhưng khi dữ liệu được thu thập đầy đủ hơn thì thời gian ủ bệnh hơi khác một chút. Chẳng hạn như công trình nghiên cứu công bố trên 177 bệnh nhân (tập san Ann Int Med, 10/3/2020 [1]) cho thấy thời gian ủ bệnh trung bình (trung vị) là 5.1 ngày, với 95% ca dao động từ 4.5 đến 5.8 ngày. Tuy nhiên, triệu chứng bắt đầu trong vòng 11.5 ngày sau khi nhiễm, với khoảng tin cậy 95% dao động từ 8.2 đến 15.6 ngày [1].
Do đó, nếu dựa vào chứng cớ này thì đáng lí ra thời gian cách li phải là 16 ngày. Thế nhưng, hầu hết các giới chức y tế trên thế giới đều dùng con số 14 ngày -- đúng 2 tuần. Lí do là họ phải ra quyết định trong lúc dữ liệu chưa đầy đủ, chớ không thể chờ đến cả tháng sau mới biết con số chính xác là bao nhiêu. Đó là bài học thứ nhứt.
𝐂𝐨𝐧 số 𝟏.𝟒 - 𝟐.𝟓
Trong dịch bệnh, hệ số lây lan rất quan trọng trong việc hoạch định chánh sách. Hệ số này còn có tên tiếng Anh là 'basic reproduction ratio' và theo qui ước thì kí hiệu là R0. Một cách ngắn gọn và cụ thể, nếu trận dịch có R0 = 2 có nghĩa là, tính trung bình, 1 người bị nhiễm có thể lây cho 2 người khác trong cộng đồng chưa bị nhiễm trước đây. Từ đó, chúng ta có thể suy đoán rằng khi R0 cao hơn 1 có nghĩa là dịch vẫn còn lan truyền, nhưng khi R0 thấp hơn 1 có nghĩa là dịch bệnh đang suy giảm. Tuy ý nghĩa đơn giản như vậy, nhưng những tính toán đằng sau thì không hề đơn giản. Không đơn giản là vì để ước tính chỉ số R0 đòi hỏi phải có nhiều dữ liệu quan sát, và phẩm chất dữ liệu phải tốt. Nhưng dữ liệu dịch tễ thì thường thu thập trong môi trường cộng đồng, nên độ chính xác thường không cao như thu thập trong môi trường thí nghiệm có kiểm soát. Thành ra, tất cả các chỉ số R0 chỉ mang tính ước lệ và xấp xỉ.
Có lẽ tôi là người đầu tiên trong cộng đồng Việt đề cập đến hệ số này vào ngày 31/1/2020. Lúc đó thấy mọi người hoang mang về vấn đề bộc phát của dịch, nên tôi cố tìm trong y văn thì thấy hệ số này được báo cáo rất sơ khởi là từ 1.4 đến 2.5. Nguồn gốc của nó là từ WHO được ước tính từ các dịch SARS và MERS. Lúc đó, tôi viết "Qua những con số trên đây chúng ta có thể thấy dịch Vũ Hán là đáng quan tâm, nhưng không quá nguy hiểm so với các trận dịch trước đây như SARS-CoV và MERS-CoV. Tuy nhiên, diễn biến trong tương lai thì khó biết, vì phải chờ thêm dữ liệu." Câu đó đến nay có phần đúng nhưng cũng có phần sai.
Cho đến nay, hệ số lây lan R0 được nhiều người ước tính, và kết quả hơi khác với WHO. Chẳng hạn như một bài báo công bố trên Int J Infect Dis (22/2/2020), các tác giả Tàu dựa vào dữ liệu thực tế ước tính rằng R0 dao động từ 2.06 đến 2.52, với trung bình là 2.28 [2]. Tuy nhiên, trong thực tế, chúng ta đã thấy vài ca 'siêu lây lan' bên Hàn Quốc (còn VN thì tôi nghĩ chưa đủ chứng cứ thuyết phục để nói ca 17 là 'siêu lây lan'). Ở đây, một lần nữa, nhà chức trách có thể dùng dữ liệu của các trận dịch trước để ước tính R0, chớ không chờ đến khi có dữ liệu mới. Đó là bài học thứ hai.
Con số 126,000 tử vong
Hôm nọ, một bạn kí giả của BBC Vietnamese hỏi tôi rằng "Liên quan đến miễn dịch quần thể, có chuyên gia ước lượng rằng, ‘Nếu chọn cách miễn dịch cộng đồng, Việt Nam sẽ có ít nhất 126.000 người tử vong’. Ước lượng như vậy bỏ qua các yếu tố khác, liệu có chính xác không? Việt Nam có thể hay có nên làm như Anh không? Vì sao?" [3] Tôi trả lời như sau:
"Tôi nghĩ chắc chắn Việt Nam sẽ không áp dụng chiến lược miễn dịch cộng đồng, vì ngay từ đầu, khi dịch bộc phát bên Tàu, đã có chiến lược can thiệp rồi. Do đó, chúng ta bàn về câu hỏi này ở đây chỉ là lí thuyết có phần giả tưởng thôi. Con số 126,000 tử vong thì tôi không rõ dựa vào cơ sở khoa học nào, vì nguy cơ nhiễm và tử vong tùy thuộc vào rất nhiều yếu tố như mức độ lây lan, cơ cấu dân số theo độ tuổi, khả năng của hệ thống y tế, v.v.
Cách tính của tôi cho thấy kết quả rất khác với con số đó. Qua kinh nghiệm ở Vũ Hán, chúng ta biết rằng phân bố của số ca nhiễm dao động lớn giữa các độ tuổi, với người cao tuổi có nguy cơ cao hơn người trẻ tuổi; chúng ta cũng biết rằng nguy cơ tử vong tăng theo độ tuổi. Tôi sử dụng dữ liệu của Vũ Hán và tạo ra hai phân bố như trình bày qua Biểu đồ 1 dưới đây.
Với phân bố về số ca nhiễm và xác suất tử vong, chúng ta có thể ước tính hậu quả của chiến lược miễn dịch cộng đồng nếu Việt Nam theo đuổi. Có 3 tình huống xảy ra: tình huống thứ nhứt là mức độ lây lan thấp (ví dụ như hệ số lây lan 1.4, theo ước tính của WHO), và tình huống thứ hai là hệ số lây lan cao như 2.0, và tình huống thứ ba là khi hệ số lây lan lên đến 2.5 (số liệu của WHO). Mỗi tình huống sẽ có những con số tử vong và số nhiễm khác nhau.
Tình huống thứ nhứt: với dân số có nguy cơ lây nhiễm 95 triệu (dân số ước tính năm 2020 là 97 triệu), Việt Nam sẽ có chừng 27.1 triệu người bị nhiễm để xây dựng miễn dịch quần thể. Chúng ta có thể thấy phân bố số ca nhiễm theo độ tuổi như biểu đồ dưới đây, với đa số trên 40 tuổi. Nguy cơ tử vong tùy thuộc vào độ tuổi, với người cao tuổi có nguy cơ tử vong cao hơn người trẻ tuổi. Giả định rằng hệ thống y tế Việt Nam tốt hơn Tàu và do đó tỉ lệ tử vong chỉ bằng 20% tỉ lệ tử vong quan sát bên Vũ Hán, thì có thể ước tính rằng có đến 102,300 ca tử vong.
Tình huống thứ hai: với hệ số lây lan là 2.0, sẽ có 47.5 triệu người bị nhiễm virus mới. Với giả định về cơ cấu dân số, phân bố số ca theo độ tuổi như tình huống 1, cùng tỉ lệ tử vong như tình huống 1, thì số ca tử vong có thể ước tính lên đến 179,300.
Tình huống thứ ba: với hệ số lây lan là 2.5, sẽ có 57 triệu người bị nhiễm virus mới. Và, với những giả định trên, có thể ước tính số số ca tử vong là 215,100 người.
Qua mô hình trên, chúng ta có thể thấy nếu chiến lược miễn dịch cộng đồng được triển khai và nếu giả định rằng khả năng y tế của Việt Nam tốt hơn Trung Quốc, số ca tử vong vẫn có thể rất cao: từ 102,300 đến 215,100 ca, tuỳ theo tình huống và hệ số lây lan (xem Biểu đồ 2). Đó là chưa tính đến số ca phải nhập viện, mà theo ước tính của tôi là khoảng 5% số ca bị nhiễm. Với 5% ca nhập viện thì hệ thống y tế của Việt Nam sẽ rất khó mà đáp ứng được. Do đó, tôi nghĩ Việt Nam sẽ không bao giờ -- và cũng không nên -- theo đuổi chiến lược miễn dịch cộng đồng."
Ở đây, như chúng ta thấy, việc ước tính số ca tử vong là rất ... mong manh. Mong manh là vì nó lệ thuộc vào rất nhiều giả định, chớ không phải đơn giản như qui tắc tam suất. Trong mô phỏng trên, tôi phải dựa vào 5 giả định, và tất cả đều có bất định. Chẳng hạn như làm sao chúng ta biết hệ thống y tế VN hơn Tàu, để cho rằng tỉ lệ tử vong ở VN chỉ bằng 20% của Tàu, NẾU đại dịch xảy ra? Bài học ở đây là dự báo về tương lai rất khó, (và điều này chẳng có gì mới) nhưng phải có tình huống, chớ không phải chỉ 1 tình huống. Đó là bài học thứ ba.
Những bài học
Ngoài 3 bài học trên (quyết định trong tình trạng bất định, dùng dữ liệu trước đây để dự báo, và dự báo phải có tình huống), dịch Vũ Hán lần này còn cung cấp rất nhiều bài học khác nữa. Đó là bài học về cách truyền đạt thông tin khoa học. Các giới chức Anh đã phải thú nhận rằng họ đã thất bại trong việc mô tả và diễn giải về chiến lược 'miễn dịch cộng đồng' cho công chúng, và hệ quả là họ bị chỉ trích nặng nề. Thật ra, họ đã làm rất nhiều, nhưng cách giải thích của họ làm cho công chúng bất an. Đó là bài học về truyền thông khoa học mà sau này giới khoa học xã hội sẽ còn nghiên cứu nhiều.
Một điều hết sức thú vị trong trận dịch lần này làsự tham gia của nhiều thành phần khoa học. Từ cộng đồng dịch tễ học chuyên nghiệp, genomics, immunology, health services, đến những nhóm mới hơn là 'data science' và toán học, v.v. tất cả đều có những đóng góp rất hay. Giới dịch tễ học làm mô hình diễn biến và dự báo qui mô của dịch. Giới genomics giải mã hệ gen để biết dịch xuất phát từ đâu. Giới immunology bận rộn với việc điều tra cơ chế của con 'Chinese virus'. Giới health services thì cảnh báo chánh phủ là coi chừng quá tải. Giới data science thì làm hiển thị dữ liệu rất hay. Giới toán học bận bịu giải mấy phương trình vi phân phức tạp, nhưng rất có ích. Mỗi người đóng góp một phần. Trong số này, phải nói là giới dịch tễ học Tàu nổi trội nhứt vì họ có dữ liệu và công bố rất nhiều nghiên cứu.
(Tất nhiên, không nên kể đến những nhóm 'tiêu cực' về misinformation và infodemics từ giới nghiệp dư và thậm chí giới chuyên môn. Nhưng nhóm này thì không đáng quan tâm về mặt khoa học).
Một điều hay nữa là các dữ liệu về số ca hoàn toàn trực tuyến. Ngay cả dữ liệu của VN cũng có (dù quá hạn chế), và tôi đã dùng dữ liệu đó để mô hình hóa [4]. Nhưng nhìn chung, sự tham gia này chưa bao giờ thấy trước đây. Tất cả nhờ công nghệ thông tin và internet.
Tuy nhiên, trong cái ecology đó sự hiện diện từ phía Việt Nam còn rất rất khiêm tốn. Ngoại trừ một hay 2 nhóm cung cấp thông tin có chứng cớ, đa số chỉ là .... []. Rất ít phân tích mô hình nghiêm chỉnh. Đa số chỉ nói chung chung hay vô chứng cớ, chớ dữ liệu thì rất ít hay không có. Điều này hơi ngạc nhiên vì VN có nhiều chuyên gia về data science mà tình hình hơi 'yên ả'. Còn trên báo chí Việt Nam, đa số các bài liên quan đến COVID-19 là tin giật gân, rất hiếm những thông tin giàu khoa học tính. So với giới khoa học Tàu và Hàn, chúng ta còn kém quá, và phải học họ nhiều hơn.
Nguyễn Tuấn
===
[1] https://annals.org/…/incubation-period-coronavirus-disease-…
[2] https://linkinghub.elsevier.com/ret…/…/S1201-9712(20)30091-6
[3] https://www.bbc.com/vietnamese/vietnam-51922994
[4] Nếu các bạn biết dùng ngôn ngữ R, các bạn có thể đọc dữ liệu trực tiếp từ ĐH Johns Hopkins, và qua vài thao tác 'làm sạch' dữ liệu, các bạn có trong tay một 'nghiên cứu' rất quí báu. Vấn đề không phải chỉ là có dữ liệu, mà quan trọng hơn là câu hỏi là gì. Muốn có câu hỏi nghiên cứu đòi hỏi kiến thức chuyên ngành, và có theo dõi thì mới phát biểu được. Nếu không biết chuyên ngành thì có thể dùng dữ liệu để hiển thị cho vui, trước là thể thao trí não, sau là giúp người.
 
Biểu đồ 1: Số ca nhiễm SARS-cov-2 phân bố theo độ tuổi (bên trái, đường màu xanh), và nguy cơ tử vong tính theo xác suất (bên phải, màu đỏ). Đa số (72%) những ca bị nhiễm tuổi từ 40 trở lên. Nguy cơ tử vong tăng nhanh theo độ tuổi. Đa số (92%) những ca tử vong tuổi từ 50 trở lên và thường có những bệnh đi kèm như tiểu đường, cao huyết áp, tim mạch, ung thư, và viêm phổi mãn tính. Dữ liệu được mô phỏng từ kết quả nghiên cứu của nhóm nghiên cứu Vũ Hán (https://www.ncbi.nlm.nih.gov/pubmed/32064853).

Biểu đồ 2: Ước tính số ca tử vong cho mỗi độ tuổi theo 3 tình huống: tình huống 1 (màu đỏ) với hệ số lây lan là 1.4; tình huống 2 (màu xanh lá cây) với hệ số lây lan 2; và tình huống 3 (màu xanh dương) với hệ số lây lan 2.5. Nếu tỉ lệ tử vong chỉ bằng 20% tỉ lệ ở Vũ Hán, tổng số ca tử vong dự báo là 102300, 179300, và 215100 cho tình huống 1, 2 và 3. Đa số ca tử vong sẽ ở độ tuổi 50 đến 70, tức là dự báo mất rất nhiều năm-người cho xã hội.




Không có nhận xét nào

Nội Bật