比較滿意的文章選集(84)

 

《誤導性的結論》補遺

 (原文發表於2003430)

 

 

數日前收到一位讀者朋友Nel­son Chung(鍾先生)來信,認為我於四月十六日發表的《誤導性的結論》一文的標題亦是誤導。我詳細看了鍾先生的來信(見附文)及自己文章,得到的結論是,文章或其標題大抵都沒有誤導,只是因為某些推演可能太快,跳了一、二個步驟,鍾先生一下子沒看清楚,誤會了。看來還得稍為再解釋一下,以釋鍾先生般讀者的疑慮。

 

 

 

應該是殆無疑義的。問題是非典型肺炎是前所未見及全球性的世紀瘟疫,一切仍在發展中,所謂病患及死亡人數是指全球,還是香港?是指此刻,還是將來甚麼時候?一定要講清楚,否則無從計算。

鍾先生提議要等香港700萬人口再無一人患此病再統計,這當然好。但更好莫過於等全世界再無一人患非典型肺炎再統計,怕就怕不知要等到甚麼時候才可統計。為盡快知道死亡率,我們衹能滿足於一時一地的統計數字,並在這些數字上作初步及粗略結論。我和某些傳媒及論者的議論基本上都圍繞著四月十四日醫管局所公佈有關香港非典型肺炎的一組統計數字,詳情再引如下表:

 

染病者類別

現仍留院

現已康復出院

現已死亡

醫院/診所醫護人員及醫科學生

280

93

病人、其家人及探訪者

910

136

合共

1,190

229

47

 

 

 

 

 

值得一提,我在《誤導性的結論》所列出的統計表,是從報章上照抄的,該表內某些名詞並不精確,容易令人誤會,我在上表已稍為修改,原本的「留院」、「出院」及「死亡」現已改為「現仍留院」、「現已康復出院」及「現已死亡」。

醫院接收的病患者,經過一段時間,結果最終不外三種:康復出院,死亡或留院,而留院衹是一種暫時狀態,最終還是會以康復出院或死亡的面貌出現的,兩者必居其一(不死不活有如植物人,要永遠留院的,縱使有亦屬於極少極少數,可以不算)。上述公式中的「病患者死亡人數」實際上等於「現已死亡人數」+「將來死亡人數」,「病患人數」則等於「現仍留院人數」+「現已康復出院人數」+「現已死亡人數」。「現仍留院人數」其實又等於「將來康復出院人數(x)+「將來死亡人數(y)」。

 

上述定義公式變成:

 

非典型肺炎病患者死亡率

 

=

現已死亡人數 + 將來死亡人數 (y)

x 100%

現仍留院人數 + 現已康復出院人數 + 現已死亡人數

=

現已死亡人數 + 將來死亡人數 (y)

x 100%

將來康復出院人數(x) + 將來死亡人數(y) + 現已康復出院人數 + 現已死亡人數

 

將上表的數字代入公式,則

 

死亡率=

47 + y

x 100%

x + y + 229 + 47

=

47 + y

x 100%

1,190 + 229 + 47

=

47 + y

x 100%

1,466

 

我們不知還要等多久才知y,要快些知道一個粗略而在統計學上較合理的死亡率有辦法嗎?有!利用統計學抽樣調查的方法便可。我們可將「現已康復出院人數」及「現已死亡人數」視為從「病患人數」中抽出來的樣本,並以之論斷整個「病患人數」中的「死亡人數」及「康復出院人數」亦會依循此比例分佈。

 

這樣,粗略非典型肺炎死亡率將

 

=

現已死亡人數

x 100%

 

 

現已康復出院人數 + 現已死亡人數

 

 

=

47

x 100%

 

 

229 + 47

 

 

=

17%

 

 

 

 

 

這樣推演出來的死亡率,盡管較粗略,但總比該等傳媒及論者的(約為3%4%)更合理。

 

鍾先生信中的評論,我得稍事回應。

 

鍾先生謂《誤導性的結論》文中所提及的最準確的「非典」死亡率公式漏掉了「x」,而「x」應取代「229」這個數字。鍾先生這兩個提法都是錯誤的,因為在公式中,1,190= x+y1,190為現仍留院人數,x為將來康復出院人數,y為將來死亡人數,x已包含在1,190中,沒有漏掉。明乎此,大家同時不難理解鍾先生所謂「x」應取代「229」亦是錯誤的,因為「x」是「將來康復出院人數」,而「229」則是「現已康復出院人數」,兩者是截然不同的東西,「x」此刻仍未知,但「229」則已知。

 

我於《誤導性的結論》一文是以醫管局四月十四日的統計資料(即上表)作為討論基礎的,並以之推演「死亡率公式」。故此,x + y = 1,190,而「x」及「y」這兩個數字衹要知某一,就可知其二,並且不出二、三個月就會知道。鍾先生謂「x」及「y」這兩個未知在全港七百萬人口再無人感染之前將永屬未知,鍾先生講的是一個仍在發展中直至非典型肺炎在全港七百萬人絕跡的個案,我講的是到四月十四日時的個案,仍有發展或變化機會的僅限於1,190中「x」及「y」,鍾先生不知不覺已將我的概念轉換了。再說,就算按鍾先生心中的概念,只要政府統計做得好,「x」及「y」早晚亦會水落石出的,在「現仍留院人數」已知的情況下,知「x 」就知「y」,反之亦然,並不存在兩個未知。

 

鍾先生又謂:「3%乃死亡人數與病患人數比較的百分比,而17%則為死亡人數與康復出院人數比較的百分比,兩者是截然不同的東西,無所謂誤導」。究竟有沒有誤導,如有,是誰誤導,要解答這個問題,還得從定義入手。某些傳媒及論者其實不是以死亡人數與病患人數比較的百分比來計算死亡率的,他們是以現已死亡人數與病患人數比較的百分比來計算(最後計出3.2%),我才是以死亡人數(即現已死亡及將來死亡人數總和)與病患人數比較的百分比來計算。但為了立刻計出一個粗略而較合理的「死亡率」,我用抽樣調查的原理將公式改為以「現已死亡人數」與「現已康復出院及現已死亡人數總和」比較,這樣計算出來的17%死亡率因此絕非鍾先生所言為死亡人數與康復出院人數比較之百分比。到四月二十九日,醫管局公佈現仍留院人數為663人,現已康復出院人數為759人,現已死亡人數則為150人,以粗略抽樣公式計算,死亡率為19.8%,與四月十四日的17%相去不遠,看來盡管失諸絕對精確,公式還是有一定準繩的。

 

「死亡率」在沒有特別說明下,泛指整體死亡率,有特定的涵義,自有其特定演算公式,不是胡亂將任何兩個數字比較均可的。同謂死亡率,傳媒及學者計出來的其實是現已死亡率,我那較詳盡細緻的公式大抵還算是整體死亡率。誰的定義較正確,不正確的是否誤導以及鍾先生對我四月十四日文章裏提及的傳媒、論者和我對「死亡率」的各自計算法有沒有理解錯誤,留待各位讀者朋友自行判斷。

 

鍾先生最後謂:「百分比衹是資料,不是結論。」這個觀點也是不對的,醫管局四月十四日公佈的統計數字(見上表)是資料,但某些傳媒及論者據之而將「非典」死亡率引伸為百分之三、四,這個百分比就不再是資料,而是結論!

 

 

附文:

Read the April 16 arti­cle, but I par­tial­ly agree with this formula. 

 

First­ly, your “cor­rect” for­mu­la missed “x”, which should replace the num­ber of 229. Also, “x” & “y” are unknown until there is absolute­ly nobody hav­ing SARS among 7 mil­lion peo­ple in HK. These two num­bers end up will be unknown for­ev­er! Two unknown num­bers sit­ting in one for­mu­la is unsolvable. 

 

Sec­ond­ly, 3% is the per­cent­age of death cas­es to total infect­ed cas­es. 17% is the per­cent­age of death cas­es to the recov­ered cas­es. How could you say the sta­tis­tic was mis­lead­ing? They are total­ly two dif­fer­ent things. If I tell you the gross mar­gin is 17%, but the net mar­gin is 3%, do you call it misleading?

 

Apply the same the­o­ry or for­mu­la to Can­cer and AIDS cas­es, the % is worse. 

 

Per­cent­age is infor­ma­tion, not con­clu­sion. Your TITLE of the arti­cle real­ly mis­lead reader. 

 

Ah…no won­der, HK now becomes a piece of shit!

 

 

Nel­son Chung
25–4‑2003