2013年4月24日 星期三

H7N9禽流感統計上的失誤

翻查中國的H7N9禽流感疫情信息,單單看某日的報告,好似沒問題,連看幾個便發現問題。

問題1:時間重疊,影響數據分布

4月20日發表的報告列出由2013年4月19日16時至4月20日16時所發現的病例。4月19日發表的報告列出由2013年4月18日17時至4月19日17時所發現的病例。兩個報告竟然有一個小時重疊。4月10日的報告與4月9日的報告也是重疊了一小時。

問題2:時間不均,影響數據分布

4月17日的報告則列出由4月16日20時至4月17日17時的病例,即少於24小時。4月16日的報告則列出由4月15日18時至4月16日20時的病例,即多於24小時。

問題3:數據遺漏

4月15日的報告則列出由4月14日18時至4月15日18時的病例,而前一日的報告則列出由4月13日17時至4月14日17時的病例。那麼4月14日17時4月14日18時的情況是沒有報告。

以上只是一般統計分析的基本失誤。


沒有留言: