兩年前,常山藥業稱「約1.4億中國男人陽痿,產品市場廣闊」而引發熱議,該公司12/28公告,收到證監會《行政處罰決定書》,認定常山藥業2018-28號公告中的部分內容信披違規,對公司給予警告並處以罰款60萬元。如此常山藥業又一次登上瞭熱搜。

毫無疑問,這所謂的約1.4億數據來源肯定是以偏概全,因為統計數據會說謊。

以前好像有本書就是這樣命名的,就像下圖這種同一個數據調坐標系。

其實常山藥業這種,就是類似的。

我們經常看到各種數據,中國xx有多少億,比如

常山藥業之前說中國陽痿患者有1.27億,貴州百靈之前說中國糖尿病患者超過1.1億,通策醫療說不孕不育的有5,000萬以上,康寧醫院說每5個人就有一個是精神病。

但是,理論上,除瞭全國人口普查,沒有任何機構可以做到全國性的普查,甚至每年的普查也是抽樣的。

那麼,常山藥業如何得出這個結論?

其實辦法就是抽樣調查算出概率,然後乘以總人口。

比如找瞭幾十上百個人調查一下比例,得出樣本群裡男性陽痿比例20%,最後用全國7億左右的男性一乘,那就是1.4億。

但是,這裡面就有問題瞭:

統計學裡做抽樣調查,對於抽樣是有嚴格的要求的。

常山藥業的樣本抽樣到底如何?

地方是否具有代表性?是否全國性抽樣?還是用某個城市代表的?

全國那麼多地市,不同區域風土環境人情都有差異,人們生活習慣也有差異,是否包括?

年齡分佈如何?

不同年齡段的個人性功能存在差異,尤其是少年兒童還沒性成熟呢。

職業分佈如何?

不同職業可能也存在差異

甚至於調查方式也有很大的影響,互聯網?電話?上門?

比如互聯網調查是否會涉及到上網人群和不上網人群的問題等等?我國當前接入互聯網的人群是9億,還有5億多人沒接入互聯網呢。

如果這些沒搞清楚,那麼這個抽樣調查就不具備說服力,舉個典型的例子:

記者到列車上采訪,發現人人都有車票,於是記者報道:春運一票難求問題已經得到解決。

這就是典型的調查樣本選取的問題。

可是很多時候,又會遇到一些問題,那就是,對方到底是故意搞錯呢?還是本身能力有限不知道抽樣調查有這麼多道道呢?