作者:王德華 來源: 發(fā)布時(shí)間:2022-9-13 3:48:22
不符合預(yù)期的數(shù)據(jù)絕不能隨便刪除

   科學(xué)是以數(shù)據(jù)說話的,任何科學(xué)結(jié)論都需要數(shù)據(jù)支持。數(shù)據(jù)不嚴(yán)謹(jǐn),會(huì)產(chǎn)生不嚴(yán)謹(jǐn)?shù)慕Y(jié)論,甚至是錯(cuò)誤荒唐的結(jié)論。這對(duì)社會(huì)的影響是極大的,尤其是涉及國計(jì)民生問題時(shí),錯(cuò)誤的數(shù)據(jù)很可能會(huì)導(dǎo)致錯(cuò)誤的決策,進(jìn)而造成巨大的損失。所以,實(shí)驗(yàn)科學(xué)無論怎樣強(qiáng)調(diào)數(shù)據(jù)都不為過。

   最近,我和學(xué)生們?cè)诮M會(huì)上又聊到了數(shù)據(jù)取舍的問題。我的研究生剛剛獲得了一個(gè)實(shí)驗(yàn)的部分?jǐn)?shù)據(jù),需要統(tǒng)計(jì)處理組與對(duì)照組的差異,但統(tǒng)計(jì)后他發(fā)現(xiàn),有一組數(shù)據(jù)標(biāo)準(zhǔn)差太大,統(tǒng)計(jì)結(jié)果是“差異不顯著”。

   我們的實(shí)驗(yàn)研究需要檢驗(yàn)處理組和對(duì)照組之間的差異,或不同因素處理的效應(yīng),在這一過程中,令研究人員最頭疼的問題就是實(shí)驗(yàn)結(jié)果與預(yù)期不一致,本該有差異顯著性的數(shù)據(jù),卻檢測不到差異顯著性,概率值大于0.05。在我們平時(shí)的科研工作中,這種情況很常見。

   在討論的時(shí)候,我跟他說:“如果個(gè)別數(shù)據(jù)偏離了整個(gè)樣本的變化趨勢,要特別重視,首先分析自己的實(shí)驗(yàn)過程是否有問題、樣品是否有問題等。不符合預(yù)期的數(shù)據(jù)是絕對(duì)不能隨便刪除的,可以在分析數(shù)據(jù)的散點(diǎn)圖和標(biāo)準(zhǔn)差后,決定是重復(fù)一次實(shí)驗(yàn),還是增加樣本數(shù)。”

   數(shù)據(jù)取舍,是我們組會(huì)上經(jīng)常討論的問題。我一般會(huì)跟我的學(xué)生說,出現(xiàn)個(gè)別偏離的數(shù)據(jù),要認(rèn)真分析是不是這個(gè)樣本有問題,并結(jié)合這個(gè)樣本的其他參數(shù)予以考慮。比方說,如果同一個(gè)動(dòng)物實(shí)驗(yàn)中,多個(gè)參數(shù)都出現(xiàn)了問題,就要考慮可能是動(dòng)物樣本的問題;如果僅是某個(gè)參數(shù)不符合預(yù)期,可以分析測定過程是否出了問題。但基本原則是,不能隨便刪除數(shù)據(jù)。

   面對(duì)個(gè)別偏離的數(shù)據(jù)時(shí),我們的處理方法一般有以下三種。第一,再重復(fù)測定一次;第二,如果問題依然存在,又不好解釋,按照數(shù)據(jù)散點(diǎn)圖,將偏離平均值范圍太大的數(shù)據(jù)在散點(diǎn)圖上標(biāo)記出來,統(tǒng)計(jì)分析時(shí),說明這個(gè)數(shù)據(jù)沒有被統(tǒng)計(jì)進(jìn)來;第三,根據(jù)統(tǒng)計(jì)學(xué)中判斷奇異值的方法,進(jìn)行個(gè)別數(shù)據(jù)取舍。

   有時(shí)我們會(huì)發(fā)現(xiàn),統(tǒng)計(jì)結(jié)果是由個(gè)別數(shù)據(jù)引起的,如果去掉偏離平均值范圍大的數(shù)據(jù),差異顯著性就出來了。這時(shí),有些研究人員就會(huì)產(chǎn)生一種取舍數(shù)據(jù)的沖動(dòng),想刪除這個(gè)不理想數(shù)據(jù)。但這是很危險(xiǎn)的,因?yàn)殡S便取舍數(shù)據(jù),或根據(jù)自己的需要取舍數(shù)據(jù)、選擇性使用數(shù)據(jù),就觸碰到了學(xué)術(shù)不端的紅線。

   我認(rèn)為,研究人員產(chǎn)生數(shù)據(jù)不當(dāng)取舍行為的一個(gè)直接原因是功利化心態(tài)、浮躁心態(tài)。例如,研究生有畢業(yè)發(fā)表論文的需要,年輕學(xué)者有晉升和申請(qǐng)各種名譽(yù)獎(jiǎng)項(xiàng)的需要等。如果沒有正確對(duì)待科學(xué)的心態(tài),沒有對(duì)待科學(xué)數(shù)據(jù)嚴(yán)謹(jǐn)?shù)膽B(tài)度,而是論文至上,再加上沒有強(qiáng)有力的監(jiān)督機(jī)制和懲罰措施,出問題是不奇怪的。

   為避免不當(dāng)?shù)臄?shù)據(jù)取舍,應(yīng)該對(duì)實(shí)驗(yàn)的原始記錄給予高度重視。我們實(shí)驗(yàn)室每周都有組會(huì),大家有數(shù)據(jù)就會(huì)在組會(huì)上討論。研究生和導(dǎo)師交流時(shí),也要提供原始數(shù)據(jù)。

   在我以前工作的中國科學(xué)院動(dòng)物研究所,我負(fù)責(zé)研究生教育工作多年,研究所學(xué)位委員會(huì)制定了導(dǎo)師檢查研究生實(shí)驗(yàn)記錄的制度,每學(xué)期都要進(jìn)行檢查,記錄本上有導(dǎo)師的簽字。導(dǎo)師檢查學(xué)生實(shí)驗(yàn)記錄,也是研究生中期考核、申請(qǐng)學(xué)位論文答辯的一個(gè)重要條件。研究所為此專門定做了實(shí)驗(yàn)記錄本,每頁都有頁碼,不能隨便撕掉。實(shí)施效果還是不錯(cuò)的。

   總之,做實(shí)驗(yàn)要尊重原始數(shù)據(jù),嚴(yán)肅認(rèn)真對(duì)待每一個(gè)數(shù)據(jù),對(duì)待科研和實(shí)驗(yàn)過程的每一個(gè)步驟,認(rèn)真做好實(shí)驗(yàn)記錄。不可以更改數(shù)據(jù),不可以選擇性地取舍實(shí)驗(yàn)數(shù)據(jù)!

(作者系山東大學(xué)生命科學(xué)學(xué)院特聘教授,記者倪思潔/采訪整理)

 

 

《科學(xué)新聞》 (科學(xué)新聞2022年8月刊 封面)
發(fā)E-mail給:      
| 打印 | 評(píng)論 |