- 人物訪談
- 熱門
Jo R?islien 博士:現在是成為生物統計學家的好時機!

Jo R?islien 是著名的國際科學傳播家,經常出現在電臺﹑電視和印制媒體,傳授關于溝通復雜訊息﹑知識傳播和自身的研究,他主持過挪威最大的國家廣播公司 NRK 1 臺的數學和統計學節目 Stiffer,以及探索頻道(Discovery Channel)的多個科學節目。去年他與導演 Christian Holm-Glad 和電影公司 Bulldozer Film 合作,拍攝以數學為主題的短篇電影 Chasing the world’s largest number。此外,他首次參與 NRK 1 的 Digits 系列,獲逐挪威年度電視獎 Gullruten 獎提名 2012 的兩個獎項—「最佳新節目」及「最佳生活節目」。
R?islien 發表過很多數學文章,比如《數字的故事》(2013)一書,這本書獲「年度最美妙書籍獎」,被 Journal of the Norwegian Medical Association 稱之為「統計學書的小寶石」。
Jo R?islien 是挪威數學家﹑生物統計學家和醫學研究人員,持有挪威科技大學(Norwegian University of Science and Technology,NTNU)石油工程系及應用地質物理系的地質統計學博士學位,曾在挪威國家大學醫院(Rikshospitalet University Hospital)擔任研究導師和奧斯陸大學(University of Oslo,UiO)生物統計學系任博士后研究人員,之后他成為挪威飛行救護車基金會(Norwegian Air Ambulance Foundation)的高級科學家。R?islien 博士以統計學顧問和研究人員身份參與過很多醫學研究項目,合作機構包括?Vestfold Hospital Trust 病態肥胖中心﹑Sunnaas Rehabilitation Hospital 和挪威公共衛生研究院(Norwegian Institute of Public Health)。他目前在挪威斯塔萬格大學(University of Stavanger)健康科學系擔任副教授,同時也在奧斯陸大學生物統計學系及成癮研究中心工作。
這是他的系列訪談第一輯,Jo R?islien 博士深入剖析數據和統計學分析的議題,發人深省。
可以談談您的研究興趣嗎?是什么吸引您關注這些主題的?
所有的研究論文最重要的部分是“研究方法”章節。結論當然是直接從研究結果得出,而研究結果則是從使用的研究方法直接得出,因此學術辯論往不是針對研究結果,而是研究方法,如果方法不成立,研究結果就沒意思。
身為統計學家,我一直支持方法學。雖然我最后從事醫學研究,但年輕時對醫學不大感興趣,我讀工程﹑數學﹑信息學和統計學。十年前,我取得地質統計學及石油工程學博士學位后,我的妹妹鼓勵我應征奧斯陸大學醫院統計學研究導師一職,我還記得第一次坐在桌子前處理一些問題,突然意識到桌子上鋪滿的這些紙,上面的方程式是通往生死之門的鑰匙,那個感覺很震撼,自此我再沒有回頭。
我曾參與很多醫學研究項目,覆蓋的醫學和統計學題目很廣,然后我的研究興趣逐漸轉向時態數據分析,主要研究怎樣適當分析多人的多項時態數據,還有同時處理多層時態影響的模型,比如長期非線性増長﹑季節性影響和每周影響的組合,這些議題開啟我與挪威公共衛生研究院﹑成癮研究中心還有挪威飛行救護車基金會等機構的合作。
醫學研究領域歷逐漸發展,數據收集隨之變得精密,隨機對照試驗無法解決所有問題,因此為了要找出因果關系,現在的研究設計傾向得出更復雜的數據,這部分的方法學研究現在發展蓬勃,因為很多分析這種數據的統計學模式太簡單,甚至不存在,因此現在入行當生物統計學家是好時機。
可以說說現在生物統計學領域中的數據本質嗎?
當醫學統計學家很棒,處理的問題種類﹑數據林林總總:在實驗室用 6 只老鼠做研究;有兩組共 50 位受試者的小型隨機臨床試驗;以健康危機為題的大型縱向觀察研究,數以千計的研究對象,每人有數十個時態測量點;涉及數以百萬個研究對象的注冊研究,要計算的變項有幾百個;分析癌細胞放射學影像的二維﹑三維幾何空間和基因組數據的一萬維。
醫學數據收集很少單純只是為了收集數據,一般我們有想要檢驗的假設﹑有想要找到答案的問題,所以收集的數據非常專門,也很費時,博士生往往在開始研究的前幾年都要專注在收集數據,然后才可能有機會分析數據,得出研究成果。我當然贊成讓更多人能接觸數據,但當你是數據的使用方,說起來當然容易。如果你花了多年時間收集一個你感興趣的專門課題的數據,然后因為不愿意開放數據讓所有人使用,而被指為保守﹑自私,如何公平地分享研究數據不是那么簡單。
有時候收集數據的難度極高,「收集數據的方法」甚至可以自成一個研究領域。我現在跟挪威飛行救護車基金會合作,提升就醫前醫療保健的知識,收集數據是其中的核心工作。當有意外造成嚴重傷亡,直升機首先到達現場,你第一時間不該也不能做的,是在特定表格中記下可能出現不同的干擾因子,或測量一系列的基準值,用作計算病患血液的不同生物標記,可是,當病患被送進醫院后才測量這些數據,那么從你一接觸到病患到他接受醫院治療這中間的數據就沒了,那你怎么有辦法知道在這個過程當中你采取的行動是否有幫助到病患呢?
我們一定要與工程師﹑分子生物學家等多個領域的專家合作,才能找出要測量什么﹑怎么測量,最好在真實情況連續測量,這樣找出身體對多種干擾物的反應的可能性就會大大提升,我們知道時間非常關鍵,但究竟怎樣關鍵?
整體來說,您覺得研究人員在數據挖掘上有什么困難或危機?
概率很有趣,概率比我們已經找出的多很多,所以談到數據挖掘,有些人會提醒大家小心,我是其中一員,統計學分析不是要「找出數據的規律」,數據總有規律,小的﹑大的﹑簡單的﹑復雜的,你越深入的分析,找出的規律就越多。
因此如果你開始挖掘,重點不是有沒有找到規律,而是找到的規律能否反映數據的真實結構,還是單純因概率而成,統計學分析是分辯真實規律與隨機規律﹑真正的相關與單純概率,最重要的是統計學量化研究成果的可信度,或者證實不可信的。
所以當我獲邀在 2013 年秋天在奧斯陸進行 TED 演講,我選擇的講題是“海量的悖論”(The Paradox of Plenty),悖論是在大數據集找到的規律自然較多,規律也較復雜,但都只是概率。可是我們對大數據集的規律較有信心,就是因為有大量的數據。
你不用上很多統計學和科研方法的課,也會發現挖掘數據引起的問題可能比什么都不做來得多,現在最大的困難不是沒有數據,而是沒有好的分析。
現在挪威有個叫做“Big Insights”的研究項目名為,目標是研發大數據集的統計學分析法,我很期待他們的研究成果。
?
不要錯過下輯訪談,R?islien 博士將分享他對研究、復制研究還有同行評審的看法。