大數據對科學有什么意義?

Series:
Part
01
Number
大數據對科學有什么意義?

幾十年前,科學是 3 個互相關聯模版的產物:實驗、理論、計算。互聯網和計算機時代的來臨擴展了收集、儲存和分享數據的能力,于是加快了數據的產生,快到科研數據產出已每年 30% 的速度成長,而且每二年就增加 2 倍,這種大量的數據就稱為“大數據”。

大數據,或稱海量數據、數據海嘯,包含了從互聯網、智能手機、科學研究、商業行為、政府及其他來源產生的所有數據。學術界因為大數據開啟了數個科研可探索的途徑,抱持歡迎的態度,而實際上很多人將大數據看作另一個模式的科學,一個奠基在收集和分析大量數據的模式。

大數據之所以這么熱門不止因為它的數量,還有它的用途,這種可以取得的海量數據為科學本質帶來改變,科學的演進已經變得越來越由數據驅動和數據密集,不論何領域,研究人員都可感受到大數據將轉變成科研方法和流程的標準的潛力。早先只有高能粒子物理學和核聚變依靠大數據集,現在已有其他領域的研究人員加入探尋大數據的潛能,比如生物學家、化學家、物理學家、天文學家和基因組學家都嘗試從大數據中創造更好的科研模式。

統計學家 David Rossell 博士提供了大數據如何幫助科學的事證,據他所稱,大數據提供了前所未有的機會給客制化藥物,因為分子水平的復雜疾病表征可與醫學和治療史還有診斷或影像檢查結合,另一個應用大數據的例子是每秒記錄4 千萬次數據測試物理理論的 Large Hadron Collider。大數據集還能幫助管理城市和自然資源、研究氣候變化、設計政治策略、了解輿論如何擴散等,除了這些之外,數據的全球可取得性也讓科研跨越國境,研究人員可以更輕松地互相分享與合作。

科學家能取得更多數據一事看似光明,許多統計學人員覺得科學家應該要小心大數據,因為大數據也是有很多缺點,如何有效儲存和管理大數據是最主要的挑戰,大數據集過于復雜,不易用傳統數據處理方式進行分析,還有,如果研究純粹依賴數據,沒有謹慎考慮分析的話,大數據有可能導致壞科學。大數據就是好數據嗎?研究人員在處理大數據的時候還遇有哪些困難呢?我們將在后續的文章中討論。

期待學術生涯高歌猛進,發表過程一帆風順?

來加入我們活力洋溢的在線社區吧。免費注冊,無限閱覽。

社交賬號一鍵登入

已有54300名科研人員在此注冊。

Editage Insights 目前正在維護中。維護期間,部分站點功能,如登錄、注冊可能無法正常工作。

Found this useful?

If so, share it with your fellow researchers

該話題屬于開展研究階段

身為科研人員,開展研究是最先也最令人興奮的一步,如果你正處在這個發表階段,歡迎訂閱學習這個階段該知道最佳實踐,為成功發表鋪平道路。