- Articles
- Popular
為了科研進步,擁抱開放數據任務的國家

看到“開放”這個詞,你會想到什么?如果你想到了開放科學(open science)或者開放數據(open data),那么你肯定跟上了在目前學術發表中最火熱的話題。
一直到幾年前,共享研究數據是完全難以想象的;研究人員多對數據小心翼翼,認為發表科研成果就夠了,但是今天,身在科研圈的人已經知道要讓數據容易存儲、訪問和共享的好處和需要。開放獲取的概念無疑改變了學術出版的模式,越來越多的科研單位、出版商、投資單位和研究人員開始相信開放數據的好處,例如,在英國開放數據研究所(Open Data Institute)已知有超過 250 家公司使用開放數據來創造產品創新,推展自身業務;出版公司愛思維爾(Elsevier)提到“為科研數據創造一個共享的生態系統”,推出推出開放數據試點給約 40 家期刊;一些科研人員也積極發聲支持數據分享,并稱分享數據的好處遠大于預期風險。我會在這篇文章中快速介紹各國的數據共享政策,在看政策之前,我會依序簡要介紹一下開放數據是什么、內容包含什么。
關于開放數據
研究資料(例如圖片、表格、、公式、計算和補充材料)的免費取得使他人在現有的研究上發展或者進行復制研究,促成科學進步,不管是在既有基礎上發展或是復制原有研究,都是科學進步之要,但,問題是研究人員不愿意分享、數據沒有存儲或因復雜的收費限制所封存,造成大量科學數據的丟失,不過這個情況隨著全球有越來越多人接受開放獲取的觀念正在逐漸改變。根據開放數據研究所所定義,開放數據(open date)是讓所有人可以免費存儲和訪問的數據,并具有許可證可免費重復使用、分享和散布。開放數據任務(open data mandate)是指需要研究人員根據單位、基金方的規定來分享他們的數據這種政策面上的規則,例如,美國科技政策辦公室(Office of Science and Technology Policy,OSTP)發出備忘錄,規定由聯邦政府資助的研究必須共享數據;像比爾及梅琳達?蓋茨基金會(Bill and Melinda Gates foundation)這類的私人資助單位已設立嚴格的數據共享規則;英國工程和物理科學研究理事會(Engineering and Physical Sciences Research Council ,EPRSC)則是使用最多人談論的數據共享。加拿大政府和奧地利科學基金(Austrian Science Fund)也都有開放數據政策等等,不勝列舉。各家政策有所不同,有些機構要求研究人員在研究發表后公開數據,然而有些機構則要求從基金申請階段就該分享數據,大多數的政策適用于公有或中央政府資助的研究(資金來自與納稅人或政府)。
數據共享六階段
Figshare 的執行長兼創辦人 Mark Hahnel 稱 2015 年為“開放數據政策年”,他明確了數據共享的六個階段,而世界各地的資助單位都已完成了前三階段。
全球開放數據任務進展
鑒于對數據共享的積極態度,全球有許多國家的政府和機構正在落實開放數據相關政策,通過自己或者外部的資料庫為數據共享能帶來的長期利益累積資本,以下是幾個國家狀況。
美國
在美國對開放數據的重視直接來自總統辦公室。由 OSTP 在 2013 年發出的備忘錄中指出“任何接受中央政府資助經費每年超過 1 百萬美元進行研究的聯邦單位,需規劃支出支持提升大眾取得研究成果”。 據美國國家科學基金會(National Science Foundation,NSF)規定,所有 NSF 撥款資助的工作都該公開,包括主要數據、樣品、實體收藏和其他支持材料等。美國國家衛生研究院(National Institute of Health,NIH)則要求數據應該在論文被接受的當下即公開。比爾及梅琳達?蓋茨基金會的政策則是要求接受基金會資金的科研人員需要在論文發表之時公開相關數據,并且同意研究用于商業用途。其他要求數據共享的機構還有戈登與貝蒂莫爾基金會(Gordon and Betty Moore Foundation,GBMF,要求在數據收集或者 DNA 測序后的六個月內儲存所有數據)、霍華德·休斯醫學研究所(Howard Hughes Medical Institute,HHMI,在論文發表后立即公開分享,因為“作者的責任是讓可用的材料、數據庫和軟件一起發表,如此其他人便可以驗證或偽證研究結果,并朝新的方向拓展”)。
加拿大
加拿大政府正在制定“政府性開放科學實施計劃”,其中包括推出由聯邦政府資助的開放獲取出版及數據、政策層面的修改和能讓數據更容易取得的工具。
澳大利亞
澳大利亞國立健康與醫學研究理事會(National Health and Medical Research Council,NHMRC)和澳大利亞研究理事會(Australian Research Council,ARC)都要求被資助的研究必須在發表后的 12 個月內被儲存到開放獲取的機構資料庫。許多澳大利亞大學都有復雜程度不同的數據庫,近來他們一同推出開放數據集合(Open Data Collections)。
中國
中國科學家一直因為政府部門的壟斷,要取得國內研究的高質量數據極為困難。不過中國過肩自然科學基金委員會(National Natural Science Foundation of China,NSFC)和中國科學院(Chinese Academy of Sciences,CAS)在2014年公布一項倡議,要求研究人員在論文發表后的12個月內將論文儲存到數據庫并且允許公開訪問。據開放數據發布的一份報告指出,“在中國,推動數據活動的是公民、非營利組織與城市政府領導人”。
日本
跟據聯合國教科文組織(UNESCO)的報告指出,雖然日本的開放獲取或數據共享未有政策層面上的發展,但有一些由政府資助成立的大學資料庫。這份報告提到“5 個 OA 政策,其中兩個來自資助者的,另三個則是機構”。2013 年日本文部科學省(Ministry of Education,Culture,Sports,Science and Technology)公布新數據庫政策,日本學術發表界如何看待這些指標和未來發展仍有待觀察。
其他在數據共享政策上值得注意的國家還有奧地利科學基金(Austrian Science Fund,如果允許的情況下,數據應該以允許無限制重復使用/引用的方式儲存),、愛爾蘭高等教育機構(Higher Education Authority,HEA)還有適用于接受瑞典研究理事會(Swedish research council)基金的研究人員的 Vetenskapsr?det 政策。
雖然一些政府和機構對數據分享政策的態度十分積極,有些仍正在萌芽,但很顯然地國家執行開放數據任務在未來幾年會是關鍵,因為這將決定現有政策的成功,以及新的政策出現的速度,欣慰的是人們普遍接受了科研數據應該要能免費取得的概念,讓所有鼓勵科學探索精神的人利用。
后記:本文只概述數據共享以及介紹各國政策中值得注意的點。關于開放數據和數據共享的其他面向,包含值得關注以及單獨詳細討論的部分包括:建立數據庫的過程、讓數據開放所需成本、數據共享的例外、各種類型的許可證、研究人員對這些政策的反應、維護的公開數據的需要、開放數據任務的反應或反響、這些任務的成功指標、國家政策間的差異、和世界各地區的比較(例如,歐洲與亞洲)等。
相關閱讀:開放獲取和數據共享是令人興奮的現象,《意得輯專家視點》已經有好幾篇關于這些主題的文章,歡迎參考我們先前的文章:
?