數據出版在中國

數據出版在中國

1 何為數據出版?

在信息技術高度發展的今天,科研模式已經發生改變。科學數據不僅僅只是科學研究和科技文獻的重要產出,已成為科學研究和促進社會進步的重要基礎設施。科學數據的共享與出版也在近年來得到了關注及快速發展。

所謂數據出版,是指科研人員與科研機構按照統一規范的質量管理和控制機制,主要利用互聯網及其他方式公開發布其通過觀察、實驗、計算分析等科研過程所產生的原始數據,或通過對已有數據進行系統化地手機、整理和再加工形成數據及數據產品的出版行為,以幫助使用者便捷地發現、獲取、理解和再分析利用數據,并可在科研論文及相關研究成果中引用數據[1]。簡單而言就是指基于同行評議的數據發表。(圖 1 為 Geoscience Data Journal 期刊對其發表數據論文的一般性流程。) ??

Overlay journal model for publishing data

2 數據出版的模式及國內外實踐

根據不同的出版機構或出版模式,數據的出版大體可以分為以下幾類:

(1) 獨立數據出版

一般是數據中心對本機構保存的數據的獨立出版。國內外的各種大型公共數據中心,提供數據存儲和共享的,基本都可以視為這種數據出版模式。例如,全球生物多樣性機構(GBIF)設立數據出版框架工作組(Data Publishing Frame Task Group),明確提出并詳細討論了科學數據出版框架,并在 Pensoft 出版集團的出版物中進行試點[2]。我國對數據的共享和發布也高度重視,科技部于 2005 年啟動實施的國家科技基礎條件平臺,設立了基礎科學數據共享網,以促進科學數據及資源的共享。中國科學院從上個世紀八十年代開始,即組建了中國科學院科學數據庫項目的建設。經過 30 年的積累,提供在線共享數據量已達 655TB。另,中國西部環境與生態科學數據中心以“黑河綜合遙感聯合試驗 (WATER)”“黑河流域生態水文過程集成研究” 和“黑河生態水文遙感試驗(HiWATER)”為例開展了系列數據出版試點研究,形成了一套“數據發布-評審-引用建議-跟蹤統計”的數據出版體系[3]

(2) 作為論文的輔助材料出版

是指數據作為論文的補充材料,隨著論文一同提交至期刊或指定的數據中心,由其提供數據的保存、獲取與共享服務。大多數傳統期刊都采用這種數據出版的模式,一般來說,會要求作者提交相關數據至期刊網站。隨著信息技術和科研模式的轉變,部分期刊選擇與專業數據中心合作,論文提交至期刊的同時,將數據提交到指定的數據中心存儲。例如,世界最大的開放獲取期刊 PLoS 一向要求論文作者向希望復制研究結果的同行提供數據,在 2014 年發布的最新數據分享政策中,要求作者在論文出版的同時立即公開所有數據,不能有任何限制[4]。 在我國,雖然很多期刊也明確要求作者提供相關研究原始數據,但真正執行情況還是一個很大的問號。值得一提的是,2016 年初,《現代圖書情報技術》編輯部與科學數據存儲庫(ScienceDB,http://www.scidb.cn/index)合作,對投稿作者明確提出了支撐數據提交要求:所有投稿論文提交支撐論文結論的科學數據,并通過適當方式供研究共同體或社會公共共享[5]。這是我國傳統學術期刊在數據出版方面一次有益的嘗試。

(3) 數據論文方式出版

是指期刊出版有關數據集的描述性文章即數據論文,并且將數據論文存儲在數據倉儲中或發表在數據期刊上。國際上已有一些期刊專門出版數據論文,例如,2008 年起出版的《Earth System Science Data》(ESSD)、Nature 自 2014 年創辦數據期刊《Scientific Data》,均屬于這類數據出版模式,并提供相關數據的機構庫存儲與訪問服務支持。在中國,《中國科學數據(中英文網絡版)》(China Scientific Data)和“全球變化科學研究數據注冊與出版系統”等也對數據出版方面做了初步實踐。其中,《中國科學數據》(CN 11-6035/N, ISSN 2096-2223)是國家網絡連續型出版物的首批試點刊物,專門面向多學科領域的科學數據進行學術出版。

3 數據出版的意義及思考

數據出版的意義及思考數據出版對科學研究及數據工作者具有重要意義。通過對數據進行出版,可實現數據的知識產權清晰,數據質量可信;通過對數據配以全球統一標示,可以長期保存并持久訪問,并可在學術出版物中正式引用,亦可對數據引用情況進行跟蹤統計與分析,從而客觀評價其對科學發現的價值和影響(Impact),能夠為生產、管理和共享數據的科學家提供一種激勵機制。同時,也有利于科學研究的自我審查;通過支持數據再利用,還可降低科研成本,帶動相關產業的發展[6-9]

同時,數據出版也面臨很多挑戰。例如,科研人員的數據共享意識還有待提高;評價機構對數據出版及數據論文的認可度還很不足;數據質量又該如何評價?等等。尤其在我國,雖然大家對于數據的出版和開放共享的關注度逐步得到提升,但還有很多方面需要改進,以便創造一個優質的數據出版和共享的生態環境。例如,應盡快制定數據出版和引用的標準規范,明晰數據版權信息,從而推動對科學數據的引用。鼓勵科研人員和出版機構,以及數據中心相關人員積極參與到國際數據出版的相關活動和組織當中去,為我國發展數據出版創造一個良好的發展環境。依托現有科研機構的學術出版機構,選取一些有實際需求的期刊,開展數據出版的試點工作,發布高質量的數據集,探索數據質量評審和數據評價及引用方法。同時,應建立一批提供永久數據存儲的認證數據中心,提供數據發布和存儲服務。國家相關管理機構也應該積極應對數據出版的需要,出臺相關政策,建立針對數據的評價體系和數據工作者的獎勵機制,鼓勵數據出版工作。

?

參考文獻:

[1] 黎建輝, 吳超, 張麗麗, 李成贊, 胡良霖. 科學數據出版調查與分析[J/OL]. 中國科學數據, 2016,1(1). http://www.csdata.org/paperView?id=9. DOI: 10.11922/csdata.120.2015.0009.

[2] Roberts Dave, Moritz Tom. A Framework for Publishing Primary Biodiversity Data[J/OL]. BMC Bioinformatics, 2011,12(S15): l1[2011-12-15]. http:// www.biomedcentral.com/1471-2105/12/S15/l1.doi: 10.1186/1471-2105-12-S15-l1.

[3] 吳立宗,屈永華,王亮緒,等. 黑河綜合遙感聯合試 驗的數據管理與共享[J]. 遙感技術與應用, 2010(6): 772-781.

[4] PLOS’ New Data Policy: Public Access to Data [OL].http://blogs.plos.org/everyone/2014/02/24/plos-new-data-policy-public-ac....

[5] 《現代圖書情報技術》支撐數據提交要求[OL].http://manu44.magtech.com.cn/Jwk_infotech_wk3/fileup/1003-3513/NEWS/2016....

[6] 黃曉磊等.生物多樣性數據共享和發表:進展和建議[J]. 生物多樣性 2014,22 (3): 293–301.

[7] 英國皇家學會:科學是開放事業 [OL]. http://royalsociety.org/policy/projects/science-public-enterprise/report/

[8] Jump up^?Lawrence, B, Jones, C., Matthews, B., Pepler, S., Callaghan, S. (2011).?"Citation and Peer Review of Data: Moving Towards Formal Data Publication".?International Journal of Digital Curation6?(2): 4–37.?doi:10.2218/ijdc.v6i2.205.

[9] 何琳,常穎聰.國內外科學數據出版研究進展[J].圖書情報工作 2014,58(5):104-110.?

期待學術生涯高歌猛進,發表過程一帆風順?

來加入我們活力洋溢的在線社區吧。免費注冊,無限閱覽。

社交賬號一鍵登入

已有54300名科研人員在此注冊。

意得輯專家視點 Editage Insights 目前正在維護中。維護期間,部分站點功能,如登錄、注冊可能無法正常工作。

覺得有用?

如果是的話,和你的同事分享吧