知識開放,開啟數字中國的一把鑰匙
?——吳建中館長在復旦大學的演講
思想者小傳
吳建中 現任澳門大學圖書館館長、中國圖書館學會副理事長兼學術研究委員會主任、國際圖聯圖書館建筑與設備委員會常委。曾任上海圖書館館長、上海科技情報研究所所長。2016年至2017年為上海市人民政府參事,2005年至2010年任上海世博會主題演繹顧問。出版著作20余本,發表論文300余篇。
2017年12月8日,中共中央政治局就實施國家大數據戰略進行集體學習。習近平總書記強調,推動實施國家大數據戰略,加快完善數字基礎設施,推進數據資源整合和開放共享,保障數據安全,加快建設數字中國。
談到大數據戰略,不得不提全球開放運動。今天,開放已經成為一種全球共識。從開放獲取到開放數據再到開放科學,一場以知識共享為特征的開放運動不斷向縱深發展。其意義不僅在于知識的開放和共享,更重要的是它有望改變科學研究范式和知識交流生態,提升科技創新能力,推進經濟社會發展。
但是,我們是否準備好了呢?幾年前,《每個圖書館員都應知道的十大技術》 主編肯·弗納姆針對圖書館嚴重滯后于互聯網發展現象說過這樣一段話:“當你在談論電子書、大數據或物聯網的時候,圖書館里根本就沒有這方面的資源”,我們還處在悶頭“做自己的事”的階段。確實,國內大部分圖書館目前仍處于印刷型資源為主體的階段,開放數據也好,開放科學也好,似乎還很遙遠。
如何看待大數據時代的知識開放和共享?它背后有著怎樣的全球發展邏輯?我們又該從何處著手?下面,我圍繞相關話題和大家作一些分享。
開放獲取論文,占總出版量的四分之一強
開放獲取,不是現在才有的。當世界上第一本科學期刊面世時,學術開放的精神就形成了,并延續數百年。
以前我們常說,大學是一個地區的學術中心,圖書館則是大學的心臟。學術成果不僅在大學集聚,而且記錄并存儲于圖書館之中。但近百年來,學術商業化現象愈演愈烈,大學研究人員創造的科研成果及其版權,分散于學會協會和商業出版機構中。這造成科技期刊無序漲價、科研成果只對付費讀者開放、數據只能通過專門系統或軟件打開等現象,嚴重影響了知識的開放和共享。
2013年,美國政府、非營利機構和大學等的科研投入為1580億美元,占美國當年研發總和的三分之一。但相關研究成果不僅為出版社免費獲取,而且其版權也被出版社所擁有。對此現象,美國科學公共圖書館創辦者邁克爾·艾森揶揄道:納稅者在對科學研究納稅的同時,還要為閱讀這些成果付費。由此,一場開放獲取運動應運而生。
如今,開放獲取運動的成果如何?歐盟委員會在一份報告中指出,全球同行評議論文數的40%實現免費獲取,在一些國家和一些領域已經超過50%的“臨界點”。2017年12月5日,英國大學協會開放獲取協調組發表《向開放獲取轉型監測報告》。調查顯示,全球研究論文在出版后立即進入開放獲取模式的,2014年占比為18%,2016年上升為25%。從總體上看,開放獲取論文占全球總出版量的四分之一強,近年來還有逐步加快發展的趨勢。
這兩年,還興起了混合開放獲取運動。這是開放與收費論文之間的過渡型方式,體現了出版界對開放獲取期刊轉型的一種支持。根據《混合開放獲取的增長狀況》里的數據,混合模式的期刊數從2009年2000種增長至2016年約10000種,論文數從2009年的8000篇發展至2016年的45000篇。
同時,著作者、學會協會也積極參與和推動開放獲取。例如,英國皇家學會于2017年11月28日宣布,該協會從1665年到1996年出版的1278卷(45883篇論文)電子版紙質期刊,將在2018年1月24日前全部免費開放。
哈佛大學圖書館咨詢委員會曾于2012年發表一份報告,提出應對大學圖書館經費危機的最佳解決方案是推進期刊的開放獲取。按現有趨勢發展,不出20年應可基本實現學術論著開放和共享的目標。在此基礎上,大學不僅將實現學術中心地位的回歸,而且會進一步推動經濟、科技與文化的發展。
研究數據與論著,應置于同等重要的位置
開放數據,不是現在才開始的。早在上世紀50年代,作為國際地理年期間全球聯手開展極地科學考察的一個部分,國際科學聯合會建立了世界數據中心。
2004年,經濟合作與發展組織成員國的科技部長簽署聯合聲明,要求凡是由政府及公費支撐的研究成果都要向公眾開放。2007年,該組織又頒布 《公共資助科研數據開放獲取的原則與指南》,對研究數據的開放提出具體要求。2011年,歐盟委員會頒布《開放數據:創新、增長和透明治理的引擎》報告,要求歐盟及其成員國建立法律機制、采取財政措施,促進在開放數據領域的合作。
開放數據的關鍵是格式的規范和開放。2013年6月,八國集團首腦在北愛爾蘭峰會上簽署《開放數據憲章》,提出開放數據五項原則:開放數據是基本原則;注重質量與數量;讓所有人使用;為改善治理而發布數據;發布數據以激勵創新。
數據為什么如此受到重視?30年前發表在《美國經濟評論》上的一篇名為《實證經濟學的反響:貨幣、信用和銀行》的論文,就曾指出數據不可復制的嚴重問題。作者經過對經濟學論文中數據是否可復制的查驗發現,很多情況下讀者難以得到來自研究人員的數據和編碼。即使得到了,某些結果仍不可復制。
為此,作者建議,應當通過說服經濟學領域雜志編輯,向著作者索取數據和計算機編碼的拷貝,以提高實驗結果的可重復性。
開放科學重視數據的開放,強調數據的活用和再利用,并把研究數據與論文、論著置于同等甚至更為重要的位置。開放科學不僅倡導論文的開放獲取,而且認為論文中的數據開放也是不可缺少的。
美國科學公共圖書館從2014年3月開始要求數據公開,著作者要簽署數據可獲取聲明,并注明數據在哪里、如何利用。當然,個人隱私等數據例外。
目前,同行評議及期刊編輯審核的重點是論文結論,一般很少會關注研究過程中的數據。只有在著作者面臨爭議或撤稿的情況下,才會去調查研究數據的真偽。而隨著開放運動的持續深入推進,科研期刊要求著作者提交數據可獲取聲明將成為常態。
明日的文化傳統,建在今日的數字信息上
研究數據管理是開放運動的產物。它將研究數據看作與論著同等的科學發現產品,并通過數據的收集、加工、傳播、保存等,形成一整套開放型數據生產與傳播價值鏈。起初,它與機構知識庫并行發展。因此,有人把它們分別比喻為Paper (以紙質出版為主體的論文)和Product(以數據為主體的作品)。
在發達國家,由開放運動而催生的機構知識庫已進入深入發展階段。機構知識庫成為一種常態,并開始新的升級探索——研究數據管理。日本國立情報學研究所2017年11月7日發布信息,宣布該所與歐洲核子研究中心、日本國立物質材料研究所合作,聯合開發下一代機構知識庫系統。該系統不僅保持原有的機構知識庫功能,而且著力于研究數據管理,力圖將二者融合為一體。
日前,歐洲研究圖書館協會發布2018年至2022年發展規劃,提出研究型圖書館的幾個發展方向。其中包括:開放獲取將處于主流地位;研究數據可查、可取、可互聯和可再用;數字技能為更開放透明的研究生命周期奠定基礎;明日的文化傳統將建立在今日的數字信息上。
研究論文與研究數據合為一體,也在引領開放科學向縱深發展。通過與其他研究團隊共享數據以減少重復試驗,不僅有助于研究效率的提高,而且有助于確保研究成果的質量和透明度。它背后的一個基本信條是,所有的理論都應該經得起批評,而且可重復。
因此,開放運動的最終目的在于通過利用現代科技手段,促進學術成果的揭示、開放和再利用,形成有利于知識共享、大眾創新和經濟發展的科研環境。
起初,開放運動推進的重點是論文和數據的開放,現在則包含相互利用研究基礎設施和共享研究方法等。2015年10月,經濟合作與發展組織發布《讓開放科學成為現實》,標志著開放科學正式進入相關國家的政策領域。2017年3月,歐盟委員會發布《開放科學監測報告》,并開設專門網站。開放科學、開放創新和向世界開放,是歐盟研究、科學和創新政策的三大重心。2017年12月8日,經濟合作與發展組織的世界科學論壇和國際科學聯合會世界數據系統發表《協調和支持國際研究數據網絡》,呼吁共同推進全球數據網絡建設,以推動開放科學的發展。
不少國家還將開放科學看作科技創新的抓手。芬蘭教育文化部明確提出,要成為全球開放科學的領先國家。其中的目標之一就是,將公共資金資助的研究成果和數據公開,并明確開放方式。
完善數字基礎設施,改變“數據孤島”現象
開放為每一個人增加了參與科學發展和創新的機會。抓住這一機遇,某種程度上就抓住了開啟數字中國大門的鑰匙。
鑒于開放與創新之間的關系,我們可以從以下幾個方面著手:
第一,加大宣傳力度,增強開放共享意識。
目前,知識開放共享的最大障礙是用戶意識不足。也就是說,科研人員存有疑慮,缺乏參與知識共享的積極性。一項關于中國機構知識庫建設現狀的調查結果顯示,機構知識庫內容的存繳以個人提交的比例最低。另一項調查也表明,科研人員繳存科研成果的積極性不高,大部分高校傾向于從其他系統采集數據。
這并非國內特有的現象,國外在推進數據管理的過程中也遇到類似問題。日本一家權威機構對1398名科研人員的開放數據認知度調查顯示,科研人員在開放數據上顧慮重重:其中,排在第一位的是“不被引用而被利用的可能性”,占87.8%; 排在第二位的是“擔心被人搶先發表”,占84.6%。由此可見,這是一個全球科技界普遍存在的問題。對此,有必要采取相應的扶持措施以增強開放和共享意識,讓更多的科研人員自愿參與數據管理。
第二,制定積極政策,推進開放科學發展。
根據聯合國教科文組織的科學報告,到2030年,科學不僅使用數據來創造,科學發現的基本產出也是數據。報告明確提出“對未來可持續發展影響最大的將是大數據和開放”,并強調將以此作為核心戰略推進2030可持續發展目標的實現。
21世紀是數據為主導的世紀。數據將在經濟、社會、科技和文化等所有領域發揮重要作用。由于開放數據是任何人都可以自由利用和再發布的數據,故政策和規范尤為重要。按美國白宮2014年5月9日發布的開放數據政策,開放數據有以下幾個要素,即公共性、可獲取性、描述充分、可再利用、完整性、及時性、可控的再發布等。為規范開放數據,日本開放數據流通推進聯盟也于2014年12月發布《社會資本信息開放數據化和二次利用促進指南》,對如何發布開放數據和推進數據二次利用提出了具體要求。
開放科學是科學發展的新范式,也是深化科技創新的新動力。我們的政府和科研機構應著眼未來、謀篇布局,為搶占下一輪發展制高點奠定基礎。
第三,整合各類資源,建設數字基礎設施。
在開放數據和開放科學的推進過程中,建立和完善數字基礎設施是當務之急。開放出來的數據不僅是為了得到驗證,而且可通過再利用催生新的研究成果。建設整合的數字基礎設施,不僅有利于改變“數據孤島”現象,增強信息交流,讓更多的人參與科學研究,形成共同攻克難關的良好環境,而且能讓研究過程中的數據和成果實現共享,提高科研及其成果的轉化效率。
第四,培育專業人才,提升數據管理水平。
人才是事業發展的保障。作為一項新的事業,開放數據和開放科學能否順利開展,很大程度上有賴于專業隊伍的水準。由于它涉及多個領域、行業,因此對從事這一工作的專業人員來說,不僅要有精深的專業技能,而且要有良好的溝通交流能力。目前我們要著力于加強專業隊伍建設,加大人才培養力度,培育一批既懂得數字技術又善于數據管理的人才,為推進開放數據、促進開放科學、助力開放創新打下基礎。
免責聲明:凡本網注明“來源:XXX(非駐馬店廣視網、駐馬店融媒、駐馬店網絡問政、掌上駐馬店、駐馬店頭條、駐馬店廣播電視臺)”的作品,均轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責,作品版權歸原作者所有,如有侵犯您的原創版權請告知,我們將盡快刪除相關內容。凡是本網原創的作品,拒絕任何不保留版權的轉載,如需轉載請標注來源并添加本文鏈接:http://www.czyfgj.cn/showinfo-318-200231-0.html,否則承擔相應法律后果。