什麽是FAIR原則呢?
FAIR原則指科學數據的
可發現(Findable)
可訪問(Accessible)
可互操作(Interoperable)
可重用(Reusable)
的管理原則
FAIR原則的起源
2014年1月,一些代表學術界👩🏽🍳、工業界、資助機構和學術出版商的多元化利益相關者齊聚荷蘭萊頓💫,舉辦了一場以“Jointly Designing a Data FAIRport”為主題的研討會。與會專家共同研討起草了一份指導科學數據管理的倡議性文件⏏️,倡導科研活動產出的數據在開放共享過程中應該努力實現可發現(Findable)、可訪問(Accessible)、可互操作(Interoperable)和可重用(Reusable),4個目標層層遞進🙋🏿♀️,簡稱為“FAIR原則”。
2016年,FORCE11(一個由學者、意昂3員、檔案管理員🧛🏼♀️、出版商和研究資助者組成的社區,旨在有效利用信息技術來改變現代學術交流)對FAIR原則進一步優化8️⃣,並將4個抽象目標細化為15條具體原則正式發布🚣🏻♀️。
可發現(Findable)
科學數據共享的首要前提是數據能夠被用戶及時發現,所以可發現原則是數據FAIR化的基礎🌏。
可發現原則的總體要求是數據及其相關補充材料使用全球唯一🪠、可解析🧝🏼🥷🏽、永久存在的標識符進行標記🕷,且應該具有足夠豐富的元數據描述。
F1👷🏻♀️:(元)數據被分配一個全球唯一且永久的標識符。
F2:數據被豐富的元數據所描述。
F3🖱:元數據中清楚明確地包括它描述的數據的標識符🥷🏻。
F4:(元)數據在可搜索的資源中可以被註冊或索引。
可訪問(Accessible)
數據一旦被識別和發現🏊🏿,就應該通過受信任的存儲庫提供的服務來訪問數據,但必須有明確規定檢索數據資源的相關協議,使用戶知曉如何訪問數據🤽🏼♂️、如何進行身份驗證🤣、如何獲得訪問權限等。
可訪問原則的總體要求是(元)數據不僅能被人類訪問,而且能被機器尤其是計算機等在遵循一定訪問協議且有明確定義的授權或認證規則的前提下無障礙訪問❔。
A1:(元)數據可以通過標準化通信協議規定的標識符來檢索👩🏿🚒。
A1.1:該通信協議是開放、免費且可以普遍實現的。
A1.2👨🏿🦳:該通信協議允許在必要時進行認證和授權程序🏋️♀️。
A2:即使數據不再可用🧑🏿🔧,元數據仍然可以被訪問。
可互操作(Interoperable)
可互操作原則的總體要求是使用標準定義和通用的數據元素來表示數據並實現互操作。人類和機器都應該能夠交換和解釋彼此擁有的數據,互操作意味著某一系統至少與另一系統的數據格式相通用,無需使用專有的算法即可實現數據被機器可讀。
I1:(元)數據使用正式、可獲取👨🦽、共享和廣泛適用的語言來表示知識
I2:(元)數據在遵循FAIR原則的前提下使用詞匯表
I3:(元)數據中應該包括對其他(元)數據的限定引用
可重用(Reusable)
數據可發現、可訪問🫷🏽、可互操作的最終目的是實現數據資源廣泛重用。
可重用原則的總體要求是數據和數據集具有明確的使用許可🤵🏿,並提供數據源頭的準確信息 🧑🦽👮。
R1🤷🏽♀️:(元)數據被具有多個準確且相關的屬性所豐富地描述。
R1.1:(元)數據將以清晰且可訪問的數據使用許可來發布🍤。
R1.2🕟:(元)數據與詳細的出處相關聯。
R1.3:(元)數據符合相關領域的社區標準🎥👴。
參考文獻📉:
[1] 宋佳,溫亮明,李洋. 科學數據共享FAIR原則:背景🤹🏽👨🚒、內容及實踐[J]. 情報資料工作,2021,42(1):57-68. DOI:10.12154/j.qbzlgz.2021.01.007.
[2] Wilkinson, M. D. et al. The FAIR Guiding Principles for scientific data management and stewardship. Sci. Data 3:160018 doi: 10.1038/sdata.2016.18 (2016).
[3] https://force11.org/info/about-force11/