OpenAIRE Graph에서 말하는 "연구 데이터(Research Data)"란?


* 이 내용은 https://www.openaire.eu/what-do-we-mean-by-research-data-in-the-openaire-graph?s=09 을 정리한 것입니다.


~~~~~

OpenAIRE Graph에서 말하는 "연구 데이터(Research Data)"란?

OpenAIRE Graph는 연구 데이터를 통합, 중복 제거 및 강화하여 연구자들이 연구 논문, 데이터셋, 연구 소프트웨어 등을 더 쉽게 찾고 활용할 수 있도록 하는 "오픈 사이언스 지식 그래프(Open Science Knowledge Graph)"입니다.

"연구 데이터"라는 개념은 학문 분야나 맥락에 따라 다양하게 해석될 수 있습니다.
OpenAIRE Graph에서 연구 데이터는 단순한 데이터 파일이 아니라 연구 과정에서 생성, 공유, 인용되는 다양한 형태의 데이터 소스를 의미합니다.

 OpenAIRE Graph에서는 연구 데이터를 다음과 같이 정의하고 활용합니다.


■ 연구 데이터의 생애 주기

연구 데이터는 "실험 단계(Experimental Phase)"와 "출판 단계(Publishing Phase)"의 두 가지 주요 과정에서 생성되고 활용됩니다.

  1. 실험 단계

    • 연구자들은 실험을 수행하면서 연구 데이터를 수집하고 분석
    • 연구 결과를 검증한 후 논문, 연구 데이터, 연구 소프트웨어 형태로 정리하여 공유
  2. 출판 단계

    • 연구 결과를 공개할 때, 연구 논문 뿐만 아니라 연구 데이터를 함께 출판
    • 다른 연구자들이 해당 데이터를 검토하고 재현할 수 있도록 함

■ 구 데이터의 주요 유형

 - 출판된 연구 데이터 (Published Research Data)

  • 연구자들이 실험 결과를 증명하기 위해 출판한 데이터
  • 주로 기관 리포지터리, 특정 주제 리포지터리, 종합 데이터 저장소(ex. Zenodo.org)에 저장됨.
  • 예시: 단백질 데이터(PDB), 지리정보 데이터(GEOS), 물리학 실험 데이터(CERN).

 - 과학적 데이터 소스 (Scientific Data Sources)

  • 연구 과정에서 생성되거나 지속적으로 축적되는 대규모 데이터.
  • 위성 데이터, 센서 데이터, 생물학적 데이터 등 연구기관 및 정부 기관에서 운영하는 데이터 저장소 포함.
  • 예시: Copernicus(지구 관측 데이터), CERN(고에너지 물리 데이터), eBrains(신경과학 지식 그래프).

■  데이터의 인용 및 활용 방식

연구의 투명성을 높이고 연구 평가를 용이하게 하기 위해, 연구 논문에서는 연구 데이터를 인용해야 합니다.

  1. 출판된 연구 데이터 인용

    • 논문에서 특정 데이터셋(예: Zenodo.org의 데이터)을 참조하며, DOI 및 서지 정보와 함께 인용.
  2. 과학적 데이터 소스 인용

    • 논문 본문에서 연구자가 사용한 데이터 저장소를 언급하거나, DOI가 있는 경우 이를 활용하여 인용.

    예시:

    • 논문에서 "우리는 OpenAIRE Graph의 데이터를 사용했다."라고 명시.
    • DOI를 포함하여 OpenAIRE Graph를 연구 데이터로서 직접 인용.

■ OpenAIRE Graph에서 연구 데이터를 다루는 방식

OpenAIRE Graph는 연구 데이터의 검색과 연구 평가를 위해 다음과 같은 기능을 수행합니다.

 - 연구 데이터 출처 통합

  • FAIRSharing, OpenDOAR, re3data 같은 데이터베이스에서 연구 데이터를 수집.

 - 연구 데이터 및 인용 정보 수집

  • 연구 논문에 포함된 연구 데이터 인용 정보를 분석하여 데이터와 논문의 연결 관계 파악.

 - 텍스트 마이닝 기법 적용

  • 논문의 본문을 분석하여 연구 데이터와 데이터 소스 간의 인용 관계를 자동으로 추출.


Comments

Popular posts from this blog

🧑‍🏫[칼럼] 미래 인재상, T자형 하이브리드로 설계하라

[인사이트] "연구용 AI"의 등장과 연구 패러다임의 변화

AI의 기반 : 데이터부터 시작하라