논문

한국 우주관측 자료 전략 수립 제안

백지혜1,https://orcid.org/0000-0002-0230-4417, 최성환1https://orcid.org/0000-0002-1946-7327, 박종엽1https://orcid.org/0000-0002-1063-9129, 김수진1https://orcid.org/0000-0002-5004-7734, 심채경1https://orcid.org/0000-0002-3737-0553, 양태용1https://orcid.org/0000-0002-5725-9828, 정민섭1https://orcid.org/0000-0002-5434-5181, 조영수1https://orcid.org/0000-0003-3574-1784, 최영준1https://orcid.org/0000-0001-6060-5851
Ji-Hye Baek1,https://orcid.org/0000-0002-0230-4417, Seonghwan Choi1https://orcid.org/0000-0002-1946-7327, Jongyeob Park1https://orcid.org/0000-0002-1063-9129, Sujin Kim1https://orcid.org/0000-0002-5004-7734, Chae Kyung Sim1https://orcid.org/0000-0002-3737-0553, Tae-Yong Yang1https://orcid.org/0000-0002-5725-9828, Minsup Jeong1https://orcid.org/0000-0002-5434-5181, Young-Soo Jo1https://orcid.org/0000-0003-3574-1784, Young-Jun Choi1https://orcid.org/0000-0001-6060-5851
Author Information & Copyright
1한국천문연구원
1Korea Astronomy and Space Science Institute, Daejeon 34055, Korea
Corresponding author : Ji-Hye Baek, Tel : +82-42-865-2057, E-mail : jhbaek@kasi.re.kr

© Copyright 2021 The Korean Space Science Society. This is an Open-Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/4.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

Received: Jul 15, 2021; Revised: Aug 10, 2021; Accepted: Aug 11, 2021

Published Online: Aug 31, 2021

요 약

우주관측 자료는 우주 임무를 통해 관측한 별, 은하, 태양, 우주 플라즈마(plasma), 달, 행성 등의 연구 자료로 관측 자료를 가공 및 활용한 것까지 포함한다. 국내외 천문우주 관측시스템이 대형화되고, 우주 임무의 확대 및 자료 용량 증가(빅 데이터)로 인해 우주관측 자료의 체계적이고 효율적인 관리에 대한 필요성이 증대되고 있다. 이에 우리나라도 우주관측 자료의 전략을 세우고, 이를 바탕으로 우주관측 자료 정책을 수립해야 한다. 이를 위한 준비 단계로 우주관측 자료에 대한 광범위한 이해와 다년간의 경험으로부터 발전된 미 항공우주국(National Aeronautics and Space Administration, NASA)의 자료 전략을 분석하였다. NASA의 자료 전략 분석 결과를 바탕으로 우리나라의 우주관측 자료 전략 방향과 앞으로 우주관측 자료 정책을 수립하는 데 기반이 될 우주관측 자료 전략 권고 사항 10가지를 제안한다.

Abstract

Space observation data includes research data such as stars, galaxies, Sun, space plasma, planets, and minor bodies observed through space missions, including processing and utilizing the observation data. Astronomy and space science observation systems are getting larger, and space mission opportunities and data size are increasing. Accordingly, the need for systematic and efficient management of space observation data is growing. Therefore, in Korea, a strategy and policy for space observation data should be established. As a stage of preparation, National Aeronautics and Space Administration (NASA)’s data strategy, which developed from extensive understanding and long-term experience for space observation data, was analyzed. Based on the analysis results, we propose a strategic direction and 10 recommendations for Korean space observation data strategies that will be the basis for establishing space observation data policies in the future.

Keywords: 우주관측; 우주임무; 자료; 자료 전략; 자료 정책
Keywords: space observation; space mission; data; data strategy; data policy

1. 서론

천문우주 분야에서 관측 대상은 태양, 행성, 별, 은하 등 지구 밖의 모든 천체와 지구의 전리권과 자기권 등 플라즈마(plasma) 영역까지 포함한다. 이러한 대상들을 다양한 방법으로 관측하여 얻은 자료와 이를 처리하고 분석한 모든 결과를 자료라 한다. 자료는 과학 연구에 있어 가장 기본적이고 중요한 수단이기 때문에 자료를 얻기 위한 다양한 프로젝트(project)가 국내외에서 진행되고 있다.

일반적으로 우주 관측소를 구축하고 위성을 개발하는 프로젝트에는 막대한 예산이 필요하다. 이러한 프로젝트로부터 얻은 성과를 일회성으로 사용하는 데 그치지 않고, 그 효과를 보다 지속적으로 활용하고 성과를 극대화하기 위해서는 프로젝트 예산에 관측 시스템을 구축하는 비용과 함께 자료를 처리하고 저장하는 데 필요한 하드웨어(hardware) 및 소프트웨어(software)의 비용도 포함되어야 한다. 미국이나 유럽 같은 선진국에서는 자료에 대한 예산을 프로젝트 계획 초기부터 고려하고, 자료 처리 방법이나 소프트웨어 개발도 관측 시스템 구축과 함께 준비한다. 특히 자료 수명 주기(data lifecycle)에 대한 관리 정책을 수립하여 막대한 예산이 투입되어 얻어진 자료가 유실되거나 왜곡되지 않고 최대한 많은 사용자들이 자료를 활용할 수 있도록 한다.

2014–2040 우주개발 중장기 계획(제2차 우주개발진흥 기본계획 수정)[1]에 따르면 우리나라에서도 2040년까지 달 및 행성탐사, 우주과학, 태양 및 근지구 우주환경 감시, 미래 우주탐사, 우주환경감시 및 우주위험 대응 분야 등 약 20여 개의 우주 임무를 계획하고 있으며, 우주관측을 위한 다양한 국제협력 우주 임무도 진행하고 있다. 또한 기술 발전으로 인한 빅 데이터(big data)화는 자료의 효율적인 관리와 활용을 위한 천문우주 자료 관리 정책 수립에 대한 필요성을 더욱 증가시켰다1. Fig. 1은 우리나라의 행성탐사 및 우주과학 계획(안)으로 우주개발 중장기 계획에 포함된 다양한 우주 임무를 보여주고 있다.

jsta-1-2-241-g1
Fig. 1. Planetary exploration and space science proposals in 2014–2040 mid- to long-term space development plan for space exploration. Adapted from Government of Korea [1] with CC-BY.
Download Original Figure

우주 임무의 목표를 달성하는 데 있어 핵심 단계는 고품질의 자료를 생성하고 분석하는 것이다[2]. 또한, 이렇게 얻은 중요한 자료를 효율적으로 관리하고 활용할 수 있는 자료 관리 정책이 필수적이지만, 우리나라의 경우, 자료 관리 정책은 물론 자료의 중요성에 대한 인식조차 부족하다[3]. 이는 천문우주 분야의 관측 시스템 개발 관련 정책이 관측 시스템 자체를 구축하는 것에 초점이 맞추어져 있었기 때문으로 보인다. 이제는 우리가 생산한 자료에 눈을 돌릴 때이다. 막대한 예산과 인력, 시간을 투입해 개발하는 관측 시스템의 자료 활용을 확대하기 위한 방안이 반드시 필요하다. 국가 R&D 사업으로 구축된 관측 시스템에서 생산된 자료는 공공재적 성격을 가지며, 연구자 개인이 아닌 관측 시스템을 운영하는 기관이나 국가에서 자료에 대한 체계적인 관리를 해야 한다. 이를 위해서는 국가 차원의 자료 전략을 세우고, 이 전략을 바탕으로 자료 관련 기관에서는 자료 정책을 수립해야 할 것이다. 이 논문에서는 우리나라의 우주관측 자료 전략 수립을 위해 천문우주 분야의 선진 기관인 미 항공우주국(National Aeronautics and Space Administration, NASA)의 자료 전략을 분석하였다. 이를 바탕으로 우리나라의 실정에 맞는 우주관측 자료 전략과 권고 사항을 제안한다.

논문의 2장에서는 우주관측 자료 전략에 대해 언급하기 전에 기본적인 배경인 우주관측 자료의 정의, 우주관측 자료 전략 및 정책에 대한 일반적인 사항을 정리하였다. 3장에서는 NASA 과학임무부서(science mission directorate, SMD)의 자료 전략을 요약하고, 이를 심도 있게 분석하였다. 4장에서는 우리나라의 우주관측 자료 전략 수립을 위한 전략 및 권고 사항을 제안하여 앞으로 한국의 우주관측 자료 정책을 수립하는 데 기여하고자 한다.

2. 배경

2.1 우주관측 자료 정의

위성 자료는 인공위성을 이용하여 획득한 모든 자료를 포함하며, 우주개발진흥법[4]에서는 위성정보라고 표현하고 있다. 위성 자료는 관측 대상에 따라 다시 지구관측 자료(earth observation data)와 우주관측 자료(space observation data)로 구분할 수 있다. 지구관측 자료는 우주 임무를 통해 얻어진 모든 형태의 지구를 관측한 자료(지질, 지형, 해양, 대기 등)이다. 우주관측 자료는 우주 임무를 통해 천문우주 분야 대상(별, 은하, 태양, 우주 플라즈마, 달, 행성 등)을 관측한 자료다. 두 자료 모두 관측 자료를 가공 및 활용한 것까지 포함한다. Table 1은 지구관측 자료와 우주관측 자료 정의를 정리한 것이다. Fig. 2Fig. 3은 각각 지구관측 자료와 우주관측 자료의 예를 보여준다. 이 논문에서는 우주관측 자료에 대한 내용을 다룬다.

Table 1. Definitions of earth observation data and space science data
Scope Definition
Earth observation data Data for Earth observation in all forms acquired from space missions
Space observation data Data such as stars, galaxies, sun, space plasma, moon, and planets observed by space missions
(including processing and utilizing of observation data)
Download Excel Table
jsta-1-2-241-g3
Fig. 3. Examples of space observation data (solar dynamics observatory data (a) and hubble space telescope data (b)). (a) Adapted from Korea Data Center (KDC) for SDO with public domain. (a) Adapted from Korea Data Center (KDC) for SDO with public domain. http://swc4.kasi.re.kr/jpg_512/aia/131/2010/20101105/20101105_001021_SDO_AIA_131_512.jpg (b) Adapted from European Space Agency(ESA) with public domain. https://www.esa.int/About_Us/ESA_history/Starryeyed_Hubble_celebrates_20_years_of_awe_and_discovery
Download Original Figure
2.2 우주관측 자료 전략과 정책

우주관측 자료 전략은 우주관측 자료를 효율적으로 생산 및 관리하고 활용을 극대화하기 위한 포괄적인 방침과 계획으로, 우주관측 데이터 전략의 대상에는 천문우주 전 분야(천체물리, 태양물리, 행성과학 등)의 자료가 모두 포함된다. 천문우주 분야의 과학 자료 아카이브(archive) 자원은 관측 자료뿐만 아니라, 모델(model) 자료, 자료 관련 툴(tool), 소프트웨어2, 메타데이터(metadata), 문서 등 범위도 넓고 분야별로 종류도 다양하다[2]. 이러한 자료를 하나의 엄격한 관리 체계를 정하고, 이를 절대적으로 따르도록 하는 것은 비효율적이며, 실제로도 적용하기 힘들다. 그렇기 때문에 NASA에서는 전 분야의 자료를 아우를 수 있는 상위의 계획(NASA Plan for Increasing Access to the Results of Scientific Research)을 수립하여 전체적인 개요, 요점, 필수 사항을 정의한다. 그리고 이를 바탕으로 NASA의 SMD에서는 하부 조직인 천체물리 본부(Astrophysics Division), 지구과학 본부(Earth Science Division), 태양권물리 본부(Heliophysics Division), 행성과학 본부(Planetary Science Division)를 위한 보다 구체적인 자료 관리 및 컴퓨팅(computing) 전략을 수립하였다. 이 또한 전체적인 개요와 필수 사항, 권고 사항만을 제시하였고, 각 부서에서는 그대로 따르거나 이를 바탕으로 본부 수준의 자료 정책을 수립하기도 한다.

우주관측 자료 정책 또는 자료 관리 정책은 자료 전 주기 동안의 자료에 대한 생산, 사용, 저장 및 접근방법에 관한 지침을 제시해야 한다[2]. 자료를 생성하고 분석하는 일은 관측기를 개발하거나 연구를 수행하는 팀에 국한된 일이 아니다. 연구 목표에 도달하기 위해서는 관측기나 시스템 정보, 관측 자료, 기타 자료, 툴과 소프트웨어 등이 필요하며, 자료의 생산, 처리, 배포 및 보관의 모든 단계는 연구자들과 기술개발자들 간의 긴밀한 협력으로 이루어져야 한다. 이러한 과정을 일관되고 효율적으로 진행하기 위해 자료 정책이 필요하다. 우주관측 자료 정책에는 보다 구체적인 아카이브 운영 및 계획, 자료 모델, 자료 서비스에 관한 내용이 포함되며, 자료 전략을 기준으로 하여 각 분야의 특성에 맞는 자료 정책을 수립해야 한다.

3. NASA 자료 전략 분석

이 장에서는 NASA의 자료 전략에 대해 내용을 요약하고 이를 분석하였다. NASA 이외에도 유럽우주국(European Space Agency, ESA)과 일본국립천문대(National Astronomical Ob-servatory of Japan, NAOJ) 등 국외 기관과 국내 연구기관의 자료 전략과 정책을 조사하였지만, NASA를 제외한 다른 기관에는 우주관측 자료를 위한 명문화된 자료 전략이나 자료 관리 정책 자료를 찾을 수 없었다. ESA의 경우, 유럽 연합(European Union)에서 제시하는 유럽 데이터 전략(European Data Strategy)을 따르겠지만, 이는 분야를 특정하지 않는 모든 자료에 대한 내용이다. 우리나라의 경우, 국가 과학자료센터 구축을 위한 다양한 연구[3,5,6]를 수행하였으나, 이 또한 전 분야의 과학자료를 고려하는 것이며, 여기에도 자료 전략이나 정책에 대한 내용은 없었다. 이러한 이유로 비교적 상세하게 정리되어 있는 NASA의 자료 전략만을 분석하였다.

3.1 NASA 자료 전략

NASA는 획기적인 과학 발견을 위해서는 과학 자료 및 컴퓨팅 시스템이 매우 중요함을 인식하고, 이를 위한 새로운 전략을 세우고자 하였다. 이를 위한 첫 단계로 NASA 자문위원회(NASA Advisory Council, NAC)는 빅 데이터의 모범 사례를 연구하고 식별하기 위한 빅 데이터 태스크포스(Big Data Task Force, BDTF)를 구성하였다. BDTF는 2015년부터 2017년까지 활동하였으며, ‘Data Science: Statistical and Computational Methodologies for NASA’s Big Data in Science’, ‘Making NASA Science Data More Usable’, ‘Modeling Workflows’, ‘Server-side Analytics’ 등 총 4종의 최종 보고서를 제출하였고, 이는 NASA의 자료 정책과 전략을 세우기 위한 기초 자료가 되었다. 이를 바탕으로 NASA SMD에서는 정보 기술의 발전을 활용하여 과학 컴퓨팅과 자료 아카이브를 개선하고, 향후 5년 동안 더 큰 과학적 발견을 가능하게 하는 새로운 전략을 개발하기 위해 각 부서의 대표, 민간 기업의 IT 전문가와 함께 전략 자료 관리 워킹 그룹(Strategic Data Management Working Group, SDMWG)을 조직하였다. SDMWG는 2018년 10월에 자료 관리 전략 워크숍을 개최하고, 빅 데이터(big data), 클라우드 컴퓨팅(cloud computing), 오픈 사이언스(open science), 학제간 연구(inter-disciplinary research) 등 네 가지 주요 주제를 중점적으로 토론하였다. 또한 SDMWG는 2018년에 “SMD의 2019년부터 2024년까지의 자료 관리와 컴퓨팅 전략 보고서[7]”를 작성하였고, SMD는 이를 승인하여 4개의 과학 부서(천체물리 본부, 태양권물리 본부, 행성과학 본부, 지구과학 본부)를 통해 구현해 나가고 있다.

SMD는 전략적인 자료 관리 및 컴퓨팅을 위한 비전, 사명, 세 가지 목표 및 11개의 관련 전략으로 구성된 전략을 수립하였으며, 이러한 전략을 구현하는 데 필요한 지침과 현재 상황 분석, 조사 결과와 권고 사항을 제시하고 있다.

또한 SMD는 자료 관리 전략 목표를 오픈 사이언스, 지속적인 자료 및 컴퓨팅 시스템 개선, 전략적 협업관계로 세우고, 다양한 권고 사항을 제시하였다. 이러한 권고 사항을 개발할 때에는 아래와 같이 세 가지 주요 운영 원칙[7]을 지정하였다.

  • 수집한 자료를 손상해서는 안됨.

  • 새로운 임무를 활용하여 발전시켜야 함.

  • 대체 불가능한 자료의 무결성을 보호하면서 과학적 가치가 높은 과거 자료 세트를 현대 화해야 함.

Table 2는 SMD의 자료 관리 및 컴퓨팅 전략을 요약한 내용이다.

Table 2. Summary of NASA SMD data management and computing strategy
Vision: To enable transformational open science through continuous evolution of science data and computing systems for NASA’s Science Mission Directorate.
Mission: Lead an innovative and sustainable program supporting NASA’s unique science missions with academic, international and commercial partners to enable groundbreaking discoveries with open science data. Continually evolve systems to ensure they are usable and support the latest analysis techniques while protecting scientific integrity.
Goal 1: Develop and Implement Capabilities to Enable Open Science Goal 2: Continuous Evolution of Data and Computing Systems Goal 3: Harness the Community and Strategic Partnerships for Innovation
Strategy 1.1:
Develop and implement a consistent open data and software policy.
Strategy 2.1:
Establish standardized approaches for all new missions and sponsored research that encourage the adoption of advanced techniques.
Strategy 3.1:
Develop common metadata standards for all NASA science data.
Strategy 1.2:
Upgrade capabilities at existing archives to support machine readable data access using open formats and data services.
Strategy 2.2:
Integrate investment decisions in High-End Computing with the strategic needs of the research communities using this capability.
Strategy 3.2:
Utilize the full capacity of advances in High End Computing to achieve SMD’s research goal.
Strategy 1.3:
Develop and implement a SMD data catalog to support discovery and access to complex scientific data across Divisions.
Strategy 2.3:
Invest in capabilities to use commercial cloud environments for open science to make data accessible by diverse set of academic and commercial users.
Strategy 3.3:
Promote opportunities for continuous learning as the field evolves through collaboration.
Strategy 1.4:
Increase transparency into how science data are being used through a free and open unified journal server.
Strategy 2.4:
Provide tools and training to scientists to be better able to collaborate with all types of computational and computer scientists, including Artificial Intelligence and Machine Learning (AI/ML).

NASA, National Aeronautics and Space Administration; SMD, science mission directorate.

Download Excel Table

SDMWG는 전략 문서를 작성하는 시점의 요구 사항과 모범 사례가 5년 동안 동일하게 유지되지 않을 것으로 예측하였다. 따라서 SMD의 자료 및 컴퓨팅 요구 사항에 대한 주기적인 재평가가 필요하며, 각 과학 부서에서 이를 검토하여 역량을 꾸준히 발전시키도록 권장하고 있다.

3.2 NASA 자료 전략 목표 분석

NASA는 자료 정책을 위한 SMD의 자료 전략을 세우고 연구 커뮤니티(community), 학계, 민간기업, 국제 협력 기관 등으로부터 들어오는 의견이나 모델을 기반으로 연구 환경을 발전시키고 있다. 우리나라도 우주관측 자료에 대한 기술 협력과 지속적인 투자를 통해 시스템, 자료 활용, 기술 확대 방안을 마련해야 한다. 이 장에서는 NASA의 자료 전략 목표를 분석하여 이를 바탕으로 우리나라의 우주관측 자료 전략을 수립하는 데 도움이 되고자 한다. 아래는 NASA 자료 관리 및 컴퓨팅 전략 목표 3가지[7]이다.

  • 오픈 사이언스

  • 지속적인 자료 및 컴퓨팅 시스템 개선

  • 전략적 협업관계

첫 번째 오픈 사이언스는 최근 천문학 및 우주과학 분야의 경향이다. NASA는 과학 자료, 소프트웨어 및 정보를 검색하고, 접근이 가능하게 하면 협업과 혁신이 촉진되고, 투명성이 높아진다고 강조하였다[7]. ESA의 전 사무총장인 Jan Wörner도 “ESA의 이미지, 정보 및 지식에 대한 접근을 개방하는 것은 Space 4.0 환경에서 정보를 제공하고, 혁신하고, 상호 작용하고, 영감을 주는 우리 목표의 중요한 요소(This evolution in opening access to ESA’s images, information and knowledge is an important element of our goal to inform, innovate, interact and inspire in the Space 4.0 landscape)”라고 했다[8]. 이러한 관점에서 우리나라는 개방형 과학 자료 생태계를 구축하여야 한다. 개방형 과학 자료 생태계는 자료의 접근성을 높이는 것과 함께 다양한 인터페이스 표준을 지원하는 개방형 소프트웨어 프레임워크(frame-work)를 중심으로 구성될 수 있다. 개방형 소프트웨어+ 프레임워크는 자료 수집, 검색, 접근 및 분석을 위한 클래스(class), 라이브러리(library), 응용프로그램 인터페이스(application pro-gramming interface, API), 응용프로그램, 서비스 시스템 구성 등을 제공하며, 각 프로젝트 또는 부서 간에 재사용 가능한 환경을 구축하여 지속적으로 개선하고 활용될 수 있도록 한다. 또한 개방형 소프트웨어 프레임워크의 라이브러리와 과학 자료를 공개하여 타 분야 연구자와 일반인들도 이를 사용할 수 있도록 하고, 다양한 분야에서 활용되고 관련 기술이 확대될 수 있는 환경을 제공해야 할 것이다.

두 번째 전략 목표인 지속적인 자료 및 컴퓨팅 시스템 개선은 자료와 소프트웨어의 관점에서 중요한 전략 목표이다. 일단 관측시스템 운영이 시작되면 시스템의 고장으로 운영이 중단되기 전까지 수년에서 수십년의 기간 동안 자료를 수집하게 된다. 과학 임무가 진행되는 동안 시간이 지남에 따라 자료 및 소프트웨어, 하드웨어에 대한 새로운 기술이 등장할 수 있고 기존의 방법 대신 새로운 자료 처리 방법이나 혁신적인 컴퓨팅 기능을 적용할 수도 있게 될 것이다. 이에 따라 자료의 가치가 크게 달라질 수 있기 때문에 기존 자료에 새로운 기술을 적용하는 것을 장려해야 한다. 이를 위해서는 임무 주기 전반에 걸쳐서 자료 및 컴퓨팅 시스템에 대한 지속적인 평가가 필요하고, 새로운 기술을 사용하고 효율적으로 적용하기 위한 방안을 마련해야 한다. 또한 자료, 소프트웨어 및 하드웨어와 관련된 기술 개발, 선정, 투자를 지원할 수 있는 방향으로 자료 정책을 수립해야 한다. 자료 관리 및 컴퓨팅 시스템 개선을 지원하기 위한 자료 시스템, 컴퓨팅 접근 방식 및 기술을 활용하는 인력에 대한 투자가 필요하며, 이러한 과정을 효과적으로 진행하기 위해 자료 과학자와 협력하는 것은 필수적이다[7].

세 번째 목표인 전략적 파트너십은 국내외 커뮤니티뿐만 아니라, 기관 간 또는 기관내의 부서 간의 적극적인 협업을 포함한다. 또한 타 분야와의 협업, 예를 들면 컴퓨터 공학이나 자료 과학 분야와의 융합 연구를 통해 관련 도구, 타 분야 혁신 기술 등을 인식하고 활용할 수 있는 기회를 마련할 수 있다. 효율적인 협업을 위한 협력 시기나 구체적인 방법은 각 기관별로 자료 정책을 통해 결정할 수 있으며, 각 기관의 특성에 맞게 시스템을 관리할 수 있는 임무와 책임, 유연성도 함께 주어야 할 것이다.

4. 한국 우주관측 자료 전략 수립을 위한 권고 사항

세계적으로 천문우주 분야의 다양한 연구와 기술 개발, 대형 사업이 진행되고 있으며, 이를 바탕으로 각 기관에서는 과학기술정책을 수립하거나 전문인력을 양성하는 등 학계뿐만 아니라, 국가적으로도 연구, 기술, 개발(research, technology, development, RTD) 성과를 확산하고 있다. 이러한 맥락에서 과학 자료도 RTD 성과 중 하나로 다뤄져야 하며, 우주관측 자료 전체를 연구 커뮤니티, 민간기업, 학계, 일반인들에게 개방하는 것도 중요하다.

우리나라도 큰 틀에서의 자료 계획을 세우는 것이 필요하다. 특히 우주관측 자료는 규모나 양이 기하급수적으로 증가하고 있고, 그에 따라 자료 센터(아카이브)는 자료 관리, 큐레이션(curation), 접근, 분석, 컴퓨팅 등에 대한 중요한 역할을 해야 한다. 이를 통해 양질의 자료를 쉽고 빠르게 획득하여 최대한 많이 활용될 수 있도록 함으로써 과학 연구와 새롭고 혁신적인 발견을 할 수 있는 기회를 제공해야 한다. 이를 준비하기 위해 이 장에서는 우리나라의 우주관측 자료 전략 권고 사항을 제안하고자 한다.

우주관측 자료 전략 권고 사항을 언급하기 전에 과학 자료에 대한 운영 원칙 2가지를 강조하고자 한다. 이는 NASA의 SMD 자료 관리 및 컴퓨팅 전략에서도 나오는 내용으로 실제 구현하는 단계에서 고려해야 하는 주요한 운영 원칙이다. 우리나라에서도 아래 원칙을 바탕으로 자료 정책을 수립하기를 제안한다.

  • 수집한 자료를 변형하거나 손상시키지 않는다.

  • 새로운 프로젝트를 활용하여 시스템(하드웨어, 소프트웨어 모두 포함)을 지속적으로 개선 한다.

첫 번째 원칙은 과학 자료 전 분야에서 가장 중요하게 인식되어야 할 항목이다. 과학 자료는 연구 목적에 따라 가공/변형되면서 정보가 손실되거나 추가될 수 있다. 따라서 원본 자료를 보존하는 것은 연구의 투명성과 윤리성을 담보한다. 또한 자료는 수많은 자원(예산, 인력, 시간, 노력 등)이 투입된 결과물로서 상당한 가치를 가진다. 예를 들어 2010년 발사된 NASA의 태양 관측 위성인 Solar Dynamics Observatory(SDO)의 개발 예산(첫 5년간의 운영비 포함)은 865백만 달러(약 9천억 원)[9]이고, 위성 개발 계획부터 개발 후 발사까지 약 10년이 걸렸다. NASA측 프로젝트 투입 인력만 수십 명이고, 위성체와 발사체 관련 인력, Atmospheric Imaging Assembly(AIA)와 Helioseismic and Magnetic Imager(HMI)를 개발한 스탠포드 대학과 록히드마틴까지 포함하면 수백 명에 이를 것으로 보인다. SDO는 발사 후 현재까지 10년 넘게 운영되고 있으며, 자료 용량은 약 6 PB이다. 또한 SDO와 관련된 연구 결과 논문은 한 해에 수백 편이 출판되며, 2020년까지 인용횟수는 약 6만 건이 넘었다[10]. SDO의 관측 자료는 특히 장기간 다량의 자료를 이용한 빅 데이터와 딥 러닝 기반의 태양 물리 연구를 가능하게 하였다. 이처럼 과학적 관측 또는 연구를 기반으로 생성된 자료는 대체 불가능한 자료(irreplaceable data)이고, 과거 자료이든 최신 자료이든 생성된 시기에 상관없이 동일하게 중요한 가치를 지닌다. 예산, 인력 등 그 어떤 이유로 이미 수집한 자료를 훼손하는 것은 절대 하지 말아야 할 것이다.

두 번째 원칙은 시스템 관점에서의 전략이다. IT 시스템의 하드웨어와 소프트웨어 관련 기술은 끊임없이 발전하고 있고, 짧은 주기로 새로운 기술이 소개되고 있다. 이에 맞춰 사용자 경험도 수준이 높아져 자료를 제공하고 관리하는 기관 입장에서는 이러한 상황 변화에 부응해야 한다. 특히 아카이브 관점에서는 자료를 저장하고 처리/분석/배포하는 전반적인 작업을 하드웨어(저장장치, 계산 자원 등)와 소프트웨어에 절대적으로 의존하고 있기 때문에 이러한 시스템을 주기적으로 개선할 필요가 있다. 이를 위해서는 예산이 필요한데, 새로운 임무 계획에 따라 시스템 개선을 계획한다면 전체적인 시스템을 보다 효율적으로 운영할 수 있을 것이다. 또한 현재 시스템의 상태에 대한 평가와 진단을 지속적으로 수행하고, 이를 토대로 신규 임무의 자료 관리 계획과 기존 자료의 이전(migration) 작업의 계획을 세울 수 있다.

위 두 가지의 우주관측 자료 운영 원칙을 기반으로 다음과 같은 우주관측 자료 전략 수립을 위한 권고 사항을 정리하였다. 우주관측 자료 전략 권고 사항은 학계, 민간 산업, 군 등 다양한 분야의 자료 사용자들과 우주관측 자료 정책을 수립할 때 근간이 되기를 강력하게 권장한다.

  • 가. 프로젝트를 계획할 때부터 장기간의 자료 관리에 대한 계획을 포함해야 한다. 자료 관리 계획에는 자료 제품(data product), 관련 소프트웨어 및 툴 개발, 자료 배포 계획 등이 포함되어야 한다. 또한 프로젝트 주기에 맞춰 자료 관리 계획도 구체화되어야 한다.

  • 나. 모든 우주 임무에 대한 자료 개방 정책 표준을 확립해야 한다. 자료의 활용성을 확대하기 위해서는 자료 접근성, 용이성, 개방성을 높여야 하며, 이를 위한 표준을 세워 우리나라에서 진행하는 우주 임무(새로운 임무는 물론 운영 중인 임무도 포함)에 적용해야 한다.

  • 다. 기관 차원의 우주관측 자료의 아카이브 계획을 세워야 한다. 임무가 종료된 이후 자료를 장기적으로 관리하는 방법을 계획할 때 자료 수명 주기 접근 방식을 취해야 한다. 각 프로젝트 단위의 임무 아카이브, 최종 아카이브, 딥 아카이브에 대한 계획과 구체적인 운영 계획이 필요하다.

  • 라. 오픈 소스 및 협업 도구를 채택하여 개발해야 한다. 국내외의 광범위한 과학 커뮤니티에서는 오픈 소스 사용이 확대되고 있고, 협업을 위한 다양한 도구 활용도 커지고 있다. NASA에서도 과학, 공학, 의학 분야에서의 오픈 소스 정책을 채택하고 있다. 단, 중요 기술에 대해서는 비공개 정책을 준수해야 한다.

  • 마. 아카이브의 IT 시스템에 대한 평가 및 개선은 5년 이내의 주기로 계획한다. 통상적인 IT 시스템의 수명주기는 5년이다. 때문에 5년 이내로 시스템에 대한 평가 및 개선이 이루어져야 한다. 이를 통해 저장장치의 용량, 서버 자원 요구 사항(컴퓨팅 자원 포함) 등을 평가하고, 새로운 리소스에 대한 수요를 조사하기 위한 전략 개발에 사용되어야 한다.

  • 바. 자료 분석, 계산, 소프트웨어 개발, 자료 관리 등은 학계(타 분야 포함)와 산업계에 있는 자료 전문가들과 협력해야 한다. 자료 및 소프트웨어 관련 기술은 빠르게 변화하고 있으며, 이러한 환경에서 연구자들이 주도하는 자료 분석 및 관련 소프트웨어 개발은 한계가 있을 수 있다. 이를 고려하여 자료 과학 전문가(data science professionals)를 영입하는 것이 필요하며, 다양한 분야의 전문가들과 공동 연구를 진행해야 한다. 또한 새로운 기술을 지속적으로 도입하고 분석해야 하며, 자료 관리를 위한 방법 및 알고리즘에 대한 개발과 교육도 지속적으로 병행해야 한다.

  • 사. 자료 및 소프트웨어의 유용성, 검색 용이성, 접근성을 평가할 수 있는 프로세스(process)를 개발해야 한다. 여기에는 컴퓨팅 자원 활용도도 포함되어야 한다. 보통은 자료를 얼마나 잘 생성하고 운영하는지 정도만 파악하고, 위의 항목들과 관련된 사항은 고려되지 않는다. 자료 및 소프트웨어의 유용성, 검색의 용이성, 접근성, 컴퓨팅 자원 활용도까지 파악할 수 있는 프로세스가 개발되면 수집된 정보를 통해 아카이브 운영에서 의사 결정하는 데 사용할 수 있다.

  • 아. 학제 간 연구를 가능하게 하는 메타자료를 개발해야 한다. 과학 자료는 임무별로 생성되지만 여러 임무 자료를 융합하여 사용할 수 있도록 해야 한다.

  • 자. 클라우드 컴퓨팅 및 인공지능(artificial intelligence, AI)/기계학습(machine learning, ML)을 포함한 새로운 계산 기술을 연구하도록 장려해야 한다. 또한 AI/ML을 사용하는 새로운 연구 방법에 대해 커뮤니티에 장려하고 교육하기 위한 투자를 해야 한다.

  • 차. 관련 기관에서는 우주관측 자료 정책에 대한 지속적인 개선을 위한 위원회를 조직하고, 과학 자료 및 정보 책임자를 임명해야 한다. 위원회와 책임자는 아래와 같은 업무에 포함된다.

  • 우주관측 자료 정책 설정, 규정 준수 확인 및 외부 정책에 대한 인식

  • 새로운 기회 포착, 선택 및 예산 조달을 위한 부서 간 협력 유지

  • 목표와 기능에 투자하고 진행 상황 추적

  • 워크숍, 연구, 교육 등을 통해 우주관측 자료 및 컴퓨팅 커뮤니티 육성

  • 우주관측 자료 및 컴퓨팅 포트폴리오의 구조와 내용에 대해 주기적인 평가

마지막으로 우주관측 자료 전략 개선, 커뮤니티 의견 수렴, 최종적으로 자료 정책 수립을 위한 협의체를 구성하는 방안에 대해 언급하고자 한다. 이러한 협의체들은 다양한 분야의 연구, 기술, 개발하는 실무자들로 구성되어야 하며, 연구 커뮤니티, 민간기업, 학계까지 포함하여 폭넓은 관점과 지식, 의견을 수렴할 수 있어야 한다. 이를 위해 각 협의체의 목적과 필수적인 구성원도 아래와 같이 권고한다.

가. 우주분야 자료 운영관리위원회
  • 목적: 포괄적인 우주관측 자료 전략과 정책의 수립 및 개선, 우주관측 자료의 운용, 관리를 위한 실무적 논의

  • 필수 구성원: 자료 및 정보 전문가, IT 시스템 전문가(민간기업), 자료 과학자(학계 또는 민간기업), 각 연구 분야(천체물리, 태양권물리, 행성과학) 전문가

나. 우주관측 자료 커뮤니티 협의체

목적: 우주관측 자료를 생산 및 활용하는 커뮤니티의 의견 수렴

필수 구성원: 각 연구 분야(천체물리, 태양권물리, 행성과학) 자료 실사용자 및 자료 생산자

5. 결론

세계적으로 다양한 천문학 및 우주과학 관측 시스템이 운영되고 있고, 우리나라에서도 국제협력을 통해서 또는 독립적으로 관측 시스템을 개발하고 있다. 두 가지 경우, 모두 정부에서 예산을 투입하여 직간접적으로 개발 및 운영하는 것이기 때문에 여기서 나오는 자료도 체계적인 관리가 필요하다. 지금까지 프로젝트 또는 기관별로 자료 관리에 대한 고민을 해왔을 것이다. 하지만 이를 실현하기 위한 구체적인 지침이나 정책은 없는 실정이다.

미국은 국가 차원에서 자료 계획에 대한 큰 그림의 개념을 가지고 있으며, 이를 바탕으로 NASA에서는 과학, 기술, 의학에 관련된 디지털 자료 계획을 수립하였다. NASA의 자료 계획에는 디지털 자료 관리 원칙, 관리 대상 범위, 요구 사항, 적용 범위, 계획 및 구현 등 실질적으로 자료 정책을 수립하는 데 필요한 구체적인 사항을 포함한다. 이와 함께 NASA SMD의 자료 전략은 과학 자료에 특화된 내용을 담고 있다. 여기에는 과학 자료의 비전과 목표, 각 목표에 따른 전략들을 구체적으로 제시하고, 이를 토대로 전략 목표와 권고 사항을 기술한다. NASA SMD의 자료 전략은 연구 부서인 천체물리 본부, 지구과학 본부, 태양권물리 본부, 행성과학 본부를 위한 것으로, 각 부서에서는 분야별 특성에 맞는 과학 자료 관리 정책을 수립하거나 관리 체계를 갖추고 있다. NASA의 자료 계획이나 SMD 자료 전략에서 강조하는 것은 오픈 엑세스(open access)이다. 수많은 임무를 통해 획득한 자료를 최대한 많이 활용할 수 있도록 개방하고, 이를 위한 다양한 전략을 제시한다. 또 하나의 중요한 점은 이 두 문서에서는 가장 상위에서의 기본 지침(guideline)만 제시한다는 것이다. 임무나 연구 분야의 특성이 상이하고 같은 연구 부서 내에서도 관측 대상이나 관측 기기에 따라 자료가 매우 다양하기 때문에 일원화된 관리 체계를 강제할 수 없으며, SMD에서도 이를 인정하고 다양성과 유연성을 용인한다. 다만 NASA의 자료 계획이나 SMD 자료 전략의 기본적인 지침을 따르도록 하고, 조금 더 구체적인 사항은 연구 부서 자체의 자료 관리 정책으로 대신한다.

우리나라도 우주관측 자료 정책이 필요하다. 하지만 자료 정책을 수립하기 위한 상위 개념의 자료 계획이나 전략이 먼저 구성되어야 할 것이다. 이 논문에서는 우리나라의 우주관측 자료 전략 방향과 이를 위한 권고 사항을 제안하였다. 이는 높은 수준의 포괄적인 전략으로 우리나라의 우주관측 자료 정책을 수립하고, 우주관측 자료 활용성을 극대화할 수 있는 기반이 될 것이다.

Notes

1 빅 데이터는 자료의 크기(volume), 다양성(variety), 속도(velocity), 가치(value) 등 4가지의 특성 을 갖는 자료를 말함.

2 소프트웨어는 컴퓨터 시스템을 관리(시스템 소프트웨어)하고, 특정 문제를 해결(응용 소프트웨어) 하기 위해 개발된 프로그램을 총칭하며, 컴퓨터 시스템, 프로그램, 자료에 의해 처리되는 모든 정 보까지 포함하기도 함.

감사의 글

본 연구는 한국천문연구원 ‘차세대 우주환경 관측 네트워크 구축 및 운영’ 과제의 일부로 수행되었으며, 지원에 감사드립니다.

References

1.

Government of Korea, 2014-2040 Mid- to long-term space development plan for space exploration, Amendment to the 2nd Space Development Promotion Basic Plan (2013).

2.

NASA, NASA Heliophysics Science Data Management Policy, version 1.2 (NASA, Washington, DC, 2016).

3.

Yun JM, Lee PJ, Kim GB, Yang YS, Jeon SB, et al., A basic research on the establishment of legal system for the management and utilization of national scientific data, Korea Institute of Science and Technology Information Report, K-12-SG-102-01P-1 (2012).

4.

Ministry of Science and ICT, The Space Development Promotion Act (2020) [Internet], viewed 2020 Dec 22, available from: https://www.law.go.kr/%EB%B2%95%EB%A0%B9/%EC%9A%B0%EC%A3%BC%EA%B0%9C%EB%B0%9C%20%EC%A7%84%ED%9D%A5%EB%B2%95

5.

Lee SH, Kim TJ, Ryu BJ, Park HS, Shin JS, et al., A study on establishing the scientific data management and application framework to build up the National Scientific Data Center, Korea Institute of Science and Technology Information Report, K-11-L05-C05-S02 (2011).

6.

Park SU, Hahn SH, Lee PW, Lee YS, Kim ST. A study on establishment of performance analysis model for National Science Data Center Construction, Proceedings of the The Korea Contents Association Spring Conference, Jeju, 20-21 May 2011.

7.

NASA, Science Mission Directorate’s strategy for data management and computing for groundbreaking science 2019–2024 (2019) [Internet], viewed 2021 Jan 10, available from: https://science.nasa.gov/science-pink/s3fs-public/atoms/files/SDMWG%20Strategy_Final.pdf

8.

European Space Agency, ESA digital agenda (2017) [Internet], viewed 2021 Jan 12, available from: http://www.esa.int/About_Us/Digital_Agenda/ESA_affirms_Open_Access_policy_for_images_videos_and_data

9.

Lovertt RA, First light for Solar Dynamics Observatory, Nature (2010) [Internet], viewed 2021 Mar 11, available from:

10.

NASA, SDO (Solar Dynamics Observatory) mission (2011) [Internet], viewed 2021 Feb 25, available from: https://sdo.gsfc.nasa.gov/

Author Information

백 지 혜jhbaek@kasi.re.kr

jsta-1-2-241-i1

충북대학교 천문우주학과에서 석사학위를 받았으며, 충남대학교 컴퓨터공학과 박사과정을 수료하였다. 2005년부터 한국천문연구원에서 선임연구원으로 재직 중이며, 데이터 파이프라인 개발 및 데이터 센터 구축 등의 기술 개발을 수행하였다. 최근에는 ‘국제우주정거장용 태양코로나그래프(CODEX)’의 지상 시스템 및 지상 소프트웨어 개발을 진행하고 있으며, SDO 데이터를 활용한 딥러닝 연구도 수행하고 있다. 관심분야는 데이터센터, 데이터정책, 컴퓨터비전, 딥러닝이다.

최 성 환shchoi@kasi.re.kr

jsta-1-2-241-i2

경희대학교 우주과학과를 졸업하고, 동대학원에서 박사학위를 취득하였다. 2004년부터 현재까지 한국천문연구원 책임연구원으로 재직 중이며, 우주환경 관측기술과 우주환경 빅데이터 기술에 대한 연구를 수행하고 있다. 2012년부터 2014년까지는 미국 뉴저지공과대학 빅베어태양천문대 객원연구원으로 태양망원경의 적응광학 시스템을 개발하였으며, 현재는 NASA와 공동프로젝트인 국제우주정거장 태양코로나그래프 개발 시스템 엔지니어로 한국측 기술 총괄을 담당하고 있다.

박 종 엽parkjy@kasi.re.kr

jsta-1-2-241-i3

2013년 경희대학교 우주탐사학과 박사과정 수료 후, 현재 한국천문연구원 선임연구원으로 재직 중이다. 국제우주정거장용 태양코로나그래프 개발 사업에서 비행소프트웨어 개발을 담당하고 있다. 관심분야는 소프트웨어(SW) 엔지니어링, SW 플랫폼이다.

김 수 진sjkim@kasi.re.kr

jsta-1-2-241-i4

경희대학교에서 2009년 태양물리학 박사학위를 받았다. 2010년부터 2013년까지 일본국립천문대 노베야마전파관측소에서 박사후연구원으로 태양전파물리 연구를 수행하였으며, 현재 한국천문연구원 우주과학본부 책임연구원으로 재직 중이다. 태양 폭발, 코로나 플라즈마 구조, 태양활동주기 등 태양의 다양한 활동을 연구하고, 태양활동으로 인한 우주환경변화 예측 연구를 진행하고 있다.

심 채 경cksim@kasi.re.kr

jsta-1-2-241-i5

현 한국천문연구원 선임원구원이며, 민간 달 착륙선 탑재체 서비스(CLPS) 한국 프로젝트 과학자이다. 경희대학교에서 우주과학 학사(2005), 석사(2008), 우주탐사학 박사(2014)를 취득했다. 한국형 시험용 달 궤도선(KPLO)에 탑재될 광시야 편광 카메라(PolCam) 등 우주 탐사 임무에 참여하고 있으며, 태양계 천체의 대기, 달과 수성 등 대기가 없는 천체의 표면 성질과 우주 풍화에 관해 연구한다.

양 태 용yty16@kasi.re.kr

jsta-1-2-241-i6

2016년 한국과학기술연합대학원에서 천문우주과학 박사학위를 받았으며, 현재 한국천문연구원에서 선임연구원으로 재직 중이다. 천문연에서 개발 중인 근지구 우주환경 관측 위성(SNIPE, 도요샛) 개발 프로젝트에 참여하여 지상국 운영을 담당하고 있으며, 위성 및 지상 관측자료를 활용하여 전리권/고층대기를 연구하고 있다.

정 민 섭msjeong@kasi.re.kr

jsta-1-2-241-i7

2017년 달 과학으로 천문학 박사학위를 받았다. 2015년부터 지금까지 한국천문연구원에서 선임연구원으로 재직 중이다. 한국형 달 탐사 시험용 달 궤도선 사업에서 광시야 편광 카메라(PolCam)을 개발했으며, 한미 민간 달 착륙선 탑재체 공동연구사업으로 미국 항공우주국의 CLPS 프로그램에 참여해 달 착륙선용 알갱이 카메라(GrainCams)를 개발 중이다.

조 영 수stspeak@kasi.re.kr

jsta-1-2-241-i8

KAIST에서 2012년 물리학 박사학위를 받았다. 현재, 한국천문연구원의 우주천문그룹에서 선임연구원으로 재직 중이다. 원자외선 전천 관측 정보를 기반으로 성간물질 연구분야인 성간먼지 산란에 의한 몬테카를로 시뮬레이션, 수소분자 형광방출선, 고온기체, 기계학습법을 이용한 전천지도 작성 연구 등을 수행하였다. 현재 SPHEREx 우주망원경 개발에 참여하고 있다.

최 영 준yjchoi@kasi.re.kr

jsta-1-2-241-i9

한국천문연구원 우주과학본부 책임연구원으로 재직 중이며, 이스라엘 텔아비브대학에서 카이퍼 벨트 천체 연구로 박사학위를 받고, NASA PostDoc Fellow로 제트추진연구소에서 근무했다. 소행성, 혜성, 달 등 태양계 소천체 대한 관측 및 분석연구에 관심이 많으며, 달시험궤도선의 광시야 편광 카메라(PolCam) 개발과 한미 민간 달착륙선 사업의 책임자이고, 소행성 아포피스탐사임무를 기획하고 있다.