2017년 12월 19일 화요일

지구에서 외계행성까지: 머신러닝으로 행성을 찾아 나섭니다

수천 년간 사람들은 별을 올려다 보며 관찰한 것을 기록하며 패턴이 존재한다는 사실을 알게 되었습니다. 초기 천문학자들이 최초로 찾아낸 것들 중 일부를 행성으로, 그리스인들은 그것을 밤하늘에서 불규칙적으로 움직이는 것처럼 보인다 하여 “planētai” 또는 “떠돌이”라고 불렀습니다.  수 세기 동안의 연구를 통해 우리는 태양계의 지구나 다른 행성들이 다른 수많은 항성 중 하나인 태양의 궤도를 돈다는 사실을 이해하고 있습니다.

오늘날 우리는 광망원경, 우주 비행, 디지털 카메라 그리고 컴퓨터와 같은 기술 덕분에 태양계를 넘어 다른 항성 주변을 돌고 있는 행성을 탐지해 우주에 대한 이해를 넓혀 나가는 것이 가능해졌습니다. 외계행성이라고 불리는 이 행성들을 연구하면 우주에 대한 인류의 심오한 질문을 해결하는 데 도움이 됩니다. 저 밖에는 또 무엇이 있을까요? 우리와 비슷한 다른 행성이나 태양계와 같은 것이 존재할까요?

기술의 발전이 이러한 연구에 도움이 되고는 있지만, 여전히 외계행성을 찾는 일은 매우 어렵습니다. 모항성과는 달리 외계행성은 크기가 작고 온도도 낮으며, 밝기도 어두워서 이를 찾는 일은 마치 강력한 탐조등 옆에 있는 반딧불이를 찾는 것만큼이나 까다롭습니다. 그것도 수천 마일이나 떨어져 있는 탐조등 옆의 반딧불이 말입니다. 그러나 우리는 최근 머신러닝의 도움을 받아서 약간의 진전이 있었습니다.

외계행성을 찾기 위해 천체물리학자들은 대개 자동 소프트웨어 및 수동 분석을 모두 사용해 NASA의 케플러 미션에서 얻은 엄청난 양의 데이터를 분석합니다. 케플러 망원경은 4년간 약 20만 개의 항성을 관찰하면서 30분마다 사진을 찍어 약 140억 개의 데이터 포인트를 생성했습니다. 이 140억 개의 데이터 포인트는 약 2000조 개의 행성 궤도가 존재할 수 있다는 의미입니다. 가장 성능이 좋은 컴퓨터로 분석하기에도 너무 방대한 양의 정보이기 때문에, 이 데이터를 검토하는 것은 시간이 많이 소요되는 굉장히 어려운 과정입니다. 우리는 이 과정을 보다 빠르고 효과적으로 진행하기 위해 머신러닝을 도입했습니다.
공전하는 행성이 빛의 일부를 차단할 때 측정된 항성의 밝기는 약간 감소합니다. 케플러  우주 망원경은 4년 동안 20만 개의 별의 밝기를 관찰하여 행성 통과로 인한 이러한 특직정인 신호를 찾아냈습니다.

머신러닝은 컴퓨터에 패턴을 인식하는 법을 학습시키는 방법으로, 대량의 데이터를 분석할 때 특히 유용합니다. 여기에서 핵심은 인간이 컴퓨터에 특정한 규칙을 프로그래밍하는 것이 아니라 컴퓨터가 예시를 통해 스스로 학습하도록 한다는 점입니다.

저는 구글 AI 팀의 머신러닝 연구원으로 우주에 관해 관심을 가지고 있으며, 이 일을 ‘20퍼센트 프로젝트’로 시작했습니다. 구글에서는 ‘20퍼센트 프로젝트’라고 해서 업무 시간의 20퍼센트를 본인이 관심 있는 분야에 사용할 수 있도록 하고 있습니다. 이 과정에서 저는 텍사스대학교 오스틴캠퍼스의 천체물리학자 앤드루(Andrew)와 협업하여 이 기술을 천체에 적용해 머나먼 곳에 있는 항성 주위의 행성을 식별할 수 있는 방법을 머신러닝 시스템에 학습시켰습니다.

연구팀은 15,000개 이상의 분류된 케플러 신호로 이뤄진 데이터셋을 이용해 행성과 행성이 아닌 것을 판별하는 텐서플로 모델을 개발했습니다. 이를 위해서 텐서플로는 실제 행성으로 인해 생성된 패턴과 별 표면의 흑점이나 쌍성 등 다른 물체로 인해 생성된 패턴을 구별하도록 했습니다. 이 모델에 이전에 보지 못한 새로운 신호를 테스트해보니, 어느 신호가 행성인지, 어느 신호가 행성이 아닌지 96%의 확률로 올바르게 식별해냈습니다. 이로써 이 모델이 유효하다는 사실을 알게 된 것입니다!

“케플러 90i는 항성 케플러 90을 공전하고 있는 8번째 행성으로 밝혀져, 케플러 90은 우리 태양계 외부에 존재하는 태양계 중 최초로 8개의 행성을 보유하고 있는 항성이 되었습니다.”

연구팀은 이 유효한 모델을 사용해 케플러 데이터에서 새로운 행성을 찾겠다는 큰 목표를 세웠습니다. 그리고 검색 범위를 좁히기 위해 2개 이상의 외계행성을 보유하고 있다고 알려져 있는 항성 670개를 살펴보기로 결정했고,  결국 케플러 80g와 케플러 90i라는 새로운 두 행성을 발견하는 쾌거를 이뤄냈습니다. 이 중에서도 케플러 90i는 항성 케플러 90을 공전하고 있는 8번째 행성으로 밝혀져, 케플러 90은 우리 태양계 외부에 존재하는 태양계 중 최초로 8개의 행성을 보유하고 있는 항성이 되었습니다.
우리는 행성 신호를 식별하기 위해 머신러닝 모델을 15,000개의 분류된 케플러 신호를 이용하여 훈련시켰습니다. 670개의 항성에서 추출한 데이터에서 새로운 행성을 찾기 위해 이 모델을 사용했습니다.

새롭게 발견된 행성에 대한 재미있는 사실 중 하나는,  이 행성이 지구보다 크기가 30% 더 크고 표면 온도는 약  800°F(426°C)로 사람이 살기에는 적합하지 않다는 것입니다. 또한 이 행성은 14일마다 그의 항성을 공전하기 때문에, 여기서는  2주마다 생일을 맞이하는 셈입니다.


케플러 90은 우리 태양계 외부에 존재하는 태양계 중 최초로 8개의 행성을 보유하고 있는 항성으로 알려졌습니다. 이 태양계에서는 행성들이 항성에 가까이 붙어서 공전하고, 케플러 90i는 14일마다 공전합니다. (행성 크기와 항성과의 거리는 비례하지 않음)

머신러닝의 가능성은 말하자면 천체가 그 한계라고 할 수 있습니다. 지금까지 연구팀은 이 모델을 사용하여  20만 개나 되는 항성 중에서 고작 670개만을 살펴봤기 때문입니다. 케플러 데이터에는 아직 발견되지 않은 수많은 외계행성이 존재할 수 있습니다. 머신러닝과 같은 새로운 아이디어와 기술은 앞으로 오랫동안 천체의 발견에 일조할 것입니다.무한한 공간, 저 너머로 말이죠!

크리스 샬루, 구글 시니어 리서치 소프트웨어 엔지니어
앤드루 밴더버그, 텍사스대학교 오스틴캠퍼스