AI가 학회를 연다? 스탠퍼드 과학자의 파격 실험

코로나19 신약 개발을 위해 가상의 AI ‘과학자’를 활용했던 제임스 저우 스탠퍼드 대학교 컴퓨터과학자가 이번에는 AI가 연구 수행부터 심사, 발표까지 모두 맡는 과학 학회를 기획하고 있다. 하지만 학계에서는 이러한 시도를 두고 의견이 엇갈린다.

올해 10월 전례 없는 새로운 학술대회가 첫선을 보인다. ‘에이전츠포사이언스(Agents4Science)’라는 이름의 이 온라인 학회는 물리학부터 의학까지 과학 전 분야를 아우르는 1일 행사다. 발표되는 모든 논문은 인공지능(AI)이 연구, 집필 및 심사를 주도하며 텍스트 음성 변환 기술을 통해 발표까지 진행된다.

이 학회를 구상한 주인공은 제임스 저우(James Zou) 스탠퍼드 대학교 컴퓨터과학자다. 그는 인간과 AI가 가장 효과적으로 협력할 수 있는 방안을 연구한다. AI는 이미 다양한 방식으로 과학자들에게 유용한 도구를 제공해 왔다. 예를 들어 딥마인드(DeepMind)의 알파폴드(AlphaFold)는 물리적으로 합성하기 어려운 단백질 구조를 시뮬레이션하는 데 활용된다. 하지만 최근에는 대형언어모델(LLM)과 추론 능력을 갖춘 AI 기술의 발전으로 AI가 과학자처럼 독립적으로 가설을 제안하고, 시뮬레이션을 수행하며, 실험까지 설계할 수 있다는 의견이 더욱 힘을 얻고 있다.

이를 비판하는 목소리도 적지 않다. 특히 많은 이들은 AI가 연구에 필요한 창의적 사고를 하지 못하고, 오류와 환각 현상을 자주 일으키며, 젊은 연구자들의 기회를 제한할 수 있다는 점을 우려한다.

그럼에도 불구하고 많은 과학자와 정책 입안자들은 AI 과학자의 잠재력에 큰 기대를 걸고 있다. 미국 정부의 AI 행동 계획(AI Action Plan)에서는 다양한 과학 분야를 위한 자동화된 클라우드 기반 연구소에 투자할 필요성을 강조한다. 일부 연구자들은 AI 과학자가 인간 혼자서는 결코 이뤄낼 수 없는 과학적 발견을 실현할 수 있다고 본다. 저우는 “AI 에이전트는 시간의 제약을 받지 않는다. 이들은 사실상 24시간 내내 우리와 소통하고 함께 일할 수 있다”라며 이러한 믿음을 명확히 뒷받침했다.

지난달 저우는 자율적으로 연구를 수행하는 AI 집단을 통해 얻은 결과에 관한 논문을 <네이처(Nature)>에 발표했다. 이러한 성과를 바탕으로 이제 그는 다른 AI 과학자들(즉, AI 자체가 과학자인 경우)이 어떤 성과를 낼 수 있는지 확인하고자 한다. 그는 에이전츠포사이언스에서 성공적인 논문이 갖추어야 할 조건으로 “AI가 제1저자가 되어 대부분의 연구를 수행해야 하고, 인간은 조언자로만 참여할 수 있을 것”을 규정했다.

AI가 운영하는 가상 연구소

2010년대 초 하버드대 박사과정을 밟고 있던 저우는 과학 분야에서 AI의 잠재력에 깊은 흥미를 느껴 컴퓨터 연구를 잠시 중단하고 1년 동안 유전체 연구소에서 근무했다. 유전체학은 전체 유전체를 해독하는 데 기술이 큰 역할을 해온 분야다. 그는 화학 물질이나 시약을 사용해 실제 실험을 진행하는 이른바 ‘습식 연구실(wet lab)’에서의 경험을 통해 서로 다른 분야의 전문가들과 협력하는 일이 얼마나 어려운지 깨달았다. 그는 “전문가들은 종종 서로 다른 언어를 사용한다”고 말했다.

그는 LLM이 전문 용어를 해석하고 특정 분야의 전문 용어들을 번역하는 데 인간보다 더 뛰어나다고 믿는다. 저우는 “LLM은 워낙 폭넓게 학습했기 때문에 과학 전반의 아이디어를 정확히 번역하고 일반화할 수 있다”고 설명했다. 이러한 깨달음은 그가 ‘가상 연구소(Virtual Lab)’라는 개념을 구상하는 계기가 되었다.

큰 틀에서 보면, 그가 구상한 가상 연구소는 실제 대학 실험실의 연구팀을 모방하도록 설계된 AI 에이전트 팀으로 이해할 수 있다. 이 에이전트들은 각기 다른 전문 분야를 담당하며 알파폴드 같은 다양한 프로그램과 상호작용할 수 있다. 인간 연구자는 하나 또는 여러 에이전트에 연구 과제를 할당하고, 모델을 통해 에이전트들의 소통 과정을 확인한 뒤, 이를 바탕으로 실제 연구에서 어떤 실험을 진행할지 정할 수 있다.

저우가 이 아이디어를 현실에 적용해 실제 연구 문제를 해결하기 위해서는 (인간) 협력자가 필요했다. 지난해 그는 존 E. 팍(John E. Pak) 챈 저커버그 바이오허브(Chan Zuckerberg Biohub) 연구 과학자를 알게 되었다. 저우와 마찬가지로 AI를 과학 연구에 활용하는 데 관심이 있던 팍은 그와 함께 가상 연구소를 만들기로 했다.

팍은 연구 주제 설정을 도왔지만, 두 사람 모두 가상 연구소가 스스로 어떤 연구 방법을 찾아낼지 확인하고 싶었다. 그들은 첫 번째 프로젝트로 새로운 코로나19 변이에 대한 치료법 설계에 집중하기로 했다. 이를 위해 저우는 (면역학자, 컴퓨터 생물학자, 책임 연구자 역할을 수행하도록 훈련된 AI 과학자를 포함해) 각기 다른 연구 목표에 따라 그에 맞는 프로그램을 활용할 수 있는 다섯 명의 AI 과학자를 훈련하기 시작했다.

모델 구축에는 몇 달이 걸렸지만, 팍은 “초기 설정이 끝나자 AI 과학자들은 매우 빠른 속도로 치료 후보를 설계하기 시작했다”며 “반나절 내지 하루 정도 걸린 것 같다”고 회고했다.

저우에 따르면 AI 에이전트들은 항체와 유사하지만 크기가 훨씬 작고 자연계에서 찾아보기 힘든 나노바디를 연구 대상으로 선택했다. 그 이유를 알게 된 저우는 매우 놀랐다. 그는 모델들이 나노바디가 그들에게 주어진 한정된 연산 자원에 적합한 작은 분자라는 점을 스스로 인식하고 이를 선택했다고 주장했다. 그는 “결과적으로 현명한 선택이었다. 에이전트들이 이 나노바디를 효율적으로 설계할 수 있었기 때문”이라고 평가했다.

논문에 따르면 모델이 설계한 나노바디는 과학적으로 완전히 새로운 성과였으며 대부분을 초기 코로나19 바이러스에 결합할 수 있었다. 그러나 팍과 저우는 이번 논문의 진정한 성과가 연구 도구로서의 가상 연구소의 가능성 그 자체에 있다고 주장했다. 이 시(Yi Shi) 펜실베니아 대학교 약리학자도 이 견해에 동의했다. 그는 이번 연구에 직접 참여하지는 않았지만 가상 연구소가 변형한 기초 나노바디 중 일부를 제작했다. 그는 가상 연구소를 활용한 시범 연구를 높이 평가하며 “가장 중요한 혁신은 자동화”라고 강조했다.

<네이처>는 이 논문을 게재하기로 하고 정식 출간 전 조기 열람이 가능하도록 신속 심사 절차를 진행했다. 저우는 AI 에이전트를 과학 연구에 활용하는 것이 뜨거운 관심을 받는 주제임을 알고 있었기에 이를 가장 먼저 시험해 보고 싶었다.

AI 과학자가 주최하는 학회

그러나 저우는 논문을 제출하는 과정에서 난관에 봉착했다. 연구에서 핵심적 역할을 한 AI를 정식 저자로 등재할 수 없었던 것이다. 대부분의 학회와 학술지에서는 AI를 논문의 공동 저자로 등재하는 것을 허용하지 않으며, 상당수가 AI를 이용해 논문이나 심사 보고서를 작성하는 자체를 명시적으로 금지한다. 예를 들어 <네이처>는 책임 소재 불분명, 저작권 문제, 부정확성 등을 이유로 이를 금지하고 있다. 저우는 이에 대해 “지나치게 제약적이라고 생각한다. 이러한 방침은 결국 연구자가 AI 사용을 숨기거나 축소하도록 만든다”고 지적했다.

저우는 이러한 관행을 뒤집기 위해 에이전츠포사이언스 학회를 기획했다. 이 학회에서는 모든 제출 논문의 제1저자가 반드시 AI여야 하며 다른 봇들이 그 연구를 평가해 과학적 가치를 판정한다. 하지만 인간의 개입이 완전히 배제되는 것은 아니다. 우수 논문이 선정되면 노벨 경제학상 수상자를 포함한 인간 전문가들이 이를 직접 검토한다.

저우는 이번 학회가 어떤 결과를 낳을지는 확신할 수 없지만, 다양한 분야에서 제출될 수백 건의 논문 가운데 의미 있는 성과가 있기를 기대한다. 그는 “AI가 제출한 논문이 흥미로운 발견을 가져올 수도 있고, 흥미로운 오류를 다수 드러낼 수도 있다”고 말했다.

저우는 학회에 대한 반응이 긍정적이었다고 밝혔지만 비판적인 시선도 존재한다.

“통찰의 도약은 어떻게 생겨나는가?”
리사 메세리 예일대학교 과학 인류학자

리사 메세리(Lisa Messeri) 예일대학교 과학 인류학자는 AI가 과학 연구를 심사할 수 있는 능력에 대해 많은 의문을 제기한다. 그녀는 “통찰의 도약은 어떻게 생겨나는가? 만약 그런 도약이 심사자의 책상 위에 올라온다면 무슨 일이 벌어지는가?”라고 질문하며 이번 학회가 이에 대해 만족스러운 답을 내놓기는 어려울 것이라고 봤다.

메세리와 공동 연구자 몰리 크로켓(Molly Crockett)은 지난해 <네이처>에 실린 또 다른 논문에서 과학 연구에 AI를 적용하는 데 따르는 장애 요인들을 분석했다. 그들은 저우의 주장처럼 AI가 나노바디 논문과 같은 새로운 성과를 낼 수 있을지에 대해서도 여전히 의문을 품고 있다.

프린스턴 대학교의 인지과학자인 크로켓은 “나는 컴퓨터 과학자는 아니지만 계산 중심의 연구를 하고 있기 때문에 이런 도구의 잠재적 사용자에 해당한다”면서도 “동시에 [AI 과학자가] 인간 사고의 특정 측면을 모방할 수 있다는 폭넓은 주장에는 여전히 큰 회의가 든다”고 말했다.

두 사람은 자동화가 인간 연구자들이 봇을 감독하는 데 필요한 전문성을 쌓는 과정을 방해한다면 AI를 활용한 과학 연구의 가치는 제한적일 것이라고 본다. 대신 그들은 AI에 연구와 검토를 맡기기 전에 더 신중한 실험 설계를 위해 다양한 학문 분야의 전문가들을 참여시켜야 한다고 강조했다.

크로켓은 “우리는 인식론자, 과학 철학자, 과학 인류학자 등 지식의 본질을 매우 진지하게 고민하는 학자들과 대화를 나눌 필요가 있다”고 덧붙였다.

반면 저우는 이번 학회가 과학을 한 단계 발전시킬 수 있는 실험이라고 평가한다. 그는 AI 기반 과학 연구에 대해 “과장된 기대와 단편적 사례는 많지만 실제로 체계적인 데이터는 거의 없다”고 지적했다. 에이전츠포사이언스가 그런 데이터를 제공할 수 있을지는 아직 알 수 없지만, 10월에는 적어도 이 봇들이 자신의 역량을 입증하기 위해 애쓰는 모습을 볼 수 있을 것이다.

The post AI가 학회를 연다? 스탠퍼드 과학자의 파격 실험 appeared first on MIT 테크놀로지 리뷰 | MIT Technology Review Korea.