
DeepMind의 AlphaMissense AI는 돌연변이가 헤모글로빈 하위 단위 베타(왼쪽) 또는 낭포성 섬유증 막횡단 전도도 조절기(오른쪽)와 같은 단백질의 기능에 영향을 미칠지 여부를 예측할 수 있습니다.
구글 딥마인드
인공지능 회사 딥마인드(DeepMind)는 수많은 단순 돌연변이가 해로운지 여부를 평가하기 위해 단백질 구조를 예측하는 알파폴드(AlphaFold) 시스템을 채택했습니다.
AlphaMissense라고 불리는 적응된 시스템은 20,000개의 인간 단백질에서 미스센스 돌연변이라고 불리는 종류의 7,100만 개의 가능한 돌연변이에 대해 이 작업을 수행했으며 그 결과는 무료로 제공되었습니다.
Google의 모회사인 Alphabet의 자회사인 DeepMind의 Jun Cheng은 “우리는 이것이 임상의와 인간 유전학자에게 매우 도움이 된다고 생각합니다.”라고 말했습니다. “이것이 유전병의 원인을 정확히 찾아내는 데 도움이 되기를 바랍니다.”
거의 모든 사람은 부모에게서 발견되지 않은 약 50~100개의 돌연변이를 가지고 태어나며, 이로 인해 개인 간에 엄청난 양의 유전적 변이가 발생합니다. 질병의 원인을 찾기 위해 개인의 게놈 서열을 분석하는 의사들에게 이는 해당 질병과 연관될 수 있는 수천 개의 돌연변이가 있을 수 있기 때문에 엄청난 도전이 됩니다.
AlphaMissense는 이러한 유전적 변이가 무해한지 또는 질병과 관련된 단백질을 생성할 수 있는지 예측하기 위해 개발되었습니다.
단백질을 코딩하는 유전자는 단백질을 만들기 위해 어떤 아미노산이 서로 연결되어야 하는지를 세포에 알려주며, 각 세트는 세 개의 DNA 문자로 구성됩니다. 아미노산을 코딩합니다. AI는 세 쌍의 DNA 문자 중 하나가 다른 문자로 변경되어 잘못된 아미노산이 단백질에 추가될 수 있는 미스센스 돌연변이에 중점을 둡니다. 단백질의 어느 부분에서 이런 일이 발생하는지에 따라 효과가 없는 것부터 중요한 단백질이 더 이상 전혀 작동하지 않는 것까지 결과가 나타날 수 있습니다.
사람들은 각각 약 9000개의 과오 돌연변이를 갖는 경향이 있습니다. 그러나 우리가 얻을 수 있는 7,100만 개의 미스센스 돌연변이 중 지금까지 확인된 효과는 0.1%에 불과합니다.
AlphaMissense는 과오 돌연변이가 단백질의 구조나 안정성을 어떻게 변경하는지, 이것이 다른 단백질과의 상호 작용에 어떤 영향을 미치는지 알아내려고 시도하지 않습니다. 하지만 이를 이해하면 치료법을 찾는 데 도움이 될 수 있습니다. 대신, 가능한 각 돌연변이 단백질의 서열을 AlphaFold가 훈련한 모든 단백질의 서열과 비교하여 그것이 “자연적으로” 보이는지 확인한다고 DeepMind의 Žiga Avsec은 말합니다. “부자연스러워” 보이는 단백질은 0에서 1까지 잠재적으로 유해한 것으로 평가됩니다.
DeepMind의 Pushmeet Kohli는 “직관”이라는 용어를 사용하여 작동 방식을 설명합니다. “어떤 의미에서 이 모델은 구조 예측 작업을 해결하면서 얻은 직관을 활용하고 있습니다.”라고 그는 말합니다.
Avsec은 “영어 문장에서 단어를 대체하면 영어에 익숙한 사람이 이 단어 대체가 문장의 의미를 바꾸는지 즉시 알 수 있는 것과 같습니다.”라고 말합니다.
팀은 AlphaMissense가 알려진 변형에 대해 테스트했을 때 다른 계산 방법보다 성능이 뛰어났다고 말합니다.
연구에 대해 논평한 기사에서 영국 에딘버러 대학의 Joseph Marsh와 케임브리지 대학의 Sarah Teichmann은 AlphaMissense가 여러 가지 성능 테스트에서 “놀라운 결과”를 얻었으며 가능한 우선 순위를 결정하는 데 도움이 될 것이라고 썼습니다. 질병을 유발하는 돌연변이에 대해서는 추가 조사가 필요합니다.
그러나 그러한 시스템은 여전히 진단 과정에만 도움이 될 수 있다고 그들은 썼습니다.
Missense 돌연변이는 다양한 종류의 돌연변이 중 하나일 뿐입니다. DNA 조각은 추가, 삭제, 복제, 뒤집기 등도 가능합니다. 그리고 많은 질병을 일으키는 돌연변이는 단백질을 변경하지 않고 대신 유전자 활동 조절과 관련된 인근 서열에서 발생합니다.
주제: