모바일 메뉴 닫기
 
전체메뉴
닫기
 

정보서비스

연구성과 홍보갤러리

제목
[의과대학] 의과대학 약리학교실 김형범 교수 연구팀, 인공지능 활용 유전자 가위 활성 예측모델 개발
작성일
2019.11.12
작성자
관리자
게시글 내용

       (사진. 의과대학 약리학교실  좌/김형범 교수(교신저자), 우상단/김영광(제1저자), 우하단/김희권(제1저자))





  김형범 연세대 의과대학 교수(IBS나노의학연구단 연구위원)와 연구팀 (김희권, 김영광 연구원)은 크리스퍼-카스9 (CRISPR-Cas9) 유전자가위의 활성을 현존하는 최고 수준으로 예측하는 기술을 개발했다.


  유전자가위는 유전자의 특정 부위를 절단하여 원하는 형태로 편집할 수 있는 기술로서, 유전병 치료 및 종양의 약물 개발, 유전자의 기능 연구 등에 활발히 사용되고 있다. 유전자가위에 사용되는 여러 효소 중 가장 보편적이고 널리 쓰이는 것이 화농성 연쇄상구균 (Streptococcus pyogenes)에서 유래한 Cas9 단백질 (SpCas9)이다. 

Cas9 단백질은 작동에 필요한 유전자 부위의 제한이 적고 활성이 가장 좋은 것으로 알려져 있어 현재 유전자가위 분야에서 가장 널리 사용되고 있으며, 최근에는 DNA의 절단 없이 원하는 염기만 바꾸는 염기편집 (Base editing), 유전체의 DNA 배열을 변경할 뿐 아니라 표적 유전자의 발현을 조절하는 에피지놈 편집 (epigenome editing) 등 다양한 분야에서도 Cas9 단백질이 활용되고 있다. 그런데 이 유전자가위의 활성은 유전자가위의 표적 부위인 유전자 주위의 염기서열에 따라 현저히 달라지기 때문에, 유전자가위를 제작하기 전에 많은 실험을 통해 각각의 효율을 측정해야만 했다.


  이에 지금까지 미국 하버드대, MIT공대 등의 연구진들이 유전자가위를 이용한 스크리닝 실험을 하고, 이 데이터를 바탕으로 유전자가위의 활성을 예측하는 모델을 개발했으나, 정확도가 낮고 실험 조건에 따라 성능이 달라지는 문제가 있어 사용에 어려움이 있었다. 또한 기존의 방법은 유전자가위에 의한 유전자의 기능변화를 통해 유전자가위의 효율을 간접적으로 측정한 것이어서 유전자가위에 의한 염기서열의 변화를 직접 측정할 수 없었다. 또한 기존 방법으로는 유전자가위의 종류를 크게 늘릴 수 없어 대량의 데이터 생산이 어려웠으며, 따라서 모델이 학습한 데이터의 양이 많지 않아 정확한 예측에 어려움이 있었다. 

따라서 연구자들이 필요한 유전자가위를 직접 제작해 유전자가위의 효율을 일일이 실험적으로 검증하는 단계가 필요하여 막대한 시간과 비용이 소요되는 단점이 있었다.


  본 연구팀은 기존 예측 프로그램의 한계점을 극복하기 위해 대량으로 유전자가위의 효율을 직접 차세대 시퀀싱 방법으로 측정하여 기존 모델들이 학습했던 데이터량에 비해 약 3~4배에 달하는 대량의 데이터를 수집하였고, 이를 인공지능 기법인 딥러닝을 통해 유전자가위의 효율을 정확하게 예측할 수 있는 모델을 개발하였다. 이를 통해 기존의 예측 모델로 예측이 어려웠던 유전자가위 실험들에서 유전자가위의 활성도를 다른 모델에 비하여 높은 정확도로 추정할 수 있었으며, 이는 여러 실험 조건에서도 일관되게 높은 수준으로 예측이 가능하였다.


  이번에 개발된 기술은 유전자 가위 제작을 위한 비용과 노동력을 획기적으로 줄일 수 있으며, 염기편집이나 에피지놈 편집 등 유전자가위를 이용한 다양한 기술들에 활용될 수 있다. 특히 여러 조건의 실험들에서도 일관되게 높은 성능을 나타내는 모델로서 크리스퍼 유전자가위를 이용한 대규모의 유전체 스크리닝, 약물 후보 발굴 등의 실험들에서 널리 사용될 수 있는 기술이라 할 수 있다.


  본 연구결과는 해당 연구분야 상위 6% 학술저널인 Science Advanced(IF 12.804)에 올 11월 7일 온라인 게재되었다.




(그림1. Deep learning을 이용한 유전자가위 활성 예측 프로그램의 성능)




(그림2. 여러 모델들의 Cas9 유전자가위의 예측 성능 비교)

첨부