EVIDENCE

쓰리빌리언 변이 해석 기술의 핵심, 자동 변이 해석 시스템

희귀질환 진단의 돌파구,
변이 해석 시스템

한 사람의 유전정보를 whole genome sequencing(WGS) 이나 whole exome sequencing(WES)으로 분석하면 WGS로는 수백만 개, WES로는 약 10만 개의 변이를 찾을 수 있습니다.

이 변이들을 변이 해석 가이드라인에 따른 근거를 바탕으로 해석해야 병원성 변이를 찾을 수 있습니다. 10만 개에서 수백 만개에 달하는 변이의 근거를 사람이 직접 확인하는 과정은 시간이 오래 걸리며 병원성 해석 결과에 편향이 생길 수 있다는 문제가 있습니다.

이를 해결 하기위해 쓰리빌리언은 변이 해석 시스템 EVIDENCE를 개발해 진단에 활용하고 있습니다.

EVIDENCE가 특별한 이유

매일 새로운 정보를 업데이트합니다.

WGS/WES를 통해 발견한 변이는 단계별로 걸러집니다. 이때, 최신 정보를 반영하기 위해 다양한 데이터베이스에서 매일 필요한 정보를 받아 활용합니다.

Disease information

OMIM, Orphanet, HPO

Pathogenic variant information

ClinVar, HGMD

Prediction
tools

3Cnet, spliceAI, REVEL

Large-scale sequencing data

gnomAD, TopMed, in-house data

10만여 개 변이를 평균 5분 안에 자동으로 해석하고 분류합니다.

의사가 직접 의심되는 모든 변이를 나열해 해석할 때보다 EVIDENCE를 활용해 해석했을 때 시간을 단축할 수 있었습니다. (*WES 기준) 또한 ClinVar의 변이 해석 데이터와 EVIDENCE의 변이 해석 데이터를 비교해봤을 때, EVIDENCE의 Sensitivity는 98.4%, Specificity는 99.99%로 확인되어, 검증된 변이 해석 성능을 자랑합니다. (3billion, 2021)

환자의 증상 정보를 수치화해 적극 활용합니다.

쓰리빌리언은 임상유전학팀에 변이 리스트를 전달할 때 여러 유전변이 중 환자의 증상에 가장 부합하는 변이를 우선으로 노출합니다. 또한, 증상 정보를 단순 비교해 사용하는 것이 아닌, 해당 변이가 존재함으로써 유발하는 증상과 환자의 증상이 얼마나 비슷한지를 ‘증상 유사도’ 점수로 계산해 활용합니다. 이를 통해 활용해 더 정교한 변이 우선순위화가 가능합니다.

사내 데이터베이스를 활용합니다.

쓰리빌리언의 임상유전학팀과 BI(Bioinformatics)팀의 연구진들은 공개된 데이터베이스에서 아직 찾을 수 없는 병원성 변이, 새로운 질환, population frequency 등의 정보를 자체적으로 수집해 데이터베이스를 구축하고 있습니다. 해당 정보는 EVIDENCE의 민감도와 특이도를 높이는 데 중요한 역할을 합니다.
또한, 쓰리빌리언의 익명화된 진단 데이터를 EVIDENCE에 다시 활용해 변이를 해석하는 근거로 활용합니다.

EVIDENCE는 이렇게 활용됩니다

EVIDENCE는 환자의 유전정보와 증상정보를 모두 활용해 ACMG Standards and Guidelines에 따라 변이를 분석합니다.
이 과정은 총 여섯 단계로 나눌 수 있습니다.

1
Allele frequency에 따라 Mendelian 질환을 일으키는 병원성 변이일 가능성이 없는 common variants는 제외합니다.
2
ClinVar, HGMD, gnomAD 등의 데이터베이스로부터 변이별 정보를 수집합니다.
3
변이가 발생한 유전자별 질환 정보를 OMIM 등의 데이터베이스로부터 수집합니다.
4
수집된 정보를 바탕으로 ACMG Standards and Guidelines에 따라 변이의 병원성을 판별합니다.
5
HPO term으로 작성된 환자의 증상 정보를 각 질환의 일반적인 증상과 비교해 증상유사도(Symptom similarity)를 계산합니다.
6
최종 목록에 남은 변이에 증상유사도로 우선순위를 매겨 임상유전학팀에 전달합니다.