3billion

GEBRA™ 사용 가이드: 3bCNV – Copy Number Variant 검출부터 임상 해석까지

    유전자 검사 | 25. 11. 28

GEBRA™은 SNV(single nucleotide variant) 분석과 함께 CNV(copy number variant) 분석 결과도 제공합니다. Deletion과 duplication을 포함한 CNV는 분석 과정에서 검출되어 사용자에게 보여집니다.

GEBRA의 CNV 검출 방법

GEBRA는 두 가지 상호보완적인 방법으로 CNV를 검출합니다.

3bCNV: Coverage Depth 기반 검출

3bCNV는 엑솜 시퀀싱 데이터의 exon-level read depth에서 도출된 depth-of-coverage 신호를 기반으로 CNV를 식별합니다.

특정 게놈 영역이 실제 copy number alteration(deletion 또는 duplication)인지 판단하기 위해, coverage depth를 레퍼런스 샘플 코호트 전체와 비교합니다. 코호트 전체의 각 exon에 대한 평균 depth of coverage가 계산되며, 이후 개별 샘플의 coverage 값이 정규화되어 샘플 간 변동성을 줄입니다.

이러한 정규화된 값을 사용하여 각 exon에 대한 z-score가 계산되며, 이는 예상 coverage 분포로부터의 편차 정도를 정량화합니다. 3bCNV는 three-consecutive-exon 기준을 적용하여, 최소 3개의 인접한 exon이 일치하는 copy-number 신호 변화를 보여야 진정한 CNV call로 간주합니다.

이 threshold는 시퀀싱 coverage의 무작위 변동에서 발생하는 false-positive detection을 크게 줄입니다.

MANTA: Breakpoint 기반 Structural Variant 검출

3bCNV에는 특정 한계가 있습니다. 예를 들어, deletion이 intragenic인 경우 exon loss가 50% 미만일 수 있어 depth 기반 검출로는 안정적으로 포착하기 어렵습니다.

이러한 한계를 극복하기 위해 GEBRA™는 MANTA를 함께 사용합니다. MANTA는 breakpoint와 paired-end read 정보를 활용하는 structural variant caller입니다. 이를 통해 coverage 분석만으로는 검출할 수 없는 작거나 부분적인 deletion을 식별할 수 있습니다.

MANTA에서 검출된 deletion(왼쪽)과 duplication(오른쪽). In courtesy of Dr. Hane Lee

CNV 변이 카드의 구성

7q11.23 cytoband의 heterozygous deletion이 식별된 예시를 살펴보겠습니다.

좌측 패널: 기본 정보

좌측에는 호출된 CNV의 시작 및 종료 위치가 표시됩니다. 이 변이를 검출한 caller의 유형도 함께 표시됩니다.

우측 패널: 상세 Annotation

우측에는 zygosity, cytoband, 변이 크기를 포함한 변이의 상세 annotation이 표시됩니다. 건강한 gnomAD 집단과 쓰리빌리언의 Inhouse DB에서 이 변이의 발생 빈도를 나타내는 population frequency 데이터도 제공됩니다. 이전 쓰리빌리언 리포트 및 Inhouse (GEBRA 사용자) Report의 기록이 표시되며, 변이에 부여된 3ASC class (high, mid and low)도 함께 제공됩니다.

중앙 패널: Overlap Variants

아래 중앙 패널에는 ClinVar와 DECIPHER에 제출된 이전에 보고된 overlap variants가 제시됩니다. 환자의 CNV와 가장 높은 overlap percentage를 가진 상위 3개 변이가 하이라이트됩니다.

하단 패널: 포함 유전자 정보

카드 하단에는 검출된 CNV에 포함된 유전자에 대한 정보가 표시됩니다. 제공되는 세부 정보에는 gene symbols, gene constraint metrics, 유전자당 이전에 보고된 pathogenic/likely pathogenic (P/LP) 변이의 개수 및 유형, 연관 질환, phenotype similarity scores가 포함됩니다.

CNV 시각화

3bCNV로 검출된 CNV의 시각적 표현이 제공됩니다. 상단의 빨간색으로 하이라이트된 영역은 deletion을 나타내고, 하단의 초록색으로 하이라이트된 영역은 duplication을 나타냅니다. 각각의 작은 박스는 exon에 해당하며, 삭제되거나 중복된 각 exon에 대한 해당 z-score가 부여됩니다.

이 시각화를 통해 사용자는 전체 CNV 크기를 신속하게 평가하고, call 신뢰도를 평가하며, CNV에 포함된 유전자를 식별할 수 있습니다.

결론

GEBRA는 SNV 분석과 함께 CNV 분석 결과를 제공합니다. 3bCNV와 MANTA 두 가지 상호보완적 알고리즘을 사용하여 deletion과 duplication을 검출하며, 통합된 변이 카드를 통해 검출된 CNV에 대한 포괄적인 annotation 정보를 제공합니다.


자주 묻는 질문 (FAQ)

Q: 3bCNV의 three-consecutive-exon 기준이란 무엇인가요?
A: 3bCNV는 최소 3개의 인접한 exon이 일치하는 copy-number 신호 변화를 보여야 진정한 CNV call로 간주합니다. 이 threshold는 시퀀싱 coverage의 무작위 변동에서 발생하는 false-positive detection을 크게 줄입니다.

Q: GEBRA가 3bCNV와 MANTA를 모두 사용하는 이유는 무엇인가요?
A: 3bCNV는 depth-of-coverage 기반으로 큰 CNV를 검출하는 데 뛰어나지만, 3개 exon보다 작아서 진짜 deletion, duplication 여부가 확실하지 않은 작은 intragenic deletion에는 한계가 있습니다. MANTA는 breakpoint와 paired-end read 정보를 활용하여 이러한 작은 변이를 식별함으로써 이를 보완합니다.

Q: ClinVar/DECIPHER overlap percentage는 어떻게 해석하나요?
A: CNV 변이 카드는 가장 높은 overlap percentage를 가진 상위 3개 변이를 표시합니다. 높은 overlap은 이전에 보고된 변이의 pathogenicity 및 연관 phenotype을 참조하는 데 더 관련성이 높음을 나타냅니다.

Q: Z-score 시각화는 어떤 정보를 제공하나요?
A: 시각화는 각 exon을 해당 z-score와 함께 작은 박스로 표시합니다. 빨간색 영역은 deletion을, 초록색 영역은 duplication을 나타냅니다. 이를 통해 전체 CNV 크기를 신속하게 평가하고, call 신뢰도를 평가하며, CNV에 포함된 유전자를 식별할 수 있습니다.


GEBRA™ 사용 가이드를 더 살펴보세요!

포스트가 마음에 드셨나요?

유용한 포스트를 다른 사람들과 공유해 보세요

3billion Inc.

희귀질환 환자들이 진단과 치료에서 외면받지 않는 세상을 만들기 위해 쓰리빌리언은 하나의 미션을 바라봅니다.

필진 글 더 보기

연관 소식