전사체
#
Find similar titles
- (rev. 11)
- JSeo
Structured data
- Category
- Analysis
Table of Contents
전사체 정의 #
전사체에 대한 정의는 위키백과에 있다. NGS 기법을 이용하여 RNA-seq, Non-coding RNAs 등 다양한 RNAs에 대한 분석을 수행할 수 있다.
분석 사례 #
포도막흑색종의 exome and transcriptome 분석 #
Whole exome과 Gene panel 시퀀싱은 암연구에서 진단과 약물 타겟을 탐색하기에 굉장히 유용하다. CLC application note에 따르면 CLC Genomics Workbench를 이용하면 같은 암 환자에서 변이를 비교하여 종양에서 얻어지는 유전자들의 서열과 분석을 하는 일반적인 접근 방법에 대한 워크플로우를 제작하여 분석할 수 있다.
개요 #
포도막흑색종은 눈에서 일반적으로 재발하는 암중에 하나이며 주로 성인에게서 나타난다. 이 종양은 전이 위험이 높은군(class 2)과 낮은군(class 1)으로 나눠볼 수 있으며 기존 연구에서 80% 이상의 class 2 종양은 3번 염색체의 BAP1을 억제하므로서 기능이 손실되어 종양으로 변이가 된다는 사실을 알아냈다.
포도막흑색종은 안구에 발생하는 원발성 종양 중 가장 흔한 악성종양으로 모든 연령의 사람들에게 나타날 수 있지만 50세 이상에게 많이 발생한다고 한다. 이 암이 발생한 환자들의 절반 이상에게서는 암 전이가 발생하고 최종적으로 사망하게되며, Harbour 교수와 그의 연구진들은 이들 환자들의 수명을 연장하기 위해서는 무엇이 전이를 유발시키는가에 대해서 더 잘 이해할 필요가 있다고 강조했다.
이미 암들은 유전자 발현에 따라서 2가지 그룹으로 분류되며 Class 1의 암은 전이가 잘 발생하지 않지만, Class 2는 전이가 발생할 가능성이 매우 높다. Class 2에 포함된 암 중에서 90%가 염색체 3번에서 2개 중 한쪽에 결실이 발생하며, 이와 달리 Class 1의 암들은 염색체 3번 양쪽에서 모두 해당 부위가 보존되어 있다.
또한 Class 2의 84%가 BAP1 유전자에 돌연변이가 존재하는 것을 확인하였고, 또한 Class 2의 암조직에서는 3번 염색체의 BAP1이 위치하는 부위에서 한쪽 염색체에 결실이 있는 것으로 나타났다. 이 때문에 환자들은 BAP1 유전자를 단일 사본(single copy)만을 가지고 있어서 세포가 제 역할을 수행하지 못하는 것으로 연구되었다.
따라서 BAP1 유전자가 암전이 억제제 역할을 한다고 볼 수 있으며, Class 2에서는 손상이 발생하여 암을 확산하게 되는 것이라고 판단할 수 있다. 이러한 연구 결과를 바탕으로 실제 암 환자 샘플 시퀀싱 데이터를 이용하여 분석에 활용해보자.
데이터 #
- Raw sequence reads : downloaded from bio project PRJNA182345 in NCBI’s SRA
- Genomic DNA libraries : Roche-Nimblegen SeqCap EZ Exome kit
- Sequencing : Illumina Genome Analyzer II (GAIIx) using paired-end protocols with 76 or 101 cycles
- Reanalyze subset : three class I (CI1-3) and four class II (CII1-4) tumor samples and corresponding control samples (peripheral blood)
분석 워크플로우 #
Reference data and NGS data import : #
Human reference genome(hg19)은 "Download Genome"기능을 이용하여 gene, transcript, CDS annotation을 함께 다운로드 받았다. 또한 다운로드 받을 때 dbSNP 데이터도 함께 다운 받았다. 그리고 CLC Genomics Workbench의 "Import Illumina"를 사용하여 서열 데이터를 import 하였다.
Mapping and variant calling : #
control과 종양 샘플의 시퀀싱 데이터는 human reference genome 서열에 맵핑을 수행하였다(length fraction= 0.75, similarity fraction=0.8). 모든 파라미터는 default 수치로 수행하였다. 또한 Local realignment 플러그인을 수행하여 불균일한 alignment 결과를 해결하고 Reference genome과 샘플 데이터를 비교하기 위하여 "Probabilistic Variant Caller"를 사용하여 variant를 검출하였고, 높은 퀄리티의 variant들만 다시 선별하기 위하여 "Filter Marginal Variant Calls"를 수행하였다. 또한 Large deletion과 insertion 그리고 inversion들은 "Structural Variant" 툴을 이용하여 분석에 수행하였다.
Workflow 1 : 위에서 진행한 분석들을 워크플로우를 이용하여 작성해보았고, 이는 많은 샘플을 분석할 때 굉장히 파워풀한 방법으로 사용될 수 있을 것이다.
Filtering control variants from cancer variant table : #
우리는 암을 유발하거나 전이시키게하는 변이들에 대한 관심이 높으므로 다음 분석을 위하여 모든 germline 변이들을 제거하였다. "Filter against Known Variants"를 이용하여 control 샘플에서 이미 알려진 variant들을 제거하였다.
Annotation of tumor-specific variants : #
종양에 특이적인 Variant들의 정보를 더 많이 얻기 위해서 우리는 각 Variant마다 어디 유전자에 위치하고 있는지 Annotation을 수행하여야 한다. 또한 "Annotate from BIOBASE Genome Trax" 플러그인을 활용하면 COSMIC, HGMD, dbNFSP, OMIM과 같은 질병 연관의 데이터베이스를 통해서 질병과 관련한 Variant 정보들을 확인할 수 있고, 종양에 특이적인 Variant들을 확인할 수 있다. 그리고 "Amino Acid Changes" 툴을 사용하면 synonymous와 Non-synonymous한 변이들도 확인이 가능하다.
Workflow 2 : Filtering과 annotating 연관된 툴들을 모두 링크하여 만들면 아래와 같은 두번째 워크플로우가 된다.
Transcriptome analysis : #
mRNA 서열을 바탕으로 RNA-Seq 분석 알고리즘을 사용하여 다른 유전자들과 그들의 Transcript isoform들에 맵핑되는 서열들을 이용하여 분석을 수행하였다.
결과 #
종양 샘플들에서 최소 50,777개의 Variant들과 최대 109,655개의 Variants들이 확인되었고 germline variant들을 제거를 하니 6-7개의 샘플에서 18~317개의 변이들이 감소되었다. 예외적으로 sample Cll4 는 8000개의 variant들이 남아있었다.
9,511개의 종양 특이적인 Variant로 최종 검출되었고, 그 중 4,845개는 Non-synonymous amino acid change를 유발하였다. Non-synonymous와 종양 특이적인 변이들을 비교하였더니 222개 유전자 내에 변이가 발견되었다.
가장 눈에 띄는 SNP는 다섯개의 샘플 안에서 9번 염색체의 GNAQ 유전자에 80409488 포지션에 있는 SNP였다. 이 변이는포도막흑색종에서 일반적으로 발견되는 GNAQ 유전자 내의 변이라고 판단된다.
그리고 5개의 추가적인 유전자에서 Variant들이 네 개의 다른 샘플에서 찾을 수 있었다. 그중 하나는 KIF20B이며, Cl1과 Cll3 샘플에서는 "AGTAAA"가 91497906과 91497907 사이에 삽입이 되어 있다. 이러한 삽입은 COSMIC에 췌장암에 대한 정보에도 있다.
또한 Harbour 교수 연구진이 보고한대로 BAP1 유전자 내에 Non-synonymous 변이가 3개 결손이 되어있는 4개의 class2 종양 샘플에서 CLC Genomics Workbench로 분석 결과 동일한 결과가 나왔다(Fig 3).
게다가 RNA 시퀀싱 분석은 변이된 allele들의 유전자 발현을 확인할 수 있었다. 아래 그림에서 보여지는 것처럼 Cl2 샘플의 GNAQ 유전자의 mRNA 서열을 정렬하면 wild 타입의 heterozygous 발현이 나타나 있는 것으로 확인된다.
Acknowledgements #
1 Harbour JW et al., “Frequent mutation of BAP1 in metastasizing uveal melanomas.”, Science, 2010 Nov 4;330(6009):1410-3 SRA 데이터 이용
Incoming Links #
Related Articles (Article 0) #
Related Bioinformaticses (Bioinformatics 1) #
- ABySS
- MapMan
- R (프로그래밍 언어)/Heatmap
- RNA Assembly Optimization
- Single cell RNA-seq
- TransDecoder
- Transcriptome 개요
- Transcriptome 개요 (책 발간용 글 편집 및 수정)
- 기능유전체학
- 발현
- 유전자 기능 분석/GBA
- 유전체/유전체 크기 예측
Suggested Pages #
- 0.222 JELLYFISH
- 0.180 Assembly
- 0.131 Sequencing Methods
- 0.068 Overlapping paired-end reads
- 0.027 Small hairpin RNA
- 0.025 DNA
- 0.024 De novo assembly
- 0.024 PacBio
- 0.022 TruSeq
- 0.021 cDNA
- More suggestions...