Biomedical Genomics Workbench Beta 4.0
#
Find similar titles
- 최초 작성자
- 최근 업데이트
Structured data
- Category
- Software
아래는 Biomedical Genomics Workbench 베타 4.0버젼에 대한 설명이다. 주로 RNA-Seq에 대해 자세히 기술하였고, 다른 목록의 추가적인 사항은 Reference를 참고하면 된다.
Table of Contents
RNA-Seq을 위한 새로운 분석 도구 #
- RNA-Seq 보고서 통합 작성 - RNA-Seq Analysis 도구로 생성된 여러개의 보고서를 하나의 통합된 개요 보고서로 만들 수 있다.
- RNA-Seq의 PCA - 2D 또는 3D로 샘플을 클러스터링한다. 각 샘플에 대해 알려진 메타 데이터가 오버레이로 추가된다.
- RNA-Seq의 Differential Expression - 음 이항 GLM을 기반으로 다중 요인 통계를 사용한다.
- RNA-Seq의 Heat Map 생성 - 샘플과 기능을 동시에 클러스터링한다. 각 샘플에 대해 알려진 메타 데이터가 오버레이로 추가된다.
- Expression Browser 생성 - 발현값, 통계 결과 및 유전자 주석을 함께 볼 수 있다.
- RNA-Seq의 벤 다이어그램 만들기 - 실험 조건 사이에서 공유되는 차별적으로 발현된 유전자를 보여준다.
- Gene Set 테스트 - hypergeometric 테스트를 사용하여 Gene Ontology 용어와 같이 많이 표현된 유전자 세트에 대한 RNA-Seq의 Differential Expression의 결과물을 테스트 한다.
- Import | RNA Spike-ins - RNA Spike-ins 시퀀스 및 농도 데이터를 가져오기 위한 것이다.
- 위의 2~6째 도구는 이전 Workbench 버전에서 Advanced RNA-Seq 플러그인을 통해 사용할 수 있었다. 이 도구들은 이제 Toolbox의 RNA-Seq Analysis 폴더에서 찾을 수 있다. 이러한 도구는 시퀀싱 depth로 인한 차이를 자동으로 고려하므로 input 데이터를 normalize할 필요가 없다. 또한 RNA-seq의 TE 및 GE 트랙을 이용한다. 이번 릴리스에서 변경된 사항은 RNA-Seq의 Differential Expression 도구의 결과를 이제 Extract reads based on overlap 도구에 대한 입력값으로 사용할 수 있다는 것이다. 인간, 마우스 및 쥐에 대한 Identify and Annotate Differentially Expressed Genes and Pathways의 세 가지 워크 플로우는 동일한 이름의 세 가지 새로운 워크 플로우로 대체되었다. 새로운 워크 플로우는 새로운 RNA-seq 도구가 포함되어 있다.
RNA-Seq Analysis #
- RNA-Seq 분석 툴은 이제 품질 관리를 위해 ERCC 및 SIRV와 같은 RNA spike-ins를 지원한다. 이것은 알려진 급상승(spike-ins) 농도를 측정된 전사 농도와 비교함으로써 RNA-Seq 실험을 검증하는 것을 가능하게 한다. Spike-ins은 새로운 RNA Spike-ins Import 도구를 사용하여 가져올 수 있다.
- RNA-Seq 분석 보고서가 개정 및 업데이트 됨.
- 맵핑된 리드의 생물 계통 분포를 보여줌.
- 맵핑된 리드의 strand specificity 를 보고함.
- Workbench 툴박스의 Whole Transcriptome Sequencing 폴더 아래에 있는 Ready-to-use workflows는 이제 "Strand Specific" 매개 변수를 설정하여 strand-specific RNA-seq 프로토콜을 지원한다.
- Transcript coverage plots 은 5' 및 3' coverage bias를 감지하고 시각화할 수 있다.
- paired-end reads의 경우, 잠재적인 어댑터 리드를 감지하고 경고한다.
- 생물 계통 정보가 있을 때, RNA-Seq Analysis 툴에 의해 생성된 Expression Track 테이블에서 생물 계통 컬럼을 볼 수 있다.
- RNA-Seq Analysis 툴의 맵핑 옵션인 "Map to gene regions only"와 "Also map to intergenic regions" 가 제거되었다. 이제 툴은 reference 전체에 맵핑하여 실행한다. 이것은 변경 전 버젼에서 "Also map to intergenic regions" 옵션을 선택하는 것과 같다.
- RNA-Seq Analysis 툴은 이제 "Expression level" 옵션 "Use EM estimation (권장사항)"을 사용하여 발현값을 정량화한다. 이것은 이전 기본 옵션보다 더 정확하다. 차이점은 Transcript Expression (TE) tracks에서 두드러진다.
- EM estimation에 의한 RNA-Seq Analysis 정량화가 이제는 더욱 빨리 실행된다.
- RNA-Seq Analysis에서 genome position에 고유하게 맵핑된 리드는 이제 항상 고유한 것으로 표기가 된다. 이전에는, 여러개의 중첩된 유전자가 있는 위치에 맵핑이 되면 고유하게 맵핑된 리드를 ambiguous한 것으로 표기되었다.
- 엑손 ID는 더 이상 RNA-Seq 분석 도구로 생성된 transcript expression (TE) 트랙의 ENSEMBL 컬럼에 포함되지 않는다. Gene과 transcript 이름은 이 컬럼에 계속해서 나열되고 하이퍼 링크로 표시된다.
Import / Export #
- 이제 PacBio 데이터를 가져 오는 도구가 Import | PacBio 에 있다.
- 특정 메타 데이터 행과 연관된 데이터 항목의 미리보기 추가를 비롯하여 메타 데이터 가져 오기 도구를 사용하여 데이터 연결의 유용성 측면이 향상되었다.
- 이 밖에 다양한 개선점이 있다.
New features and improvements #
- 두 개의 새로운 인간 reference 데이터 세트를 Reference Data Manager에서 다운로드 받을 수 있다. 하나는 Ensembl 86을 기반으로 하고, 다른 하나는 RefSeq GRCh38.p9를 기반으로 한다.
- 이전의 최상위 툴박스 폴더인 "Expression Analysis"는 제거되었으며, 발현 분석 도구는 "RNA-Seq Analysis"와 "Microarray and Small RNA Analysis" 두 가지 최상위 폴더에 있다.
- Basic Variant Detection 툴은 variant 위치에서 모호한 염기가 있는 경우 더이상 alternative allele을 N으로 보고하지 않는다.
- Pubmed 검색 옵션이 SRA 툴의 Read 검색에 추가되었다. 이것은 Pubmed abstract 또는 논문 전체 본문과 관련된 결과만 반환한다.
- 이 밖에 다양한 개선점이 있다.
Bug fixes #
- "java.lang.ClassCastException : sun.awt.image.BufImgSurfaceData can not cast to sun.java2d.xr.XRSurfaceData"텍스트를 포함하여 오류가 발생하는 산발적인 Java 문제는 java 업그레이드를 통해 해결되었다. 이 문제점은 주로 Linux 시스템에서 원격으로 Workbench를 사용할 때 나타난다.
- 이 밖에 다양한 개선점이 있다.
Retirement #
- GFF exporter는 없어져 더이상 사용이 불가하다. 대신 새로운 GFF3 exporter를 사용하면 된다.
Plugin notes #
- Advanced RNA-Seq 플러그인이 폐기되었다. 이 플러그인의 도구는 이제 Toolbox의 RNA-Seq Analysis 폴더에서 찾을 수 있다. (자세한 내용은 RNA-seq을 위한 새로운 분석 도구를 참조)