Skip to content

BioJava #
Find similar titles

Structured data

Category
Software

BioJava: an open-source framework for bioinformatics in 2012 #

BioJava는 자바를 프로그래밍 언어를 이용해 biological data를 다루는 여러가지 구현체를 제공하는 오픈소스 프로젝트이다. Biojava 프로젝는 1995년부터 시작되었으며, 2012년 기존 biojava와 구분하여 Biojava3.0 버전을 시작으로 기능을 독립적인 모듈로 개발 각각을 라이브러리 형태로 배포하고 있다. 새롭게 진행된 Biojava는 DNA, RNA, protein 분석기능이 강화된 API를 제공하며 Bioinformatics 관련 어플리케이션에 쉽게 이식될 수 있도록 설계되었다. 2016년 5월 현재 4.2.1버전을 Maven을 리용하여 배포하고 있다.

참고로 기존 Biojava 라이브러리는 1.x로 지속적인 업데이트 진행되고 있으며 2014년 현재 1.9 버전을 제공하고 있다.

이번에는 Biojava의 다양한 모듈에 대해서 알아보도록 하겠다.

Biojava3 Modules #

1. Core Module #

nucleotide, amino acide sequence의 기본 데이터 타입, 관계 모델 등 Bioinformatics 데이터를 다루는 기본 기능 및 데이터 타입등을 제공한다. 다른 모듈을 사용하는데 기본이 되는 모듈이다.

2. Protein structure Module #

PDB 파일과 mmCIF 파일 포멧 파서기능 및 FATCAT, CE 등의 알고리즘을 이용해 단백질구조 분석을 할 수 있는 기능을 제공한다. 또한 Jmol(an open-source Java viewer for chemical structures in 3D. http://www.jmol.org/ )를 이용한 단백질 구조를 시각화 할 수 있는 인터페이스를 제공하고 있다.

3. Genome and sequencing Module #

GTF, GFF, FASTAQ 파일 포멧 파서와 genomics 데이터를 분석할 수 있는 기능을 제공한다.

4. Alignment Module #

Multiple alignment 분석 기능 및 결과 포멧 파서, 결과파일을 이용한 가시화 할 수 있는 인터페이스를 제공한다.

5. ModFinder Module #

단백질 3차원구조 정보를 이용하여 단백질을 식별 분류할 수 있는 기능을 제공한다.

6. Amono acide properties Module #

Biopolymer에 대한 물리화학적 특성을 계산하는 기능 제공한다.

7. Protein disorder Module #

단백질의 disorder 영역을 예측하는 프로그램 the Regional Order Neural Network (RONN) predictor (Yang et al., 2005) 를 실행 및 결과파일 파서 기능을 제공한다.

8. Web service access Module #

REST 프로토콜을 이용하여 웹서비스를 이용할 수 있는 제공한다. 현재는 NCBI Blast와 HMMER 웹서비스를 지원하고 있다.

9. Phylogeny Module #

Nexus and Phylip 포멧 파서와 다양한 종류의 Clustering 알고리즘을 이용한 Clustering 분석 기능 제공한다.

Incoming Links #

Related Data Sciences #

Related Bioinformaticses #

Suggested Pages #

0.0.1_20140628_0