Skip to content

SFF #
Find similar titles

Structured data

Category
Analysis

개요 #

SFF는 Standard Flowgram File의 약자이며, RocheIon Torrent 장비에서 생산된 NGS raw data의 기본 포맷으로 Read 정보와 Trace data가 포함되어져 있다. 두 장비는 base calling 데이터를 flowgram 형태로 생산하는데, flowgram을 그대로 저장한 binary 포맷이다.

SFF 파일을 열고 편집 할 수있는 프로그램에는 SFF Workbench (이전 454 SFF 도구) 및 MATLAB이 있다.

  • 454 Life Sciences는 GS 데이터 분석 소프트웨어라고 불리는 SFF 파일을 처리하고 분석하기위한 툴킷을 제공
  • MATLAB을 사용하는 경우 SFFL 데이터를 구조체의 MATLAB 배열로 반환하는 sffread() 함수를 사용

SFF 데이터의 pre-processing 또는 FASTQ/FASTA 파일로의 변환은 sff_extract, sfftofasta 등의 프로그램을 이용하여 수행할 수 있다.

파일 형식 #

SFF는 3개의 section으로 구성되어져 있으며 상세항목은 아래와 같다.

  1. common header section
    • magic_number, version, index_offset, index_length, number_of_reads, header_length, key_length, number_of_flows_per_read, flowgram_format_code, flow_chars, key_sequence, eight_byte_padding
  2. read header section
    • read_header_length, name_length, number_of_bases, clip_qual_left, clip_qual_right, clip_adapter_left, clip_adapter_right, name, eight_byte_padding
  3. read data section
    • flowgram_values, flow_index_per_base, bases, quality_scores, eight_byte_padding

Reference #

Incoming Links #

Related Bioinformaticses #

Suggested Pages #

0.0.1_20140628_0