Skip to content

메타데이터 #
Find similar titles

Structured data

Category
Analysis

메타데이터(metadata)란? #

흔히 메타데이터(metadata)는 상위 레벨에서 하위 레벨의 데이터를 설명하는 정보를 담은 데이터이다. 생물정보학에서, 특히 NGS에서 메타데이터는 분석하고자 하는 표본들의 추가적인 실험 정보를 담은 테이블을 의미한다. 메타데이터는 생물정보학 뿐만 아니라 컴퓨터 파일 시스템에서 파일의 정보를 설명하거나, 데이터베이스에서 데이터의 구조를 설명하는 등 정보 자원을 효과적으로 사용할 수 있도록 보조하는 역할로 다양하게 사용된다.

NGS에서 메타데이터의 필요성 #

NGS를 통해 얻은 염기 서열은 서열 정보뿐만 아니라, 샘플이 유래된 종 혹은 개체에 관한 정보, 반복 수 등의 정보들을 가진다. 이와 같은 정보들은 행과 열로 이루어진 테이블, 주로 Excel 형식을 빌려 저장된다.

보통 NGS는 서열 데이터의 비교 분석을 위해 사용하는데, 그저 염기 서열만으로는 비교 및 분석이 불가하다. 서열 데이터를 특정 기준에 따라 분류하여 plot을 그리거나, 비교하기 위해서는 서열 정보와 해당 서열의 다른 정보들을 지정해주어야 한다. 따라서 NGS 데이터의 정보들과 비교에 활용할 기준 항목을 컬럼으로 추가하고 메타 데이터로 저장한다. 저장된 메타데이터를 임포트하여, 시퀀싱 데이터 분석 및 DEG 분석에 활용할 수 있다.

생물 정보학에서 메타데이터의 형식 #

excel 형식을 활용해 만들 수 있고, 데이터 형성 시 생성한다. 파일과 관련된 부가 사항들은 컬럼으로 추가할 수 있으며, 분석 시 해당 항목을 기준으로 그룹 지정할 수 있다.

  • 첫 번째 컬럼: 샘플의 이름. 파일의 이름과 정확히 매치해야 함.
  • 이 외의 컬럼: 샘플에 관한 다양한 정보 기록(추가 가능)

Image

메타 데이터의 예시
(A 컬럼은 샘플의 이름. B 이후 컬럼부터는 추가적인 정보이다)

Reference #

Xiong H, Li Q, Liu S, Wang F, Xiong Z, et al. (2014) Integrated microRNA and mRNA Transcriptome Sequencing Reveals the Potential Roles of miRNAs in Stage I Endometrioid Endometrial Carcinoma. PLoS ONE 9(10): e110163. doi:10.1371/journal.pone.0110163

Suggested Pages #

0.0.1_20140628_0