Skip to content

ClusterCall #
Find similar titles

개요 #

Autotetraploid (4배체)에 특화된 R package, ClusterCall은 4 배체 array를 최대한 활용하는 신호강도와 대립유전자 양 사이의 관계를 각 마커에 맞게 계산하는 프로그램입니다.

알고리즘 #

ClusterCall의 알고리즘은 크게 training phase와 prediction phase로 나뉩니다.

Image

Training phase #

F1 집단 내의 hierarchical clustering을 통해 유사한 intesity를 갖는 표본을 그룹화 하여 F1 family안에서 예상되는 분리 비 (expected segregation ratio)를 통해 allele dosages를 대입 합니다.

Image

prediction phase #

예측 단계에서, 다수의 F1 모집단과 예측 세트가 함께 클러스터링되고, 각 클러스터에 대한 유전자형은 트레이닝 세트 샘플의 모드(mode, 중간값)입니다. 모드와 동일한 트레이닝 세트 샘플의 비율로 정의 된 일치도 메트릭(concordance metric)을 사용하여 신뢰할 수 없는 마커를 제거합니다.

주요 Function와 이들의 기능 #

Function 기능
read.pop theta 및 r 값을 읽고 csv파일에서 복제 샘플을 식별합니다.
alter.pop 2 개 이상의 개체군을 결합하고, 복제 된 샘플에서 합의 된 개체를 만들고, 샘플을 제거합니다.
CC.bipop F1 집단의 유전자형을 할당하니다.
CC.anypop 2이상의 F1 개체군에 대한 일치도 계산, 임의 개체군에 대한 유전자형 지정합니다.
inspect.marker 마커의 유전자형 지정 시각화합니다.
CC.plot 하나 이상의 프로젝트에 대한 가족 간의 일치도 시각화합니다.
optimize.params 다양한 매개 변수로 프로젝트에 여러 번 유전자형 할당합니다.
write.pop csv파일로 유전자형 결과 행렬을 작성합니다.

문헌상 결과 #

ClusterCall은 8K SNP array로 genotyped 된 3 종의 감자 계열 전체에서 소프트웨어 fitTetra (총 82.5 %)의 5325와 비교하여 최소 0.95 일치 (전체의 94.6 %) 인 5729 마커를 기록했습니다. 3 가지 F1 패밀리는 SolCAP 다양성 패널에서 5218 개의6 SNP에 대한 유전자형을 예측하는 데 사용되었으며, 유전자형이 수동으로 호출 된 이전 연구에서 3521 개의 SNP와 비교되었습니다. 추가 마커 중 하나는 5 번 염색체 인근에 포도 나무 성숙을 위한 중요한 연관성을 만들어 냈다. 결론적으로, 다수의 F1 개체군이 이용 가능할 때, ClusterCall은 정확한 자동 4 배체 유전자형 호출을 위한 효율적인 방법으로 SNP 연구 및 식물 육종을 위해 사용될 것으로 기대됩니다.

Reference #

Schmitz Carley, C.A., Coombs, J.J., Douches, D.S. et al. Theor Appl Genet (2017). doi:10.1007/s00122-016-2845-5

0.0.1_20210630_7_v33