개요 #
Autotetraploid (4배체)에 특화된 R package, ClusterCall은 4 배체 array를 최대한 활용하는 신호강도와 대립유전자 양 사이의 관계를 각 마커에 맞게 계산하는 프로그램입니다.
알고리즘 #
ClusterCall의 알고리즘은 크게 training phase와 prediction phase로 나뉩니다.
Training phase #
F1 집단 내의 hierarchical clustering을 통해 유사한 intesity를 갖는 표본을 그룹화 하여 F1 family안에서 예상되는 분리 비 (expected segregation ratio)를 통해 allele dosages를 대입 합니다.
prediction phase #
예측 단계에서, 다수의 F1 모집단과 예측 세트가 함께 클러스터링되고, 각 클러스터에 대한 유전자형은 트레이닝 세트 샘플의 모드(mode, 중간값)입니다. 모드와 동일한 트레이닝 세트 샘플의 비율로 정의 된 일치도 메트릭(concordance metric)을 사용하여 신뢰할 수 없는 마커를 제거합니다.
주요 Function와 이들의 기능 #
Function | 기능 |
---|---|
read.pop | theta 및 r 값을 읽고 csv파일에서 복제 샘플을 식별합니다. |
alter.pop | 2 개 이상의 개체군을 결합하고, 복제 된 샘플에서 합의 된 개체를 만들고, 샘플을 제거합니다. |
CC.bipop | F1 집단의 유전자형을 할당하니다. |
CC.anypop | 2이상의 F1 개체군에 대한 일치도 계산, 임의 개체군에 대한 유전자형 지정합니다. |
inspect.marker | 마커의 유전자형 지정 시각화합니다. |
CC.plot | 하나 이상의 프로젝트에 대한 가족 간의 일치도 시각화합니다. |
optimize.params | 다양한 매개 변수로 프로젝트에 여러 번 유전자형 할당합니다. |
write.pop | csv파일로 유전자형 결과 행렬을 작성합니다. |
문헌상 결과 #
ClusterCall은 8K SNP array로 genotyped 된 3 종의 감자 계열 전체에서 소프트웨어 fitTetra (총 82.5 %)의 5325와 비교하여 최소 0.95 일치 (전체의 94.6 %) 인 5729 마커를 기록했습니다. 3 가지 F1 패밀리는 SolCAP 다양성 패널에서 5218 개의6 SNP에 대한 유전자형을 예측하는 데 사용되었으며, 유전자형이 수동으로 호출 된 이전 연구에서 3521 개의 SNP와 비교되었습니다. 추가 마커 중 하나는 5 번 염색체 인근에 포도 나무 성숙을 위한 중요한 연관성을 만들어 냈다. 결론적으로, 다수의 F1 개체군이 이용 가능할 때, ClusterCall은 정확한 자동 4 배체 유전자형 호출을 위한 효율적인 방법으로 SNP 연구 및 식물 육종을 위해 사용될 것으로 기대됩니다.
Reference #
Schmitz Carley, C.A., Coombs, J.J., Douches, D.S. et al. Theor Appl Genet (2017). doi:10.1007/s00122-016-2845-5