Skip to content

JoinMap #

Find similar titles

18회 업데이트 됨.

Edit
  • 최초 작성자
    Tuohy
  • 최근 업데이트
    lca

Structured data

Category
Software

JoinMap? #

JoinMapdiploid를 가진 종의 집단에 대한 유전적인 연관지도를 계산할 수 있는 프로그램이다. MS 윈도우 유저 인터페이스를 가지고 있어 사용자가 쉽게 데이터를 다룰 수 있는 환경을 제공할 뿐만 아니라 연관지도와 관련된 데이터를 분석하는 데에도 용이하다. 예를 들어 직접 명령어를 입력하는 것이 아닌 마우스 클릭만으로도 집단 마커에 대한 연관지도 작성 및 에러가 발생할 만한 좌위를 임의로 제거 가능하며, 빠른 속도로 원하는 분석이 가능하다.

논문 #

1) Stam, 1993. Construction of integrated genetic linkage maps by means of a new computer package: JoinMap. The Plant Journal 3: 739-744.

Interface #

윈도우에서 JoinMap을 실행시키면 다음과 같은 인터페이스로 구성되어 있다.
먼저 프로젝트 내에 population, group 단위로 구성되어 있는 파일들을 트리형식으로 쉽게 확인할 수 있는 Navigtion panel with navigation tree가 가장 왼쪽에 위치하고 있고, 맨 위쪽으로는 각 파일의 열기, 닫기, 옵션 등을 조절할 수 있는 Menu and tool bar가, 그 밑으로는 Tabs를 통해 각 파일에 대한 정보를 담고 있으며, 실제 파일에 대한 정보가 출력되는 Contents-and-results panel이 위치해 있다. 마지막으로 맨 아래에 계산이 진행됨에 따라서 상태를 나타내는 Status bar가 위치하고 있다.
Image

Tutorial #

예를 들어 100개의 샘플에 대한 22개의 SNP marker를 가진 BC1(first generation backcross)에 대한 데이터 셋을 가지고 있다고 가정해보자. 각 샘플들이 가진 genotype 중에 "a"는 backcross 부모의 genotype과 같고, "h"는 F1세대의 genotype과 같다.

1) 프로젝트(Project) 생성
Menu bar의 File menu에서 "New Project"를 클릭한다.
원하는 파일 이름으로 프로젝트를 생성하고, 저장 위치를 지정하여 저장한다.

2) 파일 Import 하기
먼저 Menu bar의 Dataset menu에서 "Create New Dataset"을 클릭한다.
다음으로 Pop.name 빈칸에 집단에 대한 이름을 지정하고, Pop.type에 현재 분석하고자 하는 집단의 type을 선택해준다. 현재 예제에서는 BC1 type을 선택해준다. 다음으로 sample의 개수는 "Nr. of indiv"이라는 빈칸에, marker의 개수는 "Nr. of loci"라는 빈칸에 입력해주면 그 크기만큼의 비어있는 메트릭스가 생성된다.
JoinMap은 MS-Excel의 스프레드시트에 대한 값을 처리할 수 있기때문에 import하기 위해서는 MS-Excel에서 원하는 데이터를 복사한 후 붙여넣기하면 JoinMap에 비어있는 메트릭스를 채울 수 있다.

3) 에러 체크

복사해서 채워놓은 각 샘플에 대한 genotype들이 제대로 들어갔는지 확인하기 위하여 Dataset menu에 "Highlight Errors"를 수행한다. 만약 에러가 있는 좌위가 있으면 그 부분은 빨갛게 표시가 되고 F2키를 이용하여 수정이 가능하며, 없으면 Status bar에 표시가 된다.
Image

4) Genetic mapping
데이터가 제대로 입력이 완료되면 genetic mapping 과정을 위한 분석의 첫걸음을 시작하는 population node을 만들어 내며, 각 좌위의 genotype 분포를 확인할 수 있다.
먼저 Dataset menu에서 "Create Population Node"를 선택한다.
집단에 대한 각 genotype 데이터가 성공적으로 입력되면 "navigation tree"의 root level에 "Population node"라는 데이터 노드가 생성되고 그에 따른 여러 tabsheet들이 생성된다.
Image
그 중 각 좌위당 genotype 분포를 확인하기 위해 "Locus Genot Freq"라는 탭을 선택하여 F9 키를 눌러주면 계산이 된다. 그러면 각 좌위별로 genotype frequency가 출력된다. 하나의 부모로부터, 아니면 다른 하나로 부터, 혹은 둘 다로부터 유전된 genotype의 분포를 확인할 수 있는데 주의할 점은 missing value가 너무 많을 경우, genetic map 형성에 오류를 발생할 수 있기 때문에 JoinMap에서는 "Exclude selected Items"를 통해 삭제가 가능하다.
또한 "Exclude Identicals"를 통해 loci와 individual의 simililarity가 정확히 1인 값을 제거함으로써 계산 속도를 더욱 빠르게 진행할 수 있다.
Image
"Grouping(txt) and Grouping(tree)" tabsheet에서는 현재 선택되어 진 loci와 individuals에 대한 genotype을 이용하여 loci에 대한 grouping 결과 값을 확인할 수 있다. 실행방법은 이전과 마찬가지로 F9 키를 누르면 계산이 진행된다.
일반적으로 grouping은 보통 4가지의 parameter 통계 값으로 인해 group이 선택된다.
1. LOD value of the test for independence
2. P-value of the test for independence
3. recombination frequency
4. linkage LOD
각 parameter는 옵션을 통해 start, end value값을 조정할 수 있다.
Grouping된 결과 값을 살펴보면 grouping 트리가 통계 값이 늘어남에 따라서 확장되어 감을 확인할 수 있다. 트리의 각 노드들은 세 가지 필드로 구성되어 있다: "threshold/nr(size)"
여기서 threshold는 그룹이 형성되는데에 결정적으로 사용된 threshold value를 의미하고, nr은 group의 번호, size는 각 그룹에 속해 있는 좌위의 수이다.
이 그룹을 우클릭을 통해 선택한 후에 Population menu에 "Create Groups Using the Grouping Tree"를 실행하여 각 그룹에 대한 노드를 생성한다.
Image

5) Genetic map 그리기
Genetic map을 그리기 위하여 원하는 그룹들을 우클릭을 통해 선택하고, Group menu에서 "Calculate Map"을 클릭하여 각 그룹당의 marker의 거리를 계산한다.
Marker간의 거리를 계산하기 위하여 두 가지의 mapping algorithm이 사용된다.
1. regression mapping algorithm
2. Maximum Likelihood algorithm

실행하면 각 map node에 여러개의 tabsheets가 생성된다. map에 대한 3 가지의 다른 방식의 출력 값을 확인할 수 있다.(map chart, map table, map plane text format)
Image

Incoming Links #

Related Bioinformaticses #

Suggested Pages #

0.0.1_20230725_7_v68