Entrez Direct
#
Find similar titles
- 최초 작성자
- 최근 업데이트
Structured data
- Category
- Programming
- Database
Entrez Direct (EDirect)는 NCBI E-utilities의 명령행 인터페이스 프로그램이다. Entrez 데이터베이스 내용(publication, sequence, structure, gene, variation, expression 등)에 대해 명령행에서 검색하고 조회할 수 있는 기능을 제공한다.
Table of Contents
설치 #
명령행 인터페이스인 만큼 설치도 다음 명령으로 할 수 있다.
cd ~
perl -MNet::FTP -e '$ftp = new Net::FTP("ftp.ncbi.nlm.nih.gov", Passive => 1); $ftp->login; $ftp->binary; $ftp->get("/entrez/entrezdirect/edirect.zip");'
gunzip -u -q edirect.zip
rm edirect.zip
export PATH=$PATH:$HOME/edirect
./edirect/setup.sh
명령행 설치 후, PATH에 등록해 두고 뭔가 검색하고 싶을 때 마다 쉽게 명령행에서 사용할 수 있다.
예제 #
다음 예제는 "somatic copy number" 키워드로 가장 많은 논문을 출판한 저자 현황을 정렬하여 표시한다.
esearch -db pubmed -query "somatic copy number" |
\ efetch -format xml | xtract -pattern PubmedArticle -block Author -sep " " -tab "\n" -element LastName,Initials |\
sort-uniq-count-rank | head
30 Meyerson M
25 Zhang J
24 Getz G
16 Beroukhim R
16 Li J
16 Wang J
16 Zhang Y
15 Wilson RK
15 Zhang Z
14 Wang Y
"Meyerson M" 저자가 이쪽 분야로 30개의 논문을 출판했음을 명령행 한줄로 확인할 수 있다. 웹브라우저로 하나하나 검색해야 알 수 있을 일을 이처럼 프로그램화하여 수행할 수 있다. 다양한 응용을 기대할 수 있다.
상세 기능 현황 #
EDirect는 다음과 같은 서브명령어를 제공한다. (PATH에 등록되어 있으므로, 바로 사용할 수 있다.)
목록의 현황을 다루는 명령
- esearch: 특정 데이터베이스에 대해 키워드를 입력하고 검색한다.
- elink: 데이터베이스내 혹은 데이터베이스간 연결 링크를 찾는다.
- efilter: 검색결과내 재검색할 수 있는 기능을 제공한다.
상세정보를 요청하는 명령
- efetch: 특정 상세정보를 원하는 형식으로 다운로드 한다.
- xtract: XML 형식을 파싱하여 테이블 형태로 변환한다.
기타 기능
- einfo: Entrez내 인덱싱한 필드 현황을 조회한다.
- epost: 식별번호 혹은 서열 accession 번호를 업로드한다.
- nquire: 서버로 직접 URL 요청을 보낸다.
참고정보 #
- Entrez Direct: E-utilities on the UNIX Command Line
- Exploring Entrez Direct: Parsing the XML Output of E-utilities NCBI Insights
Suggested Pages #
- 0.025 Esearch
- 0.025 EST
- 0.025 Elink
- 0.025 Gene
- 0.025 Necleotide
- 0.025 Esummary
- 0.025 Entrez utils
- 0.025 PubMed
- 0.025 Genome
- 0.025 SNP
- More suggestions...