Skip to content

Entrez Direct #
Find similar titles

Structured data

Category
Programming
Database

Entrez Direct (EDirect)는 NCBI E-utilities의 명령행 인터페이스 프로그램이다. Entrez 데이터베이스 내용(publication, sequence, structure, gene, variation, expression 등)에 대해 명령행에서 검색하고 조회할 수 있는 기능을 제공한다.

설치 #

명령행 인터페이스인 만큼 설치도 다음 명령으로 할 수 있다.

cd ~
perl -MNet::FTP -e '$ftp = new Net::FTP("ftp.ncbi.nlm.nih.gov", Passive => 1); $ftp->login; $ftp->binary; $ftp->get("/entrez/entrezdirect/edirect.zip");'
unzip -u -q edirect.zip
rm edirect.zip
export PATH=$PATH:$HOME/edirect
./edirect/setup.sh

명령행 설치 후, PATH에 등록해 두고 뭔가 검색하고 싶을 때 마다 쉽게 명령행에서 사용할 수 있다.

예제 #

다음 예제는 "somatic copy number" 키워드로 가장 많은 논문을 출판한 저자 현황을 정렬하여 표시한다.

esearch -db pubmed -query "somatic copy number" |
\ efetch -format xml | xtract -pattern PubmedArticle -block Author -sep " " -tab "\n" -element LastName,Initials |\
sort-uniq-count-rank | head
30  Meyerson M
25  Zhang J
24  Getz G
16  Beroukhim R
16  Li J
16  Wang J
16  Zhang Y
15  Wilson RK
15  Zhang Z
14  Wang Y

"Meyerson M" 저자가 이쪽 분야로 30개의 논문을 출판했음을 명령행 한줄로 확인할 수 있다. 웹브라우저로 하나하나 검색해야 알 수 있을 일을 이처럼 프로그램화하여 수행할 수 있다. 다양한 응용을 기대할 수 있다.

상세 기능 현황 #

EDirect는 다음과 같은 서브명령어를 제공한다. (PATH에 등록되어 있으므로, 바로 사용할 수 있다.)

목록의 현황을 다루는 명령

  • esearch: 특정 데이터베이스에 대해 키워드를 입력하고 검색한다.
  • elink: 데이터베이스내 혹은 데이터베이스간 연결 링크를 찾는다.
  • efilter: 검색결과내 재검색할 수 있는 기능을 제공한다.

상세정보를 요청하는 명령

  • efetch: 특정 상세정보를 원하는 형식으로 다운로드 한다.

XML 형식을 Parsing하는 명령

  • xtract: XML 형식을 파싱하여 테이블 형태로 변환한다.

기타 기능

  • einfo: Entrez내 인덱싱한 필드 현황을 조회한다.
  • epost: 식별번호 혹은 서열 accession 번호를 업로드한다.
  • nquire: 서버로 직접 URL 요청을 보낸다.

참고정보 #

Suggested Pages #

0.0.1_20140628_0