t

TopHat 설치

설치 가이드만 연속 3번 포스팅하고 있는데, 사실 설치작업은 툴박스 홈페이지 매뉴얼을 그대로 따라 하기만 하면 된다. 대부분의 경우에는 명령어 사이사이에 설명이 줄줄이 나열 되어 있는 형식인데, 나는 이런걸 보면서 한 큐에 갖다 붙여 넣어서 실행할 수 있게 정리가 되어있으면 좋겠다는 생각을 항상 했었다. 그래서 앞으로도 계속 code box를 만들고 설명은 뒤에 붙이는 식으로 포스팅을 할 것 같다. 많은 매뉴얼들을 보면서 또 하나 느끼는 점이 있다면, 다수의 개발자가 붙어서 정말 공들이지 않고서야 troubleshooting이나 dependencies에 관한 설명이 부족할 수 밖에 없는 것 같다. 내 가이드가 완벽하다고는 절대 말 할 수 없지만, 나는 이런 부분을 조금이나마 보충해서 ubuntu조차 익숙하지 않은 사람들이 쉽게 따라 할 수 있었으면 좋겠다.

이번 포스팅은 TopHat 설치이다. RNA-seq에서 많이 사용되는 alignment tool이며, built-in mapping scheme이 없고 mapping이 필요할 때 마다 bowtie를 호출한다.

이미지 출처: http://ccb.jhu.edu/software/tophat/

즉, 실행을 위해서는 bowtie가 설치 되어있어야 하는데 bowtie 설치 방법은 지난 포스팅을 참조하면 된다. TopHat 컴파일을 위해서는 추가적인 라이브러리 하나만 (boost) 있으면 된다. Ubuntu repository에는 업데이트가 늦게 되는 것 같아, apt-get install 말고 홈페이지에서 직접 최신 버전을 받는 것을 추천한다. 설치는 아래와 같이 하면 된다.

1 sudo apt-get remove libboost-dev
2 wget http://sourceforge.net/projects/boost/files/boost/1.57.0/boost_1_57_0.tar.gz
3 tar xvzf boost_1_57_0.tar.gz
4 cd boost_1_57_0/
5 ./bootstrap.sh
6 sudo ./b2 --prefix=/usr/local
7 sudo cp ./stage/lib/* /usr/local/lib/
8 sudo cp ./stage/lib/* /usr/lib/

(recommended) line 1: Removing existing files from the ubuntu repository
line 2: Downloading the latest version of boost
line 5: Setting
line 6: Compiling
line 7-8: Copying the boost library files to an existing directory in your PATH

컴파일 시 prefix를 /usr/local로 지정했기 때문에, 6번째 줄처럼 /usr/local/lib/에만 복사하면 된다고 생각했는데, 모두 설치 완료 후 TopHat을 돌려보니 라이브러리 없다고 런타임 에러가 났다. 7번째 줄처럼 /usr/lib/에도 복사를 해주면 해결 가능하다. 혹시 깔려있을지 모를 기존 버전과의 충돌을 피하기 위해 1번째 줄과 같이 삭제 명령을 추천하고, 홈페이지를 직접 확인하여 최신버전 링크를 알아낸 뒤 2번째 줄의 주소에 넣으면 된다. 현재 최신 버전은 1.57이다. 그리고 TopHat 매뉴얼에는 boost 설치시 bjam이라는 스크립트를 사용하라고 되어있는데, b2가 최신 버전을 위한 스크립트 이므로 위의 내용을 따르면 된다.

Dependencies가 해결되면 아래와 같이 TopHat 설치를 진행 할 수 있고, 나머지 설명은 공식 매뉴얼

 1 wget http://ccb.jhu.edu/software/tophat/downloads/tophat-2.0.13.tar.gz
 2 tar xvzf tophat-2.0.13.tar.gz
 3 cd tophat-2.0.13/
 4 sudo ./configure --prefix=/usr/local --with-boost=/usr/local
 5 sudo make
 6 sudo make install
 7 wget http://ccb.jhu.edu/software/tophat/downloads/test_data.tar.gz
 8 tar xvzf test_data.tar.gz
 9 cd test_data/
10 tophat -r 20 test_ref reads_1.fq reads_2.fq

line 1: Downloading
line 4: Setting
line 5-6: Compiling
line 7-10: Aligning example reads


comments powered by Disqus