Meetup 2016-05

From Pitagora-Galaxy Wiki
Jump to: navigation, search

Main Page >> Events >>

主旨

  1. ツールやワークフローを持ち寄って仮想マシンに加える (図)
    • 実際には、加えるための手順を作って、仮想マシンの管理者と共有する
    • 同時に、Wiki に新しいツールやワークフローの説明を記載する
  2. プロジェクトを改善するためのフィードバックを収集する
    • 解析プラットフォーム管理に役立つ技術ネタを共有する
    • Galaxy 以外のソフトウェアを扱っていく可能性について議論する

スケジュール

  • 日時: 2016年5月19日(木)
  • 場所: 先端研4号館4階セミナールーム
  • 連絡先: 山中 yamanaka [at] genome.rcast.u-tokyo.ac.jp
  • Skype ID:pitagora-network(最新バージョンのSkypeの使用を推奨)
10:00-10:15 今日の作業確認
10:15-18:00 ツールの開発
17:30-18:00 今日のまとめ (Skype 参加可)
18:00-20:30 有識者会議

内容

全体
山中
  • AMI 版を 0.2.3 >> 0.2.5 に公開しようと考えた
    • AMI から新しく作成したインスタンスに鍵認証でログインできない…
    • もう諦めて、0.3 系を作ることにしよう
  • 0.3 系をどうするか問題
    • Docker 親和性を考えて、OS は Ubuntu(& ストレージ・ドライバは aufs)にする
    • VirtualBox のイメージから AMI を作成する手順は煩雑なので、AMI も OS からインストール
    • 今まで 0.3.1 として CentOS 上の手順を作っていたので、新たな Ubuntu 用の手順は 0.3.2 とする
  • 新たな試みについて相談
    • CWL / Rabix / Nextflow あたり要調査

2016-05-19_17.41.39.png

大田
  • DBCLS Xenサーバ上で Pitagora-VM を動かす
    • ストレージの構成とディスク容量について
      • >500GB reference
      • as much as we can get
    • ovaをそのままインポートできるのかどうなのか
      • とりあえず 0.2.3.ova を渡してお願いしてみる
  • ワークショップの統合TVが上ってきましたのでご確認をお願いします
    • みなさまにメイルしましたのでご確認くださいませ
    • 編集もできますのでカットして欲しい部分があれば指定してください
    • ご連絡先は t.ohta@dbcls.rois.ac.jp まで
  • 東大 門田先生から執筆どうでしょうがきましたのでお手伝い頂ける方を募集してます
中岡
  • 午後より青学(淵野辺)、その後大学に戻らないといけないのでミートアップ、有識者会議共に参加できません。[進捗] RNA-seq パイプラインで ReactomePA を実装。これまでは KEGG pathway への enrichment のみだったところ、Reactome も含めて実施できるようにした。また、 clusterProfiler (GO 解析) を実装し、遺伝子リストのみ、もしくは発現情報を加えた GO 解析に対応した。これらをまとめて Galaxy へ導入する作業は今度やります。
望月
  • galaxy Try 環境の移行作業を、大田さんに、重ね重ね重ね重ね重ね重ね重ね重ねお願いした。
  • 以前、ENA / Gramene 様の方?からDNApod のデータをucsc のゲノムbrowser で表示できるようにしないのですか?とお問い合わせを頂いていたので、galaxy を絡めてデータ転送できないかと思い ucsc 様を調べたけれど植物いは対応していないようなので断念した。
  • スパコン上で動いているgalaxy (NIG 内部のみアクセス化) にAPI でアクセスして、処理を実行するサービスの開発構成を山中様にご相談させていただいた。
  • amazon ec で pitagora-galaxy を起動できるように試してみた。(今後、講習会などの普及活動で使用できるように。)
  • fast file から乱数を使ってRead を抽出し、小さいfastq file を作るプログラムをdocker 化するリクエストを頂いた。Seed を使った乱数作成に使用変更するとよいとのこと。
    • オレオレコードなので、改修します。
  • 末長くがんばります。
鈴木
  • 公共サーバーVirAmp(ウイルス ゲノム アセンブリ用)のワークフローの実行手順をVirAmp_Workflowsに記録。
池田
  • VM上でのバリアント検出ツールVerdictの実行環境構築

https://github.com/AstraZeneca-NGS/VarDictJava

  • Cent OS7.0 pitagora-galaxy上で環境を構築
  • R install
> su -c 'rpm -Uvh https://dl.fedoraproject.org/pub/epel/epel-release-latest-7.noarch.rpm'
> sudo yum update
> sudo yum install R

かなりの数のmoduleが yum updateでアップデートされてしまうので、要確認。

openjdk 1.8.0のdevelが必要なので予めインストール

> sudo yum install java-1.8.0-openjdk-devel
  • Vardict Source 取得
> git clone https://github.com/AstraZeneca-NGS/VarDictJava.git
> cd VarDict

  • Vardict コンパイル
> export JAVA_HOME='/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.91-0.b14.el7_2.x86_64'
> ./gradlew clean installDist —info
  • Vardict ヘルプメッセージの確認
> ./build/install/VarDict/bin/VarDict -H
  • planemo による galaxy tool のスケルトンの作成
> planemo tool_init --force \
      --id 'vardictjava' \
      --name 'VarDictJava' \
      --requirement vardectjava \
      --example_command './VarDictJava -G 1.ref -f $af_thr -N $sample_name -b 1.bam -z -c 1 -S 2 -E 3 -g 4 1.bed | ./VarDictJava/teststrandbias.R | VarDict/var2vcf_valid.pl -N $sample_name -E -f $af_thr' \
      --example_input 1.ref \
      --example_input 1.bam \
      --example_input 1.bed \
      --example_output 2.fasta \
      --help_from_command './VarDictJava -H'

この後は、planemoにより作成されたvardictjava.xml を編集する必要がある。