Meetup 2015-07

From Pitagora-Galaxy Wiki
Jump to: navigation, search

Main Page >> Events >>

主旨

  1. ツールやワークフローを持ち寄って仮想マシンに加える (図)
    • 実際には、加えるための手順を作って、仮想マシンの管理者と共有する
    • 同時に、Wikiに新しいツールやワークフローの説明を記載する
  2. プロジェクトを改善するためのフィードバックを収集する
    • 解析プラットフォーム管理に役立つ技術ネタを共有する
    • Galaxy以外のソフトウェアを扱っていく可能性について議論する

スケジュール

10:00-10:15 主旨のリマインド + 今日の作業確認
10:15-10:30 コミュニティ仮想マシンの更新報告
10:30-18:00 タゴラ装置の開発
18:00-18:30 今日のまとめ + 次回の日程調整 (Skype 参加可)
18:30-20:30 有識者会議

内容

山中
  • 仮想マシン Version 0.2.4 作成 (ツール・インストールスクリプトについて那須野さんに相談)
    • できなかったので、次回 Meetup 2015-08 までに完了させて報告致します。(運用として、仮想マシン作成は Meetup とは別の時間枠でやるべき)
  • 有識者会議にてご相談1:Galaxy のマニュアル作成(Wiki よりも初心者向けな感じのもの)
  • 有識者会議にてご相談2:論文作成(どんなテーマで?どこに投稿?)ーー 論文投稿が必要か? > 必要な参加者がいれば協力したい!
大田
長崎
  • 現地でHLAツールパス周り相談

10kbくらいのヒト6番染色体由来のゲノム配列、tab区切りでcdsの位置情報が書かれた データファイル、toolShedなどに置くときはどうするの?というような相談をさせていただいた。 あまり細かい取り決めなどないようなので結局フォルダ1こにまとめてパス通るようにしとけば、 ということで解決。

那須野
  • NIIクラウド上のGalaxyでRNA-seq01ワークフローを流す
    • まずはtophat2, bowtie2, cufflinksをコンテナ化すればよいはず。(テストデータはPitagora Wikiにあるものを使えばOK?)
  • VPCモニタリング機能(パイプライン実行履歴を収集して可視化=データベースにaurora_job表を追加)実装
    • 実装および動作確認まで完了。GalaxyのORマッパー sqlalchemy を使って実装した。
新海
  • VariantCallingワークフローの調達版(ラボ内環境でほぼ動作している)をピタゴラに移して作業

 →作業継続中ですが、移植元がバージョンが古いせいか色々と上手くいかず戸惑い中です。次回は最新版のマニュアルとか確認してやり直したい。

鈴木
小寺
  • 非モデル生物のRNA-seq 植物等を念頭に
    • Idea1.png
  • 久しぶりなのでまず思い出すところから http://wiki.pitagora-galaxy.org/wiki/index.php/Meetup_2015-05
    • 今後何度も使うであろう細かい手順は KotMemo に載せました。
  • 前回、Trinity を動かそうとして動かなかったところから。
    • bowtie にパスが通っていない問題
    • 次は、samtools にパスが通っていない問題
    • bowtie と samtools にパスを通したら動いてるっぽい。
  • Trinityのうち、幼虫(Inchworm)のステップで停止。メモリが足りないらしい。
         'std::bad_alloc'
         If it indicates bad_alloc(), then Inchworm ran out of memory.  You'll need to either reduce the size of your data set 
         or run Trinity on a server with more memory available.
         The inchworm process failed.
  • 小さいfastqファイルで試してみる(1.9G x 2 → 645Mと638M)
    • Trinity JM (Jellyfish) で使うメモリは最低1Gで、設定値を上げることが可能だが、次に大きい10Gにすると「メモリを確保できません」で落ちた。
    • 小さいfastqファイルで、メモリ1Gにしてもやっぱりメモリが足りないと言われ止まった。止まった原因はコマンドラインで結果ファイルを見ないと分からない。
    • この辺を指定すると動くかもしれません(小澤)
      • --bflyHeapSpaceMax
      • --bflyGCThreads
      • ありがとうございます。試してみます。
  • bflyHeapSpaceMax オプション(意味はまだ分かっていない)がデフォで4Gになっていたのを1Gにして実行
    • 、、、しようと思ったけど「Use Additional Params?:」をYesにすると「failure preparing job」エラーとなる事案発生
      • NotFound: cannot find 'min_kmer_cov' while searching for 'inputs.min_kmer_cov'
  • /home/galaxy/shed_tools/toolshed.g2.bx.psu.edu/repos/biomonika/trinityrnaseq/39b85d32b0bf/trinityrnaseq/trinity.xml を編集して対処
    • trinity.xml を書き換えたら sudo service galaxy restart
      • 元 --min_kmer_cov $inputs.min_kmer_cov --max_reads_per_graph $inputs.max_reads_per_graph --bflyHeapSpaceMax $input.bflyHeapSpaceMax
      • --min_kmer_cov 1 --max_reads_per_graph 20000000 --bflyHeapSpaceMax 1G のように決め打ちにしたら動いたっぽい。
    • でも結局 inchworm で止まった。jellyfishやbutterflyでは使用メモリ量があらかじめ指定できるが、inchwormではCでallocするので使用メモリ量をあらかじめ指定できない?
      • なので --min_kmer_cov を 1 から 2 に変えた。これでinchwormでのメモリ使用量を減らせると期待。
        • まだジョブは実行中。
  • 次回の課題
    • Trinity がきちんと最後まで動くことを確認し、RSEMに連結する。
    • trinity.xml のパラメーター指定の部分のエラーが未解決。決め打ちではなく選択可能な形で動くようにしたい。
池田
  • Pitagora galaxy のServerへの展開
    • Galaxyのインストール手順の確認
    • 仮想環境: VmWare Fusion 7.1.2
    • Client OS: Cent OS 7.0 (CentOS-7-x86_64-Minimal-1503-01.iso)
  • インストール手順書からの変更点
    • mysqlのインストール手順の変更
    • サーバー起動手順の変更
小澤
  • KVM上ので動作確認 ------------------> こちらにアップしました Admin > KVM で起動する手順(山中)
    • SLES11SP3のKVM上ではあっさり動作
    • RHEL6.6のKVM上では起動できず
  • ファイルのconvertからインストールまでをスクリプトで自動で