科学技術の進歩に寄与し
豊かな社会発展に貢献する
唯一の専門紙です。
毎週金曜日発行

TOP > 最新記事一覧 > 「最先端研究とクラウド:AWSの挑戦」第3回 膨大な量のゲノム情報の解析

2023.07.21 連載

「最先端研究とクラウド:AWSの挑戦」第3回 膨大な量のゲノム情報の解析

基礎生物学研究所進化ゲノミクス研究室の重信秀治教授

 

 

生物学研究全体でHPC需要が拡大
リソース不足を解決したクラウド活用

 

生物が持つ遺伝情報を総合的に解析し、その遺伝情報を解明するゲノム研究の分野では、膨大な量のゲノム情報を高速に解析するためにHPC(ハイパフォーマンスコンピューティング)の利用が不可欠である。これまでのように研究室や組織でコンピューターを導入して利用するオンプレミスシステムに比べ、使いたいときに使いたいだけ利用するアマゾン ウェブ サービス(以下、AWS)のクラウドサービスは、そうした基礎研究に最適であると、自然科学研究機構基礎生物学研究所進化ゲノミクス研究室教授の重信秀治氏は話している。

重信氏が取り組むゲノム解析の研究は、DNAデータをコンピューターで高速処理して解析するという、生物学とデータサイエンスが融合したバイオインフォマティクスの研究である。最大限にコンピューターを活用してDNAの情報を解析し、生命の進化や様々な特徴、機能のメカニズムなどを解明している。

「このDNAデータは非常に巨大なので、その解析には大規模な計算リソースが必須で、ゲノム科学にコンピューティングパワーは不可欠である。加えて、近年はゲノム解読を行うDNAシーケンサーが革新的に進歩し、実験生物学者のような、従来は大規模データを扱ってこなかった研究者も、巨大なDNAデータをコンピューターで解析するようになり、生物学研究業界全体でコンピューターのリソース不足は一層拡大している」。バイオインフォマティクス研究の現状を、そう説明する。

同氏が所属する自然科学研究機構は全国の大学・学術機関と共同研究を行う大学共同利用機関であり、重信氏自身も毎年50から60の共同研究を行っている。その共同研究では、様々な生物学者と一緒に巨大なDNAデータをコンピューターで解析している。そうした大学や学術機関では、HPCシステムの共用利用をジョブキューイングシステムで運用管理していることがほとんどで、利用者は自分の計算が実行されるまで順番待ちを強いられる状況が常態化している。

「共用システムが混んでいると自分のジョブがなかなか実行されないので、早く解析して研究を進めたいと思っても待つしかない。私たちの研究所にも共用のHPC環境があり、所内だけでなく、所外の研究者にもその利用を開放しており好評であるが、それでも利用者の需要に追いつかなくなっている」と、深刻な状況を説明する。

「特に、私たちの研究は基礎研究であり、トライ&エラーが多い。この計算を試してだめなら、次に少し条件やコードを変えて計算して、ということなどを繰り返して行う。また、基礎研究では常に新しい論文や新しいアルゴリズムが出てくるので、トライ&エラーをしながら、いち早く実行環境を整え、試していく必要がある。しかし、オンプレミスの共用コンピューターでは、1ユーザーのためだけにOSのバージョンやその他の環境を変更することは現実的にはなかなか難しい」

そうした事態を解決する手段として注目したのが、AWSの提供するHPC向けクラウドサービスだったという。「私がAWSに惹かれたのは、基礎研究で一番求められるトライ&エラーが容易にできることであった」。つまり、必要な時に自分だけの環境を作って自由に変更したり削除したりする、スクラップ&ビルドの利用が簡単に行えるので、新しいことにすぐチャレンジできる。それがAWSを導入した大きな動機だったとしている。

AWSを採用した結果、例えばAWS ParallelCluster(AWSパラレルクラスター)というサービスを使ってHPC環境を構築し、好きな時に好きなだけコンピューターを使って解析することができ、自身の研究のスピードが上がったと重信氏は評価している。「計算量は多い場合も少ない場合もあるが、好きな時に好きなだけ計算リソースを使い、それに見合った最適な料金を払えばいいので、便利かつコストも経済的である」

また、これだけの計算負荷に耐えうる規模の計算機のハードウェアの導入には、自然科学研究機構のような公的機関では調達手続きが厳格かつ複雑で、数カ月から場合によっては1年以上の期間を要することもある。一方、AWSのクラウドでは、調達に要する期間をあまり気にすることなく必要な時に必要な量からすぐに計算機を利用開始できるだけでなく、煩雑な手続きも最小限でよい。その結果、調達のための事務的作業に要する時間も少なくてすみ、その時間を本来の研究に充てられるようになったという。

さらに「AWSのクラウドは国内外の共同研究者とデータを共有する上でも有利である。例えば、AWSのオブジェクトストレージ上にゲノムデータを置いて、これを可視化ツールを介して共同研究者とシェアすることで、迅速かつスムーズなデータ共有が可能となり、活発な共同研究に結びついている」と、共同研究での効果もあげている。

いま運営費交付金が削減されて大学運営は厳しい財政事情に直面している。「そうした中でも、AWSなら予算の範囲内で調整しながら最適なHPCの環境が利用できる。多くの共同研究を行う立場の研究者として、柔軟性の高さをメリットとするAWSは魅力的である。より多くの研究者に広がり、日本全体のゲノム研究がさらに発展することを願っている」。重信氏は最後にそう期待を述べた。(了)

  • facebook
  • twitter
  • Google +
  • はてなブックマーク
  • LINE
  • Mail
  • 202312-202412バイテク情報普及会A案
  • デジタル版・SNW購読募集
  • 202304-202403_PHC
  • 202112-202208日本分光PR-1s/PR-1w
  • 202112-202208日本分光FT/IR-4X
  • 202104-06_サイエンスジャパン
  • カイロジャーナル
THE SCIENCE NEWS
  • facebook
  • twitter
  • Google +
  • はてなブックマーク
  • LINE
  • 購読申込
  • メール