氏名 山下 洋史
指導教員 定兼邦彦 教授
研究室 数理情報第7研究室

研究概要

DNA を断片化して読み取る全ゲノム・ショットガン・シークエンシングでは,そのゲノム断片を組み合わせることでできるだけ長いDNAの塩基配列の断片を再現す る de novo アセンブリと呼ばれる操作が行われる.de novo アセンブリを精度よく,かつ効率的に行うソフトウェアMEGAHITをさらに改良する手法を提案し,時間効率・メモリ使用量を改善し た.
Metagenomics アセンブラ“MEGAHIT”の改良
MEGAHIT で用いられる de Bruijn グラフ.入力の塩基配列に含まれる長さ k の文字列を節点として,長さ k+1 の文字列を辺として表現している.

卒論の感想

規模の大きいデータとプログラムに対して格闘するのは大変であった.また,人工データと実データでは性質が異 なり,実験の結果が変わってくる,という点においても難しく,また面白かった.