Link Search Menu Expand Document

電子情報工学演習B 第5回

課題

GC 含量の解析
ウイルス由来の DNA 配列の GC 含量の分布を調べる。

使えそうな知識

  • less
      $ less ddbjvrl01.seq
    

    vim コマンドで操作します。矢印キーも使えます。
    知っておくとよさそうなものを抜粋すると

    キー動作
    /<word>word を検索
    n検索した文字列の次のマッチへ移動
    N検索した文字列の前のマッチへ移動
    ggファイルの先頭に移動
    Gファイルの末尾へ移動
    q終了

    詳しくはこちらへ

  • GC 含量
    塩基配列の GC 含量は gc_percent メソッドで得られます。
      bioruby> dna = getseq("atgcatgcaaaa")
      bioruby> p dna.gc_percent
      # => 33
    
  • gnuplot
      # "GC contents (%)" "Frequency"
      5 8
      10 12
      15 13
      .
      .
      .
      85 12
      90 9
      95 7
      100 6
    
      set nokey
      set ylabel "Freqency"
      set xlabel "GC Contents (%)"
      set style fill solid 0.5
      set term pdfcairo color size 4in, 3in # カラー
      set output "histogram.pdf"
      plot [0:100] "hist.dat" using ($1-2.5):2 with boxes