データベースツール

配座クラスタリング

 

作成日: 2001年8月24日

最終更新日: 2015年7月22日

作成者: 株式会社モルシス、Chemical Computing Group

 

概要: 

 配座間のRMSDを算出し、またその値を基準にクラスタリングするプログラムです。  いわゆる階層的なクラスタリングではなく、配座間のRMSD マトリックスをもとに、指定したRMSDより近い配座を一括してまとめてしまうというアルゴリズムなので、 データ点数が多くても高速で処理できます。 なお、ここで算出されるRMSDは、重ねあわせを行わずに算出されますので、ドッキングスタディの結果を実験データと比較する場合などに適しています。

2008.2.14版では、下記の2点が改良されています。

  1. 対称探索アルゴリズムを改良しました。

  2. sd_RMSDコマンドを実装し、sdファイルについてもRMSD計算ができるようにしました。

2003.8.26版では、下記の3点が改良されています。

  1. 対称性をもつ分子に対しては、RMSD算出前に、分子内の等価な原子のリストを自動的に作成し、座標の交換をくりかえして、最も低い値を出力するアルゴリ ズムを組み込みました。

  2. クラスタリングを行わず、RMSD計算のみを行うこともできるようになりました。

  3. 重原子のみを表示するオプションをつけるなど、GUIを改良し、操作性が向上しました。

2008.2.14版では、下記の機能が加わっています。

  1. sd_RMSDコマンドを追加しました。

2008.11.12版では、以下の不具合の修正を行いました。

  1. 同一配座を持つデータに対して計算を行った際にエラーが発生することがある不具合。

2010.7.14版では、以下の修正を行いました。

  1. 分子フィールドが複数存在するmdbファイルへの対応。
  2. GUIから別のmdbファイルを指定した場合のフィールドリストの更新。

使用方法:

RMSDの算出

  1. 添付のファイル clusterconf.svl を任意のディレクトリにコピーする。

  2. clusterconf.svlをLoadする。
    または、$MOE/custom/lib/svl/rsi.svl/以下にclusterconf.svlを保存しておくことで、 MOEを起動する度に自動的に読み込まれます。
  3. RMSDの計算


    1. メインウィンドウ上に表示された分子間の計算

      複数の分子を表示し、下記のコマンドを入力する。

        RMSD[]

      1番目の分子に対して、n番目の分子のRMSDは、RMSD (n)というように、下記のよ うなリストがコマンドウィンドウに出力されます。

      RMSD (1) = 0
      RMSD (2) = 0.312616
      RMSD (3) = 0.49377
      RMSD (4) = 0.417846
      RMSD (5) = 0.18708

      ここで、分子の一部を選択しておけば、その選択された原子についてのみRMSDを算出します。

    2. mdbファイル内の配座に対する計算

      下記のコマンドを実行します。

      db_RMSD 'ファイル名'

      ただし、ファイルを一つだけ開いた状態であれば、以下のようにファイル名を省 略することも可能です。

      db_RMSD []

      この場合、メインウィンドウに参照する分子が表示されていなければ、ファイル の1番目の分子に対してRMSDが算出されます。
      結果は、RMSDというフィールド が自動的に作成され、書き出されます。
      また、メインウィンドウに参照分子を表示しておけば、その分子に対するRMSDを 算出します。
      また、その分子の一部を選択状態にしておけば、選択された原子 についてのみRMSDを算出します。
      なお、このプログラムでは、重原子のみについてRMSD算出されます。

    3. sdファイル内の配座に対する計算

      下記のコマンドを実行します。

      sd_RMSD 'ファイル名'

      ファイル の1番目の分子に対してRMSDが算出されます。 結果は標準出力および入力ファイル名_superposermsd.mdbに出力されます。 標準出力はGUIの場合 SVL ボタンを押すことで確認できます。 出力したmdbのフィールドのうち出力に当たる項は以下の通りです。

      • 'pair_mol' は、対称性を考慮した重ね合わせを行った後の構造
      • 'sRMSD' は、対称性を考慮した重ね合わせを行った後のRMSD
      • 'xRMSD' は、対称性を考慮した絶対座標のRMSD (重ね合わせはしない)

      標準出力のRMSDは sRMSD にあたります。

配座クラスタリング
  1. 添付のファイル clusterconf.svl を任意のディレクトリにコピーする。

  2. 解析するデータベースのみを開いておく。

  3. 下記のいずれかのコマンドをタイプしてプログラムを起動する。

    run '$path/clusterconf.svl'
    なお、$pathは、このコードをセーブした絶対パス

    あるいは、clusterconf.svlをLoadした後、

    ClusterConf [ ]

  4. Conformer Clusteringパネルが開くので、解析対象となるファイル名や フィ ールド名、クラスタリングの基準となるRMSDを必要に応じて書き換える。

    なお、ここでmethodは、以下のような条件を意味する。

    Maximize Cluster
    • 指定したRMSDの範囲で最も大きなクラスターをCluster1として出力し、Cluster2 は、Cluster1とエントリの重複のないようにして、 次に大きなクラスターを選ぶ。
      この場合、例えばCluster1に含まれている配座でも、実際は、Cluster2の中心との距離の方が、 Cluster1よりも近いという場合がありえます。

    Minimize Cluster(デフォルト)
    • クラスターのメンバー全てが、そのクラスター中心が最も近くにあるクラスター に属するようにクラスタリングする。

  5. Clusteringをクリックする。

    なお、クラスタリング実行時に、画面上に1つの配座を表示しておき、その中の一部、例えば環構造に属する原子のみを選択しておけば、その部分のRMSDを基準 にしたクラスタリングを行う。

    計算が終了すると、パネルの下半分にある 構造表示のためのパラメータが操作可能になる。同時に、Clusteringボタンの表示がRecalc.に変わり、 ファイル名 やRMSDのフィールドが書き換え不可になる。

    結果は、mdbファイルに、3つのフィールド Cluster(所属するクラスター 番 号), Center(クラスター中心であれば1、それ以外は0), RMSD(クラスター中心の構造と比較したRMSD) として出力される。

    クラスターごとの配座数は、SVL Commandsウィンドウに書き出される。

  6. 計算終了時には、メインウィンドウに、全配座がコピーされているが、3つの表示オプションDisplay Conformers, Color, Cluster Center で表示状態を変えることができる。


  7. クラスタリングをやり直したい場合は、Recalc.ボタンをクリック。

    SVLコードはこちら

    clusterconf.svl]


    Copyright(C) 2001-2018 MOLSIS Inc. All Rights Reserved.
    (株)モルシス