大倉 暢仁, 平田 耕一, 久保山 哲二, 原尾 政輝
電子情報通信学会技術研究報告. COMP, コンピュテーション 105(273) 25-29 2005年9月8日
本稿では, ラベル無し順序木のqグラム距離について考察する.まず, qグラムを線グラフに同型なノード数qの木と定義し, 2つの木のqグラム距離を2つの文字列のqグラム距離と同様に定義する.そして, 後行順の深さ列を用いることで, ノード数nの木Tのすべてのqグラムを, O(n^2)時間O(q)領域で数えあげる単純なアルゴリズムEnumGramを設計する.次に, このEnumGramを, O(qn)時間O(qd)領域のアルゴリズムLinearEnumGramに改良する.ここで, dはTの深さである.したがって, T_1とT_2のqグラム距離D_q(T_1, T_2)は, O(qmax{n_1, n_2})時間O(qmax{d_1, d_2})領域で計算することができる.ただし, n_iおよびd_iはT_iの中のノード数およびT_iの深さである.