研究者業績

久保山 哲二

クボヤマ テツジ  (Tetsuji Kuboyama)

基本情報

所属
学習院大学 計算機センター / 人文科学研究科アーカイブズ学専攻 教授
東京電機大学 総合研究所・知能創発研究所 客員教授
学位
博士(工学)(東京大学)

研究者番号
80302660
ORCID ID
 https://orcid.org/0000-0003-1590-0231
J-GLOBAL ID
200901047478411760
researchmap会員ID
5000102916

外部リンク

学歴

 1

論文

 122
  • Naoya Higuchi, Yasunobu Imamura, Vladimir Mic, Takeshi Shinohara, Kouichi Hirata, Tetsuji Kuboyama
    ICPRAM 499-510 2024年  
  • 草場彰, 寒川義裕, 久保山哲二, 新田州吾, 白石賢二, 押山淳
    日本結晶成長学会誌 50(1) 50-1-05 2023年4月28日  査読有り
  • 徳永 弘子, 久保山 哲二, 木村 敦, 武川 直樹
    電子電子情報通信学会論文誌A 基礎・境界 J106-A(3) 104-113 2023年3月1日  査読有り
    共食はコミュニケーションの場であり,人の心理的健康に良い効果をもたらすことが明らかになっている.本研究は,2種類の形式で食事を提供し,共食中の人の発話行動の特徴から心理的効果の根拠を示す.具体的には,6名からなる4グループに対し,同じメニューを銘々膳形式,共同膳形式で提供した.参与者らによる共食シーンを映像に記録し,食事開始後の各20分の発話を書き起こした.分析の結果,食事中の話し手は,一定の時間において発話を継続する状況が確保しやすいこと,参与者らは料理のトピックにより会話を活性化させていることが確認された.これにより共食会話には他者との相互理解を深めたり,初対面同志の会話機会を得たりする場として機能しており,こうした人と人のつながりが心理的健康に貢献していることが示唆された.
  • 宇野, 毅明, 武富, 有香, 小林, 亮太, 橋本, 隆子, 久保山, 哲二, 申, 吉浩
    じんもんこん2022論文集 2022 207-212 2022年12月2日  査読有り
    本稿では,ニュース記事に対するコメント,および,ニュース記事のあるカテゴリのニュース記事に対するコメントの多様性を測り,その結果を紹介する.記事やカテゴリに対して人々がどのような反応をしているかを読み解くための材料として,新たな方向性を提案する.異なる記事に対するコメントは,単一の記事に対するコメントよりも多様性が増すであろう,という仮説から,あるカテゴリの複数の記事に対するコメントの多様性を比較することで,カテゴリの多様性を評価する. We analyze the diversity of the comments posted to news articles, and news articles in some categories. We think this helps interpretation of the behavior of the persons in a society from a new view point. From a hypothesis that the diversity of comments to two different news articles is larger than that to one news article, we compare the diversity of several number of articles in the same category, to observe the diversity of the comments to the articles in the category.
  • 杉山, 佳奈美, 久保山, 哲二, 三輪, 洋文, 宇野, 毅明
    じんもんこん2022論文集 2022 289-294 2022年12月2日  査読有り
    選挙公報のテキストデータに対して文書クラスタリングを適用した. クラスタリング手法には、 文書間類似度により形成されるネットワーク構造から密な部分構造を抽出するマイクロクラスタリン グと、代表的なトピックモデルである LDAの2種類を利用した. クラスタリング結果を比較したとこ ろ, マイクロクラスタリングではトピックの解釈が容易な解像度が高いクラスタ, 特に政党に関して より類似度が高いクラスタが多数得られることが示された. さらにマイクロクラスタリングで抽出さ れた文書クラスタを元に回帰分析を行い, 個人票志向の候補者の傾向を解析した. その結果, LDA を 用いた先行研究にあった人手によるトピック解釈の過程を経ることなく, 選挙制度改革前後の変化や 政党ごとの特色について先行研究の主張を支持する結果が得られた. A text analysis was applied to the election manifestos. Two kinds of clustering methods were utilized and compared: microclustering that extracted dense substructures from the network constructed based on the similarity of the documents, and the LDA model, which is a kind of topic model. The microclustering gave many clusters that were easier to understand their topics, especially for the party of candidates. Furthermore, regression analysis was applied to the obtained clusters, and the tendency of candidates with personal-oriented was elucidated. The results correspond to previous studies, such as the change of the electoral rule and the characteristics of each political party, without any manual topic interpretation process as in the previous studies.

MISC

 131
  • 久保山 哲二, 申 吉浩
    情報処理学会研究報告. AL, アルゴリズム研究会報告 2005(91) 9-16 2005年9月16日  
    インターネット上のXMLやHTML文書等の半構造データの増大にともない、膨大な半構造データを効率よく比較・照合するための手法や、複数の半構造データを統合するための手法が求められている。これまでに半構造データのための様々な照合・結合手法が提案されているものの、これらの手法を統一的に記述するためのフレームワークが存在しなかった。そこで、本稿では、木の近似照合の意味論を木構造間のノード写像として定式化し、木構造間のノード写像が与えられたときに、その写像が属する近似照合のクラスを効率よく同定するアルゴリズムを示す。このアルゴリズムは、クラスの同定過程で、2つの木構造が矛盾なく結合できるかどうかを調べ、結合可能な場合は、実際に結合木を構成する。
  • 大倉 暢仁, 平田 耕一, 久保山 哲二, 原尾 政輝
    電子情報通信学会技術研究報告. COMP, コンピュテーション 105(273) 25-29 2005年9月8日  
    本稿では, ラベル無し順序木のqグラム距離について考察する.まず, qグラムを線グラフに同型なノード数qの木と定義し, 2つの木のqグラム距離を2つの文字列のqグラム距離と同様に定義する.そして, 後行順の深さ列を用いることで, ノード数nの木Tのすべてのqグラムを, O(n^2)時間O(q)領域で数えあげる単純なアルゴリズムEnumGramを設計する.次に, このEnumGramを, O(qn)時間O(qd)領域のアルゴリズムLinearEnumGramに改良する.ここで, dはTの深さである.したがって, T_1とT_2のqグラム距離D_q(T_1, T_2)は, O(qmax{n_1, n_2})時間O(qmax{d_1, d_2})領域で計算することができる.ただし, n_iおよびd_iはT_iの中のノード数およびT_iの深さである.
  • 福島 瞳, 林 周志, 原 健蔵, 久保山 哲二, 鈴木 常夫, 平原 清光, 瀬崎 薫, 柴崎 亮介
    生産研究 57(5) 79-84 2005年9月  
  • 久保山 哲二, 申 吉浩, 安田 浩
    情報処理学会研究報告. データベース・システム研究会報告 2005(42) 47-54 2005年5月19日  
    インターネット上のXMLやHTML文書等の半構造データの増大にともない、膨大な半構造データを効率よく比較・照合するための手法や、複数の半構造データを統合するための手法が求められている。これまでに半構造データのための様々な照合・結合手法が提案されているものの、一般的なフレームワークが存在しないため同様の手法が独立に繰り返し提案されることも少なくない。本稿では、2つの半構造データを結合するための一般的かつ理論的なフレームワークを提供する。本手法では、まず、木の編集距離の概念を用いて2つの木の近似照合を行い、2つの木の間で類似しているノードの対応をとる。次に、対応のとれたノード同士を重ね合わせ、その他の全てのノードが、もとの木における階層構造を保つように新しい木を生成する。このような数理的なフレームワークによって、様々な照合・統合手法に統一的な観点を提供し、効率的な実装のための基礎を与える。
  • 久保山 哲二, 申 吉浩, 安田 浩
    情報処理学会研究報告. 情報学基礎研究会報告 2005(42) 47-54 2005年5月19日  
    インターネット上のXMLやHTML文書等の半構造データの増大にともない、膨大な半構造データを効率よく比較・照合するための手法や、複数の半構造データを統合するための手法が求められている。これまでに半構造データのための様々な照合・結合手法が提案されているものの、一般的なフレームワークが存在しないため同様の手法が独立に繰り返し提案されることも少なくない。本稿では、2つの半構造データを結合するための一般的かつ理論的なフレームワークを提供する。本手法では、まず、木の編集距離の概念を用いて2つの木の近似照合を行い、2つの木の間で類似しているノードの対応をとる。次に、対応のとれたノード同士を重ね合わせ、その他の全てのノードが、もとの木における階層構造を保つように新しい木を生成する。このような数理的なフレームワークによって、様々な照合・統合手法に統一的な観点を提供し、効率的な実装のための基礎を与える。
  • 久保山 哲二, 申 吉浩, 安田 浩
    情報処理学会研究報告情報学基礎(FI) 2005(42) 47-54 2005年5月19日  
    インターネット上の XML や HTML 文書等の半構造データの増大にともない、膨大な半構造データを効率よく比較・照合するための手法や、複数の半構造データを統合するための手法が求められている。これまでに半構造データのための様々な照合・結合手法が提案されているものの、一般的なフレームワークが存在しないため同様の手法が独立に繰り返し提案されることも少なくない。本稿では、2 つの半構造データを結合するための一般的かつ理論的なフレームワークを提供する。本手法では、まず、木の編集距離の概念を用いて2つの木の近似照合を行い、2つの木の間で類似しているノードの対応をとる。次に、対応のとれたノード同士を重ね合わせ、その他の全てのノードが、もとの木における階層構造を保つように新しい木を生成する。このような数理的なフレームワークによって、様々な照合・統合手法に統一的な観点を提供し、効率的な実装のための基礎を与える。With the rapid growth of semistructured data such as XML and HTML documents on the Internet, we need efficient methods for comparing, matching and integrating semistructured data. Although there have been diversity of these methods recently, no comprehensive framework has been available. In this paper, we formulate and provide a new framework for merging semistructured data. In this framework, we firstly find a set of node-to-node correspondences between two trees by approximate matching based on tree edit distance. Then, we merge two trees by overlaying these corresponding nodes, and locating the other nodes so that each ancestor relation in two trees is preserved. This mathematical framework gives a unifying view of matching and merging semistructured data, and is beneficial to efficient implementations.
  • 久保山 哲二, 申 吉浩, 安田 浩
    情報処理学会研究報告データベースシステム(DBS) 2005(42) 47-54 2005年5月19日  
    インターネット上の XML や HTML 文書等の半構造データの増大にともない、膨大な半構造データを効率よく比較・照合するための手法や、複数の半構造データを統合するための手法が求められている。これまでに半構造データのための様々な照合・結合手法が提案されているものの、一般的なフレームワークが存在しないため同様の手法が独立に繰り返し提案されることも少なくない。本稿では、2 つの半構造データを結合するための一般的かつ理論的なフレームワークを提供する。本手法では、まず、木の編集距離の概念を用いて2つの木の近似照合を行い、2つの木の間で類似しているノードの対応をとる。次に、対応のとれたノード同士を重ね合わせ、その他の全てのノードが、もとの木における階層構造を保つように新しい木を生成する。このような数理的なフレームワークによって、様々な照合・統合手法に統一的な観点を提供し、効率的な実装のための基礎を与える。With the rapid growth of semistructured data such as XML and HTML documents on the Internet, we need efficient methods for comparing, matching and integrating semistructured data. Although there have been diversity of these methods recently, no comprehensive framework has been available. In this paper, we formulate and provide a new framework for merging semistructured data. In this framework, we firstly find a set of node-to-node correspondences between two trees by approximate matching based on tree edit distance. Then, we merge two trees by overlaying these corresponding nodes, and locating the other nodes so that each ancestor relation in two trees is preserved. This mathematical framework gives a unifying view of matching and merging semistructured data, and is beneficial to efficient implementations.
  • 久保山 哲二, 申 吉浩, 宮原 哲浩
    数理解析研究所講究録 1426 20-25 2005年4月  
  • 久保山 哲二, 申吉浩, 宮原 哲浩
    情報処理学会研究報告数理モデル化と問題解決(MPS) 2005(20) 21-24 2005年3月10日  筆頭著者
    木の近似照合は広い適用領域をもち、半構造化文書やRNA2次構造の類似性判定、XMLのスキーマ発見・統合、プログラムの差分検出をはじめとする様々な分野で、独立に多様なアルゴリズムが提案されている。木の近似照合アルゴリズムの多くは、編集距離による操作的な記述により特徴づけられてきたが、独立して提案されてきたこれらの様々なアルゴリズムの関連性については、ほとんど研究されていない。本論文では、編集距離に基づく既存の様々な木の近似照合を統一的に記述するための数学的モデルを提案する。文字列においては、アラインメントと編集距離が、その計算において等価であるが、これを木に拡張した場合、両者が等価ではなくなることが知られている。 本提案モデルを用いて、木のアラインメントと等価な編集距離のクラスを同定する。すなわち、従来、別々のアルゴリズムであると考えられていた木のアラインメントと less-constrainded 編集距離が等価であることを示す。The notion of tree edit distance provides a unifying framework for measuring distance and finding approximate common patterns between two trees. In prior work, the edit distance measures have been not well-formalized. So the essentially equivalent distance measures have been independently proposed as the measures different from each other. In this paper, we present a theoretical framework for tree edit distance. By using our framework, we establish the relationship between alignment of trees, and a tree edit distance measure called less-constrained edit distance.
  • 久保山 哲二, 申 吉浩, 宮原 哲浩
    情報処理学会研究報告. MPS, 数理モデル化と問題解決研究報告 53 21-24 2005年3月9日  
  • 久保山 哲二, 申 吉浩, 宮原 哲浩
    情報処理学会研究報告. MPS, 数理モデル化と問題解決研究報告 2005(20) 21-24 2005年3月9日  
    木の近似照合は広い適用領域をもち、半構造化文書やRNA2次構造の類似性判定、XMLのスキーマ発見・統合、プログラムの差分検出をはじめとする様々な分野で、独立に多様なアルゴリズムが提案されている。木の近似照合アルゴリズムの多くは、編集距離による操作的な記述により特徴づけられてきたが、独立して提案されてきたこれらの様々なアルゴリズムの関連性については、ほとんど研究されていない。本論文では、編集距離に基づく既存の様々な木の近似照合を統一的に記述するための数学的モデルを提案する。文字列においては、アラインメントと編集距離が、その計算において等価であるが、これを木に拡張した場合、両者が等価ではなくなることが知られている。本提案モデルを用いて、木のアラインメントと等価な編集距離のクラスを同定する。すなわち、従来、別々のアルゴリズムであると考えられていた木のアラインメントとless-constrainded編集距離が等価であることを示す。
  • 久保山 哲二, 申 吉浩, 宮原 哲浩
    電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 104(669) 97-102 2005年2月17日  
    Shock treeは二次元形状を効果的に抽象化する手法である。TorselloとHancockは、shock treeの照合のために、木構造の教師なし学習手法を提案している。この手法で核になるのは、木の編集距離を用いて2つの木を結合する手続きである。しかし、この手法においては、2つの木の結合後の構造が木になることは保証されておらず、木が得られなかった場合は、その結果を棄却して、別の組み合わせを試すというアドホックな方法を用いている。本稿では、2つの木を結合した結果が木になるための本質的な条件を示す。この条件は、木構造アラインメント計算が、less-constrainedという制約型の木の編集距離の計算と等価であることを証明することによって示される。また、結合して得られる木が一意に定まるための条件について考察する。
  • 久保山 哲二, 申 吉浩, 宮原 哲浩
    電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 104(667) 97-102 2005年2月17日  
    Shock treeは二次元形状を効果的に抽象化する手法である。TorselloとHancockは、shock treeの照合のために、木構造の教師なし学習手法を提案している。この手法で核になるのは、木の編集距離を用いて2つの木を結合する手続きである。しかし、この手法においては、2つの木の結合後の構造が木になることは保証されておらず、木が得られなかった場合は、その結果を棄却して、別の組み合わせを試すというアドホックな方法を用いている。本稿では、2つの木を結合した結果が木になるための本質的な条件を示す。この条件は、木構造アラインメント計算が、less-constrainedという制約型の木の編集距離の計算と等価であることを証明することによって示される。また、結合して得られる木が一意に定まるための条件について考察する。
  • 大倉 暢仁, 平田 耕一, 久保山 哲二, 原尾 政輝
    電気関係学会九州支部連合大会講演論文集 2005 470-470 2005年  
  • 久保山 哲二, 申 吉浩, 宮原 哲浩
    人工知能学会全国大会論文集 5 181-181 2005年  
    複数の木に共通する木構造パタンを発見するための新しい手法について提案する。本手法では、木の編集距離に基づき、木の近似照合を行い、複数の木のノード間の対応を求めることにより、パタン発見を行う。
  • 久保山 哲二, 申 吉浩, 宮原 哲浩
    人工知能学会全国大会論文集 19 1-4 2005年  
  • Kuboyama Tetsuji, Shin Kilho, Miyahara Tetsuhiro
    人工知能基本問題研究会 57 41-46 2004年11月4日  
  • 久保山 哲二, 宮原 哲浩
    電子情報通信学会技術研究報告. DC, ディペンダブルコンピューティング 104(347) 19-24 2004年10月12日  
    Webページからの情報抽出のために、Webラッパーを(半)自動生成するための様々な研究が行われている。本研究では、Webラッパー生成のために木の編集距離を用いてHTML文書やXML文書のような半構造データから、共通パタンを近似的にみつけることを目的とする。共通パタンは、複数のWebページの構文木の構造的類似性を見つけ出し、構文木を木構造アラインメントにより結合することにより生成する。木の各ノードには、出現頻度に応じた重み付けをする。プログラムにより機械的に生成された複数のWebページのみでなく、テンプレートを元に人手による編集を経て作成された複数のWebページ間に共通する構造を柔軟に抽出し、Webラッパーを生成する手法を提案する。
  • 久保山 哲二, 宮原 哲浩
    電子情報通信学会技術研究報告. DE, データ工学 104(345) 19-24 2004年10月12日  
    Webページからの情報抽出のために、Webラッパーを(半)自動生成するための様々な研究が行われている。本研究では、Webラッパー生成のために木の編集距離を用いてHTML文書やXML文書のような半構造データから、共通パタンを近似的にみつけることを目的とする。共通パタンは、複数のWebページの構文木の構造的類似性を見つけ出し、構文木を木構造アラインメントにより結合することにより生成する。木の各ノードには、出現頻度に応じた重み付けをする。プログラムにより機械的に生成された複数のWebページのみでなく、テンプレートを元に人手による編集を経て作成された複数のWebページ間に共通する構造を柔軟に抽出し、Webラッパーを生成する手法を提案する。
  • 久保山 哲二, 安原 晃, 宮原 哲浩
    電子情報通信学会技術研究報告. COMP, コンピュテーション 104(317) 25-32 2004年9月10日  
    2つの木構造間の類似性を比較する手段として編集距離による様々な手法が提案されている。木構造アラインメントもその1つであり、2つの木を共にグラフマイナーとして包含するような共通木を見つける手法である。文字列については、編集距離計算とアラインメント計算は本質的に等価であることが知られている。しかし、木の場合には、一般的にこのような等価性は成り立たない。本稿では、木の編集距離と木構造アラインメントの関連性について考察し、木構造アラインメントの計算が、less-constrainedという制約型の木の編集距離計算と等価であることを、両者のマッピング条件の等価性を証明することによって示す。また、木構造アラインメントにより共通木が一意に定まるマッピング条件を示す。
  • 久保山 哲二, 安原 晃, 宮原 哲浩
    人工知能基本問題研究会 56 67-72 2004年7月25日  
  • 久保山 哲二, 宮原 哲浩
    人工知能学会全国大会論文集 4 259-259 2004年  
    木構造を埋め込める変数を含む順序木で記述した木構造パタンと半構造データの編集距離を計算することにより変数部分の情報抽出を行う手法について提案する。
  • 久保山 哲二, 宮原 哲浩
    人工知能学会全国大会論文集 18 1-4 2004年  
  • 宮原 哲浩, 正代 隆義, 内田 智之, 久保山 哲二, 高橋 健一, 上田 祐彰
    電子情報通信学会技術研究報告. AI, 人工知能と知識処理 99(447) 59-64 1999年11月19日  
    グラフ構造、特に木構造は、様々なデータを表現する手段として、重要な役割を果たしており、グラフ構造データ、木構造データからの知識発見が注目されている。項木(term tree)とは、木構造をしたデータのパターンを表現するための、変数を含むデータ構造であり、一階項(first order term)よりも表現力が大きい。我々は、木構造データからの知識発見の効率化のため、項木と木の単一化可能性を効率的に判定するアルゴリズムを提案している。項木と木が単一化可能であるとは、項木が表すパターンに木が適合することである。この単一化可能性判定アルゴリズムを実現し、実験によりその有効性を確認したので報告する。また、グラフ構造データからの知識発見システムへの応用についても述べる。
  • 宮原 哲浩, 正代 隆義, 内田 智之, 久保山 哲二, 高橋 健一, 上田 祐彰
    人工知能学会全国大会論文集 = Proceedings of the Annual Conference of JSAI 13 389-392 1999年6月15日  
  • 宮原 哲浩, 久保山 哲二, 内田 智之, 山本 竜也, 高橋 健一, 上田 祐彰
    全国大会講演論文集 57 325-326 1998年10月5日  
  • 松本 誉史, 越村 三幸, 久保山 哲二
    Research reports on information science and electrical engineering of Kyushu University 2(1) 75-80 1997年3月  
    We present a new method to eliminate redundant inferences caused by case-splitting in MGTP. There are two types of redundancies eliminated by the method: One is that the same sub-proof tree may be generated at several descendant nodes after a case-splitting occurs. Another is caused by useless model candidate extensions with irrelevant non-Horn clauses. Both types of redundancies can be eliminated by combining the folding-up function that conveys unit lemmata obtained from solved descendant nodes to a proper antecedent node and the NHM function that suppresses useless model extensions. The method has been implemented in MGTP. We evaluate its effects on a UNIX workstation for some typical problems taken from the TPTP problem library.
  • 久保山 哲二, 松本 誉史, 長谷川 隆三
    Research reports on information science and electrical engineering of Kyushu University 2(1) 81-86 1997年3月  
    Factorization used in resolution provers can be effectively applied to model generation provers in order to eliminate the redundancies in case splittings. We propose a new factorization-based technique called a static/dynamic lemma generation, and present its efficient implementation on MGTP(Model Generation Theorem Prover). Experimental results obtained by running MGTP with the technique for several problems from the TPTP library demonstrate the effectiveness of the proposed technique and implementation.
  • 久保山 哲二
    人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence 9(3) 464-464 1994年5月1日  

教育業績(担当経験のある科目)

 15

共同研究・競争的資金等の研究課題

 33