
久保山 哲二

クボヤマ テツジ  (Tetsuji Kuboyama)


学習院大学 計算機センター / 人文科学研究科アーカイブズ学専攻 教授
東京電機大学 総合研究所・知能創発研究所 客員教授






  • Naoya Higuchi, Yasunobu Imamura, Vladimir Mic, Takeshi Shinohara, Kouichi Hirata, Tetsuji Kuboyama
    ICPRAM 499-510 2024年  
  • 草場彰, 寒川義裕, 久保山哲二, 新田州吾, 白石賢二, 押山淳
    日本結晶成長学会誌 50(1) 50-1-05 2023年4月28日  査読有り
  • 徳永 弘子, 久保山 哲二, 木村 敦, 武川 直樹
    電子電子情報通信学会論文誌A 基礎・境界 J106-A(3) 104-113 2023年3月1日  査読有り
  • 宇野, 毅明, 武富, 有香, 小林, 亮太, 橋本, 隆子, 久保山, 哲二, 申, 吉浩
    じんもんこん2022論文集 2022 207-212 2022年12月2日  査読有り
    本稿では,ニュース記事に対するコメント,および,ニュース記事のあるカテゴリのニュース記事に対するコメントの多様性を測り,その結果を紹介する.記事やカテゴリに対して人々がどのような反応をしているかを読み解くための材料として,新たな方向性を提案する.異なる記事に対するコメントは,単一の記事に対するコメントよりも多様性が増すであろう,という仮説から,あるカテゴリの複数の記事に対するコメントの多様性を比較することで,カテゴリの多様性を評価する. We analyze the diversity of the comments posted to news articles, and news articles in some categories. We think this helps interpretation of the behavior of the persons in a society from a new view point. From a hypothesis that the diversity of comments to two different news articles is larger than that to one news article, we compare the diversity of several number of articles in the same category, to observe the diversity of the comments to the articles in the category.
  • 杉山, 佳奈美, 久保山, 哲二, 三輪, 洋文, 宇野, 毅明
    じんもんこん2022論文集 2022 289-294 2022年12月2日  査読有り
    選挙公報のテキストデータに対して文書クラスタリングを適用した. クラスタリング手法には、 文書間類似度により形成されるネットワーク構造から密な部分構造を抽出するマイクロクラスタリン グと、代表的なトピックモデルである LDAの2種類を利用した. クラスタリング結果を比較したとこ ろ, マイクロクラスタリングではトピックの解釈が容易な解像度が高いクラスタ, 特に政党に関して より類似度が高いクラスタが多数得られることが示された. さらにマイクロクラスタリングで抽出さ れた文書クラスタを元に回帰分析を行い, 個人票志向の候補者の傾向を解析した. その結果, LDA を 用いた先行研究にあった人手によるトピック解釈の過程を経ることなく, 選挙制度改革前後の変化や 政党ごとの特色について先行研究の主張を支持する結果が得られた. A text analysis was applied to the election manifestos. Two kinds of clustering methods were utilized and compared: microclustering that extracted dense substructures from the network constructed based on the similarity of the documents, and the LDA model, which is a kind of topic model. The microclustering gave many clusters that were easier to understand their topics, especially for the party of candidates. Furthermore, regression analysis was applied to the obtained clusters, and the tendency of candidates with personal-oriented was elucidated. The results correspond to previous studies, such as the change of the electoral rule and the characteristics of each political party, without any manual topic interpretation process as in the previous studies.


  • 橋本 隆子, 久保山 哲二, 白田 由香利
    學習院大學經濟論集 48 285-302 2012年1月  
  • 齋藤 良平, 久保山 哲二, 山川 裕大
    人工知能基本問題研究会 84 1-6 2011年12月16日  
  • 齋藤 良平, 久保山 哲二, 山川 裕大, 安田 浩
    電子情報通信学会技術研究報告. AI, 人工知能と知識処理 111(310) 13-18 2011年11月14日  
  • 齋藤 良平, 山川 裕大, 久保山 哲二
    人工知能基本問題研究会 82 13-18 2011年8月4日  
  • 齋藤 良平, 山川 裕大, 久保山 哲二, 安田 浩
    研究報告グループウェアとネットワークサービス(GN) 2011(2) 1-5 2011年5月12日  
    本研究では、企業内のクライアント PC のログから個々のユーザの勤務形態や生産性について推定することを目標として、その要素技術について提案する.本稿では,実際に企業内 PC から約 60 ユーザーのマウスおよびキーボードの入力ログとアクティブウィンドウ遷移ログを取得し,クラスタリング手法と信号処理手法を用いて、部署ごとおよび個々のユーザーのアプリケーション利用パターンを分析した結果について報告する.また,PC 操作ログから,企業内における PC を利用した業務の基準的な利用パターンの抽出や,各個人の勤務形態を特徴付けるための要素技術について提案する.This paper proposes a simple method for analysing PC usage logs aiming to identify working patterns and behaviors of employees at work. The logs we analyse are recorded at individual PCs for employees in a company, and include active window transitions, the number of keystrokes, and mouse distance traveled per units of time. Through a simple method based on singular value decomposition (SVD) and clustering, we show that aggragate Application usage patterns of employees are extracted. We report results of analysis of individual users Application usage pattern from obtained And we propose a method for extracting basic pattern of working with PC and characterizing individual users working patterns from mouse, keyboard and active window transition logs.
  • 齋藤 良平, 山川 裕大, 久保山 哲二, 安田 浩
    電子情報通信学会技術研究報告. LOIS, ライフインテリジェンスとオフィス情報システム 111(50) 9-13 2011年5月12日  
  • 大城 一紘, 久保山 哲二, 安田 浩
    電子情報通信学会総合大会講演論文集 2011(1) 97-97 2011年2月28日  
  • 大塚 大輔, 久保山 哲二, 安田 浩
    電子情報通信学会総合大会講演論文集 2011(1) 98-98 2011年2月28日  
  • 齋藤 良平, 山川 裕大, 久保山 哲二, 安田 浩
    電子情報通信学会技術研究報告. LOIS, ライフインテリジェンスとオフィス情報システム 110(450) 73-78 2011年2月24日  
  • 木村大翼, 久保山哲二, 渋谷哲朗, 鹿島久嗣
    人工知能学会論文誌(Web) 26(3) 2011年  
  • 勝野 弘康, 鏑木 崇史, 山口 健二, 久保山 哲二, 横山 悦郎, 入澤 寿美, 坂本 孝治郎
    学習院大学計算機センター年報 32 2-13 2011年  
  • 久保山 哲二, 磯上 貞雄, 城所 弘泰, 村上 登志男
    学習院大学計算機センター年報 32 140-146 2011年  
  • 入澤 寿美, 久保山 哲二, 勝野 弘康, 鏑木 崇史
    学習院大学計算機センター年報 32 185-189 2011年  
  • 白田 由香利, 橋本 隆子, 久保山 哲二
    學習院大學經濟論集 47(4) 263-280 2011年1月  
    金融工学数学のためのグラフィクス教材のデータベースのWEB サイトを立ち上げたので報告する。金融工学数学は難しいと言われるが,数学を理解させるために,グラフィクスの利用は有効であり,その利用により学生の理解度を高めることが可能である。我々は,大学および高校の数学授業において,グラフィクス教材をもっと多く活用してもらうためにこのサイトを開いた。そのため,数式処理ソフトウェアとしては,国内でも普及しているフリーソフトであるMAXIMA(マキシマ)を使った。本稿の目的は,グラフィクス教材作成に際して,ユーザー自身が,パラメータ値を自由に変更でき,ユーザー独自の金融工学数学グラフィクス教材を作成できるようにすることである。教材の内容としては,グラフィクスが効果的に生かせるテーマをとして,ポートフォリオの効率的フロンティア及びイミュニゼーションのテイラー展開描画,住宅ローン,年金の増加関数と減少関数の描画,債券価格の3次元的描画などを選んだ。本稿では,我々が研究中である,債券数学の学習支援システム構想にもふれ,このグラフィクス教材データベースが,その一部であることを説明する。
  • 奥野 智孝, 市野 将嗣, 久保山 哲二, 吉浦 裕
    研究報告コンピュータセキュリティ(CSEC) 2011(2) 53-56 2011年  
    近年,多様な個人情報がネットワーク上に流通している.同一人物に関する複数の情報を入手することで,単独の情報からでは分からなかった情報が明らかになり,予期せぬプライバシー侵害につながる懸念がある.本研究ではこの危険性を明らかにするために,問題の代表例としてバックグラウンドチェックと呼ばれる雇用前の身辺調査を例に挙げ,ソーシャルメディアのプロフィールが匿名化されていても,履歴書の情報を基にソーシャルメディアのコンテンツの特徴を分析することで,採用希望者のアカウントを特定できることを示した.これにより,履歴書の情報とソーシャルメディアで開示された情報を統合し,個人の言動を調査することができる.Various types of personal information about individuals are accessible through the Web medias. Linking of the personal information obtained through multiple medias can lead to a serious violation of privacy. To address this problem, we developed a method to identify the author of the short messages of Twitter, known as tweets, by using the information from other medias.
  • 坂本 孝治郎, 入澤 寿美, 横山 悦郎, 久保山 哲二, 勝野 弘康, 佐藤 友彦, 海老澤 賢史, 浦上 大輔
    学習院大学計算機センター年報 31 2-11 2010年12月  
  • 磯上 貞雄, 城所 引泰, 村上 登志男, 久保山 哲二
    学習院大学計算機センター年報 31 123-128 2010年12月  
  • 太田 宏之, 浦上 大輔, 高橋 達二, 久保山 哲二, 西田 育弘
    学習院大学計算機センター年報 31 129-132 2010年12月  
  • 久保山 哲二
    学習院大学計算機センター年報 31 171-172 2010年12月  
  • 平田 耕一, 山本 恭之, 久保山 哲二
    人工知能基本問題研究会 80 33-38 2010年11月17日  
  • 白田 由香利, 久保山 哲二
    學習院大學經濟論集 47(3) 151-161 2010年10月  
  • 申 吉浩, 久保山 哲二
    人工知能基本問題研究会 79 35-39 2010年9月24日  
  • 久保山 哲二, 申 吉浩, 伊藤 公人
    人工知能基本問題研究会 78 1-7 2010年7月31日  
  • 白田 由香利, 橋本 隆子, 久保山 哲二
    研究報告情報基礎とアクセス技術(IFAT) 2010(5) 1-6 2010年7月28日  
    本研究の目的は,金融工学数学教育のための学習支援システムの構築である.難度の高い金融関連文章題が与えられたときに,学生が演繹推論することを,支援するシステムを構築したい.この学習支援システムは,学生が解にいたるプロセスを演繹推論することを支援する.システムは知識ベースを検索し,必要な公式を探し,それを使った演繹推論の最適なパスを提示する.技術的課題としては,用語のユニークなセマンティクスのラベル付け,文章題日本語文からの Given Data と Unknown の抽出,公式のメタレベルでの記述,最適な解法プランの作成,等がある.The purpose of this research is construction of a computer-assisted learning system for financial mathematics. Given a hard bond mathematics word problem, the system helps a student conduct deductive reasoning to solve the problem. The system retrieves the knowledge database to obtain the formula that is required for the reasoning so that the system may construct and offer the solution path to the unknown. The problems we should overcome include systematic semantics labeling of bond mathematics terminology, extraction of Given Data list and Unknown from the given word problem, description of formula stored in the knowledge database, and construction of the optimal solution plan.
  • 白田 由香利, 橋本 隆子, 久保山 哲二
    本研究の目的は,金融工学数学教育のための学習支援システムの構築である.難度の高い金融関連文章題が与えられたときに,学生が演繹推論することを,支援するシステムを構築したい.この学習支援システムは,学生が解にいたるプロセスを演繹推論することを支援する.システムは知識ベースを検索し,必要な公式を探し,それを使った演繹推論の最適なパスを提示する.技術的課題としては,用語のユニークなセマンティクスのラベル付け,文章題日本語文からの Given Data と Unknown の抽出,公式のメタレベルでの記述,最適な解法プランの作成,等がある.The purpose of this research is construction of a computer-assisted learning system for financial mathematics. Given a hard bond mathematics word problem, the system helps a student conduct deductive reasoning to solve the problem. The system retrieves the knowledge database to obtain the formula that is required for the reasoning so that the system may construct and offer the solution path to the unknown. The problems we should overcome include systematic semantics labeling of bond mathematics terminology, extraction of Given Data list and Unknown from the given word problem, description of formula stored in the knowledge database, and construction of the optimal solution plan.
  • 吉田 健吾, 宮原 哲浩, 久保山 哲二
    人工知能基本問題研究会 77 49-54 2010年3月17日  
  • 坂本 孝治郎, 海老沢 賢史, 佐藤 友彦, 浦上 大輔, 久保山 哲二, 横山 悦郎, 入澤 寿美
    学習院大学計算機センター年報 30 2-16 2009年12月  
  • 永田 健一郎, 久保山 哲二
    学習院大学計算機センター年報 30 110-117 2009年12月  
  • 久保山 哲二
    学習院大学計算機センター年報 30 158-160 2009年12月  
  • 久保山 哲二
    学習院大学計算機センター年報 30 163-166 2009年12月  
  • 長嶺 将俊, 宮原 哲浩, 久保山 哲二
    人工知能基本問題研究会 73 35-40 2009年3月13日  
  • 永田 健太郎, 久保山 哲二
    情報処理学会研究報告. EIP, [電子化知的財産・社会基盤] 2009(11) 31-38 2009年2月6日  
  • 申 吉浩, 久保山 哲二
    人工知能学会論文誌 24(2) 263-271 2009年  
    Haussler's convolution kernel provides a successful framework for engineering new positive semidefinite kernels, and has been applied to a wide range of data types and applications. In the framework, each data object represents a finite set of finer grained components. Then, Haussler's convolution kernel takes a pair of data objects as input, and returns the sum of the return values of the predetermined primitive positive semidefinite kernel calculated for all the possible pairs of the components of the input data objects. On the other hand, the <I>mapping kernel</I> that we introduce in this paper is a natural generalization of Haussler's convolution kernel, in that the input to the primitive kernel moves over a predetermined subset rather than the entire cross product. Although we have plural instances of the mapping kernel in the literature, their positive semidefiniteness was investigated in case-by-case manners, and worse yet, was sometimes incorrectly concluded. In fact, there exists a simple and easily checkable necessary and sufficient condition, which is generic in the sense that it enables us to investigate the positive semidefiniteness of an arbitrary instance of the mapping kernel. This paper presents and proves the validity of the condition. In addition, we introduce two important instances of the mapping kernel, which we refer to as the <I>size-of-index-structure-distribution</I> kernel and the <I>edit-cost-distribution</I> kernel. Both of them are naturally derived from well known (dis)similarity measurements in the literature (the maximum agreement tree, the edit distance), and are reasonably expected to improve the performance of the existing measures by evaluating their distributional features rather than their peak (maximum/minimum) features.
  • 荒津 拓, 平田 耕一, 久保山 哲二
    人工知能基本問題研究会 71 57-62 2008年9月17日  
  • 久保山 哲二, 申 吉浩
    人工知能基本問題研究会 66 41-46 2007年7月13日  
  • 江村 恒一, 安木 慎, 宮崎 誠也, 久保山 哲二, 青木 輝勝, 安田 浩
    電子情報通信学会技術研究報告. KBSE, 知能ソフトウェア工学 106(473) 61-66 2007年1月16日  
    Weblogなどの新たなコミュニケーションツールの普及により,個人が容易に情報発信する消費者発信型メディア(CGM: Consumer Generated Media)が急激に増加しており,既存のマスメディアからのパラダイムシフトを引き起こしている.さらに,携帯端末から投稿するMobile Weblog(モブログ)の登場により,時間と場所に制約されない情報発信が可能となっている.しかしながら,大量な情報を受発信できるようになったことで,必要な情報を取り出したり,相手に本当に伝えたい気持ちを表現することが困難となっている.このため,電子メールやWeblogなどの日常的に用いるテキストを対象に書き手の感情を抽出する研究が行われているが,感情を表現した語に基づいて抽出するため,感情語を含ないテキストから感情を抽出するために適した特徴量を扱えないなどの課題がある.本稿では,文末に付与する絵文字が感情を表すという仮定に基づき,SVMを用いて学習,感情モデルを構築し,書き手の感情を抽出する方式を提案する.
  • Emura Koichi, Kuboyama Tetsuji, Aoki Terumasa, Yasuda Hiroshi
    電子情報通信学会技術研究報告. IE, 画像工学 106(448) 101-106 2007年1月2日  
    The purpose of our research is to discover the creation process of users who do not already have high degrees of animation skills, and to provide a compatible authoring system that augments their process. It is very important that authoring systems have knowledge about a user's creation process. However, it is difficult to acquire this knowledge since it can vary depending on a user's preferred creation style. This paper proposes a new user model that considers both creation style and process, and explores an easy-to-use authoring interface design. We classify users with similar creation styles into clusters using a movie scenario structure of scenes and shots including events in the scenario text created by the users. Finally, an authoring interface based on the proposed user model is presented, and future research topics that must be addressed in order to achieve easy-to-use authoring are assessed.
  • Kuboyama Tetsuji, Hirata Kouichi, Kashima Hisashi, Aoki-Kinoshita Kiyoko F., Yasuda Hiroshi
    Information and Media Technologies 2(1) 292-299 2007年  
    Learning from tree-structured data has received increasing interest with the rapid growth of tree-encodable data in the World Wide Web, in biology, and in other areas. Our kernel function measures the similarity between two trees by counting the number of shared sub-patterns called tree q-grams, and runs, in effect, in linear time with respect to the number of tree nodes. We apply our kernel function with a support vector machine (SVM) to classify biological data, the glycans of several blood components. The experimental results show that our kernel function performs as well as one exclusively tailored to glycan properties.
  • 大倉 暢仁, 平田 耕一, 久保山 哲二
    人工知能基本問題研究会 63 19-24 2006年9月8日  
  • Kuboyama Tetsuji, Hirata Koichi, Kashima Hisashi
    人工知能基本問題研究会 63 71-76 2006年9月8日  
  • 久保山 哲二, 申 吉浩
    電子情報通信学会技術研究報告. COMP, コンピュテーション 106(29) 49-56 2006年4月19日  
  • Song Kwanghyun, Shin Kilho, Kuboyama Tetsuji, TAGUCHI Akinori, AOKI Terumasa, YASUDA Hiroshi
    電子情報通信学会技術研究報告. IE, 画像工学 105(500) 145-148 2006年1月2日  
    The web browsing has increased by the widespread diffusion of the Internet and the expansion of electronic commerce. Under these situations, it is assumed that the problem of mismatch between contents of web pages that the originator of the pages claims and that the recipient of the pages claims has been arising. The mismatch could be a serious issue for the financial interest. The established technique of the digital signature in the context of PKI(Public Key Infrastructure) can be imagined to be a technique to approach the problem since it supports the requirements of the integrity and the non-repudiation. However, the digital signature can only partially solve the problem. In fact, it can provide the recipient of web pages with the method to prove the existence of web pages that he or she has received only when they are signed by their originator. The originator can prove neither the existence of web pages that he or she has created in the past (since a malicious originator can sign web pages whenever it is advantageous for him or her) nor the non-existence of web pages tampered web pages. In the same way, the recipient cannot prove the non-existence of web pages the existence of which their originator claims. In this paper, we propose a moderation model for solving the mismatch problem. For that, we introduce Moderation Proxy. This model comprises of one or more proxy entities that cooperate with one another under a certain common policy. It can moderate the mismatch between contents of web pages with absolute equity. By this model, we can solve the current problem of mismatch.
  • Information and Media Technologies 1(1) 242-256 2006年  
    The notion of the tree edit distance provides a unifying framework for measuring distance and finding approximate common patterns between two trees. A diversity of tree edit distance measures have been proposed to deal with tree related problems, such as minor containment, maximum common subtree isomorphism, maximum common embedded subtree, and alignment of trees. These classes of problems are characterized by the conditions of the tree mappings, which specify how to associate the nodes in one tree with the nodes in the other. In this paper, we study the declarative semantics of edit distance measures based on the tree mapping. In prior work, the edit distance measures have been not well-formalized. So the relationship among various algorithms based on the tree edit distance has hardly been studied. Our framework enables us to study the relationship. By using our framework, we reveal the declarative semantics of the alignment of trees, which has remained unknown in prior work.
    Genome Informatics 17(2) 25-34 2006年  
    We propose a novel general-purpose tree kernel and apply it to glycan structure analysis. Our kernel measures the similarity between two labeled trees by counting the number of common <I>q</I>-length substrings (<I>tree q-grams</I>) embedded in the trees for all possible lengths <I>q</I>. We apply our tree kernel using a support vector machine (SVM) to classification and specific feature extraction from glycan structure data. Our results show that our kernel outperforms the layered trimer kernel of Hizukuri <I>et al</I>.[9] which is well tailored to glycan data while we do not adjust our kernel to glycanspecific properties. In addition, we extract specific features from various types of glycan data using our trained SVM. The results show that our kernel is more flexible and capable of finding a wider variety of substructures from glycan data.
  • 大倉 暢仁, 平田 耕一, 久保山 哲二, 原尾 正輝
    電気関係学会九州支部連合大会講演論文集 2006 506-506 2006年  
  • 宋 光顯, 申 吉浩, 久保山 哲二, 田口 哲典, 青木 輝勝, 安田 浩
    電子情報通信学会技術研究報告. ISEC, 情報セキュリティ 105(484) 17-21 2005年12月9日  
  • 大倉 暢仁, 平田 耕一, 久保山 哲二
    人工知能基本問題研究会 61 51-56 2005年11月24日  



