杉山, 佳奈美, 久保山, 哲二, 三輪, 洋文, 宇野, 毅明
じんもんこん2022論文集 2022 289-294 2022年12月2日 査読有り
選挙公報のテキストデータに対して文書クラスタリングを適用した. クラスタリング手法には、 文書間類似度により形成されるネットワーク構造から密な部分構造を抽出するマイクロクラスタリングと、代表的なトピックモデルである LDAの2種類を利用した. クラスタリング結果を比較したとこ ろ, マイクロクラスタリングではトピックの解釈が容易な解像度が高いクラスタ, 特に政党に関して より類似度が高いクラスタが多数得られることが示された. さらにマイクロクラスタリングで抽出さ れた文書クラスタを元に回帰分析を行い, 個人票志向の候補者の傾向を解析した. その結果, LDA を 用いた先行研究にあった人手によるトピック解釈の過程を経ることなく, 選挙制度改革前後の変化や 政党ごとの特色について先行研究の主張を支持する結果が得られた.