2020年5月2日土曜日

共起ネットワークによる動向分析のテスト。

データマイニングの手法を活用した動向調査(蓄積されたデータのなかに意味のあるパターンを発見する手法による調査,という感じでしょうか)をよくやるのですが,今日は一つの方法をご紹介します。

共起ネットワーク分析」という手法なんですが,次の画像をみていただくのが早いと思います。


データマイニングの手法なので,まずは分析するデータが必要になります。今回は「Googleアラート」を「図書館」(「ライブラリー」などの類義語も)で設定し届いたメール(「コロナ」という文字列が登場した日から,ということで2020/2/19から4/17まで収集しました)で試しました(動向調査の例として)。

データを整えたうえで(データクレンジング),「共起ネットワーク分析」を,「KH Coder」というソフト(様々なテキストマイニングの分析ができます)を利用し,行いました。○回以上登場する言葉のみ含む,など,種々の設定の上,分析するのですが,今回は簡単な説明にとどめたいと思いますので,詳しい説明は省きます。

「共起ネットワーク」では,上記のような図として,視覚化されるわけです。ざっくり説明すると,図のように,言葉の出現頻度により点を大きくしたり,「共起」というように一緒に登場する傾向がある言葉(「距離」が遠いか近いかを計算)を線で表現したりできます。これから何が読み取れるか,みるということになります。
この例だと,電子資料サービスが注目されている,など動向が読み取れると思います。

データマイニングの手法は,もっと初歩的な方法など,所属先で利用したものを公開していますので(『動向レポート』の「公共図書館の動向を新聞記事見出しに探る」(1)(3)),本記事に興味を持っていただいた方には,楽しんでいただけるかもしれませんね。動向調査としては,最近のものとはいえないのですが。今日はこのくらいで失礼します。

0 件のコメント:

コメントを投稿