放送大学・情報ネットワーク最終課題

 情報ネットワークレポート


タイトル:
ビッグデータから見る人間行動・感情の相関と判断の非相関


このトピックを選択した理由:

図書を選定する際、他のトピックの本は原理原則の説明が多かったが、ビッグデータの場合は、定義や原理原則よりもそのデータをどのように活かすか、というアウトプットや社会的影響にフォーカスした書籍が多く、興味そそられたため。


内容:

データには相関性が直感的に理解できるものと、そうでないものが存在する。その相関の高さと低さを実際のYahooのレポートチームの解析結果を元に考察する。


正比例するデータとしては人々の検索ワードから見る「感情」である。

例えば以下のデータを示す。

・新社会人の悩み時系列マップ(p24-29)

・時間帯別の気分ワードTop5(p55)

新社会人が4月に気になるワードは「初任給 使い道」「洗濯機 使い方」。5月は「仕事 ミス」「足 臭い」。6月は「休み 過ごし方」「ボーナス」などである。


また時間帯別の気分ワードは以下である。

6時は「明るい、眠い、健康的、もう少し、穏やかな」

17時は「帰ろう、疲れた、終わり、頭痛い、足痛い」

4時は「死ね、変な、どうして、情けない、苦しく」


このように人々の感情を時系列上にしてデータ化すると相関性が高いことが明らかとなる。


対して、相関性が低いデータも存在する。例えば以下のデータ、

・候補者検索料と投票率の相関性(p196)

である。Yahooでは検索量と関連用語から選挙の予測モデルを構築してきたが、その中でも特に悩ましいのはある政党や立候補者に対する人々の興味が、必ずしも投票まで結びつかない場合である。人々は応援のためのみならず、単なる興味本位や批判のためにSNSで言及する、など必ずしも投票行動に至らない。人々の感情を想起させるが、その上で判断する必要がある場合には、直線的な相関関係には至らないということである。

その他、

・公明党得票率の謎の周期性(p187)

など選挙に関しては、一般的な分析可能性からは多少離れたこと、判断が難しいものが多く存在するという調査結果となっている。


意見・感想:

データや調査結果を見るにつけて、3つの感想を持つに至った。

・「相関」と「見える化」がビッグデータに関連する基本的な姿勢であること

・モデルは日々変化していること

・もはやネットとリアルは別個として切り分けることはできないし、ますます密接になるだろうこと

である。基本的には多量のデータは、データだけでは役に立たない形状であるため、それを見える化していくことが前提としてあり、見えたものから相関を見るのが第一ステップであると考えた。

また、それら分析結果は完璧とは言えず、日々の生活の時々刻々とデータや最適モデルは変化していくということ。

そして、データで実生活を分析するアウトプットを見るにつけて、ネットと現実の世界はもはや不可分の領域に至っていると感じた。

これらYahooチームが活用したデータは文字列データなので、特徴をみることに容易であるが、本講義であるようなIoTと関連したビッグデータの解析の場合は、また違った様相を呈するのだろうと思われた。いずれにせよ、日進月歩に進化・変化していく領域であり、興味は尽きない。


文献一覧:

安宅和人・池宮伸次.Yahoo!ビッグデータレポートチーム.
ビッグデータ探偵団 :. 講談社現代新書, 2019,





Next Post Previous Post
No Comment
Add Comment
comment url