ツイッター分析者に選ばれましたので報告記事
この記事はこんな人にオススメです
  • Twitter分析がどのようなものか気になる方.
  •  Twitterが好きで,何か攻略アイデアをお持ちの方.

こんにちは.けんゆー(@kenyu0501_)です.
昨夜の話ですが,けいすけ🌏ツイッター分析のプロ(@kei31)さんと反逆のコアラ社長(@hangyaku_koala)さんが企画された「Twitter攻略法開拓企画!」の分析者に選ばれました.
ありがとうございます.

反逆のコアラ社長(@hangyaku_koala)さんのTwitter内容をご覧いただくと詳細が分かると思いますが,今回の企画は

「けいすけさん(@kei31)さんのもつ数千人分のTwitterアナリティクスデータを分析して新しいTwitter攻略法を探す」

というものですね.

なぜ申し込んだのか?

1番の原因はけいすけさんから声が掛かったからなのですが,基本的にノリと勢いと興味とタイミングですね.
統計分析はあまり深くやっていない分野なので,この機会に挑戦しようかと思いました.
しかも生のTwitterアナリティクデータを触らせてもらうなんて,結構価値が高いと思います.

普段研究でやっているのは,信号のモデリングなので,こんなことを夜な夜な考えていましたが,
上手くいくかどうかも分からないです.前向きにやっていきます.

どのようなことをやっていくのか

しかし,基本的なアイデアはないんですよね.笑

ただ,Twitterデータは頂きましたので,データの内側を広げてみて,基本的な統計処理を一度やってみて考えます
とりあえず,指針としては,けいすけさんがTwitter分析のアウトプットとして出されているいくつかの項目を個人的にトレースして一度検証します.
型にハマってるようなアプローチですが,アイデアがない内は王道を攻めます...

これ,本日分析してもらいました.
(最近はブログ執筆が多くて,スコアを上げることを怠ってましたが,前回よりは上がっているようです笑)

既存の項目を一度確認しておく

このツイッター分析は,フォロワーを増やすために果たして何が必要なのか,ということを把握するためのものだと思います.
フォロワー数の予測やコンバージョン率もそういうことを念頭に置いた具体的提示がなされてますね.
さてさて,(けいすけさんの)既存の項目は以下です

  • ツイート数スコア(ツイート頻度)
  • インプレッションスコア(ツイートを届ける力)
  • アイコンネームスコア(見に行かれ易さ)
  • プロフィールスコア(フォローされ易さ)
  • 予測フォロワー推移
  • コンバージョン率(フォロワー獲得/ツイート)

ツイッターの6個のデータ(ツイート数やツイートインプレッションなど)から,ここまで深掘りできるとはすごいですね.
先人を見習って,ちょっとアイデアを練ります.

データの取り扱いに関して

分析をする前に,いただいたデータの取り扱いについて明記しておきます.

  1. 分析データはみんなのツイッター分析によって集められたデータです.
  2. 本データが公開されることにユーザーは同意しています.
  3. 本データはすでにツイッター上で公開ずみのデータです.
  4. 個人に着目して分析をする場合に限って,事前に掲載許可をお願いします.

また,各アカウントのアナリティクスのデータは自己入力なので,入力ミスと思われるデータは事前にこちらで判断して削除してます.
(ツイート数がものすごく高いものなど)

1日目はデータの全体的確認

分析のアイデアがパッと思いつかないので,毎日2時間くらい手を動かしながら考えていきたいなーと思っています.
とりあえず本日Twitterデータを頂いて行ったことは以下の3つです.

  1. データの全体的構造の確認
  2. 異常データの排除
  3. ユーザの度数分布を確認

基本的に,ツイッターデータはユーザが個人で入力するので,打ち間違いがあると思います.
こちらで確認して明らかに数値が高くて全体に影響を及ぼすと考えられるものをこちらで選定して排除しました.
( TwitterのアカウントIDを調べ,使用状況を確認して,15人くらい排除しました笑)

今日は,初日なので約3000人分の度数分布をざっと見ました
(ツイート数,インプレッション,プロフィール,メンション,フォロワー増加)
こんな感じになりました.

度数分布の詳細

グラフのサイズがズレていて申し訳ないです.

ざっとみて思ったのは,

ツイッター分析をする人は,それなりに意識が高い人だと思っていたので,もっとツイート数とかは正規分布的になるのかな,,,と思っていたが違いましたね.
見事に,低域に分布が集中しています.
国民の金融資産のような見事なグラフです.

一見すると,ツイート数と各種データとの相関値は高いようなので,やっぱりフォロワー獲得には,まずツイート発信が大きな要素だということが改めて認識できました.

ペンのすけ

けんゆーよ,お前は最近発信を怠けてるぞ!

うう,,,
一日20ツイート目指して頑張ります...笑

 

では,また明日から基本的な統計処理をざっと手にかけていきますー!
気長にデータ触っていきましょう〜

終わり