- Twitter分析がどのようなものか気になる方.
- Twitterが好きで,何か攻略アイデアをお持ちの方.
こんにちは.けんゆー(@kenyu0501_)です.
昨夜の話ですが,けいすけ🌏ツイッター分析のプロ(@kei31)さんと反逆のコアラ社長(@hangyaku_koala)さんが企画された「Twitter攻略法開拓企画!」の分析者に選ばれました.
ありがとうございます.
反逆のコアラ社長(@hangyaku_koala)さんのTwitter内容をご覧いただくと詳細が分かると思いますが,今回の企画は
「けいすけさん(@kei31)さんのもつ数千人分のTwitterアナリティクスデータを分析して新しいTwitter攻略法を探す」
というものですね.
なぜ申し込んだのか?
1番の原因はけいすけさんから声が掛かったからなのですが,基本的にノリと勢いと興味とタイミングですね.
統計分析はあまり深くやっていない分野なので,この機会に挑戦しようかと思いました.
しかも生のTwitterアナリティクデータを触らせてもらうなんて,結構価値が高いと思います.
僕が得意なのは、モデリングなので、わかってるパラメータ(フォロワーとかインプレッション)をあるモデル式に入れると予測がたつといったような一種の非線形モデルは作れそうですが、アウトプット系に正確性?整合性をとるのに、半年くらいかかりそうですなぁ、、スピード感はでないですね泣
— けんゆー@博士課程 (@kenyu0501_) January 27, 2019
普段研究でやっているのは,信号のモデリングなので,こんなことを夜な夜な考えていましたが,
上手くいくかどうかも分からないです.前向きにやっていきます.
どのようなことをやっていくのか
しかし,基本的なアイデアはないんですよね.笑
約3000人のTwitterデータ(分析用)頂いたので、今日は基本的な統計処理を一通りやってデータを眺めます〜
できれば今日中に、取り組んだ内容の記事を書きます( ^ω^ ) pic.twitter.com/AiQY6MNY8V
— けんゆー@博士課程 (@kenyu0501_) January 29, 2019
ただ,Twitterデータは頂きましたので,データの内側を広げてみて,基本的な統計処理を一度やってみて考えます.
とりあえず,指針としては,けいすけさんがTwitter分析のアウトプットとして出されているいくつかの項目を個人的にトレースして一度検証します.
型にハマってるようなアプローチですが,アイデアがない内は王道を攻めます...
これ,本日分析してもらいました.
(最近はブログ執筆が多くて,スコアを上げることを怠ってましたが,前回よりは上がっているようです笑)
既存の項目を一度確認しておく
このツイッター分析は,フォロワーを増やすために果たして何が必要なのか,ということを把握するためのものだと思います.
フォロワー数の予測やコンバージョン率もそういうことを念頭に置いた具体的提示がなされてますね.
さてさて,(けいすけさんの)既存の項目は以下です
- ツイート数スコア(ツイート頻度)
- インプレッションスコア(ツイートを届ける力)
- アイコンネームスコア(見に行かれ易さ)
- プロフィールスコア(フォローされ易さ)
- 予測フォロワー推移
- コンバージョン率(フォロワー獲得/ツイート)
ツイッターの6個のデータ(ツイート数やツイートインプレッションなど)から,ここまで深掘りできるとはすごいですね.
先人を見習って,ちょっとアイデアを練ります.
データの取り扱いに関して
分析をする前に,いただいたデータの取り扱いについて明記しておきます.
- 分析データはみんなのツイッター分析によって集められたデータです.
- 本データが公開されることにユーザーは同意しています.
- 本データはすでにツイッター上で公開ずみのデータです.
- 個人に着目して分析をする場合に限って,事前に掲載許可をお願いします.
また,各アカウントのアナリティクスのデータは自己入力なので,入力ミスと思われるデータは事前にこちらで判断して削除してます.
(ツイート数がものすごく高いものなど)
1日目はデータの全体的確認
分析のアイデアがパッと思いつかないので,毎日2時間くらい手を動かしながら考えていきたいなーと思っています.
とりあえず本日Twitterデータを頂いて行ったことは以下の3つです.
- データの全体的構造の確認
- 異常データの排除
- ユーザの度数分布を確認
基本的に,ツイッターデータはユーザが個人で入力するので,打ち間違いがあると思います.
こちらで確認して明らかに数値が高くて全体に影響を及ぼすと考えられるものをこちらで選定して排除しました.
( TwitterのアカウントIDを調べ,使用状況を確認して,15人くらい排除しました笑)
今日は,初日なので約3000人分の度数分布をざっと見ました.
(ツイート数,インプレッション,プロフィール,メンション,フォロワー増加)
こんな感じになりました.
1ヶ月のツイート数を増やせば、インプレッションも上がるし、プロフも見られるし、リプも増えるし、フォロワーも増える、、、可能性があると言う分布ですな。
自分で直接変えられる事が出来るのは、左上のツイート数だけですもんね、、機会は大事です。#ツイッター分析#コアラ社長のnote pic.twitter.com/nt2Vo9LPpR
— けんゆー@博士課程 (@kenyu0501_) January 29, 2019
度数分布の詳細
グラフのサイズがズレていて申し訳ないです.
ざっとみて思ったのは,
ツイッター分析をする人は,それなりに意識が高い人だと思っていたので,もっとツイート数とかは正規分布的になるのかな,,,と思っていたが違いましたね.
見事に,低域に分布が集中しています.
国民の金融資産のような見事なグラフです.
一見すると,ツイート数と各種データとの相関値は高いようなので,やっぱりフォロワー獲得には,まずツイート発信が大きな要素だということが改めて認識できました.
けんゆーよ,お前は最近発信を怠けてるぞ!
うう,,,
一日20ツイート目指して頑張ります...笑
では,また明日から基本的な統計処理をざっと手にかけていきますー!
気長にデータ触っていきましょう〜
終わり