一日一膳(当社比)

RとJavaと時々数学

なんか自分のブログのアクセス数が木曜日に増えるっぽい

 

自分のブログのアクセス数を見ていて、木曜日に若干アクセスが伸びている気がした。

そのことについての雑感を書きます。

 

木曜日にアクセス数が増えてるっぽい

まず昨年の11/19日から今年1/17までの60日間のアクセス数をグラフにしてみた。

f:id:kimigayoseishou:20200119232359p:plain

アクセス数推移

木曜日を青色でハイライトしてみると、木曜日のアクセス数が多い気(?)がしてきますね。そこで平均アクセス数を木曜日 / 木曜日以外で集計してみると、

曜日 平均アクセス数
木曜日以外 4.9
木曜日 8.6
全体 5.5

と、木曜日が全体と比較して5割強程度アクセスが多いようでした。

状態空間モデルで曜日別アクセス数を推定

統計モデルを使って曜日ごとにアクセス数に違いがあるか検証してみます。

 {\sf access}_t t日目のアクセス数とします。

曜日ごとのアクセス数の違い s_tと、定常部分 w_tを導入して、

つぎのような状態空間モデルを用いてモデル化します。

 

w_t \sim {\sf Normal}(\mu, \sigma_w ^ 2), \quad ({\rm i.i.d.})
 s_t \sim {\sf Normal} \bigl(-\sum_{j = 1}^6 s_{t-j}, \sigma_s^2\bigr),
 {\sf access}_t \sim {\sf PoissonLog}(\lambda_t),\quad \lambda_t = w_t + s_t,

 

ただし、 {\sf PoissonLog}は対数Poisson分布でつぎの確率質量分布をもつ離散確率変数

  {\sf PoissonLog}(x | \lambda ) = \frac{1}{x!} \exp(\lambda x - \exp(\lambda)), \quad (x = 0, 1, 2, \ldots)

です。

このモデルで \exp(s_t)を推定し曜日ごとについてバイオリンplotにしてみた図が以下になります(横線は四分位点)。木曜日(day_id = 4)で中央値が約1.6と、木曜日のアクセス数が他の曜日より多いことがわかります。

 

f:id:kimigayoseishou:20200120000134p:plain

結局木曜日にアクセス数が多い理由は?

f:id:kimigayoseishou:20200120001957p:plain

アメリカからのアクセスが木曜日に増えてるっぽい

Google Analyticsで調べてみたら、どうやらアメリカからのアクセスが木曜日に増えてるみたいだ。しかもそのアクセスのほとんどがイリノイ州からによるものでした。

f:id:kimigayoseishou:20200120003933p:plain

USからのアクセスでは、そのほとんどがイリノイ州からのアクセス。

 

不思議に思って調べてみるとつぎのような記事を発見。

www.dj-mope.com

引用した記事によると、イリノイ州からアクセスしているユーザーはmicrosoftbotによるアクセスなのだとのこと。ここから推測するに、自分の場合もこの方と同様に

botによるアクセスが発生しており、そのスケジューリング設定(?)の影響で木曜日にアクセスされているのではと思うなど。。。

 

以上、取り止めのない内容ですが今日はここで失礼いたします。