データはどうやって使うの?

ブログの書き方第2弾

前回の続きです。このブログが「NBA」を「データ」を使って「語る」事になった理由を書いているわけですが、主題がデータになった理由は、どこの誰だかわからない管理人が記事の内容だけで読者を、それもNBAをよく見ている層を読者にしようとしたのですから、それなりに「説得力」が必要になります。それが「データ」でした。

NBAを見ながら語ります!

読者がNBAをよく見ている層で、かつ戦術やら何やらと自分が気になったことを書くわけですから、この題名でも良いわけです。でもさ、この題名の時点で一体何を「語る」のか伝わらないでしょ。

NBAのデータ見ながら語ります!

この題名だけで主題がわかるでしょ。このブログが何なのか。そして途端に「説得力」が出てきます。語っているだけのブログから、データ使って考えるブログに大変身です。それを一見さんにも理解してもらいたいわけです。だから題名って大切だし、考えて考えての題名です。本当は「語ります」が重要なのですが、「データ」でテーマ設定したみたいな。

正直言うと、最近はデータなんか使わなくっても納得してもらえることが増えたので、主題が消えかかっているのですが、それでもやっぱりデータは重要です。

◎データはどこからもってくるのか

NBAスタッツのみです。たまにリーグ平均を観たいときに他のサイトを調べることもありますが、基本は公式スタッツのみ。NBAは公式だけで充実した情報を得られるので素晴らしく、Bリーグはなんであんなサイトなのか理解に苦しみます。

しかし、この公式スタッツは気を付ける必要もあります。まず、数字の意味がわからないことが頻繁に発生します。2か月間ミネアポリスに旅行していただけの管理人の語学力では苦しすぎました。なんとなくはわかっても計算式がわからない事が多い。一応、各スタッツの説明ページもあります。

https://stats.nba.com/help/glossary/

欲しいものがなかったり、自分で数字を編集しなおすこともたまにありますが、概ね気にすることはありません。その意味では非常に使いやすいし、これよりも詳細な数字ってことになると専門的になってきます。

「詳細な数字」にも注意が必要です。詳細すぎるとサンプルスケールが小さくなり偶然の要素が増えてきます。これはシーズン序盤あるあるです。30試合くらいを経過してこないとサンプル数として不足しているイメージがあります。逆に言うと「ここ10試合好調」くらいだと数字的な変化が起きていることが多いので違いをとらえやすくなります。

スマートがスターターに加わって7連勝した時の話は、ただシュートが決まって強かったことよりも「パス数が40本も伸びた」ってのが大切でした。非常にわかりやすいデータの変化です。このパス数は比較的、変動しにくい数字であり、3P成功率みたいに一時の好調さにはなりにくい数字です。だけど、試合をなんとなく見ていても気が付かない変化でもあります。

ここは気を付ける点です。「シュートが決まった」ってのは最も信用してはいけない数字で、それは単なるスタッツです。データってことになると、その一歩手前で「何故、シュートが決まるのか」を探したくなります。

偶然性が高い数字の変化+必然性が高い数字の変化

こうなるわけですが、後者ってめったに見つかりません。だから結局は「数字よりも自分の感覚が大切」だと思っています。わかりやすい変化とそこにある理由を必ず探しましょう。その中にはデータじゃなくて単なる個人の感想になるときもありますよ。

好調なチームの理由を探すパターンは、数字の変化とその根拠を探すという方法でした。これはどっかのチームが勝っているときに、無理やりでも理由を探したいときのパターンです。でも、日常的には試合を見て自分が感じたことで書いていくのが基本です。

◎日常的なテーマ設定

自分が感じた感想をデータで確認してく作業を繰り返してテーマを探していきます。最近は同じチームを3試合くらい連続でみることにしていますが、それによって違いを探していきます。ここではゴベアーの例をとってみましょう。オフェンス面での活躍が目立つようになったゴベアー。だけど、平均点は2.4点しか伸びていません。テーマとして書くには苦しい程度の成長です。

しかし、元々フェイバーズの方がお気に入りだった管理人的にはゴベアーがフェイバーズに近づいた感じがあったので、そのステップワークの向上がわかりやすくみえていました。言い換えれば、あくまでも「試合を見て気が付いた」要素を文章にしていく流れでした。

でも、「ゴベアーは上手くなった」じゃあ誰もすんなりと受け入れてはくれません。ここでYouTubeを登場させることもできるわけですが、「上手くなった」を表現するのは難しかったりします。下手だったころの動画をいっぱいもってきて、改善した部分と的確に比べる必要があります。かなり大変。一方でデータ的には非常にわかりやすい変化がありました。

〇アリウープ
38本 → 100本
〇ダンク
161本 → 244本

とってもわかりやすくゴベアーの進化した部分であり、何故こんなに増えたのかという理由については管理人の印象を文章化して埋めていきました。ちなみに一般層に向けるならこの数字のみで書いて、ブログ的にはもっとデータを探してきました。

〇シュートまでのドリブル数
0ドリブル 5.8→7.4
1ドリブル 0.9→0.8

これもわかりやすい数字です。ダンクが増えたけど、ドリブルしないでダンク。アリウープも含めて、「ゴベアーのシュートまでの一連の動作がスムーズになった」と堂々とかけるデータが揃ったわけです。

自分で気が付いたことをデータで証拠集めする。

日常はこの繰り返しです。なんならデータが揃わないときもありますが、そこは記事にしないときもあるし、それでも記事にするときもあります。記事にしたパターンだとジョン・コリンズ

正直、数字にならなかったけど、だからこそ『魔力』という題名になりました。これは昨シーズン前に書いた記事ですが、無事にブレークしているのでしてやったりです。

コリンズといえばもう1件あって、2018年ドラフト組をランキングした時に1位ドノバン・ミッチェル、2位ディアーロン・フォックス、3位ジョン・コリンズにしました。世の中的にはクズマやテイタムの方が知られており、ホークスへの注目度の低さもあってコリンズの名前が出されたら一般層には否定されそうですが、そうはならない本ブログの読者ならではの事情もありました。みんなそれぞれの意見があって良いんだよ、という感じ。

◎データから考える

そんな1位のドノバン・ミッチェルについては、初めて見た時から衝撃を受けました。ジャズの注目度も低い時期だったので、埋もれていたころですが、あまりの衝撃に何かを書かずにはいられませんでした。考えた結果、データから書いていくという非常に珍しい記事になっています。

これは個人的にもターニングポイントの記事になっていて、こういう形で書けるってことと、選手の特徴を分析してから試合を見ることで、なるほどと思わせるプレーが増えてきました。おススメの方法なのですが、ドノバン・ミッチェルの数字が特徴的すぎるだけっていう話もあります。

だからこのパターンだと書きたくても書けない選手の方が多くなります。それに比べるとチームの分析はデータから考えることがやりやすくなります。シーズン後半に一気に上がってきたマジックについては、数字から特徴を調べて、それを基に考えていく手法を取りました。

始めにチームスタッツの中で特徴的な部分を抽出し、そこから個人のデータとの関係性を調べていく流れです。もちろん、大体のイメージは事前に固まっていますが、マジックの場合は全員が頑張る理論のチームなので、試合を見ているだけでは理解しにくかった部分をデータで補って、頭の中で再構築しています。具体的にはゴードンとアイザックのディフェンスの良さは頭の中にあり、それが数字的にどうなのかを探しています。

一方で、ここで発見したのがキース・ビーチの存在。昨シーズンのデータにおいて最大級の発見だったといえるビーチは、データを調べてからプレーを見た特異な例です。もちろん見たことはあるものの、ベンチメンバーなので短いプレータイムと限られた役割で評価するところまでは行っていませんでした。

ところがデータで知ってからのビーチの驚異的なディフェンス能力からは目が離せなくなりました。マジックのディフェンス時はボールよりもビーチを探しちゃうよね。

管理人はNBAを本格的に見始めて2年ですが、この期間にほとんどの選手の特徴を抑えられるようになったのはデータのおかげ。きちんと検索していくと、その特徴が浮かび上がってきます。ブログ的には証拠探しのデータですが、試合観戦としては予習になるデータです。

こうして気になる選手を試合からもデータからも調べることにしています。ただ、データから調べるパターンが記事になることはレアです。それだけ無駄に検索しているわけです。「ブログを書くため」には検索せず、「知らない選手を知るため」には検索するって感じです。

◎ボツになりかける

ボツになるデータも多くありますが、この記事はシーズン中はボツにしていたのが「そういえばシーズン中から気になっていたデータってどうなったんだろう」とシーズン後に調べたら十分に記事になる数字になっていた例です。

開幕から試合時間が長かったクリッパーズ。その理由がとんでもない数のフリースローを打っていたから。でも、そこまでだとファールコール問題なんかが絡むので一概には言えませんでしたが、シーズン後でデータが揃ったのだからかけた例です。ボツだと思われていたのがボツにならなかった。

要するに気になったことがあったら調べておいて、でも即座に記事にするとは限らないわけです。シーズン中は特にその傾向が強く、ゲームレポートばかり書いているので、その積み重ねがまとまると記事になっています。結局はデータも調べるし、試合も見ている。

◎データでブログを書く

「NBA」の「データ」で「語る」ブログですが、やっぱり最終的には「語る」ってのが大切で、データはそのための道具です。道具をどうやって使うかはセンスも問われるし、日常的に扱っているかどうかです。

管理人は営業的な仕事は一切経験したことがありませんが、資料を作ってプレゼンする機会が多く、そのために必要なデータを探してくるのが日常茶飯事です。NBAとは関係ない部分でも使っているのがブログを書くのには役立っていると思います。でも、そんなバックボーンがなくても書くためには、手法を1つに統一してみるべきかと思います。いろいろやろうとすると上手くいかないしね。

あとデータの場合は、基本は比較すること。だから特定の選手を引っ張ってきて3年くらいの数字の変化を調べるとかが現実的なブログの書き方になります。「語る」のでなければ、そういう書き方になるんじゃないかな。

このブログの良いところはネタがつきないことでした。移り変わりの激しいNBAでは数字が揺れ動き、その時その時の流行系と対抗系が存在するので次から次に新しいデータが登場します。ネタを探しに行くのは自分自身ですが、「何書けばよいかなー」って時にはデータを調べて、普段触れていないことを探したり、特定のチームの分析をしてみたり。30チームを見るから尽きないし、飽きないし。管理人に時間とやる気さえあれば書けます。

そして今回書いてきたような内容はブログ読者にも追体験してもらえるのも面白い部分です。データで紹介された内容は管理人の主観ではないので、試合観戦で注目すべきポイントになりやすくなります。

このドラモンドの記事何かは「ドラモンドはリバウンドが強い」のではなく、なぜ強いのかがわかるようになり、試合を見ながらそれを体験できるし、逆に「このリバウンドは強くない」ってこともわかるので、対戦相手がプレーを工夫していればそれも理解できます。

つまり共感を得やすいというか、データから試合を見ることでブログへの納得性も高まるわけです。個人の感想よりも細かい部分にツッコめるし、見どころをわかりやすくしてくれます。

管理人自身もこういった「見た目ではわかりにくい良さ」を紹介するのが好きです。カリーの例でいえばほとんどのケースで「超高確率の3P」ばかりが紹介されますが、それよりも「誰よりも走るってことを知ってほしい」みたいな。

ということでデータでブログを書くことについて紹介してみましたが、どんなことを書きたいかでデータの使い方も様々です。「NBA」を「語る」ってのが主題であり、そこに「データ」を絡ませたのが本ブログであり、管理人が書きたいことに近づくためには必要なものでした。

ということで手の内を明かしたような第2回になりましたが、明かしたところでってのも正直あります。このスタイルを丸パクリされたら困るけどさ。それはもうパクリといわれるでしょうし。まぁ別にいいかってことで書いてみました。

NBAブログを書いてみたい方で方針に迷っている場合は、参考にしていただき、方向性の再構築をしたい場合は定価100万円のところを今なら99%オフで相談を承わまわまわーります。

データはどうやって使うの?” への10件のフィードバック

  1. 趣味とビジネスは紙一重で難しいですね。

    ・HCポポビッチがNBAに残したもの
    ・レブロンとKDが次世代にもたらしたもの
    ・ホーネッツとサンズの暗黒時代が終わらない理由
    もし長いスパンで見ていくなら、この辺りの大きなテーマがみたいですね。

    1. ホーネッツはフロントが中途半端な選手に金使いたい病気
      サンズはオーナーがフロントには金使いたくない病気

      だと思っていますが、そういうニュースみたいなのはプレーからは説明できないんですよね。

  2. 逆に幻想が膨らみすぎてる感のあるポポビッチの現在地を示してほしい
    名将には間違いないですが、HCといえばみたいにアイコン化するほどか?と常々思ってまのど

    1. うちのブログは「ポポビッチを神格化するな」路線です。
      USAはポポビッチが悪かったと絶賛批判中!

  3. スタッツの+/-は実は意味のない数字だったみたいな海外の記事を最近見た記憶があり、自分もあのスタッツは懐疑的なのですが管理人さんはどう思われますすか? 一試合だけで見てもあの数字は意味がないかと。

    1. あれはあまり意味ないですよ。
      その瞬間に相手チームのメンバーにもよりますしね。

      だから意味があったと思う試合では使い、なかったと思う試合では使いません。

      交代直後にフリースローだったときとか、意味ないですしね。

  4. NBAブログをなんとなく探してあさっている時に『データ』でつられ読み出しましたが、今では管理人さんの『語り』の方が僕的には楽しみです。

    なら『語り』系のブログが好きって話でもなんいんですよね。『語り』なんて、『好み』だし、人それぞれだし。管理人さんのデータで説明しつつ、好みを披露するのが、体育館で一緒にバスケをしたこともない、

    家で一緒にNBAを観たこともないのに、『お互いの好みを』尊重しながら意見を言い楽しむ。(実際会ってバスケしたりNBA談義したら意見の相違で仲良く出来ないかもだし 距離感って大事 そーそー自分と相性のいい人なんて世の中にいないのが通常だと思っています。相性が良いことの方が異常でありレアケースだと思う今日この頃)

    楽しみを膨らますのが近いかな。

    まぁー とりあえず、管理人さんのタネあかしすら、『管理人さんらしさ』をこちらとしては楽しんでいます。

    『需要』と『供給』ですかねー。

    いつも目新しい話題やスポーツのプレーを文章化してもらってまたバスケを考える日々です。あざっす。

    ちなみに、Gリーグで試験導入するらしいフリースロー本数変動や4Pルール導入はあんまりして欲しくない派です。 2時間で試合が終わらないのは48分ゲームのNBAだからかと。国際試合の40分でも2時間ちょいかかる放送の時もあるし。

    クラッチタイムとフリースロー以外、サッカーやラクビーのよーにタイム流しでやりゃー、時間がきたら終わるんだし。48分ゲームでタイム止めしてたらそりゃーオーバータイムいってないのに、3時間コースになっちゃうのがクリッパーズ戦法だしね(ドック・リバース戦法かな)

    1. 4Pゾーンは不要です。それってロングシュートびいきになってしまうので。

      フリースローの話は、よくよく考えると、そんなに悪くもないんですよね。
      ただ、ファールゲームの価値が高まるので、試合時間が短くなるようで終盤が長くなるのではないかと。

  5. 数字で語るとき難しいのは、人によって数字の捉え方が変わる所ですね。
    どうしても数字を答えとして扱う人がいる、優勝回数とかMVPとかのレガシー系はいいのですが、アドバイススタッツをそう捉えると話が進まないという。
    あくまでもスタッツは傾向と思って欲しいものです。
    2.3年前は僕も散々スタッツで語ってたので苦い思い出があります。
    短期的な議論でのスタッツはそれを自然と傾向と捉えてくれるので相性はいいんですが、選手のキャリア全部を終えての評価等では途端に数字=答えになってしまう。
    これESPNは上手くて、スティーブンAは印象論でマックスが統計論というプロレス構造にしてるんですが、二人ともちゃんと実際の事象を踏まえてわりと中立寄りなんですよね。
    そして結果無難な答えに行き着くんですが。
    まぁ個人サイトには無難ではなく鋭い視点を求められるでしょうが。

コメントする

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA