【後編】西内 啓
統計はただの数字ではなく、人間が作るもの
統計データを意思決定に活用するには
2024.12.19
日々、年齢別の給与平均に一喜一憂したり、成果の数字を求められることにストレスを感じたりする私たち。エビデンスが重要だと理解しつつも、「どこか冷たく人間味を感じられない」と考えている人もいるかもしれません。
でも、シリーズ累計53万部突破の著書『統計学が最強の学問である』で統計ブームを起こした西内啓さんは、「人間を理解したい」という興味から生物統計学を専攻し、統計家に。統計データを意思決定に活用するには、そこに関わる人間を理解することが重要だと言います。
膨大なデータを分析し組織や企業を課題解決に導くための統計的思考とはどんなもので、西内さんはどのように身につけたのでしょう。前編に続き、西内さんに伺います。
( POINT! )
- アウトカムは「どんないいこと?」
- 統計家の仕事はデザイン
- 統計的・計算機的・人間的側面が大事
- 人間を理解するための統計学
- 世の中はよくなっている
- レベルUP経験を増やす
西内 啓
1981年生まれ。東京大学医学部卒(生物統計学専攻)。東京大学大学院医学系研究科医療コミュニケーション学分野助教、大学病院医療情報ネットワーク研究センター副センター長、ダナファーバー/ハーバードがん研究センター客員研究員を経て、2010年より企業と行政のデータ活用プロジェクト支援に多数従事した後、2024年11月に株式会社ソウジョウデータを創業。著書に累計53万部を突破した『統計学が最強の学問である』シリーズ(ダイヤモンド社)のほか、『1億人のための統計解析』(日経BP社)、『統計学が日本を救う』(中公新書ラクレ)などがある。『マンガ 統計学が最強の学問である』(漫画:うめ/ダイヤモンド社)は2025年4月発売予定。
「どんないいことがありますか?」を意思決定に
統計データを意思決定にいかすため、統計家にはどんなセンスが必要でしょうか。
西内
必要なのは、センスより理詰めで考えられるところですね。私は「アウトカム」という表現をよく使っています。アウトカムは結果変数や従属変数と説明されることもありますが、「どんないいことがありますか?」という意味合いで使っています。
いいこと?
西内
「こうなったら嬉しい」というものに対して何かが関係していることがわかれば、関係してるものをうまく使うことで、より嬉しい状況に変えていけますよね。そういうことが統計学の分析手法の本には説明されていないことが多いです。
医療でデータ分析が一般化したのは、生死という明確なアウトカムがあるからだと思います。蓄積されたデータから高血圧がある病気の発症に関係しているとわかったら、血圧を下げる対策が死亡率にも関係するだろうと考えられますよね。
この場合、「死亡率が下がった」が「いいこと」ですね。
西内
アウトカムを究極のところ、例えば死亡率から逆算して、短期間で集められる限られたデータでここがこうなっていたら明確にいい結果になるというものに設定するのが重要です。逆にどうでもいいものを分析してもどうでもいい結果にしかなりません。それがデータを使うことの意味なんです。
ビジネスの世界でも、たとえば「管理会計上、このプロジェクトの営業利益が上がっていてほしいね」という希望に対して、「結果がわかるのはプロジェクトが終わる3年後」だと意思決定にはつながりにくい。でも、営業利益に関係しているのはどこだろうと考えたらもう少し手前で、人件費の削減や営業効率の最適化といった改善ポイントがわかります。そこが見えてくると分析結果が面白いものになるというイメージです。
「統計家の仕事はデザイン」
与えられたデータから数字を出すだけではなく、「この結果のためにはこのデータが欲しい」と考えられることも大事ですよね。そうなると、幅広い視点が必要なのかなと思います。
西内
そうですね。私の師匠、生物統計学者の大橋靖雄先生は「統計家の仕事はアナリシスじゃない。圧倒的にデザインだ」とおっしゃっていました。データの取り方や分析の仕方といった設計の仕事が重要で、それがきっちりできていたら分析自体はそんなに難しいことじゃないと。そして、データサイエンティストの育成には3つの要素が大事だといわれています。
何でしょうか。
西内
統計的・計算機的・人間的側面です。「統計的」は数学というより統計学。今のディープラーニングやLLMも統計的機械学習といわれる技術を使ってできているぐらい、統計学的な基礎が大事です。
また数式で統計学が理解できるだけではあまり意味がなくて、扱うデータに必要な規模のコンピューティングリソースを自前で用意して運用できるようになるためには「計算機的」、コンピュータサイエンスの考え方も必要です。
そして、データサイエンスを活用するには人間との接点が出てきます。たとえばマーケティングなら消費者の、人事なら従業員の、あるいはビジネスモデルに関わる社内外の様々なオペレーションなど、そこに関わる人たちを理解する「人間的側面」が重要です。そこがあってはじめて統計と計算機が役に立ちます。
たとえば医学でも、人体がどういうふうにできているとか、今医療制度上どういう問題が議論されているかみたいなところがわかっていると、意思決定につながる分析ができます。
「数字には血が通っていない」といわれることがありますが、数字には人間の営みが反映されていて、人間的側面がないと読み取れないということですね。西内さんは人間への興味から統計家の道に進んだそうですが。
西内
高校で進路を考えるとき、「人間を理解したいな」と思ったんです。それで東大の理科二類に進みましたが、遺伝子や脳というミクロのことを見てもあまり人間がわかった気がしなくて。人間理解のためには様々な実証研究や調査実験などが行われていて、それを支えるのが統計学です。そこで「人間を理解するための統計学ってなんだろう?」と考えて医学部のなかの生物統計学を専攻しました。
その後、人間はわかりましたか?
西内
ありとあらゆる業界のデータを分析してきて仕事にまつわるデータや人間について勉強できたおかげで、昔よりは解像度が上がったと思います。
「世の中はよくなっている」。レベルUP体験を増やしていく
データから何かを読み取るようなことにはいつから興味があったんでしょうか。
西内
データ分析みたいなことを人生で最初にしたのは、多分ドラクエのレベル上げですね。小学生のとき、ゲームは1日1時間までに制限されていたので、ゲームを進めるには、レベル上げを効率化する必要がありました。そして山のほうのエリアに敵が多く出現するという噂を聞いたので、ストップウォッチ片手に出現数と得られた経験値を記録してみたんです。当時は誤差の検証まではできなかったけど、明らかに山のほうがよかったんですね。
その経験のように「よくしたい」欲望があるから、データを集めて効率化する発想が生まれるんですよね。そう考えると、「データ分析したい」より「効率化したい」が先にある気がします。
ドラクエから効率化が。
西内
さらに、スーパーファミコンの赤いランプを油性ペンで塗りつぶして目立たないようにして、倒しても倒しても敵が増え続ける一方で味方側も全滅しないような膠着状態を作って、洗濯バサミでコントローラーのAボタンを留めたんです。1日その状態で放置した後学校から帰って敵を倒すとレベルUPの音が鳴り止まなくて。人生で初めてくらいテンションが上がりました。
そういう経験は実は今もあります。ITもAIも好きなのは企業が無限レベルUPできるような仕組みができるから。それで企業のAI活用やデータ分析を支援する会社も作りました。
洗濯バサミのときと、仕組みを考えるワクワク感みたいなものは変わらないのかもしれませんね。最後に、西内さんの未来へのビジョンを教えてもらえますか。
西内
そうですね、一般論でいうと世の中はいろいろよくなっていて。
よくなっているんですか?
西内
最近、特殊詐欺や闇バイトによる強盗が話題になったので治安が悪くなったと言う人が多いですが、たとえば詐欺も強盗の件数は20年前と比べてかなり減っているんですよ。データを見れば日本の治安はよくなっていることがわかるし、世界の貧困や飢餓をみても全体の指標はよくなっているんですよね。
不安な話のほうがPVを稼げるのでそういう情報が増えることもありますが、自分の感覚を偏らせずにいたほうがいいと思います。
でも、人口減少のデータから不安を感じている若者が多いです。
西内
ちなみにデータ上、国が経済成長するかどうかと人口が増えるか減るかはあまり関係ないんです。どちらかというと、人口が増えてるほうが緩やかに経済成長にマイナスの関係があると指摘されています。では何によって経済成長するかというと、教育と研究開発。それによってイノベーションを起こせるかで未来が変わります。
研究して技術開発をして新しいビジネスを作ること。それができなければ経済は成長しません。「成長しないから」みたいな話ではなくて「させる」のだと。すべての大人がそこに本気で取り組む姿を見せ続けることが大事なのに、逆に若者の不安をあおってどうするんだと思いますね。
ちょっとがんばって生産性が上がったことで稼いだお金を使って楽しかったとか。そういうレベルUP体験をくり返す人が増えていけば、日本全体として素敵な未来を描けるようになると思います。
[取材・文]樋口 かおる [撮影]小原 聡太