Skip to content

Latest commit

 

History

History
24 lines (17 loc) · 1.43 KB

episode-061.md

File metadata and controls

24 lines (17 loc) · 1.43 KB

Episode

Agenda

  • BIG DATA IS DEAD を読んで
    • 最近 Twitter でも界隈でいいね・リツイートされていた記事を読んで二人の感想を紹介

Contents

  • データ量ではなく,より良い意思決定を行うためにデータをどう活用するか,質はどうかを考えることが大事
  • ほとんどの会社はビッグデータと言われる数百ペタバイトのデータを持ってる会社はなくて,数百ギガバイト程度
  • 実際使うデータは直近のデータが多く,古いデータは使わないことが多い
  • 使うデータも期間や用途を絞った形で抽出されたデータが多い
  • 機械学習のタスクにもよるが,最近は少量のデータでどう精度を出すかに傾いている
  • 「古いデータを保管しているのであれば、なぜ保管しているのか」を改めて考えてみても良いかも
    • データを保存することは悪ではないが,保存する Why, What を意識すべき
  • BigData is Deadは言い過ぎな気もするが,筆者が言うほどのデータ量は要らないと思うし,それに対処できる技術も増えてきている印象

Reference