【英語】純ジャパがTOEFLiBT103点を取るのに効果的だった対策

日本人にとってTOEFLのハードルは高い TOEFLを主催している組織であるETSが発表している資料によると、日本人のTOEFLの平均点はおよそ70点ほどです。平均点が90点以上がざらであるヨーロッパの国々と比べると「そりゃそうだろ」という感じですが、実は中国、…

【Excel】キーワードを含むかどうかでカテゴリ分けを行う

データのカテゴリ分けをしたい 「商品名の一覧」のようなデータを与えられたとき、それぞれの商品名がキーワードを含むかどうかでカテゴリ分けをする方法をご紹介します。 下図のように「商品名-カテゴリ」の対応表を作ることが目標になります‍♂️ キーワード…

【R】5つの基礎的なグラフ描画関数(stripchart, hist, box, plot, qqnorm)

Rで使う基礎的なグラフ関数 箱ひげ図、ヒストグラムなどはRでデータを可視化する際に頻繁に使うのですが、 脳内であまり整理されていなかったため、基礎的な5つのグラフ関数としてまとめてみました。 データセットにはRに組み込まれているFisherのirisデー…

【Excel】AND/OR関数を使って複数条件に合うものを抽出する

AND/ORを使って集計をしたい Excelを使って集計を行う際、単純な条件ではなく複数条件を論理式で繋いで集計したい場合があります。 このような場合はAND/OR関数を使って集計するのがよいでしょう。以下に具体例を示します。 AND/OR関数を使う A君~F君の6人…

【KDD2018】論文『Customized Regression Model for Airbnb Dynamic Pricing』を読んでまとめた

はじめに 2018年8月19日から23日にかけてロンドンで行われたKDD2018(データマイニングの世界的なカンファレンス)に採択されていた『Customized Regression Model for Airbnb Dynamic Pricing』なる論文を読みました。 Airbnbで実装されている価格推薦モデ…

分析用のデータが「汚れ」てしまう7つの原因

分析用のデータが「汚れ」てしまう データサイエンティスト(コンサルタント、マーケターなども然り)として日々データに向き合っていると、世の中には「汚れ」ているデータばかりだと気付くだろう。 欠損値だらけの歯抜けのデータだったり、特定の領域に偏…

【因数分解】ビジネスシーンで頻繁に使われる理系用語10選

ビジネスシーンで使われる理系用語 理系の人がビジネスの世界に飛び込むと「課題を因数分解すると・・・」「最大公約数的な意見にはなるが・・・」など、高校までのカリキュラムに登場する数学・理系用語が日常会話の中にふつうに登場しているのに驚くのでは…