例えば身長と体重のデータから、ある人が男性か女性かを分類、判断したいとします。 すでにある統計データを散布図にプロットすると、男性・女性によって傾向があることが分かったとします。
このデータを元にすると、以下のようなif文でデータから身長と体重から男性か女性かを判断する処理を書けます。
def is_man(height, weight):
return height > 160 and weight < 63
人間はプロットした散布図から傾向としきい値を読み取り、分類・判断する処理を作れます。
このように機械学習でなくてもデータのプロットとif文を使って「分類」する処理は作れます。
ここで、このしきい値を自動で設定する(学習する)のが機械学習です。さらに、人間が判断できないような高次元(身長、体重の他に視力や体脂肪率を含めたデータ)でも分類が可能です。
これが機械学習の根本的な概念で、if文の延長線上にあるものです。