Я знаю о градиентном спуске и теореме о обратном распространении. То, что я не получаю, - это: когда используется важность смещения и как вы его используете?
Например, при отображении функции AND
, когда я использую 2 входа и 1 выход, он не дает правильных весов, однако, когда я использую 3 входа (1 из которых является смещением), он дает правильные веса.