Как да тълкуваме „загуба“ и „прецизност“ за модел d; машинно обучение

Когато тренирам невронната си мрежа с Theano или Tensorflow, те ще отчитат променлива, наречена "загуба" за епоха.

Как да тълкувам тази променлива? По-високата загуба е по-добра или по-лоша, или какво означава това за крайната производителност (точност) на моята невронна мрежа?

Колкото повече загубата е ниско , толкова по-добър е моделът (освен ако моделът не е твърде подходящ за данните от обучението). Загубата се изчислява, когато обучение и няколко валидиране и неговото взаимодействие е представянето на модела за тези два комплекта. За разлика от точността, загубата не е процент. Това е сбор от грешките, допуснати за всеки пример в обучителните или валидационни набори.

В случай на невронни мрежи загубата обикновено е отрицателна логаритмична вероятност и остатъчна сума от квадрати съответно за класификация и регресия. Тогава, естествено, основната цел на тренировъчния модел е да намали (минимизира) стойността на функцията за загуба по отношение на параметрите на модела чрез модифициране на стойностите на вектора на тежестта чрез различни методи за оптимизация, като например обратното размножаване в невронни мрежи.