logo

Линейна регресия срещу логистична регресия

Линейната регресия и логистичната регресия са двата известни алгоритми за машинно обучение, които попадат в техниката на контролирано обучение. Тъй като и двата алгоритъма са контролирани по природа, следователно тези алгоритми използват етикетиран набор от данни, за да направят прогнозите. Но основната разлика между тях е как се използват. Линейната регресия се използва за решаване на регресионни проблеми, докато логистичната регресия се използва за решаване на проблеми с класификацията. Описанието на двата алгоритъма е дадено по-долу заедно с таблица на разликите.

предварителна регресия срещу логистична регресия

Линейна регресия:

  • Линейната регресия е един от най-простите алгоритъм за машинно обучение, който попада в техниката за контролирано обучение и се използва за решаване на проблеми с регресия.
  • Използва се за прогнозиране на непрекъснатата зависима променлива с помощта на независими променливи.
  • Целта на линейната регресия е да се намери най-подходящата линия, която може точно да предвиди изхода за непрекъснатата зависима променлива.
  • Ако за прогнозиране се използва една независима променлива, тогава тя се нарича проста линейна регресия, а ако има повече от две независими променливи, тогава такава регресия се нарича множествена линейна регресия.
  • Като намира най-подходящата линия, алгоритъмът установява връзката между зависима променлива и независима променлива. И връзката трябва да има линеен характер.
  • Резултатът за линейната регресия трябва да бъде само непрекъснатите стойности като цена, възраст, заплата и т.н. Връзката между зависимата променлива и независимата променлива може да бъде показана на изображението по-долу:
предварителна регресия срещу логистична регресия

В горното изображение зависимата променлива е на оста Y (заплата), а независимата променлива е на оста x (опит). Регресионната линия може да се запише като:

 y= a<sub>0</sub>+a<sub>1</sub>x+ &#x3B5; 

Къде0и а1са коефициентите, а ε е членът на грешката.

Логистична регресия:

  • Логистичната регресия е един от най-популярните алгоритъм за машинно обучение, който попада в техниките за контролирано обучение.
  • Може да се използва за класификация, както и за проблеми с регресия, но се използва главно за проблеми с класификация.
  • Логистичната регресия се използва за прогнозиране на категоричната зависима променлива с помощта на независими променливи.
  • Резултатът от проблема с логистичната регресия може да бъде само между 0 и 1.
  • Логистичната регресия може да се използва, когато се изискват вероятностите между два класа. Като например дали ще вали днес или не, 0 или 1, вярно или невярно и т.н.
  • Логистичната регресия се основава на концепцията за оценка на максималната вероятност. Според тази оценка, наблюдаваните данни трябва да са най-вероятни.
  • В логистичната регресия ние предаваме претеглената сума на входовете през функция за активиране, която може да картографира стойности между 0 и 1. Такава функция за активиране е известна като сигмоидна функция и получената крива се нарича сигмоидна крива или S-крива. Разгледайте изображението по-долу:
предварителна регресия срещу логистична регресия
  • Уравнението за логистична регресия е:
предварителна регресия срещу логистична регресия

Разлика между линейна регресия и логистична регресия:

Линейна регресия Логистична регресия
Линейната регресия се използва за прогнозиране на непрекъснатата зависима променлива с помощта на даден набор от независими променливи. Логистичната регресия се използва за прогнозиране на категоричната зависима променлива, като се използва даден набор от независими променливи.
Линейната регресия се използва за решаване на регресионен проблем. Логистичната регресия се използва за решаване на проблеми с класификацията.
При линейната регресия прогнозираме стойността на непрекъснатите променливи. В логистичната регресия ние прогнозираме стойностите на категоричните променливи.
При линейната регресия намираме най-подходящата линия, чрез която можем лесно да предвидим изхода. В логистичната регресия намираме S-кривата, по която можем да класифицираме пробите.
Методът на най-малкия квадрат се използва за оценка на точността. За оценка на точността се използва методът за оценка на максималната вероятност.
Резултатът за линейна регресия трябва да бъде непрекъсната стойност, като цена, възраст и т.н. Резултатът от логистичната регресия трябва да бъде категорична стойност като 0 или 1, Да или Не и т.н.
При линейната регресия се изисква връзката между зависимата променлива и независимата променлива да е линейна. При логистичната регресия не се изисква да има линейна връзка между зависимата и независимата променлива.
При линейната регресия може да има колинеарност между независимите променливи. При логистичната регресия не трябва да има колинеарност между независимата променлива.