ALGORITIMII si predictia Rezultatelor la Fotbal. SVM, Naïve Bayes, Random Forest. Care este mai bun

Tehnicile de Machine learning (invățarea automată) ne permit să obținem informații cu privire la datele cu ajutorul cărora ne propunem să acoperim extragerea caracteristicilor pentru analiza predictivă a rezultatelor meciurilor de fotbalului și să efectuăm calcule algoritmice pentru a obține o perspectivă asupra acestora.

Sistemul matematic va efectua analiza bazată pe setul nostru de date și va implementa mai mulți algoritmi de clasificare, cum ar fi: SVM, Naïve Bayes, Random Forest etc,

Caracteristicile sistemului nostru includ atributele echipei care sunt calculate prin luarea în considerare a evaluărilor cumulative ale jucătorilor și ale coeficientului echipei.

Acești factori sunt apoi transformați într-un singur fișier CSV.
generator matematic predictii fotbal pronosticuri corecte sau eronate

Aceste date pentru minerit sunt clasificate în Home (victoria gazdelor), Away (victoria oaspetilor) sau Draw (egalitate) pentru fiecare echipa in mod individual, luând în considerare parametrii prin diferiți algoritmi de clasificare.

Rezultatul sub formă de matrice de confuzie care compară rezultatul real cu rezultatul prevăzut, va fie apoi afișat.

1) Atribute ale echipei: Evaluarea echipei de acasă și Evaluarea echipei în deplasare

2) Quotientul* echipei : Quotientul echipei acasă și Quotientul echipei în deplasare

3) Date pentru "minerit": Atribute ale echipei + Quotientul echipei

4) Algoritmi de clasificare: SVM, Naïve Bayes, Random Forest

*Quotient egal cantitate produsă prin împărțirea a două numere.

Quotientul echipei acasă este egal cu numarul jocurilor  castigate de echipa gazda impartit la numarul total de jocuri de acasa. Identic calculam si Quotientul echipei în deplasare.

Acest lucru ne permite să înțelegem performanțele fiecărei echipe in jocurile disputate acasa si in deplasare și să luăm în considerare forma asociată, împreună cu evaluările echipei.

Cateva cuvinte despre algoritmii ML (machine learning utilizati) si rezultatele obtinute

1) Naïve Bayes: Un clasificator naiv Bayes consideră că caracteristicile contribuie independent la probabilitatea rezultatului.

Naïve Bayes va lua în considerare ratingul pentru echipa de gazdă, echipa din deplasare și coeficientul lor independent, pentru a clasifica rezultatul la timp complet.

Aplicarea acestui algoritm duce la obținera ueni rată de eroare de 0,44 pentru datele de invatare și 0,45 pentru datele de testare.

Pentru datele noastre de testare, clasificatorul Naïve Bayes a fost capabil să clasifice 209 victorii din 330 cu exactitate de 0,63, 15 remize au fost clasificate cu exactitate din 35, cu precizie de 0,42, iar 106 infrangeri din 223 au fost clasificate cu precizie de 0,47.

2) Support Vector Machine Clasificatorul de asistență vectorial care construiește hiper-planuri

SVM kernel RBF a fost aplicat anterior cu succes pentru clasificarea datelor de fotbal, acesta a clasificat datele noastre în trei clase Home Win, Away Win și Draw.

Cei mai buni parametri pentru SVM au avut funcția de cost de 1, funcția gamma de 0,2, 995 de vectori de asistență, atingând rata de eroare de 0,40 pentru antrenament și 0,42 pentru setul de date de test.

Support Vector Machine  a fost în măsură să clasifice cu exactitate 229 de victorii din 353 având o precizie de 0,64, 46 de remize au fost clasificate cu acuratețe din 83 având o precizie de 0,55 și 90 de infrangeri din 152 au fost clasificate cu o precizie de 0,59

3) Random Forest: Random Forest Classification functioneaza prin colectarea de arbori decizionali care nu au legătură.

În sistemul nostru Random Forest a avut rate de eroare mari în comparație cu SVM și Naïve Bayes de 0,496 pentru setul de date de instruire și 0,498 pentru setul de date de testare.

Random Forest a reușit să clasifice cu exactitate 186 de victorii din 318 având o precizie de 0,58, 39 de remize au fost clasificate cu acuratețe din 133 cu o precizie de 0,29.

CONCLUZIE

Algoritmul cel mai performant în sistemul nostru pentru a prezice rezultatele meciurilor de fotbal a fost SVM cu o precizie de 0,599, urmat de Naïve Bayes de 0,55, care este mai bun in prezicerea rezultatului final decât casa de pariuri Pinnacle Sportsin, care a avut o precizie de 0,55, care este echivalentă cu cea obținută de Naive Bayes.

Această acuratețe poate fi îmbunătățită suplimentar prin adăugarea unor funcții mai relevante care dezvoltă modele care iau în considerare aspecte și mai largi ale jocului de fotbal.
MAI POTI CITI