Machine Learning Kategorier
Supervised Learning
- Supervised learning koncentrer sig på at lære mønstre via forbinde forhold mellem variabler og kendte outcomes og arbejde med labeled datasets
- Feed maskine sample data x og value output af data Y når de er kendt er det labeled
- Algoritmen decipher mønstre som eksistere i dataen og laver en model der kan reproducere den samme underlæggende regl med ny data. Eksempel: for at forudse market rate for at køber en brugt bil, en supervised algoritme kan formluere forudsigelser ved at analyser forholdet mellem bil attributter(fremstillings dato, bil mærke, kilomettal, etc) og salgs prisen på andre biler solgt baseret på historisk data. Fordi supervised algoritme kender til slut prisen af andre biler som er solgt, kan den arbejde baglæns til at determinere forholdet mellem karateristik af bilen og dens værdi.
- Labeled Data -> hvis sample data har adskillige features (år, farve, kilometertal) og korrekt værdi output (2000kr) fordi man kender output og feature værdier er det dataset labeled
- Derefter oprettes der en model: en algoritmisk ligning for at producere et outcome med ny data baseret på reglerne som kommer fra training data.
- Eksempler på supervised learning algoritmer inkludere regression analysis, desicion trees, k-nærest neighbors, neural networks, og support vector machines.
Unsupervised Learning
- Finder mønstre kun ved brug af input data. Dette er brugebart hvis man ikke helt ved hvad man leder efter. Bliver brugt i exploratory analysis af rå data.
- Mest anvendt Unsupervised learning teknikker er af form af Cluster Analysis
- Cluster Analysis -> Man grouper data items som har samme mængder af lighed baseret på karakteristisk værdier
- Clustering Algorithm -> f.eks højde og vægt for at determinere om det en kvinde eller mand. Så ser man på cluster af data.
- AutoEncoder -> Artificial neural network. Autoencoder by design reducere data dimensioner ved at lærer hvordan man ignorere støj i data.
- Unlabeled data indeholder kun dataen og ikke andet det vil sige f.eks hvis man har en frugt skål og den skal identificere 3 frugter, hvis dataen i det initial trainsing set er labeled vil machine learning programmet arbejde fra det perspektiv. Hvorimod i unlabeled vil programmet nødt til at arbejde ved at evaluere hver enkelte billede og kigge på karakteristik som farve, form og andre karakteristik.
Reinforcement Learning
- Er den tredje og mest avanceret algoritmisk kategori indenfor MachineLearning
- Bliver anvendt til spil bl.a. hvor AI’en lærer af erfaring og til sidst kan slå en spiller
- RL forbedre dens model ved at få feedback fra forrige iterationer og continuous learning
- performance criterier med rewards (selvkørende biler der ikke køre galt -> reward)
- f.eks pacman spil -> set of engironement of states S(obstacles, challenges eller pathways i spillet). Sæt af mulige actions til at reagere på de forskellige states er A(up, ned, venstre, højre). Q er starts værdien og har initial 0. Når spillet er igang sker dette:
- Q falder da negative ting sker efter en given state/action
- Q stiger da en positiv ting sker efter en given state/action
- I Q Learning vil maskinen lære ved at matche action for en given state som genere eller vedligholder den højeste level af Q.
Kilder:
https://becominghuman.ai/machine-learning-for-dummies-explained-in-2-mins-e83fbc55ac6d
machine Learning For Absolute Beginners