AI
På afterwork i begreppsdjungeln
20/02/2018 | Skriven av: Therése Svensson
Share this post:
AI, machine learning, deep learning, prediktiv analys och data mining, vad betyder de egentligen?
För några år sedan när jag var nyanställd på IBM befann jag mig på en after work för ”young professionals”. Den mest ställda frågan denna kväll var ”Vad jobbar du med?”. En fråga som jag stolt besvarade genom att berätta att jag jobbade som teknisk specialist med programvara inom området prediktiv analys. Min civilingenjörsutbildning på Uppsala universitet hade inkluderat ett flertal kurser i statistik, modellering och data mining. Dessa kurser hade väckt ett intresse och gjort mig beslutsam att söka examensarbete såväl som jobb inom data mining. Att jag sedan fick en roll som teknisk specialist för IBMs data mining-programvara passade perfekt in i mina planer. Det var också det som låg bakom stoltheten när jag besvarade kvällens hetaste fråga ”Vad jobbar du med?”. Efter att ha ställt denna fråga ett antal gånger under kvällen samt besvarat den ungefär lika många gånger blev jag presenterad för en person som ställde en bra och samtidigt lite jobbig fråga. Han undrade nämligen om prediktiv analys var samma sak som artificiell intelligens och om inte, vad var egentligen skillnaden?
Jag insåg att jag inte var helt säker på svaret trots att jag själv ansåg att jag borde veta detta, något som fick mig att fundera. Artificiell intelligens är långt ifrån ett nytt begrepp men måste nog ändå under sent 2010-tal fortsatt kategoriseras som ett buzzword. Det finns många nyare och kanske hetare buzzwords inom området som machine learning, deep learning, data mining och prediktiv analys. Men vad är egentligen skillnaden? Dessa uttryck används ofta lite slarvigt som synonymer men du anar nog, precis som jag gjorde när jag fick frågan under den där AW:n, att det finns skillnader i begreppen.
Artificiell intelligens använder sig av data mining
Jag var naturligtvis tvungen att ta reda på vilka dessa skillnader är. Förenklat kan man säga att artificiell intelligens använder sig av data mining-algoritmer och av dessa är deep learning-algoritmer de mest komplexa. Begreppet machine learning används av vissa personer ganska synonymt med data mining. En annan definition är snävare där machine learning ses som synonymt med deep learning. Oenigheten bidrar naturligtvis till begreppsförvirring. Personligen tillhör jag skaran som använder en snävare definition av begreppet machine learning. Den mer vedertagna definitionen är dock den bredare, därav kommer jag här presentera machine learning som synonymt med data mining. Jag vill understryka att det i teorin finns en viss skillnad mellan machine learning och data mining men i syfte att mingla självsäkert på en AW är distinktionen obetydlig. Om du tyckte att det här var svårt att hänga med på, misströsta inte. För att förstå skillnaderna; låt oss gå in på lite djupare på de olika begreppen.
Artificiell intelligens (AI)
AI handlar om system som anses vara intelligenta för att de har vissa egenskaper som anses typiskt mänskliga. De egenskaper som avses är exempelvis förmågan att förstå naturligt språk, förmågan att analysera bilder och förmågan att lära sig. När begreppet myntades för över 50 år sedan handlade det om helt andra egenskaper än vad vi idag talar om som AI. De första datorerna ansågs troligtvis vara en typ av AI medan vi idag inte skulle tala om AI när vi diskuterar en vanlig laptop. Detta beror naturligtvis på att de egenskaper vi tillskriver tekniken ständigt utvecklas vilket medför högre förväntningar på tekniken. En smartphone år 2018 är inte längre så smart. Den är snarare standarden och definitionen för vad en telefon är idag. På samma sätt förändras också de egenskaper som utmärker AI.
Machine learning (ML)
Förmågan för system att lära sig är som begreppet antyder själva definitionen av machine learning. ML gör att system kan lära sig att hantera situationer som de inte blivit hårdkodade att hantera. Det vill säga, med hjälp av matematiska algoritmer går det att lära systemet hur det ska agera i olika situationer baserat på historiskt data från tidigare situationer. De tekniker som används inom ML för att göra detta kan delas upp i två användningsområden. Dels finns tekniker för att hitta generella mönster i data som exempelvis när du vill skapa kluster för att kartlägga kundgrupper. Det andra användningsområdet är att se hur ditt data förhåller sig till något specifikt såsom bedrägeri eller komponenthaveri. Inom det senare användningsområdet används så kallad prediktiv analys.
- Prediktiv analys används alltså för att beräkna sannolikheten för ett visst utfall och göra en prediktion. Tänk exempelvis att du vill veta när olika komponenter på din bil behöver bytas. Du vill inte att bilen ska bli stående trasig vilket innebär att komponenterna måste bytas innan de går sönder. Då du själv inte vet exakt vilka tecken som finns på att till exempel växellådan håller på att haverera, så kan du inte hårdkoda in regler för när denna ska bytas. Om du hade fått ta del av data från ett stort antal andra bilar skulle du kunna använda prediktiv analys för avgöra sannolikheten att växellådan på din bil kommer gå sönder inom en snar framtid. Detta genom att låta dessa algoritmer lära sig av hur andra bilar har betett sig precis innan deras växellådor har havererat.Inom de två ML-användningsområdena som nämnts ovan finns det algoritmer som är mer eller mindre komplexa. Till de mindre komplexa tillhör en del traditionella statistiska algoritmer som du kanske stött på tidigare, såsom linjärregression. Till de mer komplexa hör sådana som är skapade för att efterlikna hur den mänskliga hjärnan tar emot och skickar signaler. Det är för att beskriva den senare gruppen begreppet deep learning har skapats.
- Deep Learning (DL) används för att beskriva vissa ML-algoritmer. Dessa används ofta för att analysera bilder och naturligt språk. Utmärkande för DL-algoritmer är att mönstren som de hittar i data är så komplexa att dessa i princip är omöjliga för dig och mig att förstå. Men om du tänker tillbaka på exemplet med växellådan och bilen så behöver vi ju inte förstå vilka tecken som pekar på att växellådan håller på att gå sönder. Det viktiga är att prediktionen är rätt så vi inte byter växellåda i onödan men inte heller riskerar att vara utan fungerande bil.
Med andra ord är DL en typ av ML som ofta används inom området AI. Det finns ML-algoritmer (bland dem också DL-algoritmer) som används för prediktiv analys, men även traditionella statistiska algoritmer kan användas. Data mining och ML kan vi däremot lite slarvigt använda synonymt.
Så nästa gång du går på AW och det börjar diskuteras AI eller machine learning kan du känna dig lugn då du nu varit på besök i begreppsdjungeln. Om kunskapsnivån här ändå inte skulle vara tillräckligt djup, då undrar jag vad det är för AWs du brukar gå på. Och hur jag får en inbjudan.
/Therése Svensson, Predictive Analytics Consultant
Kontakta mig gärna på LinkedIn!
Data Science & AI Ethics Solution Specialist
Är din data en guldgruva – eller en skräpvind?
Det sägs att data är vår tids naturresurs. Genom att analysera data kan vi få ny förståelse och upptäcka helt nya samband, effektivare drift av maskiner och annan utrustning i industrin, nya typer av samarbete mellan organisationer i ekosystem, kompletterande tjänster, nya affärsmodeller, riktad marknadsföring och inte minst en personaliserad kundupplevelse. Länge såg vi på […]
Vasaloppet + IBM = stärkt varumärke, engagemang och upplevelse i och av loppen
Vasaloppet är idag världens äldsta, längsta och största skidtävling. Vad som började med ett skidlopp år 1922 har idag utvecklats till 16 olika lopp – för längdskidåkare, cyklister och löpare. Totalt drar alla Vasaloppen närmare 100 000 deltagare per år. Alla tävlar längs samma historiska sträcka, de klassiska 90 kilometrarna mellan Sälen och Mora. Expansionen […]
När IT-jättarna känner dig bättre än du känner dig själv
Jag sitter på en flygplats på väg hem från en utbildning i Berlin och tänker på hur skönt det ska bli att komma tillbaka till Sverige där vi kan använda kontokort överallt. Jag tänker att tyskarna lider av en överdriven ”storebror ser dig”-rädsla som begränsar dem i vardagslivet. Det måste vara denna rädsla som förhindrar […]