Automatiseerimine: andmeteaduse ja masinõppe tulevik?

Masinõpe on olnud üks suurimaid edusamme arvutusteaduse ajaloos ning nüüd peetakse seda oluliseks suurandmete ja analüütika valdkonnas. Suurandmete analüüs on ettevõtte seisukohast tohutu väljakutse. Näiteks võivad sellised tegevused nagu paljude erinevate andmevormingute mõistmine, andmete ettevalmistamise analüüsimine ja üleliigsete andmete filtreerimine olla ressursimahukad. Andmeteadlaste spetsialistide värbamine on kallis ettepanek ja mitte vahend iga ettevõtte jaoks. Eksperdid usuvad, et masinõpe võib automatiseerida paljusid analüüsiga seotud ülesandeid - nii rutiinseid kui ka keerulisi. Automatiseeritud masinõpe võib vabastada märkimisväärseid ressursse, mida saaks kasutada keerukamaks ja uuenduslikumaks tööks. Tundub, et masinõpe liigub kogu aeg selles suunas.

Automatiseerimine infotehnoloogia kontekstis

IT -s on automatiseerimine erinevate süsteemide ja tarkvara ühendamine, mis võimaldab neil täita konkreetseid ülesandeid ilma inimese sekkumiseta. IT -s saavad automatiseeritud süsteemid täita nii lihtsaid kui ka keerukaid töid. Lihtsa töö näide võib olla vormide integreerimine PDF-failidega ja dokumentide saatmine õigele adressaadile, samas kui varukoopiate tegemine väljaspool ühendust võib olla näide keerukast tööst.

Oma töö nõuetekohaseks täitmiseks peate programmeerima või andma automatiseeritud süsteemile selged juhised. Iga kord, kui töö ulatuse muutmiseks on vaja automatiseeritud süsteemi, peab keegi programmi või juhiste komplekti uuendama. Kuigi automatiseeritud süsteem on oma töös tõhus, võib vigu esineda mitmel põhjusel. Vigade ilmnemisel tuleb välja selgitada ja kõrvaldada algpõhjus. On selge, et oma töö tegemiseks sõltub automatiseeritud süsteem täielikult inimestest. Mida keerulisem on töö iseloom, seda suurem on vigade ja probleemide tõenäosus.

IT-tööstuse automaatika tavaline näide on veebipõhiste kasutajaliideste testimise automatiseerimine. Testjuhtumid sisestatakse automatiseerimisskripti ja kasutajaliidest testitakse vastavalt. (Lisateavet masinõppe praktilise rakendamise kohta leiate jaotisest Masinõpe ja Hadoop järgneva põlvkonna pettuste tuvastamisel.)

Argument automatiseerimise kasuks on see, et see täidab rutiinseid ja korduvaid ülesandeid ning vabastab töötajad keerukamate ja loomingulisemate ülesannete tegemiseks. Siiski väidetakse ka, et automatiseerimine on välistanud suure hulga inimeste varem täidetud ülesandeid või rolle. Nüüd, kui masinõpe siseneb erinevatesse tööstusharudesse, võib automaatika lisada uue mõõtme.

Automatiseeritud masinõppe tulevik?

Masinõppe olemus on süsteemi võime pidevalt andmetest õppida ja ilma inimese sekkumiseta areneda. Masinõpe on võimeline käituma nagu inimese aju. Näiteks võivad e-kaubanduse saitide soovitusmootorid hinnata kasutaja ainulaadseid eelistusi ja maitset ning anda soovitusi kõige sobivamate toodete ja teenuste kohta. Arvestades seda võimalust, peetakse masinõpet ideaalseks suurandmete ja analüüsiga seotud keeruliste ülesannete automatiseerimiseks. See on ületanud traditsiooniliste automatiseeritud süsteemide peamised piirangud, mis ei võimalda inimeste regulaarset sekkumist. On mitmeid juhtumiuuringuid, mis näitavad masinõppe võimet täita keerukaid andmeanalüüsi ülesandeid, mida käsitletakse käesolevas artiklis hiljem.

Nagu juba märgitud, on suurandmete analüüs ettevõtjatele keeruline väljakutse, mida saab osaliselt delegeerida masinõppesüsteemidele. Ettevõtte seisukohast võib see tuua palju eeliseid, näiteks vabastada andmeteaduse ressursse loovamate ja missioonikriitilisemate ülesannete täitmiseks, suurema töökoormuse, vähem aega ülesannete täitmiseks ja kulutõhususe.

Juhtumiuuring

2015. aastal hakkasid MIT teadlased töötama andmeteadusliku tööriista kallal, mis suudab luua ennustavaid andmemudeleid suurest kogusest toorandmetest, kasutades tehnikat, mida nimetatakse süvafunktsioonide sünteesi algoritmideks. Teadlased väidavad, et algoritm võib ühendada masinõppe parimad omadused. Teadlaste sõnul on nad seda testinud kolme erineva andmekogumiga ja laiendavad testimist, et hõlmata rohkem. Teadlased James Max Kanter ja Kalyan Veeramachaneni ütlesid rahvusvahelisel andmeteaduse ja analüüsi konverentsil esitletavas artiklis: "Kasutades automatiseeritud häälestusprotsessi, optimeerime kogu tee ilma inimeste osaluseta, võimaldades sellel üldistada erinevate andmekogumite jaoks".

Vaatame ülesande keerukust: algoritmil on nn automaatse kohandamise võimalus, mille abil saab hankida või hankida algandmetest (nt vanus või sugu) statistikat või väärtusi, mille järel ennustavad andmed mudeleid saab luua. Algoritm kasutab keerulisi matemaatilisi funktsioone ja tõenäosusteooriat nimega Gaussi koopia. Seetõttu on lihtne mõista, kui keerukas on algoritm. See tehnika on võitnud auhindu ka võistlustel.

Masinõpe võib asendada kodutööd

Kogu maailmas arutatakse, et masinõpe võib asendada paljusid töökohti, kuna see täidab ülesandeid inimese aju efektiivsusega. Tegelikult on muret, et masinõpe asendab andmeteadlasi, ja tundub, et selliseks mureks on alust.

Tavalise kasutaja jaoks, kellel puuduvad andmeanalüüsi oskused, kuid kellel on igapäevaelus erineval määral analüütilisi vajadusi, ei ole võimalik kasutada arvuteid, mis suudavad analüüsida tohutuid andmemahtusid ja esitada analüüsiandmeid. Loodusliku keele töötlemise (NLP) meetodid saavad sellest piirangust siiski üle, õpetades arvuteid aktsepteerima ja töötlema loomulikku inimkeelt. Sel moel ei vaja tavakasutaja keerukaid analüüsifunktsioone ega oskusi.

IBM usub, et vajadust andmeteadlaste järele saab minimeerida või kõrvaldada selle toote - Watsoni loomuliku keele analüüsi platvormi - kaudu. Watsoni analüüsi- ja äriteabe asepresidendi Marc Atschulleri sõnul: „Sellise kognitiivse süsteemiga nagu Watson esitate lihtsalt oma küsimuse - või kui teil pole küsimust, laadite lihtsalt oma andmed üles ja Watson saab seda vaadata ja järeldage, mida võiksite teada. ”

Järeldus

Automatiseerimine on masinõppe järgmine loogiline samm ja me juba kogeme selle mõju igapäevaelus-e-kaubanduse saidid, Facebooki sõprade soovitused, LinkedIni võrgusoovitused ja Airbnb otsingu edetabelid. Arvestades toodud näiteid, pole kahtlust, et selle võib seostada automatiseeritud masinõppesüsteemide toodangu kvaliteediga. Kõigi selle omaduste ja eeliste puhul tundub idee masinõppest põhjustada tohutut tööpuudust pisut ülereageerides. Masinad on inimesi asendanud mitmel pool meie elu juba aastakümneid, kuid inimesed on arenenud ja kohanenud, et olla selles valdkonnas asjakohased. Vaate kohaselt on masinõpe kõigi selle häirete jaoks lihtsalt järjekordne laine, millega inimesed kohanevad.


Postitamise aeg: 03.03.2021