Teknik

Allt du behöver veta om Google Brains TensorFlow

Allt du behöver veta om Google Brains TensorFlow

Alla som har provat Google Photos håller med om att denna kostnadsfria fotolagrings- och hanteringstjänst från Google är smart. Den har olika smarta funktioner som avancerad sökning, förmåga att kategorisera dina bilder efter platser och datum, skapa automatiskt album och videor baserat på likheter och föra dig ner i minnesfältet genom att visa bilder från samma dag för flera år sedan. Det finns många saker som Google Photos kan göra som för flera år sedan skulle vara maskinellt omöjligt. Google Foto är en av de många "smarta" tjänsterna från Google som använder en maskininlärningsteknik heter TensorFlow. Ordet inlärning indikerar att tekniken blir smartare med tiden till den punkt som vår nuvarande kunskap inte kan föreställa sig. Men vad är TensorFlow? Hur kan en maskin lära sig? Vad kan du göra med det? Låt oss ta reda på.

Vad är TensorFlow?

TensorFlow är Googles öppen källkod och kraftfull programvara för artificiell intelligens, som driver många tjänster och initiativ från Google. Det är andra generationen av ett system för storskaliga implementeringar av maskininlärning, byggt av Google Brain-teamet. Detta algoritmbibliotek lyckas med DistBelief - den första generationen.

Tekniken representerar beräkning som statistiska dataflödesdiagram. Det som gör TensorFlow unik är dess förmåga att modellera beräkningar på ett brett utbud av hårdvara, från mobila enheter på konsumentnivå till multi-GPU-servrar i världsklass. Den kan köras på olika GPU: er och processorer och lovar skalbarheten för maskininlärning bland de olika enheterna och prylarna utan att behöva ändra en betydande mängd kod.

TensorFlow härstammar från Googles behov av att instruera ett datorsystem för att efterlikna hur en mänsklig hjärna fungerar i lärande och resonemang. Systemet, känt som neurala nätverk, bör kunna utföra multidimensionella dataarriser som kallas "tensorer". Slutmålet är att träna neurala nätverk för att upptäcka och dechiffrera mönster och korrelationer.

I november 2015 skapade Google denna teknik öppen källa och tillät det att antas i alla typer av produkter och undersökningar. Alla, inklusive forskare, ingenjörer och hobbyister, kan hjälpa till att påskynda maskininlärningens tillväxt och ta det till en högre nivå på kortare tid.

Denna åtgärd visade sig vara den rätta eftersom det finns så många bidrag från de oberoende utvecklarna till TensorFlow att de långt överträffar Googles bidrag. Wikipedia nämner att ”det finns 1500 förvar på GitHub som nämner TensorFlow, varav fem är från Google. ” Med detta sagt misstänker en av diskussionerna hos Quora att den släppta källan med öppen källkod är den "rensade" versionen från den som Google använder i sina tjänster.

Hur fungerar TenserFlow?

Med det enkla normala mänskliga språket och en tung förenkling kan vi se ena sidan av TensorFlow som en avancerad autonom filtreringsteknik. Kärnan är tekniken ett enormt programvarubibliotek för maskininlärning. Den använder databasen för att hjälpa den att "fatta beslut".

Till exempel laddar någon upp ett foto till Google Foto. Tekniken kommer att jämföra alla detaljer från bilden till dess databas och avgöra om det är en bild av ett djur eller en människa. Sedan, om det är en människa, kommer det att försöka bestämma kön, ålder till hela vägen till personen. Samma process upprepas för andra objekt på fotot.

Den använder också användardata som personens identitet i bilden och platsen där bilden tas för att förbättra sitt bibliotek så att det kan ge bättre resultat i framtiden - både för den person som laddade upp bilden och för alla annan. Därav termen "lärande". Men det slutar inte bara med att känna till och lära sig data från foton. Det finns så mycket som tekniken kan göra med information från ett foto. Det kan till exempel gruppera foton med liknande detaljer som samma person, samma plats, samma datum; se ansiktsmönstret för att avgöra vilken familj och vänner personen på bilden tillhör, och använd informationen för att göra videor av familjesemester eller animering från kontinuerliga bilder.

Det repar knappt ytan på hur TensorFlow fungerar, men jag hoppas att det kan ge dig en allmän bild av tekniken. Att bara använda ett exempel kan inte göra rättvisa åt vad den kan.

Och för alla artificiella intelligensentusiaster där ute är det värt att nämna att Google redan skapat en datorkretsteknik optimerad för maskininlärning och integrering av TensorFlow i den. Det heter Tensor Processing Unit (TPU) ASIC-chip.

De som vill lära sig mer om TensorFlow kan besöka handledningssidan.

Tillämpningar av TensorFlow

Vi befinner oss i ett tidigt skede av maskininlärningstekniken, så ingen vet vart det tar oss. Men det finns några initiala applikationer som kan ge oss en titt på framtiden. Eftersom det härstammar från Google är det uppenbart att Google använder tekniken för många av sina tjänster.

Vi har diskuterat exemplet med att använda tekniken för bildanalys i Google Foto. Men bildanalysapplikationen används också i Google Maps Street View-funktion. TensorFlow används till exempel för att ansluta bilden till kartkoordinaterna och för att automatiskt suddig ut nummerplåten för alla bilar som av misstag ingår i bilden.

Google använder också TensorFlow för sin röstassistentprogram för taligenkänning. Tekniken som gör det möjligt för användare att uttala sig om instruktioner är inte ny, men att inkludera det ständigt vuxna biblioteket TensorFlow i mixen kan föra upp funktionen några steg. För närvarande känner igen taligenkänningsteknologin över 80 språk och varianter.

Ett annat exempel på ”inlärningsdelen” av maskininlärningstekniken är Googles översättningsfunktion. Google tillåter sina användare att lägga till nya vokabular och fixa misstagen i Google Translate. Den ständigt växande informationen kan användas för att automatiskt upptäcka det inmatningsspråk som andra användare vill översätta. Om maskinen gör misstag i språketekteringsprocessen kan användare korrigera dem. Och maskinen kommer att lära av dessa misstag för att förbättra dess framtida prestanda. Och cykeln fortsätter.

Ett roligt exempel på användning av TensorFlow är Alpha Go. Det är ett program som är programmerat till spela Go. För de som inte känner till Go är det ett abstrakt brädspel för två spelare med ursprung i Kina för mer än fem tusen fem hundra år sedan, och det är det äldsta brädspelet som fortfarande spelas kontinuerligt idag. Medan reglerna är enkla - att omge mer territorium än motståndaren, är spelet otroligt komplext och enligt Wikipedia: "har fler möjligheter än det totala antalet atomer i det synliga universum."

Så det är intressant vad en lärande maskinteknik kan göra med de oändliga möjligheterna. I sina matcher mot Lee Sedol - 18-gången Go-världsmästaren, vann Alpha Go 4 av 5 matcher och fick heders högsta Go-mästare rank.

En annan intressant tillämpning av TensorFlow är Magenta Project. Det är ett ambitiöst projekt att skapa maskingenererad konst. Ett av de tidiga konkreta resultaten av experimentet är 90 sekunders pianomelodi. På lång sikt hoppas Google kunna generera mer avancerad maskingenererad konst via sitt Magenta-projekt och bygga en grupp konstnärer runt den.

I februari 2016 höll Google också en konstutställning och auktion i San Fransisco med 29 datorgenererade - med lite hjälp från mänskliga - konstverk. Sex av de största verken såldes för så mycket som 8 000 dollar. Datorn kan fortfarande ha en väldigt lång väg att gå innan den kan imitera en riktig konstnär, men hur mycket pengar människor är villiga att betala för konsten visar oss hur långt tekniken har gått.

Stöd för iOS

Medan vi redan har sett funktionerna hos TenserFlow på Android, med sin senaste version, lägger TensorFlow äntligen till stöd för iOS-enheter. Eftersom det finns massor av bra mobilappar exklusivt tillgängliga för iOS, eller släpps först på iOS, betyder det att vi kan förvänta oss fler fantastiska mobilappar som antar maskininlärning inom en snar framtid. Samma sak kan sägas för möjligheterna till bredare antaganden och tillämpningar av TensorFlow.

Framtiden för TensorFlow

Vad kan man göra med en maskin som kan lära sig och fatta sitt eget beslut? Som en person som hanterar mer än ett språk som en del av det dagliga livet är det första som dyker upp i mitt sinne språköversättning. Inte i ord för ordnivå, utan mer på längre textnivå som dokument eller till och med böcker. Dagens översättningsteknik är begränsad till vokabulärerna. Du kan enkelt ta reda på vad som "sover" på kinesiska och vice versa, men försök att slänga in ett kapitel i Eiji Yoshikawa's Musashi på sin ursprungliga japanska och översätta kapitlet till engelska. Du får se vad jag håller på med.

Det är också roligt att se vad framtiden för artificiell intelligens kan göra med musik. Även om det fortfarande är väldigt enkelt kan Apples Music Memo-app redan ge automatisk bas- och trumuppföljning till din inspelade sång. Jag kommer ihåg ett avsnitt av en SciFi TV-show där en karaktär i showen skapade en maskin som analyserar alla topplåtarna i listorna och kan skriva sina egna hitlåtar. Kommer vi någonsin fram dit?

Och som den slutliga tanken vill jag nämna Sunspring. Det är en kort science fiction-film skriven helt av en AI-manusförfattare som kallade sig själv Benjamin - som även komponerade pop-låten musikaliska mellanrum. Filmen sattes samman av regissören Oscar Sharp för 48-timmars Film Challenge of Sci-Fi London-evenemanget.

Nu kan jag inte sluta tänka på Terminator. Välkommen till framtiden.

Bildkredit: Wikipedia, TechInsider, The Verge, Wall Street Journal

Starta Windows 8 med låsskärmen och bildlösenordet
Trenden på marknaden för surfplattor, smartphones, ultrabooks, bärbara datorer ändras dag för dag och konkurrensen blir tuff för varje version. Tekni...
Facebook-tidslinjen nu tillgänglig på mobil
Facebook-tidslinjen för mobil är som en grädde på kakan för de människor som besöker webbplatsen mer via mobila enheter. ”På mobil tidslinje börjar m...
Twitter Vs. Facebook för professionellt bruk
Vad kommer du att tänka på först när vi säger ordet "Sociala medier"? Trots att du kanske använder andra plattformar för att få tillgång till denna vä...