Först var det AlphaGo AI från Googles DeepMind-dotterbolag som slog världens bästa Go-spelare i sitt eget spel för att göra rekord. Sedan utökade en AI med namnet Libratus, utvecklad av Carnegie Mellon University, pokerproffs i en turnering för att rikta världens uppmärksamhet mot den snabba takt som AI utvecklas. I det senaste exemplet på en AI som överträffar människor, en djup neural nätverksmodell utvecklad av Alibaba gick bättre än människor i ett läsförståelsestest.
AI-modellen utvecklad av Alibabas Institute of Data Science and Technologies flammade förbi SQuAD-testet (Stanford Question Answering Dataset) - ett av de mest tillförlitliga läsförståelsestestet för att utvärdera en maskins språkkunskaper - i en tävling som ställde den mot mänskliga rivaler.
Alibabas AI fick poängen 82.44 Exact Match (EM), vilket överträffade sina mänskliga konkurrenter som missade att placera 82.304 poäng på resultattavlan. Enligt en rapport som publicerades i South China Morning Post - som också ägs av Alibaba - är denna prestation första gången när en maskin har slagit sina mänskliga motsvarigheter i ett läsförståelsestest.
När det gäller netto F1-poäng i SQuAD-bedömningen, Alibabas AI-modell toppade diagrammet med 88,607 poäng och placerade sig högre än liknande system utvecklade av Microsoft och Facebook. Resultaten är verkligen imponerande eftersom språkförståelse traditionellt har betraktats som en svag punkt i AI-system. Ovan nämnda brist begränsar allvarligt deras förmåga att föra en verkligt produktiv konversation med en person, och inte bara knäcka siffror och bearbeta information.
Med orden från Si Luo, en chefsvetenskapsman för bearbetning av naturliga språk vid Alibabas forskningsarm, kommer de senaste resultaten att öppna nya möjligheter att distribuera AI-system i kundtjänstjobb tack vare deras förbättrade språkbehandlingsmöjligheter.
Vi tror att den underliggande tekniken gradvis kan tillämpas på många applikationer såsom kundtjänst, museumstudier och online-svar på förfrågningar från patienter, vilket frigör mänskliga ansträngningar på ett aldrig tidigare skådat sätt
De resultat som uppnåtts med Alibabas djupneurala nätverksmodell indikerar att AI-system snart kommer att kunna svara på objektiva frågor som "vad som orsakar regn" genom att bearbeta den stora mängden information till deras förfogande och svara med det mest sammanhangsnoggranna och exakta svaret.