Forskare har visat en algoritmbaserad automatiserad lösning som är jämförbar med och ibland bättre än människor för att korrekt identifiera falska nyheter. Systemet som identifierar taliga språkliga ledtrådar i falska nyhetsberättelser kan ge nyhetsaggregat och sociala medier som Google News ett nytt vapen i kampen mot felinformation.
En automatiserad lösning kan vara ett viktigt verktyg för webbplatser som kämpar för att hantera ett angrepp av falska nyhetsberättelser, ofta skapade för att generera klick eller för att manipulera den allmänna opinionen, säger Rada Mihalcea, professor i University of Michigan bakom projektet, i ett uttalande.
Det nya systemet hittade framgångsrikt förfalskningar upp till 76 procent av tiden, jämfört med en mänsklig framgångsgrad på 70 procent, enligt studien som presenterades den 24 augusti vid den internationella konferensen om beräkningslingvistik i Santa Fe, New Mexico..
Forskarna tror att deras språkliga analysmetod också skulle kunna användas för att identifiera falska nyhetsartiklar som är för nya för att debunkera genom att korsreferera deras fakta med andra berättelser. Den språkliga analysmetoden analyserar kvantifierbara attribut som grammatisk struktur, ordval, interpunktion och komplexitet.
För studien skapade Mihalceas team sina egna data och Crowdsourcing av ett onlineteam som omarbetade verifierade äkta nyhetsberättelser till förfalskningar. Så här skapas de flesta faktiska falska nyheterna, sa Mihalcea, av individer som snabbt skriver dem i utbyte mot en monetär belöning..
Studiedeltagarna fick betalt för att förvandla korta, faktiska nyheter till liknande men falska nyheter, som efterliknade artiklarnas journalistiska stil. I slutet av processen hade forskargruppen en dataset med 500 riktiga och falska nyheter. De matade sedan dessa märkta par berättelser till en algoritm som utförde en språklig analys och lärde sig skilja mellan verkliga och falska nyheter.
Slutligen förvandlade teamet algoritmerna till en uppsättning riktiga och falska nyheter som hämtades direkt från webben, vilket gav 76 procent framgångsgrad. Detaljerna i det nya systemet och datauppsättningen som teamet använde för att bygga det kunde användas av nyhetssajter eller andra enheter för att bygga sina egna upptäckssystem för falska nyheter, sa Mihalcea.