МІНСК, 4 лют — Sputnik. Агенцтва па перспектыўных абаронным навукова-даследчым распрацоўкам ЗША зладзіла конкурс на выяўленне ботаў.
Паводле афіцыйных дадзеных Twitter, боты складаюць каля васьмі з паловай працэнтаў актыўных карыстальнікаў сацыяльнай сеткі. Аўтары ўмоўна падзялілі ботаў на тры групы ў залежнасці ад прызначэння акаўнта: спам, манетызацыя трафіку, і ўплыў на грамадскую думку. Конкурс, які праводзіцца DARPA, быў накіраваны менавіта на пошук апошняй катэгорыі ботаў, якія імітуюць чалавека з нейкай палітычнай або сацыяльнай пазіцыяй і выкарыстоўваюцца для ўплыву на грамадскую думку.
У рамках спаборніцтваў, якія прайшлі ў першым квартале 2015 года, камандам-удзельніцам было прапанавана за чатыры тыдні выявіць ботаў. Усяго ў спаборніцтве бралі ўдзел шэсць каманд з розных універсітэтаў і арганізацый. Удзельнікі павінны былі выявіць сярод масы твітаў ўсіх ботаў, якія ўплываюць на грамадскую думку, прычым вылучыць менавіта ботаў, якія ўдзельнічаюць у дыскусіі на зададзеную тэму — абмеркаванне пытання вакцынацыі.
Сярод 7038 акаўнтаў, якія ўдзельнічалі ў абмеркаванні, ботамі былі 39. Усяго набор дадзеных уключаў у сябе звыш чатырох мільёнаў твітаў са спадарожнай службовай інфармацыяй. За кожны правільна выяўлены бот-акаўнт каманда атрымлівала адзін бал, за кожную няслушную здагадку пазбаўлялася чвэрці бала.
Каманда-пераможца даследчай арганізацыі SentiMetrix выкарыстала алгарытм, які ўлічваў сінтаксіс (напрыклад, знакі прыпынку ў канцы паведамлення не характэрныя людзям, якія пішуць у Twitter), семантыку, спецыфіку паводзінаў (рэгулярнасць постынга і пазіцыя ў спрэчцы), а таксама характарыстыкі профілю (фатаграфія, нік) і характарыстыкі іншых звязаных акаўнтаў. Прычым у выпадку з фатаграфіяй алгарытм правяраў не толькі яе наяўнасць або адсутнасць, але і спрабаваў знайсці крыніцу.