Со користење на пакетот „FACTS Benchmark Suite“, „Google“ имаше можност да ја тестира и утврди ефикасноста, како и точноста на податоците што ги нудат популарните "AI" чет-ботови. Заклучоците од ова истражување не се позитивни.
Како што покажуваат податоците од извештајот, ниту еден од 15-те чет-ботови што компанијата ги тестирала не успеал да го надмине прагот од 70 проценти точност во однос на фактите. Тоа значи дека, во просек, речиси секој трет одговор не е во согласност со реалноста.
Најдобар модел според тестовите е „Gemini 3 Pro“ од „Google“, кој постигнал 69 проценти точност. Следуваат „Gemini 3.5 Pro“ и „GPT 5“, кои се единствените што успеале да го надминат прагот од 60 проценти.
Ова покажува дека креаторите на "AI" чет-ботови сè уште ги чека долг пат до постигнување задоволително ниво на доверливост. Воедно, ова претставува и предупредување дека сите податоци што ги нудат овие алатки треба внимателно да се проверуваат.
#Google’s new FACTS benchmark shows today’s best #AI chatbots are only about 69 percent accurate. Even top models like #Gemini 3 Pro still get facts wrong one-third of the time, raising fresh concerns for businesses betting on AI reliability.
— Digital Trends (@DigitalTrends) December 16, 2025
The post… https://t.co/6DiREzKdy9






