Созданный в 1950 году тест Тьюринга, который был назван в честь известного британского учёного Алана Тьюринга, является гипотетической основой для проверки интеллекта нейронной сети. В этой имитационной игре участник-человек вслепую задаёт вопросы как человеку, так и компьютеру. Если компьютер успешно обманывает спрашивающего, заставляя его думать, что это человек, значит, он прошёл тест.
Первая попытка пройти тест была предпринята в середине 1960-х годов. Тогда программисты разработали чат-бота по имени Элиза, имитирующего психолога. В 2014 году ИИ Женя Густман первым успешно прошёл тест. Программа имитировала реакции 15-летнего мальчика.
За прошедшее десятилетие появилось множество программ, претендовавших на прохождение теста Тьюринга. Недавно искусственный интеллект Google LaMDA прошёл тест и попытался убедить инженера Google в своей разумности.
Некоторые исследователи утверждают, что тест Тьюринга далёк от совершенства. С одной стороны, язык – это одна из самых сложных вещей для имитации системой ИИ. Однако тест игнорирует другие аспекты интеллекта, которые не менее важны. Многие чат-боты были созданы так, чтобы обмануть людей, заставив их думать, что им отвечает человек. У Жени Густмана, например, английский был вторым языком. Это эффективно скрывало некоторые просчёты в ответах ИИ.
Предложения о внесении поправок или замене теста Тьюринга существуют уже много лет. На этой неделе появился новый тест AI Classification Framework. Он делает тест Тьюринга частью оценки общего интеллекта ИИ, состоящей из 8 частей.
Крис Саад, разработчик нового теста, черпал вдохновение в книге 1983 года «Теория множественного интеллекта». В ней описывается идея психолога Говарда Гарднера о том, что интеллект – это не просто монолитная конструкция, а гобелен из 8 отдельных видов интеллекта: логико-математического, лингвистико-вербального, визуально-пространственного, музыкально-ритмического, телесно-кинестетического, межличностного, внутриличностного и экзистенциального. В новом тесте ИИ оценивается согласно этим категориям интеллекта по шкале от 1 до 5.
Теория бросила вызов традиционному взгляду на интеллект как на единственную, фиксированную сущность и открыла новые возможности для изучения разнообразия человеческого познания. Хотя теория множественного интеллекта на протяжении многих лет подвергалась некоторой критике и дебатам, она оказала значительное влияние на области психологии и образования, – пишет Саад.
Популярный чат-бот ChatGPT продемонстрировал средний человеческий интеллект в категориях логико-математического и лингво-вербального интеллекта, однако получил ноль баллов по всему остальному. Хотя некоторые утверждали, что чат-бот прошёл тест Тьюринга, в рамках этой новой структуры ChatGPT предстоит ещё долгий путь.
Становится всё более очевидным, что современные ИИ перерастают тесты, разработанные в ту эпоху, когда мощность и сложность современных компьютеров казались недостижимыми. Возможно, сегодняшний искусственный интеллект действительно может пройти тест Тьюринга, но ему предстоит много учиться, если он хочет сдать заключительный экзамен под названием «человеческое сознание».