- Сообщения
- 4.590
- Реакции
- 5.049
Ученые показали искусственному интеллекту (ИИ) мир глазами ребенка, чтобы выяснить, как он будет изучать язык.
«Эта шаровидная вещь, долго катящаяся по полу и подпрыгивающая при метании — мяч. А вот этот шаровидный предмет не подпрыгивает, но вкусный и его можно есть – это яблоко».
Приблизительно так изучают язык младенцы, замечая связь между видимым предметом, его свойствами и словом, которое то и дело повторяют взрослые, указывая на него.
Такая способность детей изучать язык, наблюдая за связью между предметами, их свойствами и словами, вызывает восхищение не только у родителей, но и у ученых. Она подчеркивает сложность и эффективность мозга.
Но можно ли достичь подобной способности к обучению у искусственного интеллекта? Этот вопрос побудил группу ученых Нью-Йоркского университета поставить эксперимент, проверяющий, способен ли искусственный интеллект научиться понимать мир, опираясь только на аудиовизуальные данные, как дети.
Для этого ученые использовали данные только в виде видео с камеры, которую в течение полутора лет время от времени носил на голове малыш Сэм из Австралии, передавая программе детский взгляд на мир.
Чтобы понять важность эксперимента, следует разобрать, чем отличается обучение языку у младенцев и алгоритм искусственного интеллекта. Традиционно считается, что дети учатся через повторение и имитацию, взаимодействуя с родителями и окружением. Они формируют ассоциативные связи между словами и объектами, к которым эти слова относятся, используя контекстуальные подсказки для понимания значения новых слов с раннего возраста.
Однако, детали того, как происходит формирование языковых навыков на ранних этапах, оставались недостаточно исследованными. Некоторые ученые предполагали, что самого ассоциативного обучения недостаточно и важную роль играют врожденные когнитивные способности людей и сложный комплекс навыков и механизмов восприятия, способствующих обучению.
В отличие от детей нейросети обычно учатся на основе огромных объемов данных, получая четко определенные пары «изображение-описание», что существенно отличается от более интуитивного и исследовательского подхода детей. Объем информации, с которым сталкиваются нейросети, масштабируется до триллионов единиц, что намного превышает информационную нагрузку, доступную младенцам.
Эта разница в подходах и объеме обрабатываемой информации является ключевой для понимания потенциала и вызовов в обучении — как людей, так и машин. И она может указать, есть ли у людей сложные врожденные механизмы для изучения языка, или же с его данными научиться может и компьютерная модель.
В основу эксперимента с Сэмом исследователи положили уникальный подход: использование видеоданных, собранных с помощью камеры, которую с 6 месяцев до 2 лет время от времени носил на голове малыш.
Это позволило искусственному интеллекту погрузиться в детский опыт, получив доступ к визуальному и звуковому восприятию мира с точки зрения мальчика. Так алгоритм становился свидетелем повседневной жизни ребенка, включая моменты его взаимодействия с предметами и общения со взрослыми.
Несмотря на то, что Сэм носил камеру всего около двух часов в неделю, регистрируя всего 1 процент его жизни, этих суммарных 61 часа записей и 250 тысяч зарегистрированных слов хватило для создания обширного набора данных для обучения нейросети.
Алгоритм успешно справился с задачей научиться ассоциировать слова с визуальными и аудиовизуальными стимулами, которые она встречала в данных. На тесте он правильно идентифицировал объекты быта в 62 процентах случаев — существенно лучше 25 процентов, которые ожидались бы от случайного угадывания (вытекающего из четырех вариантов выбора, где один верен). И этот результат сравним с аналогичной моделью, обученной на 400 миллионах пар изображения-текст.
Тесты на словарный запас для детей и моделей искусственного интеллекта выглядят следующим образом - каждый вопрос имеет четыре соответствующих изображения, из которых нужно выбрать то, что отвечает на вопросы. Например, «какое является мячом?» или «какое изображение является деревом?».
Благодаря исследованию, ученые получше поняли, как люди учатся: похоже, что для обретения языка все же не требуется сложных врожденных когнитивных механизмов, достаточно ассоциативного обучения.
В то же время эксперимент пролил свет на потенциал искусственного интеллекта учиться подобным людям образом. И он может стать ключом к созданию более интуитивно понятных и эффективных алгоритмов.
Взглянув на мир глазами ребенка, искусственный интеллект станет не только лучше понимать наши команды, но и контекст, в котором они даны, а это сделает взаимодействие с технологиями более естественным и эффективным.
Так исследование становится мостом между человеческим опытом и будущим искусственного интеллекта, показывая, что понимание одних может обогатить других.