- Ссылка на статью: arXiv
В статье описывается дорожная карта к машинному интеллекту (МИ, по крайней мере к её составляющей).
Статья разделена на 4 части:
Описание основных характеристик машинного интеллекта:
- коммуникация (communication),
- обучение (learning).
Машина изучает новые понятия через коммуникацию.
Выдвигается идея, что надо декомпозировать сложную задачу, которую для нас должен решать машинный интеллект на более простые подзадачи, которые ведут к решению сложной задачи.
Предложена интерактивная среда обучения (interactive learning environment) на котором обучается и проверяется качество работы МИ.
Описаны методы, которые позволят МИ эффективно использовать интерактивную среду обучения.
Предложенный авторами подход рассмотрен в контексте прошлых и текущих подходов к разработке МИ.
В этой части рассматриваются три составляющие машинного интеллекта:
- коммуникация (communication),
- обучение (learning),
- мотивация (motivation).
- происходит через естественный язык,
- естественный язык можно использовать для передачи нелингвистической информации (например, давать команду для включения телевизора).
- может быть рассмотрена как интерфейс между естественным языком и языком программирования (ниже будет подробнее),
- интерактивная (задавание вопросов, уточнения, обратная связь...),
- максимально простой интерфейс (bit-based IO channel),
- интерфейс к машине - лингвистическое знание никак не кодируется, машина должна сама понять что делать, на основе входа и выхода.
Адаптация к окружению путем максимизации функции мотивации.
Задается позитивное и негативное подкрепление, контролируется пользователем (учителем, окружением) через коммуникацию.
- Это "детский сад" для машинного интеллекта, контролируемое окружение,
- с помощью него МИ Учиться как учИться,
- должна быть достаточно сложной, чтобы МИ выучил сложные стратегии обучения,
- человек не должен испытывать больших трудностей, если окажется в такой среде, даже если там будет неизвестный ему язык.
![Ecosystem Scheme] (Towards ai scheme.png)
Ученик:
- должен внимательно слушать учителя,
- изучает базовые умения,
- создаем кластеры связанных задач, организованных по уровням, так чтобы ученик мог найти для себя оптимальный путь для их изучения.
- Обучаем взаимодействовать с окружением.
- Понимаем, что состояние окружения меняется.
- Генерализация - понимание того, что действие может быть применено к объектам разного типа. Изучение новых стратегий.
- Декомпозиция высокоуровневых задач.
- Интерактивная коммуникация (обращение за помощью к учителю или эксперту, общение для достижения цели, решения задачи).
- Знание базовых алгоритмических элементов (циклы, if). Ученик может рассматриваться как нечто, что пишет программы на основе сообщений полученных от учителя. Ученик выдает инструкции, которые выполняются окружением. Т.о. можно автоматизировать написание программ.
- различные виды поведения, которым мы хотим обучать
- коммуникация (базовый навык),
- чем более узкая задача ставится, тем меньше обучения требуется. В краевых случаях можно писать программу.
- храним факты и алгоритмы относящиеся к выученному навыку,
- композиция имеющихся навыков для решения задачи,
- берем имеющиеся навыки,
- формируем план (прям как в постгрес),
- выполняем, ... PROFIT.
- не нужно строить МИ на базе Машины Тьюринга,
- существует много Тьюринг-полных вычислительных систем (какую выбрать?).
Тьюринг (1950)
- создаем child-машину, которую учим через communication channel,
- предполагал, что машина будет запрограммирована людьми (60 прогеров на 50 лет),
- Игра в имитацию.
The Blocks world of Winograd (1971) - идея о AI находящимся в синтетическом окружении коммуницирующим через естественный язык.
Далее описываются статьи про помощников типа Siri, про мультиагентные системы, про semantic parsing, про статьи на тему "learning to learn".
Ring (1997) desiderata к AI:
- автономный агент,
- сенсорный,
- производит действия,
- отвечает на подкрепление (вознаграждение, reward) от окружения,
- обучается (поведение и навыки) во время решения задачи,
- обучается инкрементально,
- нет фиксированной обучающей выборки,
- обучение происходит на каждом шаге,
- обучается иерархически,
- навыки могут быть изменены,
- черный ящик,
- внутренности агента не обязаны быть нам понятны и изменяемы нами,
- поведение агента строится через обучение, а не манипуляцию,
- имеет доступ к миру через сенсоры, действия и подкрепление,
- нет ultimate final task.
![Example of interaction] (example.png)