Урок 10: Некоторые мифы об ИИ — 2
Текст видео

Приветствую вас, друзья. Это курс по основам Искусственного Интеллекта, меня зовут Роман Душкин, и мы продолжаем рассматривать мы об ИИ. Сегодня мы рассмотрим ещё три мифа, которые связаны друг с другом тем, что так или иначе ограничивают область применения Искусственного Интеллекта или его понимание. Уверен, что вы уже и сам можете расправиться с этими мифами, но давайте пройдёмся по ним вместе. Проехали…

Первый миф говорит о том, что Искусственный Интеллект — это решения, основанные на нейросетевых технологиях. Основан этот миф на том, что сегодня во время третьего хайпа именно искусственные нейронные сети стоят во главе угла. Обычно мы транслируется теми, кто что-то где-то слышал, не разобрался и побежал вместе со всеми. Миф довольно распространён — мне много раз приходилось с ним сталкиваться, да ещё и в расширенной форме о том, что нейросети плохи по той или иной причине. Причины могут варьироваться в зависимости от того, кто что услышал. В общем, мы распространён, и если вы, скажем, руководитель проекта, который хочет использовать в своём проекте генетические алгоритмы, то можете натолкнуться на непонимание, когда скажете, что собираетесь использовать в проекте технологии искусственного интеллекта.

Дойдя до этого места курса, вы уже должны хорошо понимать, что технологии Искусственного Интеллекта очень разносторонни и многочисленны, а потому не ограничиваются только нейросетями. Мы уже изучили две парадигмы и пять подходов, в каждом из которых есть свои направления исследований. И искусственные нейросети — это одна из конкретных технологий восходящей парадигмы. Да, можно сказать, что на сегодняшний день она является самой проработанной и содержит огромное количество разных вариантов как искусственных нейронов, так и архитектур сетей. Одно из перечисление заняло бы по времени примерно такое же видео, а для погружения надо делать отдельный курс. Тем не менее, существуют и другие направления и технологии решения задач — обработка естественного языка, обработка неопределённости, деревья решений, неструктурированный поиск, представление знаний и многое другое, что мы уже упоминали. И кое-что из этого мы рассмотрим более детально в следующих видео.

Следующий миф в какой-то мере связан с предыдущим. Некоторые люди могут говорить о том, что всё, что делают искусственные нейронные сети, можно сделать и без них и даже эффективнее, поскольку нейросети надо обучать, это требует больших затрат сил и средств. В общем, в неприятном свете выставляют нейросети. С мифом можно столкнуться самым неприятным образом, если его носителем является человек, принимающий решения. Большой руководитель в силу своей загруженности не может разобраться в вопросе, когда-то слышал про неэффективность нейросетей, и теперь переносит это услышанное на свою работу, не разрешая вам использовать нейросети в проекте, где они были бы уместней всего. А дело, например, было в том, что двадцать лет назад, когда он учился в институте, кто-нибудь из его преподавателей кинул в сердцах, что нейросети плохи. Ну вот и оттуда понеслось.

Само собой разумеется, что сегодня с развитием технологий нейросети стали очень продвинуты, и они действительно решают огромное количество задач, которые раньше решались иными методами. Например, сегодня очень мощным направлением является анализ естественного языка при помощи нейросетей. В те далёкие годы, когда первые сети только появились, об этом даже и подумать было невозможно, и анализ естественного языка осуществлялся либо статистическими, либо формальными методами. А сегодня нейросети на входных естественно-языковых строках строят специальные векторы, что позволяет применять векторную математику. Например, научилась такая нейросеть «понимать» слово «царь», и в предоставлении оно входит в класс «мужчина». Теперь если из вектора «царь» отнять вектор «мужчина» и прибавить вектор «женщина», то получится «царица». Точно так же можно получить «царевна» и «царевич», и много чего ещё. Подход очень перспективный, так как моделирует семантические сети, традиционно относящиеся к нисходящей парадигме.

Самое главное преимущество искусственных нейросети заключается в том, что они могут давать осмысленный результат на входных данных, которые не участвовали в обучении таких сетей. Если показать хорошо построенной нейросети с достаточным количеством нейронов и слоёв сотни изображений птиц, то потом она объявит птицей и похоже изображение птицы, не участвовавшее в обучении. Впрочем, это не уникальная способность именно нейросетевой технологии. Аппарат нечёткой математики тоже позволяет обрабатывать входные данные, которых нет в базе знаний.

Наконец, третий миф на сегодня в какой-то мере мере перекликается с первым. Он гласит, что Искусственный Интеллект — это роботы. Миф основан на неплохих достижениях робототехники, которые можно наблюдать сегодня. И речь идёт не только об «игровых роботах», которые очень популярны в Японии, где даже устраиваются чемпионаты, но и о роботах производственных линий на заводах. В этом втором направлении достигнуты особенные результаты, и сегодня можно говорить о появлении так называемых «заводов-автоматов», про которые писали первые кибернетики.

С этим мифом разобраться было бы столь же просто, сколь и с первым, но мы пойдём немного другим путём. Ведь если провести аналогии с человеческим телом, то интеллект и сознание, что бы ни обозначали эти термины, находятся внутри тела. Скорее всего, сознание — это что-то типа «программного обеспечения», хотя на этот счёт полной уверенности нет. Но аналогию можно провести, и тогда окажется, что робот — будь то робот-андроид или робот на производственной линии — является лишь телом для программного обеспечения, которое является интеллектуальным. Робот предоставляет лишь сенсоры и исполнительные устройства для взаимодействия с нашей реальностью, но как мы уже поняли на наших прошлых занятиях, Искусственный Интеллект не обязательно должен жить именно в нашей реальности. Другими словами, роботы являются лишь вместилищем для Искусственного Интеллекта, будь он слабым или сильным. И сами по себе роботы, конечно же, Искусственным Интеллектом не являются.

Итак, мы рассмотрели ещё три мифа об Искусственном Интеллекте. Эти мифы не такие распространённые, как те, которые мы изучали вчера, но они более сильно воздействуют на принятие решений, так как часто сидят в головах людей, эти решения принимающих. Им надо разъяснять про новые технологии, объяснять, что Искусственный Интеллект — это не роботы и даже не только нейросети, которые, к тому же, имеют одну важную особенность — нейросети могут обучаться и работать на входе, которого не было во время обучения. Или же просто приглашайте всех этих людей ко мне. Ну а пока переходите к домашнему заданию. Обязательно проходите тесты. До завтра.
Популярные вопросы студентов
(Орфография и пунктуация студентов сохранены в большинстве случаев)
Может мне не хватает математики, но могли бы Вы мне простым языком еще раз обьяснить, как работают нейронные сети?) На входе есть какие-то вводные (в виде чего?) и потом на их основе образуются выводы (в виде результатов формул они появляются?)
Нейросеть (ИНС = искусственная нейронная сеть) работает так. Обычно она состоит из входного слоя нейронов (1), скрытых слоёв (0 или больше) и выходного слоя (1). Каждый нейрон входного слоя получает сигнал, скажем, один бит. Соответственно, все нейроны входного слоя получают последовательность битов, то есть вектор. При помощи вектора закодирована входная информация. Это может быть, например, изображение, аудиозапись, какая-то цифровая последовательность, текст и многое другое. Ведь любую информацию можно представить в виде последовательности битов. Далее каждый нейрон входного слоя передаёт входную информацию на нейроны следующего слоя, при этом передач осуществляется дискретно. Входной сигнал умножается на некоторый весовой коэффициент, и если результат больше некоторого порога, то на выходе нейрона имеется возбуждение (значение 1). Нейроны скрытых и выходного слоёв уже собирают информацию с каждого нейрона предыдущего слоя, и на каждой связи тоже есть весовой коэффициент. Каждый нейрон скрытого и выходного слоя выполняет операцию перемножения входного значения с каждого нейрона предыдущего слоя на весовой коэффициент этой связи, после чего все произведения складываются. И опять, если результат превышает некоторый порог, то нейрон выдаёт на своём выходе 1. На выходе же всей нейронной сети имеется вектор выходов выходных нейронов. Самая главная фишка, как теперь должно быть понятно, в этих самых весовых коэффициентах. Именно на то, чтобы они получили определённые значения и направлен процесс обучения ИНС. Но это уже совсем другой вопрос.
«Если результат превышает некоторый порог, то нейрон выдает на своем выходе 1», а если не превышает? Что он выдает?
Если не превышает, то выдаёт 0. На самом деле, в разных архитектурах ИНС может быть по-разному. Есть ИНС, в которых выдаётся –1. Есть ИНС, где на выходе в любом случае появляется значение — либо сама по себе эта сумма произведений, либо некоторая гладкая функция на ней же.
Нейронная сеть работает с семантикой и выводами на основе чего? Как из царя получается царевич? Сам процесс как реализуется?
Нейронная сеть не работает с семантикой. Она как-то там внутри себя настраивает коэффициенты на связях между нейронами. И вот когда мы ИНС обучаем, она внутри себя строит что-то типа векторов, и так получается, что слова ЦАРЬ и ЦАРЕВИЧ оказываются близки друг к другу в этом векторном пространстве, а их близость внезапно определяется вектором в том же пространстве, который отвечает за возраст. А близость между словами ЦАРЬ и ЦАРИЦА определяется вектором, который отвечает за пол. И тогда если мы подадим на вход такой обученной ИНС задачу из слова ЦАРЬ вычесть слово МУЖЧИНА и добавить слово ЖЕНЩИНА, то вот ЦАРИЦА и получится. При этом что там получится, если от слова ЦАРЬ просто отнять слово МУЖЧИНА, неясно, так как на выходе будет что-то невразумительное, имеющее только внутреннюю ценность для самой ИНС.
Завод-автомат работает на нейронных сетях?
Давайте про завод-автомат. Завод-автомат (ЗА) — это давняя мечта ранних кибернетиков. Сам по себе ЗА является сложной технической системой, основанной на принципах социо-технических систем, просто мы часть «социо-» убрали. То есть это завод, работающий в автоматическом режиме. Но он не может быть основан ТОЛЬКО на нейросетях. Очевидно, что там будет большое количество разных подсистем, которые основаны на совершенно различных технологиях ИИ. Могу рекомендовать Вам книгу Стэффорда Бира «Мозг фирмы», там всё это очень интересно описано. И ещё его же книгу «Кибернетика и менеджмент». Ну и, собственно, могу сейчас кратко пояснить — на нижнем уровне работают «грязные технологии». Ну то есть вот у нас есть некоторый непрерывный технологический процесс, у которого пара параметров, значения которых надо поддерживать гомеостатически. Для этого подойдёт АСУТП с элементами нейросетей. А на верхнем уровне планирования производства должна располагаться автономная СППР, принимающая решения на основе обработки символьной информации, приходящей как с низовых систем, их тех же подчинённых АСУТП, так и из вне — например, баланс спроса и предложения на продукцию этого ЗА.
Игровые роботы в Японии работают тоже на нейронные сетях?
Уверен, что каждый робот использует внутри себя какие-нибудь технологии, которые вложили в него создатели. В каких-то роботах используются ИНС, в каких-то универсальный решатель с продукциями, в каких-то гибридная схема. Но я уверен, что наилучшие результаты показывают именно гибридные схемы, где сенсорной информацией с датчиков занимается ИНС, потом она преобразует её в символы, которые обрабатывает универсальный решатель, принимающий решение, а потом это решение реализуется моторной нейросетью на исполнительные устройства. Всё, как в человеке.
Как проявляется парадокс Моравека в разных подходах к моделированию ИИ?
Парадокс Моравека как раз возник в рамках гибридного подхода, когда в «голову» роботу вставляли что-то типа экспертной системы, а его моторные навыки развить не могли. Рассматривать его в рамках какого-либо более специфического подхода смысла не имеет, так как в нём речь идёт именно о наиболее общем решении в области ИИ. Собственно, думаю, что этот парадокс применим и к естественному интеллекту. Если рассмотреть устройство нервной системы человека, то неокортекс, конечно, очень сложен, но его структура и коннектом в целом, на довольно высоком уровне абстракции, вполне простая. А если спускаться ниже в палеокортекс, средний мозг и все остальные древние структуры, то там устройство довольно сложное, переплетённое, особенно по количеству связей между нейронами и мышцами и внутренними органами.
Самостоятельная работа
Задание 1

Прочесть все материалы по ссылкам выше

Задание 2

Сдать проверочный тест
Есть вопросы? Отлично, задавайте!
Предыдущие уроки
Урок №1: ИИ и две зимы здесь
Урок №2: ИИ и междисциплинарные исследования здесь
Урок №3: Две парадигмы здесь
Урок №4: Интуитивный подход и тест Тьюринга здесь
Урок №5: Символьный и логический подходы здесь
Урок №6: Агенты и роевой интеллект здесь
Урок №7: Гибридный подход здесь
Урок №8: Гибридный подход здесь
Урок №9: Некоторые мифы об ИИ — 1 здесь