Может ли Искусственный интеллект заменить человека?
Сейчас широко распространяется заблуждение о том, что ИИ оставит без работы людей. Данный посыл часто продвигается теми, кто с ИИ имеет весьма шапочное знакомство и опираются в своих изысканиях на научно-популярные статьи и художественные фильмы (та же «Матрица»), а не личный опыт. Однако, как обычно, дьявол кроется в деталях. И эти детали принципиально меняют картину — на самом деле бояться его не надо. Но обо всем по порядку.
Начнем с самого термина — Искусственный интеллект. Столь громкие слова создают в воображении практически автономное цифровое сознание. В воображении возникает образ, который действует практически наподобие человеку, но абсолютно механически. Как агент Смит из «Матрицы». И этот воображаемый объект еще не возникнув уже несет угрозу человеку. Однако на самом деле ничего подобного в реальности нет. Современный ИИ (да и «ИИ» в перспективе ближайших лет) гораздо правильнее называть машинным обучением. Он построен в общем-то на известных законах и алгоритмах статистики и теории вероятности. Машинное обучение звучит гораздо менее эффектно, чем «искусственный интеллект», поэтому журналисты не любят его использовать. Что ж, здесь мы видим как жажда славы и пиара превращает муху в слона. Зачем это журналистам? Ответ прост — чем сильнее эмоции зрителей, тем больше просмотров ролика или передачи. Чем больше просмотров — тем больше денег они получат от спонсоров или рекламодателей. Чем больше денег — тем больше премия конкретного журналиста. И когда конкретный журналист готовит текст ясно, чем именно определяется его выбор — наживой. Далее будем использовать правильную терминологию — машинное обучение.
Машинное обучение — это прежде всего технология. Такая же как телевидение или интернет. Чем эта технология отличается от других компьютерных программ? Очень просто — машинное обучение способно обрабатывать менее определенные наборы данных. Например, для того чтобы напечатать слово вам необходимо нажать на клавиатуре различные кнопки. Каждая кнопка точно соответствует конкретной букве. Нажав кнопку с буквой А вы точно ожидаете, что на экране появится именно буква А и ничего другого. Та же самая задача может быть решена уже с помощью машинного обучения — технологии распознавания голоса. Пользователь надиктовывает голосом слово и это слово появляется на экране. Результат точно такой же, как в случае с клавиатурой, однако усилий затрачивается меньше. Главная роль технологии распознавания голоса здесь в том, чтобы научится различать голоса разных людей и даже если шум или дефект речи привел в какой-то момент к потере какого-то звука, на экране все равно будет отображено диктуемое слово. Т.е. машинное обучение позволяет получить результат при условии, что на входе программы возможно некоторая доля неопределенности — но только относительно небольшая. И исходя из накопленных исторических данных эта неопределенность превращается в такие результаты, которые чаще всего с похожими входными параметрами встречались в прошлом.
Для тренировки модели машинного обучения берутся тексты и звуковые записи этих текстов — как итог модель «учится» сопоставлять звук и текст. Может ли голосовой ввод распознать слово, которое не было в обучающей выборке? - нет, не может. Но главное - может ли голосовой ввод самостоятельно задуматься о том, что ему нужно обучится еще какому-то слову? Также ответ отрицательный. Это крайне важные отличия его от человеческого сознания. Огромные и непреодолимые. Машинное обучение будет работать исключительно в тех рамках, которые были поставлены разработчиками. Мало того, технология очень чувствительна и легко может быть сломана. Если, к примеру, модель обучалась на текстах английского языка, а на вход ей подать русский — она выдаст такую редкую чушь, что даже при знании английского и очень сильном воображении не получится понять смысл. Или другой случай — в языке постоянно возникают новые слова. Модель не сможет их распознать и правильно отобразить на экране. Очень важный вывод — технология имеет очень сильные ограничения, возможности технологии подвержены достаточно быстрому устареванию. При проектировании разработчики стараются заложить возможность изменения входных данных (часто это называют «самообучением»). Но и это самообучение имеет жестко установленные рамки и границы и должно постоянно контролироваться и обновляться разработчиками.
Аналогично голосовому вводу работают и такие технологии машинного обучение как компьютерное зрение. Если модель «научилась» различать цифры на номерах автомобиля, то не стоит ожидать от этой модели способности отличить котиков от собачек. Модель уже сформирована и дальше заданных ей рамок не уйдет. Для того, чтобы модель могла распознавать и номера и, например, котиков - нужно готовить новую модель, а это все достаточно длительные и часто дорогостоящие процессы.
Очень важно понять, что подготовка технологии машинного обучения содержит очень небольшую часть собственно по самой подготовке модели. 90% если не больше — это создание предпосылок для того, чтобы модель в принципе могла быть создана. Необходимо подбирать под модель исторические данные, размечать их, продумывать логику обработки, оценивать качество модели, вносить изменения, внедрять в реальную жизнь и т. д. Для сравнения время на создание первой версии модели — это несколько недель. А вот сбор и разметка данных, внедрение новой модели, контроль результата в жизнь может занимать года.
О чем это говорит? О том, что массовая замена профессий на модели машинного обучения — это в принципе утопичное и голословное утверждение. Ресурсов целой страны такой как Китай на это не хватит. Но на самом деле даже одну профессию машинное обучение не может полноценно заменить. Дополнить, облегчить работу, расширить возможности - может. Но полностью заменить — нет.
Рассмотрим простой пример. Очень много сфер человеческой жизни никак не регламентированы. Среди тех, где правила более-менее понятны - это правила дорожного движения. Если взять те же системы автопилота на базе компьютерного зрения для автомобиля, то работа над ними ведется еще с 70ых годов 20 века. Успехи в развитии технологии есть, однако массового использования не наблюдаем. Почему? Потому что поток входных данных огромен. Недостаточно просто нарисовать маршрут из точки А в точку Б. Недостаточно учесть дорожные знаки. Недостаточно учесть других участников дорожного движения (хотя это уже проблематично, учитывая то, какое количество вариантов поведения даже в рамках одной ситуации возможно). Есть еще огромное число данных, которые даже учесть то трудно, не говоря о том, чтобы разметить для обучения эти ситуации (например, град, обледенения, объезды через неразмеченные грунтовые дороги и т д) а в связке с остальными это рождает огромные проблемы. Поэтому десятилетия потрачены на задачу создания автопилота (читаем — замена профессии водитель), но до завершения еще очень далеко. Скорее всего мы будем наблюдать какое-то ограниченное применение этой технологии: например в рамках фиксированных маршрутов по хорошо управляемым трассам между крупными городами или внутри городов с высоким уровнем контроля дорожного движения. Но о замены профессии как таковой говорить не приходится.
Есть области применения, в которых наоборот — люди бы явно не хотели сами работать и были бы счастливы переложить работу на роботов. Например, такие случаи как работа в условиях радиационного или химического заражения, стихийных бедствий, разминирование и т. д. Опять же — работы ведутся, дистанционное управление такими машинами вполне реально, но возможность полностью убрать человека из этой системы нет.
А вот что действительно можно ожидать — это автоматизация с помощью машинного обучения рутинных, повторяющихся и «бездумных» операций. Такие операции хорошо проработаны, по ним как правило накоплено достаточно исторических данных, есть более-менее понятный алгоритм действий и требования к качеству работы модели. А главное — понятно как их внедрять. Хороший пример — это автоматизация процессов на складах, когда роботы вместо людей переносят грузы в рамках хорошо размеченных складских помещений, где ясно при каких условиях груз взять, куда отвезти, что может встретится по пути. И ничего человеческого в этой работе нет — гораздо лучше, чтобы люди не занимались такой скучной деятельностью.
Более интеллектуальный пример — анализ бухгалтерских проводок и поиск ошибок в них. Ежемесячно бухглатера постоянно вынуждены тратить много времени на этот процесс, чтобы свести балансы по счетам. Машинное обучение может помочь — программа может находить аномалии и подсвечивать пользователю, что в этой транзакции что-то не так — проверь, пожалуйста. И бухгалтер сможет тратить меньше времени на эту работу. Ключевое — тратить меньше времени, о замене ни человека, ни профессии речь не идет. А вот время, которое освобождается можно использовать для решение более сложных задач.
Существует известная история о том, как алгоритмы машинного обучения помогли Трампу выиграть выборы. Суть истории в том, что благодаря накопленным данным и их правильной обработке аудитория фейсбука была очень детально сегментирована. Каждый сегмент формировался специально по нужным для выборной кампании критериям. И политическая агитация строилась не одна на всех как обычно, а адаптировалась под каждую аудиторию. Что и дало взрывной эффект. Очень часто именно эту историю применяют как «страшилку» для иллюстрации «могущества искусственного интеллекта». Однако именно эта история на самом деле показывает совсем иное — а именно могущество Человека, который применят машинное обучение.
Во-первых, давайте разделим процесс сбора данных, их обработку и саму агитацию. Сбор данных — это независимый процесс и он осуществлялся задолго до выборов. Аналогично процесс обработки данных. Для формирования нужных сегментов инженерам была поставлена специальная задача. Согласно поставленной задаче инженеры по сути решали простой вопрос: я точно знаю, что пользователь Джон,например, эмоционален. Могу ли я сказать, что пользователь Питер такой же, если по каким-то признакам его поведение в Фейсбуке похоже? Здесь нет никакой сложности — это базовая математическая задача. И самый большой труд в решении этой задачи не связан с машинным обучением, а связан с тем, чтобы определить какой признак как лучше трактовать. Например, как будут считаться лайки пользователя под тем или иными фото. Или какие именно слова должны содержать комментарии пользователя к постам. Это все определялось психологами, а не машинным обучением. Это называется разметка. Машинное обучение позволило лишь масштабировать разметку в масштабах такой площадки как Фейсбук. И то, только в рамках одной страны — США. Для работы в других странах скорее всего наборы того, как трактовать то или иное поведение будут другими — а значит изменятся сегменты. А значит и всю работу надо делать заново. Кроме того, после того как сегменты были созданы, работали с ними уже люди. Именно люди создавали посты, генерировали идеи для стратегий и т. д. Т.е. в данном примере машинное обучение дало людям дополнительную работу, позволило им шире проявить творчество и принесло неожиданный для всех результат. И это очень важный вывод.
Вывод:
1. Термин искусственный интеллект специально применяется для привлечения внимания. В основе технологии лежат математические принципы статистики и теории вероятности. Правильно говорить не искусственный интеллект, а машинное обучение.
2. Технологии машинного обучения — это инструмент. Инструмент, который имеет очень точные границы. И который быстро устаревает, если его не поддерживают разработчики.
3. Каждая модель машинного обучения требует много времени, денег и усилий на создание и поддержание. При этом само машинное обучение — это малая часть всей технологии.
4. Полная замена какой-либо отдельной профессии на технологию машинного обучения невозможна в принципе.
5. Технологии машинного обучения позволят взять на себя рутинные, скучные операции и дать возможность сотрудникам заниматься более интересными и творческими задачами.
6. Мощь машинного обучения состоит в том, что Человек, пользуясь этим инструментом способен проявлять больше творчества и достигнуть гораздо больших результатов, чем тот, кто будет их игнорировать.
Скрынник Евгений Витальевич