Нести мир в сознание мужчин и женщин

Широкий обзор

Четвертая революция

cou_03-18_big_data_01.jpg

Рефлексия#2. Инсталляция бразильской художницы Ракель Коган. Автоматически генерируемые компьютером числа проецируются на посетителей, превращая их в часть композиции.

Появление Интернета и мобильных устройств повлекло за собой третью промышленную революцию. Технологии искусственного интеллекта в сочетании с обработкой больших объемов данных подводят человечество к четвертой промышленной революции, которая может кардинально изменить существующий мировой порядок.

Ян Цян отвечает на вопросы Вана Чао

Скажите, как происходило совмещение технологий искусственного интеллекта (ИИ) и так называемых больших данных?

Интерес к использованию ИИ в сочетании с большими данными резко возрос с начала 2000-х годов. Когда компании Google и Baidu – тогда еще совсем молодые поисковые системы – стали применять в целях размещения рекламы рекомендательные системы на основе ИИ, результаты значительно превзошли их ожидания. И чем больше данных они собирали, тем лучше был результат. Однако на тот момент никто не думал, что в других областях эффект будет аналогичным.

Поворотным моментом в этом процессе стало появление базы данных ImageNet. Эта крупнейшая в мире база данных изображений была разработана учеными из Стэнфордского и Принстонского университетов США с целью отработки алгоритмов распознавания образов. Считается, что именно она положила начало методам глубокого обучения, совершившим настоящую революцию в сфере ИИ. Благодаря наличию в базе огромного числа изображений случаи неправильного распознавания образов удалось сократить на 10%. Это наглядно продемонстрировало, что сочетание технологий глубокого обучения и больших данных может эффективно применяться для чрезвычайно сложных вычислений.

Как бы вы охарактеризовали отношение между глубоким обучением и большими данными?

Это отношение носит взаимодополняющий характер, в его основе – взаимное совершенствование. Если интеллектуальная система хорошо продумана, она будет совершенствоваться по мере своего функционирования, становясь все более удобной и выдавая все более точный и полезный результат. Благодаря этому она будет привлекать больше пользователей, а значит, объем данных также продолжит увеличиваться, способствуя дальнейшему улучшению работы системы.

ИИ в сочетании с большими данными может стать основой новой технологии – так называемой интеллектуальной обработки данных (Data Intelligence).

Какие условия нужно соблюдать компаниям, чтобы успешно использовать большие данные в бизнес-процессах?

Первое условие – это осознанный подход к сбору данных. Иначе говоря, до того как приступать к какой-либо деятельности, следует тщательно обдумать то, как вы будете собирать данные.

Во-вторых, необходимо помнить о тесной связи сбора данных и ключевых алгоритмов. Вам нужно знать, чего не хватает в работе этих алгоритмов, и собирать данные – из различных источников – с четко поставленной целью.

Наконец, система должна автоматически регулироваться, образуя замкнутый цикл с обратной связью. Выходные данные, полученные в результате функционирования системы, должны побуждать источник данных к генерированию новых данных, которые будут поступать обратно в систему. Благодаря этому она сможет непрерывно саморегулироваться и самосовершенствоваться. Такие системы проектируются особым образом и существенно отличаются от тех, что применялись в бизнес-процессах ранее.

Расскажите подробнее о проектировании систем с обратной связью в области ИИ и больших данных.

Первый элемент, который необходимо учитывать, – это источник данных, например, пользователи. Все поведение пользователей должно регистрироваться в виде данных. Второй важный элемент – это поставщики услуг. Так, в Китае широко используются мобильная платежная система WeChat Pay и торговая интернет-площадка Taobao. На основе полученных данных генерируется обратная связь, позволяющая выявить потребности потребителей. Данные обратной связи от пользователей поступают к поставщикам услуг, а те, в свою очередь, предоставляют пользователям данные по услугам. Таким образом, образуется замкнутый цикл.

Для того чтобы система могла совершенствоваться быстро, цикл должен быть как можно короче. В идеале, система должна функционировать без участия человека – то есть процесс должен быть полностью автоматизированным, – а данные должны регулярно обновляться, лучше несколько раз в день. Цикл не должен прерываться, с тем чтобы пользователи могли передавать информацию постоянно. Если описать этот процесс тремя словами, то он должен быть коротким, быстрым и частым.

Как вы считаете, когда такие интеллектуальные системы с обратной связью станут реальностью?

Я думаю, что развитие ИИ будет проходить в два этапа. Сначала попытки внедрить эту технологию будут осуществляться во всех сферах человеческой деятельности. К примеру, технология распознавания лиц найдет применение в службах охраны и безопасности, в банковской сфере ИИ будет использоваться для управления рисками и т. д. Эти отдельно взятые технологии и решения могут применяться в уже существующих сферах деятельности.

На втором этапе начнут появляться принципиально новые отрасли, в которых ИИ будет играть ведущую роль. Так, в банках ИИ мог бы осуществлять управление инвестициями, обслуживание клиентов и кредитование в полностью автономном режиме, а банковским служащим оставалось бы лишь вносить в процесс небольшие корректировки по мере необходимости. Быть может, со временем будут созданы новые системы обслуживания клиентов, в корне отличающиеся от тех, что мы используем сегодня.

Я уверен, что именно на этом этапе ИИ по-настоящему преобразует жизнь человечества, приблизив ее к нашим представлениям о будущем. Вспомните, как развивался Интернет: сначала, когда он только появился, если обычный книжный магазин заводил себе веб-страницу, он уже считал себя онлайн-магазином, хотя в действительности он таковым не являлся. Затем появились такие сервисы, как Amazon, которые ничего общего не имеют с классическим магазином.

Использование ИИ в сочетании с большими данными может поставить под угрозу неприкосновенность частной жизни и социальную справедливость. Можно ли как-то обезопасить обмен информацией?

Комбинация технологий ИИ и больших данных позволит выработать новые, гораздо более эффективные модели ведения бизнеса. Однако до широкомасштабного внедрения таких моделей на практике надлежит решить вопрос о защите персональных данных пользователей. Для этого нужно действовать в трех направлениях:

‣ Во-первых, необходимо разработать правовые и социальные нормы, направленные на защиту права собственности на данные и четко определяющие, в каких случаях можно использовать информацию, а в каких – нельзя. На мой взгляд, пользовательские данные следует разбить на несколько категорий: например, отнести к красной категории те данные, которые использовать запрещается, к желтой – данные, доступные лишь определенному кругу лиц, и к зеленой – те, что находятся в свободном доступе. На сегодняшний день не существует ни единого подхода к классификации данных, ни закона, определяющего лицо, ответственное за соблюдение этих правовых норм, и меры наказания за их нарушение.

‣ Далее следует обеспечить конфиденциальность данных на техническом уровне. Например, пекинская компания 4Paradigm, занимающаяся разработкой технологий на основе ИИ, в настоящее время изучает вопрос использования для защиты персональных данных так называемого метода миграционного обучения (Migration Learning), который появился сравнительно недавно. С его помощью компании могли бы производить обмен данными, например, по такой схеме: компания А создает модель, интегрирует в нее соответствующие данные и передает ее компании B. Поскольку данные пользователей передаются от А к В не в чистом виде, а посредством модели, степень их защиты выше.

‣ Наконец, следует углубить изучение вопроса о связи персональной информации и установлении цен на данные. Когда пользователь нажимает на онлайн-рекламу, предложенную рекомендательной системой на основе ИИ, должна ли часть дохода от этой рекламы направляться системе? Если поисковая система приносит своему владельцу прибыль, следует ли распределять часть вырученных средств между пользователями? Эти вопросы, несомненно, заслуживают изучения.

В ближайшие годы люди начнут в полной мере осознавать важность ИИ. В этой связи следует больше внимания уделять вопросу о том, какие формы он может принять и в каких областях его целесообразно использовать. На сегодня такими областями представляются финансы, Интернет и беспилотные транспортные средства.

Как сочетание технологий ИИ и больших данных может отразиться на развивающихся странах?

Я думаю, что эти технологии помогут некоторым из них догнать или даже обогнать развитые страны, поскольку в будущем конкурентоспособность страны будет определяться не столько состоянием ее экономики и финансов, сколько объемом данных и скоростью перехода к экономике данных. Например, быстрое развитие Интернета и мобильной связи в Китае позволило собрать обширное количество данных. Несомненно, это ускорит развитие сферы ИИ в Китае и, возможно, приведет к изменению существующего мирового порядка.

В тех странах, где уже сейчас хорошо развита инфраструктура и предоставляется высококачественное образование, ИИ позволит повысить эффективность производства. Так же, как изобретение паровых двигателей способствовало развитию ряда стран во время промышленной революции.

Фото: Ракель Коган

Ван Чао

Журналист Ван Чао (Китай) является руководителем отдела по искусственному интеллекту (AI Studio) новостной компании NetEase News, освещающей события из сферы ИИ.

Ян Цян

Ученый и ведущий международный эксперт в области ИИ и интеллектуального анализа данных Ян Цян (Китай) стал первым китайцем на должности председателя Международной объединенной конференции по искусственному интеллекту (International Joint Conferences on Artificial Intelligence, IJCAI). Он является членом Ассоциации по развитию искусственного интеллекта (Association for the Advancement of Artificial Intelligence, AAAI), деканом факультета информатики и инженерных наук Гонконгского университета науки и технологии, а также соучредителем и главным научным сотрудником компании 4Paradigm.