Паника с GDPR: препятствие или стимул для развития индустрии искусственного интеллекта

Паника с GDPR может стимулировать инновации в индустрии искусственного интеллекта Фото: flickr.com/photos/justinaptaker

Если инновация искусственного интеллекта (ИИ) основывается на данных, то новые правила Общего регулирования защиты данных (GDPR) Европейского союза, похоже, могут приостановить развитие ИИ. Правила предписывают утопическое будущее данных, где потребители могут отказаться от доступа компаний к их личной информации (PII). Несмотря на то, что срок выполнения новых правил прошел, техническая инфраструктура и сотрудники необходимые для этого в большинстве компаний сегодня еще отсутствуют.

По совпадению, барьеры, препятствующие соблюдению GDPR, также являются помехой для широкого распространения ИИ. Несмотря на хайп, корпоративный ИИ все еще на стадии зарождения: компании могут владеть петабайтами данных, которые могли быть использованы для ИИ. Но полностью оцифровывать эти данные, зная, что действительно содержат таблицы данных, и понимая, кто, где и как получит доступ к этим данным, остается архисложной координацией усилий даже для самого вдохновленного мега-специалиста компании. Неудивительно, что многие стартапы ИИ, развивающиеся собственными силами, увязли в очистке данных клиентов и с пользовательской интеграцией.

Несмотря на то, что мультинациональные и технологические корпорации пересматривают их процессы управления данными и подчиняют свои технологии GDPR, здесь мы расскажем, каким образом ИИ и инновации в области данных как ни странно выигрывают от этого.

Как GDPR влияет на искусственный интеллект

GDPR охватывает сбор, обработку и перемещение данных, которые могут использоваться для идентификации человека, такие как имя, адрес электронной почты, информация о банковском счете, сообщения в социальных сетях, информация о здоровье и т. д., Все это в настоящее время используется для обеспечения алгоритмов ИИ от таргетинга рекламных объявлений до идентификации террористических ячеек.

Штраф за несоблюдение составляет 4% от глобального дохода, или 20 млн евро, в зависимости от того, что больше. Положим это на перспективу: 4% дохода Amazon в 2017 году составляют $7,2 млрд, Google - $4,4 млрд, а Facebook - $1,6 млрд. Эти правила применяются к любому гражданину ЕС, независимо от их нынешнего места жительства, а также к поставщикам компаний, которые собирают PII.

В статье 22 GDPR, озаглавленной «Автоматизированное индивидуальное принятие решений, в том числе профилирование», указывается, что ИИ не может использоваться в качестве единственного лица, принимающего решение в выборе, имеющем юридические или аналогичные существенные последствия для пользователей. На практике это означает, что модель ИИ не может быть единственным шагом для принятия решения о том, может ли заемщик получить кредит. Другими словами, клиент должен иметь возможность попросить человека просмотреть заявку.

Одним из способов избежать затрат на обеспечение соблюдения GDPR, в том числе найма сотрудника по защите данных и построение контроля доступа, является прекращение сбора данных о жителях ЕС в целом. Это привело бы к остановке зависимого от данных ИИ в ЕС. Учитывая, что ЕС составляет около 16% мирового ВВП, 11% общемировых рекламных кампаний в Интернете и 9% мирового населения в 2017 году, большие техно-компании скорее всего, инвестируют значительные средства в решения, которые позволят им продолжить работать на этом рынке.

Требования к прозрачности усиливают доступность данных

GDPR требует, чтобы компании, собирающие данные о потребителях, давали возможность отдельным лицам знать, какие данные собираются о них, понимать, как они используются, отзывать разрешение на использование конкретных данных, исправлять или обновлять данные и получать доказательства того, что данные были стерты, если клиент запрашивает это. Чтобы удовлетворить эти потенциальные запросы, компании должны перейти от раздельного сбора данных к поэтапному и децентрализованному созданию организованного процесса с четкой цепью контроля.

Любые данные, которые собираются компаниями, должны быть немедленно классифицированы как PII и получить надлежащий уровень защиты. Их местоположение в базах данных компании должно отслеживаться с помощью проверяемого маршрута: GDPR требует, чтобы организации, работающие с PII, могли находить все копии регулируемых данных независимо от того, как и где они хранятся. Эти организации должны будут назначить кого-то для управления своей инфраструктурой данных и выполнить эти запросы по конфиденциальности пользователей.

Наличие этих инфраструктур данных и процессов управления значительно снизит барьеры компании для развертывания ИИ. Полностью понимая свои активы данных, компания может стратегически планировать, где они могут развернуть ИИ в ближайшей перспективе, используя свои существующие данные. Более того, как только они строят дорожную карту ИИ, компания может определить, где им нужно получить дополнительные данные для создания более сложных и ценных алгоритмов ИИ. Благодаря упрощению создания потоков данных, созданию хранилища и созданию сети, компания может более эффективно взаимодействовать с поставщиками ИИ для развертывания своих решений по всему предприятию.

Что еще более важно, GDPR заставит многие компании стиснув зубы завершить оцифровку. Нормы GDPR требуют, чтобы данные были переносимыми: компании должны предоставить пользователям возможность загружать все собранные данные в стандартном формате. В настоящее время только 10% всех данных собираются в формате для облегчения анализа и совместного использования, и более 80% корпоративных данных сегодня неструктурированы, согласно оценкам Gartner.

Большая часть этого структурирования и извлечения информации изначально должна быть выполнена вручную, но Big Tech-компании и многие стартапы разрабатывают инструменты для ускорения этого процесса. Согласно PWC, наиболее отсталыми секторами в области оцифровки являются здравоохранение, правительство и отельный бизнес, то есть те, кто обрабатывают большое количество неструктурированных данных, содержащих PII. Полная оцифровка и структурирование этих данных могли бы дать большой поток инноваций ИИ в этих категориях, поскольку данные становятся более легкими для доступа и использования.

Пользовательский отказ требует более детализированной модели управления ИИ

В соответствии с руководящими принципами GDPR, компании должны позволить пользователям не хранить информацию о них. Если пользователь просит, чтобы компания постоянно удаляла все данные о них, она должна выполнить и показать подтверждение удаления. То, как эта норма может быть применима к алгоритму ИИ, обученному на данных, которые пользователь хочет удалить, специально не прописывается и ждет своего первого теста.

Сегодня данные объединяют, чтобы обучать алгоритму ИИ. Неясно, как инженер ИИ будет приписывать влияние конкретного свойства точки данных на общую производительность алгоритма. Если исполнители GDPR решат, что необходимо стереть эффект конкретной единицы данных в модели ИИ, в компании должны найти способы настроить модель так, чтобы она забыла данные, которые были удалены. Сегодня многие модели ИИ являются черными ящиками, и ведущие исследователи ИИ работают над тем, чтобы объяснять и настраивать модели. Нормы GDPR по сокращению данных могут ускорить прогресс в этом направлении.

В ближайшем будущем эти нормы GDPR могут формировать оптимальные методы разработки моделей UX и AI. Сегодня компании, ориентированные на GDPR, предлагают пользователям двойной выбор, позволяющий полное, эффективное неограниченное использование своих данных или без вообще какого-либо доступа. В будущем разработчики могут захотеть создать более подробные разрешения доступа к данным.

Например, прежде чем полностью удалять аккаунт в Facebook, пользователь может отказаться от доступа компаний к определенным наборам информации, например, к их сети друзей или их местоположению. Инженеры ИИ, ожидающие необходимости отслеживать влияние конкретных данных на модель, могут выбрать построение серии простых моделей, оптимизирующих одномерные измерения, вместо одной монолитной и очень сложной модели. Такой подход может иметь негативный побочный эффект на производительность, но сделает управление моделью ИИ более удобным.

Построение доверия для большего количества данных в будущем

Новые правила требуют, чтобы компании защищали PII с новым уровнем безопасности и так ранее ограниченные данные о здоровье пациента и данные о потребительском кредитовании. Почти половина компаний, недавно опрошенных Experian о GDPR, внедряют технологию обнаружения и сообщения о нарушениях данных, как только они происходят. Поскольку компании внедряют более сложную инфраструктуру данных, они смогут определить, кто должен иметь доступ к каждому потоку данных и соответствующим образом управлять разрешениями. Кроме того, компания может также выбрать инструменты, которые сразу же уведомляют пользователей, если их информация была получена неавторизованной стороной; Facebook предлагает аналогичную услугу своим сотрудникам, называемую «Sauron alert».

Хотя ограничения скорее могут говорить о снижении способности техно-компаний к доступу к данным в краткосрочной перспективе, 61% компаний видят дополнительные выгоды от готовности к GDPR, согласно недавнему отчету Deloitte. Принимая эти меры предосторожности, чтобы получить доверие клиентов, возможно, в конечном итоге снизится стоимость приобретения высококачественных соизмеримых данных.

В пост-GDPR будущем, компаниям больше не нужно будет делать выводы из дорогостоящих схем, чтобы скрытно получать информацию о клиентах. Улучшенная инфраструктура данных позволит ранним приложениям ИИ продемонстрировать свою ценность, поощряя больше клиентов добровольно делиться еще большей информацией о себе с достойными компаниями.

Естественно, что неподтвержденный потенциал роста всегда был недостаточным, чтобы мотивировать к масштабной модернизации, но угроза многомиллиардного штрафа может в конечном итоге подтолкнуть компании к действию. Что еще более важно, GDPR - это лишь первое из гораздо более четкого регулирования конфиденциальности данных, и многие страны мира рассматривают его как модель для своей собственной внутренней политики. Поскольку компании во всем мире закладывают основу для соблюдения и прозрачности, они также прокладывают путь к еще более динамичному будущему для ИИ.

По материалам: techcrunch

Читайте также в блогах на Investgazeta:

Что такое GDPR и что украинскому бизнесу важно знать о новых правилах конфиденциальности ЕС

Все веб-сайты исчезнут, и это произойдет раньше, чем вы думаете, - экс-глава Amazon Alexa

Искусственный интеллект в Голливуде: смог бы он предсказать успех фильма «Мстители: война бесконечности»?

Читайте также:

 

Комментарии

Нет созданных комментариев. Будь первым кто оставит комментарий.
Уже зарегистрированы? Войти на сайт
Гость
16.08.2018
Если вы хотите зарегистрироваться, пожалуйста заполните формы имени и имя пользователя.

Изображение капчи

Поддержать блогерскую платформу Investgazeta

 

Кнопка пожервовать - изображение

Подписаться на новые блоги на платформе Инвестгазета:

Проверь своего бизнес-партнера

Сервис «Проверь своего бизнес-партнера» - получи информацию о компании по коду ЕГРПОУ, названию компании или фамилии руководителя.

 

Курсы валют

Официальные курсы основных валют (НБУ) на сегодня
Доллар США
ЕВРО
Фунт стерлингов
Курсы основных криптовалют

 

^