Как китайский AI-гигант iFlytek сделал слежку через голосовых помощников лёгкой

Alexa может рассказать вам о погоде, Siri знает несколько шуток, а китайская компания iFlytek сделала похожего умного помощника, полюбившегося пользователям, однако её технология также помогает правительству подслушивать — представляем сокращённый перевод истории данной компании, опубликованной в Wired.  

.

Предыстория: ViaVoice

.

Джулиан Чен родился в Шанхае в 1937 году. Он изучал английский, русский и мандаринский языки, а дома говорил по-шанхайски. Позже он взялся за французский, немецкий и японский. Во время чисток конца 1950-х годов интеллектуалы были осуждены, отправлены в трудовые лагеря и даже казнены. Чен, который к тому времени был студентом престижного Пекинского университета, был сослан на пекинскую стекольную фабрику.

Работа Чена состояла в том, чтобы возить вагоны с углём и золой в заводскую печь и обратно. Он старался сохранять ясность ума, слушая разговоры своих коллег. По ночам в рабочем общежитии он составлял своего рода лингвистическую этнографию для пекинского диалекта. Он закончил книгу примерно в 1960 году. Вскоре после этого ее конфисковали аппаратчики Коммунистической партии.

Положение Чена улучшилось после смерти Мао, когда партийные лидеры поняли, что экономика Китая для развития нуждается в интеллектуалах. Чен вернулся в университет, и в 1979 году в возрасте 42 лет благодаря хорошим тестовым баллам он получил место в первой группе аспирантов, отправившихся за границу за последние десятилетия. Он переехал в США и получил докторскую степень по физике в Колумбийском университете. По окончании обучения Чен остался в Америке, получив работу в IBM: он стал заниматься физическими научными исследованиями. IBM разработала одну из первых в мире программ распознавания речи, которая позволяла профессионалам нечетко диктовать сообщения, не касаясь клавиатуры. В 1994 году компания стала искать человека, который мог бы адаптировать ее к мандаринскому языку. Это была не область Чена, но он охотно вызвался добровольцем.

Чен сразу понял, что в Китае программа распознавания речи может предложить гораздо больше, чем инструмент диктовки для офисных работников. Он полагал, что она полностью преобразует общение на его родном языке. Как письменный язык в компьютерную эпоху, китайский язык долгое время представлял собой уникальную проблему: не было простого способа ввести 50 тыс. символов на клавиатуре QWERTY. Чтобы построить свой механизм диктовки, Чен разбил мандаринский на мельчайшие элементы, называемые фонемами. Затем он нанял 54 говорящих на китайском жителей в Нью-Йорке и записал их чтение статей из People’s Daily.

Получившая название ViaVoice программа дебютировала в Китае в 1997 году. Ее коробка гласила: «Компьютер понимает мандаринский! Когда ваши руки будут свободны, ваши мысли оживут». В том же году президент Цзян Цзэминь побывал на демонстрации. Вскоре производители ПК по всему Китаю, включая конкурентов IBM, начали предустановку программного обеспечения на свои устройства. Эра свободного общения с компьютером была ещё очень далека, у ViaVoice нашлись свои ограничения, но ПО облегчало ввод текста на китайском языке, и оно прижилось у соотечественников Чена.

Некоторым ученым, оставшимся в Китае, было обидно, что именно исследователь, работающий на американскую компанию, сделал первый шаг к завоеванию китайского языка.

.

История iFlytek

.

Среди тех, кто вдохновился триумфом IBM, был Лю Цинфэн, 26-летний аспирант в лаборатории распознавания речи в престижном университете науки и техники Китая в Хэфэе (USTC). В 1999 году, будучи в USTC, Лю основал компанию голосовых вычислений iFlytek. Цель, казалось, состояла не просто в том, чтобы конкурировать с IBM и другими иностранными фирмами, но и в том, чтобы создать продукты, которые вернули бы китайцам гордость. Сначала Лю и его коллеги делали разработки в кампусе USTC. Позже они переехали в другое место Хэфэя.

Несмотря на то что технология голосового интерфейса представляла собой переполненную, непопулярную нишу, амбиции Лю придавали ей возвышенную моральную ценность. «Голос — это основа культуры и символ нации, — рассказывал он позже о происхождении iFlytek. —Многие люди думали, что они [иностранные компании] держат нас за горло». Когда некоторые члены его команды предложили диверсифицировать компанию в нечто действительно важное для государства, Лю решительно заявил: любой, кто не верит в голосовые вычисления, может уйти. Тонкость его задумки заключалась в построении здорового бизнеса, помогающего корпоративным клиентам автоматизировать свои колл-центры, заменяя людей-операторов голосовыми меню телефонов («чтобы произвести оплату, скажите «оплата»»). iFlytek взлетел, когда внедрил такие меню для телекоммуникационной компании Huawei.

iFlytek стала публичной компанией в 2008 году и запустила крупный потребительский продукт — приложение iFlytek Input — в 2010 году. В том же году Apple iPhone оснастили Siri, которая была разработана SRI International и приобретена Apple. Но если Siri была «личным помощником» — говорящим цифровым консьержем, который мог отвечать на вопросы, — iFlytek Input оказалась более «глубокой». Она позволила людям диктовать текст в любом месте на своих телефонах: в электронной почте, в веб-поиске или в WeChat, суперприложении, которое доминирует как в работе, так и в играх в Китае.

Как и любая технология, обученная взаимодействию с человеческой речью, ввод данных вначале был неточным. Но по мере того, как объем данных из реальных взаимодействий пользователей с приложением начал увеличиваться, точность ввода при транскрипции речи в текст резко возросла. Более поздние версии позволили людям переводить свои личные разговоры и получать закрытые субтитры телефонных звонков на 23 китайских диалектах и 4 иностранных языках. В сочетании с большим населением Китая акцент на перевод позволил компании собирать огромные объёмы данных.

«На Западе существуют проблемы с конфиденциальностью пользователей, — говорит Джун Ду, ученый из USTC, который курировал техническую разработку приложения. — Но в Китае мы заключаем контракт с пользователями и можем использовать их данные».

В 2017 году MIT Technology Review включил iFlytek в свой список 50 самых умных компаний мира, и китайское правительство предоставило ей желанное место в своей тщательно подобранной национальной «Команде искусственного интеллекта». Другими выбранными в том же году компаниями были гиганты Baidu, Alibaba и Tencent. Вскоре после этого iFlytek подписала пятилетнее соглашение о сотрудничестве с лабораторией компьютерных наук и искусственного интеллекта Массачусетского технологического института (CSAIL), ведущей лабораторией искусственного интеллекта. Технология перевода компании используется испанским футбольным клубом RCD Espanyol, она также подписала эксклюзивное соглашение о предоставлении автоматизированного перевода для зимних Олимпийских игр 2022 года в Пекине. По состоянию на середину апреля iFlytek была оценена на Шэньчжэньской фондовой бирже в 10,8 млрд долл. Компания утверждает, что обладает 70% китайского рынка голосовой связи с 700 млн конечных пользователей.
Спустя два десятилетия после того, как Джулиан Чэнь интуитивно понял, что голосовые вычисления произведут революцию во взаимодействии людей с компьютерами в Китае, их влияние там действительно высоко. Согласно данным за 2017 год, каждый день пользователи WeChat отправляют около шести млрд различных голосовых сообщений.

Лю убежден, что голосовые вычисления когда-нибудь проникнут во все сферы общества. Недавно он сказал интервьюеру государственного онлайн-видеоканала: «Это будет так же распространено, как вода и электричество. Это мечта, которая полностью соответствует видению китайской Коммунистической партии о государстве наблюдения».

.

iFlytek: «военно-гражданское слияние»

В 2009 году глава Министерства общественной безопасности Китая Мэн Цзяньчжу отправился в Хэфэй и посетил штаб-квартиру iFlytek. Согласно отчету, размещенному на сайте центрального правительства, он говорил там о необходимости «тесного сотрудничества органов общественной безопасности с технологическими компаниями для создания систем предупреждения и контроля».

По мере того как министерство наращивало свои возможности наблюдения в течение последнего десятилетия, она установила миллионы камер, ввела электронные удостоверения личности и регистрацию реальных имен в интернете, а также построила управляемые технологиями умные города. iFlytek помогла правительству интегрировать аудиосигналы в эту сеть цифрового наблюдения, сообщала Human Rights Watch.

Компания — символ широких усилий китайского правительства под названием «военно-гражданское слияние», которое направлено на использование достижений в технологическом секторе Китая для военной мощи. «Flytek способствует военно-гражданскому слиянию довольно активно», — говорит Эльза Кания, сотрудница Центра новой американской безопасности в Вашингтоне, который изучает искусственный интеллект в Китае. По ее словам, компания занимается и потребительскими приложениями, но приложения, ориентированные на общественную безопасность, полицию и оборону также занимают важное место.

В 2012 году Министерство общественной безопасности приобрело у iFlytek устройства, ориентированные на интеллектуальную голосовую технологию. Министерство выбрало провинцию Аньхой, где находится штаб-квартира iFlytek, в качестве одного из пилотных мест для составления базы данных голосовых образцов — каталога уникальной речи людей, который позволил бы властям идентифицировать говорящих по звуку их голоса. Согласно Белой книге компании, загруженной в интернет в 2013 году, рабочая станция может взять фрагмент аудио, сравнить его с голосами двухсот динамиков и выбрать человека менее чем за две секунды.

В 2017 году американская правозащитная Human Rights Watch опубликовала доклад с подробным изложением правительственной работы iFlytek. Исследователь правозащитной группы Майя Ванг говорит, что инструменты компании являются существенной частью плана партии «построить цифровое тоталитарное государство». Компания назвала это обвинение «необоснованным и абсурдным». «Голосовые биометрические технологии iFlytek позволяют отслеживать и идентифицировать людей», — говорит Ванг. В какой-то момент благородная попытка вернуть себе китайский язык и облегчить общение стала неотличима от попытки контролировать его.

В последние годы iFlytek вступила в стадию международной экспансии, выступая посредником в научно-исследовательских партнерствах с университетами Канады, Новой Зеландии и Соединенных Штатов. По случаю своего соглашения с CSAIL Массачусетского технологического института директор лаборатории Даниэла Рус заявила, что партнерство будет сосредоточено на решении «самых больших проблем 21-го века путем поиска путей более эффективного использования сильных сторон как человеческого, так и искусственного интеллекта». Критики придерживались более циничной точки зрения: iFlytek отдала неназванную сумму денег в обмен на престиж бренда MIT.

В октябре прошлого года Министерство торговли включило iFlytek в список предприятий правительства США, на который  распространяются экспортные ограничения. В ответ на это Лю Цинфэн разместил на сайте компании вызывающее послание на китайском языке, которое мало могло развеять представления о тесных связях с китайским правительством. «Без революционных мучеников, отдающих свою кровь, сегодня не было бы современного Китая, — гласила надпись. — Без процветания и развития современного Китая iFlytek не смогла бы дебютировать на индустриальной сцене… Нет такой силы, которая могла бы остановить наши уверенность и скорость в построении прекрасного мира с искусственным интеллектом!» На следующий день госсекретарь США Майк Помпео в своей речи коснулся репрессий в Синьцзяне. «Там оживают страницы «1984» Джорджа Оруэлла», — сказал он.

Прошлой осенью в ответ на отправленные по электронной почте вопросы представитель CSAIL заявил, что добавление iFlytek в список организаций вызвало пересмотр со стороны MIT, но что в промежуточном периоде CSAIL продолжит сотрудничество с партнерством. В апреле, после того как WIRED отправила ещё несколько запросов, MIT объявил, что прекратил отношения с компанией в феврале. Университет не стал бы раскрывать причины такого решения.

В Соединенных Штатах такие компании, как Apple, упорно боролись с представлением о том, что их устройства подслушивают. В Китае, однако, это было тем, что продается.

Оригинал статьи

Контакты

По общим вопросам

[email protected]

По юридическим вопросам

[email protected]

Для СМИ

Телеграм: moi_fee
Signal: moi_fee.13

18+

23 декабря 2022 года Минюст включил Роскомсвободу в реестр незарегистрированных общественных объединений, выполняющих функции иностранного агента. Мы не согласны с этим решением и обжалуем его в суде.