Кто такой виртуальный ассистент

Голос, пол и характер: как придумывают личность виртуальным ассистентам

Кто такой виртуальный ассистент. Смотреть фото Кто такой виртуальный ассистент. Смотреть картинку Кто такой виртуальный ассистент. Картинка про Кто такой виртуальный ассистент. Фото Кто такой виртуальный ассистент

Об эксперте: Игорь Калинин, основатель компании TWIN.

Цифровое доверие

Более 3 млрд людей регулярно обращаются к голосовым ассистентам — одним только Google Assistant пользуются 500 млн человек. Siri, Alexa, Bixby, «Алиса», а также тысячи других помощников и сервисных ботов за последние 5-10 лет проделали огромный путь. Синтетические голоса и предписанные однообразные скрипты остаются в прошлом — на передний план выходят живые диалоги, вариативные сценарии и более развитые алгоритмы синтеза и распознавания речи.

ИТ-гиганты вкладывают в голосовых помощников миллиарды долларов. А компании готовы тратить миллионы ежемесячно на развитие и совершенствование смарт-систем для общения с клиентами — довольствоваться базовыми настройками они уже не хотят. Современный голосовой ассистент — неважно, в b2b- или b2c-сегменте — это максимально реалистичная симуляция собеседника, с неподдельными интонациями, вариативностью, а главное, набором уникальных черт.

Личностными характеристиками в последние годы стали наделять даже обслуживающих ботов, которые решают задачи бизнеса. Конечно, они не пытаются шутить или рассказывать сказки, как Siri, но могут проявлять эмпатию или, наоборот, твердость. Для работы над скриптами привлекают психологов, лингвистов, сторителлеров и профессиональных сценаристов, а ассистентов все чаще наделяют именами, узнаваемым голосом, а иногда и визуальным образом.

Кто такой виртуальный ассистент. Смотреть фото Кто такой виртуальный ассистент. Смотреть картинку Кто такой виртуальный ассистент. Картинка про Кто такой виртуальный ассистент. Фото Кто такой виртуальный ассистент

Но зачем это брендам?

Элементы личности бота

Людям сложно коммуницировать с обезличенными собеседниками: клиенты хотят представлять, с кем именно общаются, тем более если ведут диалог по телефону или в мессенджере. В случае с ботами имя запоминается лучше, чем абстрактный номер или код. Имя становится синонимом бренда и в то же время создает иллюзию дружеского общения — это повышает восприимчивость. Люди часто вешают трубку, когда понимают, что общаются с обезличенным ботом. У помощника, который представляется, больше шансов быть услышанным.

Для бизнеса ИИ — это такой же сотрудник компании, только виртуальный, поэтому он должен обладать именем. Например, мы разрабатывали помощницу для цифрового офиса СК УРАЛСИБ Страхование. Ее задача — напоминать о выплатах и выступать в роли интерактивного советника для клиентов и партнеров компании. В этом случае важно было наделить бота не только именем, но и фамилией — так появилась Оксана Соколова. При утверждении концепции цифрового офиса помощницу переименовали: чтобы сгладить образ, фамилию Соколова заменили на более мягкую — Соловьева. Также компания разработала прототип аватара для виртуальной советницы.

Кто такой виртуальный ассистент. Смотреть фото Кто такой виртуальный ассистент. Смотреть картинку Кто такой виртуальный ассистент. Картинка про Кто такой виртуальный ассистент. Фото Кто такой виртуальный ассистент

Подбор имен для голосовых сервисов — это отдельная наука. Большинство компаний-разработчиков делает ставку на простые и понятные имена, которые легко произносить и печатать. Также бизнесу важно, чтобы имя бота запоминалось, но при этом не вызывало негативных ассоциаций. Как раз по этой причине бренды чаще всего делают ставку на нейтральные имена — такие, как Аня, Олег или Оксана.

Впрочем, не все используют имена. Например, Google Assistant намеренно отказалась от имени — компания хотела, чтобы виртуальный ассистент ассоциировался с линейкой продуктов Google, оставаясь при этом максимально нейтральным.

Большинство голосовых помощников на момент запуска обладали только женским голосом, за что их разработчики часто подвергались критике. Эксперты ЮНЕСКО отмечали, что такой формат укрепляет гендерные предрассудки и предписывает женщинам обслуживающую роль.

На эту проблему нужно посмотреть с позиции разработчика. Исследования показывают, что люди разного пола лучше распознают именно женские голоса. К тому же большинство text-to-speech систем натренированы на записях женской речи, поэтому создать помощницу проще, чем помощника.

В некоторых случаях сервисам дают голоса знаменитостей — опять же в маркетинговых целях. Причем приглашать звезду в студию не требуется — всю работу выполняют алгоритмы. Например, нейросетевые модели WaveNet помогли Google создать имитацию голоса певца Джона Ледженда.

Интересно, что в последнее время голосов становится все больше и они не ограничиваются только женскими и мужскими. Так, Google маркирует разные варианты не гендерным признаком, а оттенками — всего у компании более 11 различных голосов только на английском языке. Появляются и нейтральные боты, например, Q, который разговаривает на частотах, которые затрудняют распознавание гендера.

В случае с ботами многое зависит от сферы услуг, в которой их используют. Если банку нужно напомнить клиенту о задолженности, он может задействовать мужской голос. Если курьерская служба предлагает клиенту скидку, то виртуального оператора по традиции наделят женским голосом. Например, в банке «Тинькофф» утверждают, что люди охотнее общаются на финансовые темы с мужчинами, чем с женщинами. Поэтому команда создала помощника по имени Олег — мужчину 25-40 лет.

Характер — это, пожалуй, самый сложный элемент любого голосового помощника. Разработчики пытаются найти баланс между безликостью и индивидуальностью, чтобы ассистент мог поддержать живой диалог, но в то же время не высказывал свое мнение по противоречивым вопросам и сохранял нейтралитет.

Кто такой виртуальный ассистент. Смотреть фото Кто такой виртуальный ассистент. Смотреть картинку Кто такой виртуальный ассистент. Картинка про Кто такой виртуальный ассистент. Фото Кто такой виртуальный ассистент

Для этого к работе над скриптами привлекают целый пул специалистов. Например, психологи работают над формулировками в сложных ситуациях, особенно если собеседник делится с ботом мрачными мыслями. Дизайнеры разговоров учат бота поддерживать диалог и казаться естественным, а комики создают подобие чувства юмора.

Впрочем, подобные характеристики обычно нужны виртуальным помощникам, сценарии взаимодействия с которыми постоянно меняются. При разработке сервисного ИИ компании важно учитывать, какие именно задачи она решает с помощью бота и какой процесс хочет оптимизировать.

Чаще всего бизнес стремится проводить как можно больше звонков за короткий промежуток времени, поэтому главное — это экономия и эффективность. Сервисным ботам шутки, скорее, мешают, потому что они усложняют диалог и замедляют обработку звонка. А сокращение диалога с 1 минуты до 50 секунд может сэкономить немало ресурсов. Эмпатия также уместна не всегда — например, банковскому помощнику не так важно проявлять сочувствие, тогда как медицинскому боту без этого не обойтись.

Использование уже готовых сценариев — референсных диалогов — обычно упрощает задачу и помогает быстро создавать точечные решения с учетом потребностей каждой компании. Хотя сейчас на рынке принято создавать ботов с нуля, это не самая эффективная стратегия. Как показывает практика, лучше записать сотню реальных диалогов и выбрать из них два идеальных сценария, а потом воспроизвести их с помощью нейросети.

В TWIN мы всегда опираемся на референсы — беседы с наибольшей конверсией преобразуем в текст, проводим разметку данных и на основе полученной базы обучаем нейросеть и синтезируем речь. Так создаются реалистичные сервисные боты. В будущем этот процесс можно будет выстраивать автоматически — достаточно загрузить в систему образцовый диалог-референс и нажать «Преобразовать».

Кто такой виртуальный ассистент. Смотреть фото Кто такой виртуальный ассистент. Смотреть картинку Кто такой виртуальный ассистент. Картинка про Кто такой виртуальный ассистент. Фото Кто такой виртуальный ассистент

Проработанная личность сервисному боту обычно также не требуется. Важнее добавить эмоциональный окрас. Для этого дизайнеры диалогов могут задействовать разные приемы: например, использовать теорию Карла Юнга об архетипах или наделить бота определенной акцентуацией. Многое зависит от собеседника — для этого мы, например, считываем настроение клиента. Бот или оператор будут менять тактику в зависимости от того, настроен человек позитивно, негативно или нейтрально.

На то, как клиент воспринимает помощника, влияют многие мелкие факторы, которые со стороны могут показаться незначительными. Например, правильное ударение в имени и фамилии при обращении к клиенту. Это усложняет процесс синтеза речи, потому что нужно сверять данные по базам и проверять ударение для каждого элемента ФИО. Но такие детали играют важную роль, ведь достаточно одной ошибки, чтобы клиент мгновенно потерял доверие к боту.

Будущее цифровой личности

Несмотря на все эксперименты, боты пока далеки от совершенства: они все еще не могут работать автономно, выполняя задачи секретаря и персонального помощника. Паритет между искусственным интеллектом и человеком на диалоговом уровне пока не достигнут, а создать виртуального собеседника на основе реального — до сих пор непростая задача, которую пытаются решить многие компании.

Очевидно, что в будущем базы данных расширятся, а тренировать нейросети будет проще. Пару лет назад исследователи из Facebook запустили Persona-Chat — базу данных, в которую входит более 160 тыс. отрывков диалогов реальных людей. С ее помощью компания будет обучать компьютерные модели.

Пока первостепенная задача ассистентов и ботов — это помощь людям. Для этого они должны понимать не только речь, но эмоции и намерения собеседника, а также решать задачи самого клиента или бизнеса. Личностные характеристики, которые положительно влияют на эффективность, продолжат развиваться. Но создавать реалистичные цифровые копии людей для бизнес-задач пока не имеет смысла. Цель существования бота — это выполнение конкретной функции, и в этом заключается его принципиальное отличие от человека.

Подписывайтесь на Telegram-канал РБК Тренды и будьте в курсе актуальных тенденций и прогнозов о будущем технологий, эко-номики, образования и инноваций.

Источник

Как стать виртуальным ассистентом и зарабатывать на этом.

Знание — сила. А хорошее знание иностранных языков, это мега сила. Особенно, при поиске новой высокооплачиваемой работы, с хорошими условиями и с возможностью работы из дома.

Конечно, удаленной работой теперь никого не удивишь, ведь таких работ с каждым годом становится все больше. Но если вы знаете только свой язык, то по сути, вы очень сильно ограничены. Другое дело, это хорошее знание иностранных языков, в первую очередь, английского. Ведь тогда, вы можете выбирать работу не только в своей стране, но и во всём мире. А это означает, больший выбор и большую зарплату.

Говоря про работу связанную со знанием иностранных языков на ум сразу приходит работа переводчика. Об этой работе вы можете узнать из этой статьи. Но переводами выбор не заканчивается. И сегодня я вам расскажу про работу виртуальным ассистентом.

Кто такой виртуальный ассистент. Смотреть фото Кто такой виртуальный ассистент. Смотреть картинку Кто такой виртуальный ассистент. Картинка про Кто такой виртуальный ассистент. Фото Кто такой виртуальный ассистент

Кто такой виртуальный ассистент?

Виртуальный ассистен — это независимый работник, который предоставляет административные услуги клиентам, работая за пределами офиса клиента. Такой помощник обычно работает из домашнего офиса, но может получить удаленный доступ к необходимым документам планирования.

Люди, работающие в качестве виртуальных ассистентов, часто имеют опыт работы в качестве административного помощника или офис-менеджера в течение нескольких лет. Новые возможности открываются для онлайн-помощников, обладающих навыками в социальных сетях, управлении контентом, написании блогов, графическом дизайне и интернет-маркетинге.

Чем занимается виртуальный ассистент?

Лучше спросить — чем такой ассистент не занимается.

От выполнения общих задач, как это делал бы виртуальный секретарь, до специализации в бухгалтерии или управлении социальными сетями. Виды работ, которые могут на себя взять виртуальные ассистенты, бесчисленны.

Размышляя о том, как стать личным онлайн-помощником, большинство людей предполагает, что это включает в себя обычную офисную работу, такую ​​как проверка электронной почты, ответы на телефонные звонки, управление встречами и остальное в этом же духе.

Да, такая работа тоже есть. Но работая виртуальным ассистентом, вы можете выполнять и ряд других задач.

Ассистенты могут делать что угодно. Вот лишь несколько востребованных услуг, которыми вы можете заняться прямо сейчас.

Кто такой виртуальный ассистент. Смотреть фото Кто такой виртуальный ассистент. Смотреть картинку Кто такой виртуальный ассистент. Картинка про Кто такой виртуальный ассистент. Фото Кто такой виртуальный ассистент

Сколько может заработать виртуальный ассистент.

Сколько вы будете зарабатываете в качестве виртуального ассистента, зависит от ваших навыков, опыта и того, сколько часов вы хотите этому посвятить.

Но если говорить про средние значения, то это примерно от 15 до 50 долларов в час. После создания клиентской базы можно зарабатывать до 100 долларов и более в час. Но помните, эти заработки касаются работы на англоязычном рынке, в первую очередь на американском.

То есть, от вас требуется хорошее знание английского языка, а также специфику профессий на американском рынке. Кроме того, будьте готовы работать в соответствующее время (в США день, в России ночь).

Как стать виртуальным ассистентом?

Вам не потребуется сертификат виртуального помощника. Отсутствие опыта — не проблема. Даже начиная с нуля, вы можете построить прибыльную карьеру. Вот что вам может потребоваться, при поиске вакансии, чтобы зарабатывать ассистентом удаленно.

Выберите навыки, которые вы будете предлагать своим клиентам.

Это область, где многие люди впадают в ступор. Вы хотите работать в качестве виртуального ассистента, но не знаете, какие услуги предложить своим клиентам.

Как новичок, выберите себе один тип задач и сосредоточьтесь на нем, прокачивая все необходимые навыки для этого и становясь экспертом в своей области. Помните, ваш часовой заработок будет на 90% зависеть от вашей квалификации в какой-то одной области.

Если выбранная вами тема не сработала, или она вам не понравилась, то посмотрите другую тему.

Имейте в виду, что обычно вы можете брать больше за задачи, которые требуют более высокого уровня компетенции.

Например, управление электронной почтой, планирование, обслуживание клиентов и общие исследования относительно не квалифицированы.

Если у вас есть опыт и навыки работы в бухгалтерии, управлении Pinterest, рекламой на Facebook, веб-дизайна или разработки приложений, вы можете начать с этих вакансий. Это может помочь вам увеличить свой доход быстрее.

Присутствуйте в интернете.

Это не только физический выход в интернет. Работа в интернете обычно требует, чтобы у вас была личность в интернете. Это означает, что вам, вероятно, нужен сайт и присутствие в социальных сетях. Без этого поиск работы будет сложным.

Наличие сайта значительно упрощает возможность доказать потенциальным клиентам, что вы настоящий человек.

Как бы ужасным это ни казалось, но на самом деле создать сайт не так уж сложно. WordPress — самая распространенная платформа для использования, и работать с ней просто. Даже не программистам))

Это лишь немногим сложнее работы с офисными программами, такими как Word, Excel, или с почтовыми программами.

Создавая свой сайт и социальные профили, ставьте своего клиента на первое место. Добавить немного индивидуальности — это нормально, но не переусердствуйте.

Убедитесь в том, что ваш сайт хорош. Об этом в интернете есть масса материалов и хороший сайт можно сделать буквально за пару часов. Максимум, за пару вечеров.

Наличие присутствия в сети — отличный способ завязать знакомство с новыми клиентами. Когда вы общаетесь, очень важно строить отношения. Предоставление потенциальным клиентам ссылки на ваш сайт — это хороший способ построить свои отношения с клиентом на длительный период.

Это также прекрасная возможность поделиться своими талантами. После завершения нескольких проектов попросите клиентов оставить отзывы на вашем сайте. Это социальное доказательство, которое будет отличать вас от других виртуальных ассистентов и может сильно упростить своё продвижение и увеличить заработок.

Как найти работу виртуальным ассистентом?

Самый простой способ, чтобы начать работу, это использование таких площадок как Upwork и Fiverr. Для обычного человека, это самый быстрый способ, чтобы найти своего первого клиента.

Кто такой виртуальный ассистент. Смотреть фото Кто такой виртуальный ассистент. Смотреть картинку Кто такой виртуальный ассистент. Картинка про Кто такой виртуальный ассистент. Фото Кто такой виртуальный ассистент

Но не зацикливайтесь на этих площадках. С самого начала карьеры, вам нужно выстраивать отношения со всеми потенциальными клиентами.

Начните с контактов с людьми, которых вы уже знаете. Если вы знаете блоггеров или тех, кто уже зарабатывает деньги в интернете, спросите, не нужен ли им помощник. Возможно конкретно им не нужен помощник, но они могут знать тех, кому помощник нужен.

LinkedIn — это еще одно место, где потенциальные клиенты могут зависать. Например, если вы ищете работу в сфере недвижимости, найдите группу по недвижимости в LinkedIn.

Заключение

Заработок сидя дома в интернете, уже давным давно не фантастика. И все большая глобализация делают наш мир все более взаимосвязанным. Уже давно прошли времена, когда работу можно было найти только в своем городке.

Теперь, весь мир перед вами! И работа виртуальными ассистентом, это хороший способ выйти за пределы своего городка и получить достойный доход.

Источник

Виртуальный ассистент – профессия будущего

Представьте ситуацию: вы живёте в стране, в которой не имеете возможности работать. Дети подрастают, хочется реализоваться профессионально, но идей для собственного бизнеса нет, да и времени свободного всего час-два в день. Знакомо?

Думаю, что я не одинока в таком положении. Живу на Кипре уже давно, но разрешения на работу нет, да и найти работу в нашей деревне довольно сложно. Поэтому я начала думать об удаленной работе через интернет – вела собственный блог, администрировала несколько групп в Фейсбуке для поддержки местного комьюнити, писала статьи, фотографировала, но не понимала, как перевести это хобби в оплачиваемую деятельность.

Да, я читала рекламные статьи школ, которые онлайн обучают различным профессиям, но мне было непонятно, как потом находить работу, как работать с клиентами, чем зацепить клиента, когда на рынке множество таких новичков, как я…

И вот, когда некоторое время назад я прочитала статью о профессии «Виртуальный ассистент», во мне щелкнуло – вот оно! То дело, которое я искала.

Кто такой виртуальный ассистент? Это универсальный специалист, который помогает предпринимателю вести бизнес в интернете – наполняет страницы в социальных сетях, верстает лендинги и презентации, организовывает вебинары и налаживает почтовую рассылку. В зависимости от предыдущего опыта, ассистент может специализироваться в том или ином направлении. Но в целом, это человек, который хорошо ориентируется в интернете, может найти нужный сервис, написать запрос, проконтролировать подрядчиков и быть тем многоруким многостаночником, который снимет с предпринимателя рутинные обязанности. И не важно, в какой стране живёт предприниматель и какое гражданство имеет Виртуальный ассистент – они встречаются и сотрудничают в интернете.

Я погуглила и поняла, что в англоязычной среде эта профессия очень распространена, даже существуют ассоциации бизнес-помощников. На русскоязычном пространстве информации меньше, но есть несколько школ подготовки виртуальных ассистентов. И все они – что очень ценно – обещают помощь со стажировками и трудоустройством. Результаты исследования школ, которые готовят бизнес-помощников, вы можете посмотреть на моей странице в фейсбуке Я остановилась на Международной школе подготовки бизнес-ассистентов и интернет-маркетологов “Helppy” Ольги Шевченко и ни минуты не пожалела. И организация обучения, и полезность информации – на высоте!

Обучение длится пять недель, и погружение в учебу полное. За 35 дней ты вникаешь в принципы организации интернет-бизнеса, верстаешь презентацию в Пауэр Поинт, составляешь контент-план и график постов в рамках тобой же разработанной стратегии продвижения в соцсетях, верстаешь лендинг – одностраничный сайт, а так же – ТА-ДАМ! – составляешь портфолио для самого себя. Понятно, что это не все темы, а только те, по которым требовалось сдать домашнее задание, и над которым мы все корпели ночами. На все домашки ты получаешь развёрнутые ответы, и очень редко удавалось сдать их с первого раза, спрашивали очень строго – то типографика хромает, то дизайн подвёл.

Кроме лекций и обучающего материала, в закрытом разделе собрана база данных полезных статей, в секретной группе кипит жизнь – кураторы и сокурсники обсуждают задания, а по пятницам Ольга Шевченко разговаривает с каждым курсистом отдельно и отвечает на все волнующие вопросы.

Хорошо, что я начала учиться заранее, поэтому даже успевала спать и вести клиентов, которых нашла тут же, рядом с собой. Дело в том, что, начиная заниматься и вникать в тему, у тебя обостряется зрение и ты видишь, что в этом проекте, например, ты можешь быть полезной, а здесь ты можешь докрутить страницу и получить совсем другие результаты. Ты предлагаешь свои услуги, показываешь, что можешь сделать, как можешь помочь, и люди откликаются. Я и многие сокурсники именно так получили работу.

Я не обещаю лёгкой жизни – учиться и работать надо будет много, информация в интернете меняется быстро, у Фейсбука, например, нововведения каждую неделю, ежедневно на рынок труда выходит всё больше людей. Надо будет выстраивать свой график работы и думать о тайм-менеджменте. Например, черновик этой статьи я набирала на телефоне в гугл-кипе в то время, пока мастер педикюра работала с моими ногами. А от одного, очень перспективного предложения пришлось отказаться, потому что я понимала – или работа, или семья, третьего не дано, со всем в данный момент не справлюсь.

Профессия виртуального ассистента – хорошая ступенька для тех, кто выходит из декрета и живёт в том месте, где устроиться на работу сложно. Это профессия для того, кто умеет работать с большим количеством информации и в состоянии организовать рабочие процессы и самого себя. А дальше можно покорять новые вершины, и истории выпускников школы тому подтверждение.

Если я вас убедила, то загляните на сайт школы Helppy, а от меня вам мой промо-код выпускника «utesheva» со скидкой 10%.

Источник

Исследовательский практикум. Голосовые виртуальные ассистенты – что с ними не так?

Введение

Аналитики, исследующие сервисы чат-ботов и виртуальных ассистентов, обещают рост рынка как минимум 30% в год. В абсолютных цифрах, по состоянию на 2019 год, рынок оценивался более чем в 2 миллиарда долларов в год. Виртуальных голосовых помощников выпустили практически все ведущие мировые IT-компании, а основную работу по их популяризации уже провели Apple, Google и Amazon.

Кто такой виртуальный ассистент. Смотреть фото Кто такой виртуальный ассистент. Смотреть картинку Кто такой виртуальный ассистент. Картинка про Кто такой виртуальный ассистент. Фото Кто такой виртуальный ассистент

На российском рынке тоже наметились свои лидеры в этой области. Первым крупным игроком, запустивших собственного голосового ассистента в России, стал «Яндекс». По данным компании, публикуемым официально, Алисой пользуется 45 миллионов пользователей в месяц, а число ежемесячных запросов к ассистенту – составляет более 1 млрд. По мнению специалистов, 2020 год может стать для рынка голосовых ассистентов переломным – конкуренция платформ и брендов приведет к росту узнаваемости ассистентов.

В общем, то, что рынок голосовых ассистентов – интересная ниша, сомневаться не приходится. И первая идея, которая приходит в голову – взять любой из доступных сервисов ASR (Automatic Speech Recognition) и TTS (Text To Speech), связать их с конструктором ботов, имеющим поддержку NLU (Natural Language Understanding), и все! Тем более что все это довольно легко и быстро можно реализовать в облачных платформах, таких как Twilio и VoxImplant.

Проблема только в том, что полученный результат будет весьма посредственным. В чем же причина этого? Прежде всего попробуем понять почему совокупность довольно-таки неплохих технологий, собранных вместе дают такой посредственный результат. Это важно, т.к. в реальной жизни клиент всегда будет отдавать предпочтение тому сервису, чей голосовой сервис удобнее, интереснее, умнее и быстрее прочих.

Как работает типичный голосовой ассистент

Прежде всего отметим, что наша речь представляет из себя последовательность звуков. Звук в свою очередь — это наложение звуковых колебаний (волн) различных частот. Волна же, как нам известно из физики, характеризуются двумя атрибутами — амплитудой и частотой.

Кто такой виртуальный ассистент. Смотреть фото Кто такой виртуальный ассистент. Смотреть картинку Кто такой виртуальный ассистент. Картинка про Кто такой виртуальный ассистент. Фото Кто такой виртуальный ассистент
Речевой сигнал

Алгоритм работы ассистента:

После этого начинается процесс распознавания, и первой задачей, которую приходится решать, является разбиение всего аудио-фрагмента на отдельные слова. Речь содержит в себе некоторые паузы (промежутки тишины), которые можно считать «разделителями» слов. В итоге получается, что нам необходимо найти некоторое значение, порог — значения выше которого являются словом, ниже — тишиной. Вариантов тут может быть несколько, но это уже детали реализации, которые нам сейчас не особо интересны. Важно только понимать, что это не константа, а динамически вычисляемая величина, например, на основе анализа энтропии.

Далее происходит выделение фонем, работа с фонетическом алфавитом и в общем много чего еще, включая работу с вариантами произношения, морфологией и семантикой, причем исходя из контекста и статистики. Итогом становится то, что сервис ASR переводит набор фонем в слово.

Выделение набора слов в предложения и целые смысловые фразы, происходит аналогично делению речи на слова – по интервалам между словами. Только в этом случае величина интервала принимается большей, чем в случае деления на слова.

Возникающие проблемы

Несмотря на кажущуюся очевидную правильность реализуемого подхода, в случае голосового ассистента он несет массу проблем. Вот основные из них:

Я не просто так на первые три места поставил одну и туже проблему. Считается, что для комфортного общения ответ должен быть озвучен, примерно через 500 миллисекунд после того, как собеседник закончил формулировать свое сообщение.

Исходя из реальной практики по реализации голосовых ассистентов, в случае задержки более чем в 1 сек. голосовой ассистент довольно часто будет слышать от собеседника-человека характерные для «проверки связи» фразы: «Алло!» или «Меня слышно?». Это особенно свойственно для случаев, когда разработчики пытаются скрыть тот факт, что с человеком общается робот, особенно при исходящих телефонных обзвонах, используя вместо синтеза речи набор заранее предзаписанных аудио-файлов, сделанных реальным человеком.

Основная сложность здесь состоит в том, что в указанный интервал времени должно уместиться выполнение следующих действий:

— В каком отделении Банка вам будет удобно забрать готовую кредитную карту?
— На Ленинском проспекте. А кстати, когда оно работает? Там далеко от остановки?

— А-а-а-а… ну-у-у-у…
— Ну, как бы вам сказать, типа того как… э-э-э…
— Сейчас, одну минутку, да-а-а… Надо подумать, сразу так и не скажешь…

Что же делать?

Во-первых, при реализация голосового ассистента следует обязательно обеспечить «слушание» собеседника в т.ч. в те моменты, когда виртуальный ассистент сам озвучивает исходящее сообщение. Вариант: либо слушаем, либо отвечаем, является крайне плохой реализацией, которую следует избегать в реальной работе.

Во-вторых, следует провести оптимизацию по скорости работы всех компонентов системы. Однако, в какой-то момент времени мы обязательно упремся в пределы возможного сокращения задержек и усложнения сценариев обработки естественного языка. Поэтому, к нам приходит понимание, что требуется принципиально изменить подход к реализации голосового сервиса.

Основная идея, которая лежит в основе нового подхода, – брать пример с процесса реализуемого человеческим мозгом. Вы замечали, что человек, в процессе разговора, начинает анализировать сообщение, которое проговаривает собеседник, не в тот момент, как оно было полностью закончено, а практически сразу, в момент самого начала его звучания, уточняя с каждым новым словом? По этой причине мы, часто, готовы выдать ответ еще до того, как собеседник закончил свое сообщение.

Если вернуться к алгоритму, который должен реализовывать голосовой виртуальный ассистент, то он может выглядеть следующим образом (для иллюстрации рассмотрим входящий вопрос: «Где находится ближайший банкомат?»):

a) Запрос: «где». Результат: намерение не определено
b) Запрос: «где находится». Результат: интент «Расположение отделения» с вероятностью 50%, «Расположение банкомата» с вероятностью 50%
c) Запрос: «где находится ближайший». Результат: интент «Расположение отделения» с вероятностью 50%, «Расположение банкомата» с вероятностью 50%, сущность «Точка привязки» = «Текущее местоположение»
d) Запрос: «где находится ближайший банкомат». Результат: интент «Расположение банкомата» с вероятностью 100%, сущность «Точка привязки» = «Текущее местоположение»

Способы повысить качество работы ассистента

Давайте рассмотрим какие есть методы, что бы еще больше повысить качество работы нашего голосового виртуального ассистента:

Под этим усовершенствованием понимается возможность определять для некоторых интентов включение «перебивание» собеседника, когда содержимое выходного буфера начинает озвучиваться до того, как пользователь закончил свой рассказ. Данная настройка хорошо работает с предыдущей опцией, когда «перебивающий» ответ получает максимальный приоритет для озвучания из выходного буфера.

Очень желательно выявлять в выходном буфере ответы, которые противоречат друг-другу. В этом случае следует ответ с меньшим приоритетом просто удалять из выходного буфера.

В обычном разговоре двух и более людей, собеседники, как правило довольно точно могут определить эмоциональное состояние друг друга. Причем делается это не только по содержанию используемой лексики, например, факту наличия или отсутствия в речи ругательств, но и по тембру и скорости речи. Будет просто отлично, если ассистент сможет особым образом обслужить рассерженного пользователя.

Современные системы речевой аналитики достаточно хорошо справляются с задачей определения гендерной принадлежности и эмоционального состояния человека. Осталось только приспособить их к анализу разговора в режиме online.

Особенность реализации бизнес-кейсов

До сих пор мы рассматривали лишь технические особенности реализации виртуальных голосовых ассистентов. Но надо понимать, что не всегда успех зависит только от совершенства технической реализации. Давайте проанализируем уже рассмотренный пример: «Где находится ближайший банкомат?» и поймем, в чем есть особенность для его реализации в голосовом интерфейсе.

Знаете, есть такое правило, справедливое для менеджеров по продажам – «То, что нельзя продать по телефону, не следует продавать по телефону». По этой самой причине ответ вида «Ближайший банкомат находится по адресу …» является не информативным для человека. Если бы он хорошо знал район где сейчас находится, т.е. знал бы названия всех близлежащих улиц и номера домов, то скорее всего он и так бы знал где здесь находится ближайший банкомат. Так что такой ответ скорее всего сразу вызовет формирование другого вопроса: «А где тогда находится названный только что адрес?». Гораздо более информативным ответом будет вариант: «Ближайший банкомат находится примерно в ста метрах от вас по направлению на юго-восток», а еще лучше так же дополнительно отправить человеку сообщение типа location на Yandex или Google карты.

Универсальное правило здесь такое – если для дальнейшего использования информации требуется ее перевод в другой канал восприятия, то этот вариант является неудачным выбором для прямой реализацию в рамках голосового интерфейса. Требуется переформулировать ответ в форму, удобную для восприятия «на слух».

Для ряда сервисов, их реализация в рамках именно голосового ассистента – вообще самое удачное решение. Например, если человек находится в стрессовой ситуации, то ему как правило бывает сложно сконцентрироваться и быстро описать проблему текстом в чате, и он всегда предпочтет все высказать голосом. Это может стать важным критерием при выборе бизнес-кейсов для реализации в рамках виртуального голосового ассистента.

Второй очевидный выбор кейсов на реализацию «голосом» – необходимость их использования в ситуациях, когда есть либо законодательные ограничения на этот счет (например, находясь за рулем автомобиля запрещено вести текстовую переписку), либо просто неудобно использовать другие каналы коммуникации (например, в процессе работы или занятий спортом, когда руки человека попросту заняты).

Совершенству нет предела

Голос удобнее, чем любой другой интерфейс тогда, когда пользователю нужна очень конкретная функция для решения вполне конкретной задачи. Почему так? Очень просто – в такой ситуации необходимость ожидания загрузки сайта, скроллинг по странице, поиск по меню приложения, нажатие кнопок и т.д. всегда неудобнее, чем быстро произнесенная голосовая команда. Сайты и приложения многофункциональны. И в этом их достоинство и недостаток одновременно. Голосовой же навык должен быть заточен под функцию «здесь и сейчас».

Важно помнить, что следует избегать ситуаций, когда голосовые команды требуется сопровождать еще какими-либо дополнительными действиями в других интерфейсах. В противном случае это делает голосовой канал нерабочим т.к. нарушается принцип eyes-free, так как надо читать, и hands-free, если надо еще что-то зажимать.

Еще одна важная рекомендация – не стоит пытаться учить человека говорить. Он это и без нас умеет отлично, т.к. язык – это и так привычный и понятный интерфейс. Наглядный пример плохого стиля: «Чтобы прослушать данное сообщение еще раз, скажите: Прослушать заново». Мы ведь с вами в обычной жизни так не говорим. Разве нет? Лучше просто спросить: «Послушать сообщение ещё раз или перейти к следующему?»

Хорошим стилем реализации голосового виртуального ассистента будет вообще избегать открытых вопросов. Желательно направлять собеседника к конкретным действиям. Особенная ценность появляется там, где ассистент выступает в качестве навигатора или рекомендательной системы. Голосовой ассистент не должен требовать от человека слишком подробной информации. Уточняйте ее по ходу течения разговора.

И на конец, хотелось бы отметить, что персонализация – это, пожалуй, главное, чего не хватает существующим голосовым диалоговым интерфейсам. Без этого невозможно вести более-менее продолжительный диалог. Ассистент должен собирать данные о собеседнике, структурировать и проверять полученную информацию. Важно не терять нить диалога, сохранять и учитывать контекст разговора. Это важно. Иначе ассистент способен будет реализовать только короткие и довольно простые запросы, и, как итог, – это не позволит выйти на по настоящему живой диалог при общении голосового ассистента с пользователем.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *