Голосовой ассистент, который понимает и
реагирует на эмоции
Работает на базе Телеграм-бота и веб-сайта
О проекте
Команда реализует голосового помощника, определяющего эмоции собеседника, и внедрит его в телеграм-бота и веб-сайт. Для реализации будут использоваться open-source модели и данные.
Проект имеет несколько уровней сложности
Определение эмоционального состояния пользователя способно помочь улучшить рекомендации и предложения, которые делает голосовой ассистент
Бот умеет выступать в качестве саппортера для школьников и студентов, испытывающих беспокойство в период экзаменов и интенсивной учебы
Беспокойство влияет на самооценку и уверенность в  знаниях. Это напрямую связано с академической мотивацией и адаптацией. Голосовой помощник поддерживает пользователя в стиле узнаваемых и близких персонажей и делится мотивирующими цитатами
Актуальность
Цели
1 - Создать эмпатийного голосового помощника, способного поддержать обучающихся в формате мотивирующего общения

2 - Дать возможность участникам команды поработать с голосовыми технологиями, нейронными сетями, back-end разработкой и инфраструктурой
На смене мы должны создать MVP (минимально жизнеспособный продукт) такого ассистента с использованием технологий машинного обучения и нейронных сетей
Голосовой ассистент должен обладать всеми основными функциями реальных ассистентов: распознавать речь, давать пользователю уместный разумный ответ, отвечать голосом. Все это — с учетом данных о настроении пользователя
Ассистент должен выдавать ответ, учитывая уникальные сценарий выбранного персонажа, советовать фильмы и книги и озвучивать эмоционально-корректные ответы разработанными голосами
Задачи проекта
1
2
3
План работы
1 неделя
2 неделя
3 неделя
Освоить лекции по DL, STT (speech to text), TTS (text to speech), NLP, познакомиться с аудио- и текстовыми классификаторами, протестировать открытые модели STT, построить план работы
Протестировать модели TTS. Обучить ассистента определять эмоции пользователя по голосу и тексту. Обучить бота давать осмысленный ответ с учетом эмоции собеседника.
Интегрировать результат по выполненным задачам в интерфейс Телеграм-бота и веб-сайта: обернуть все модели в серверы, поднять необходимую инфраструктуру для стабильной работы серверов и написать сервис, обращающийся во все модели. Протестировать готовый продукт.

Почему сделали голосового помощника эмпатийным?
Бот учитывает настроение пользователя и дает логичный ответ, исходя из информации об эмоциональном состоянии собеседника
Такая способность бота реагировать на позитивные и негативные интонации улучшает пользовательский опыт и генерирует доверие
Советовать фильмы и книги, делиться знаниями, поддерживать диалог и собеседника. А еще — рассказывать шутки и говорить разными голосами
Распознавать речь собеседника, оценивать эмоции пользователя и отправлять сгенерированный логичный голосовой ответ
Подстраивать сценарий ответа и рекомендации под эмоциональный фон пользователя
Что умеет наш бот
Персонажи
пользователь сам может выбрать, с кем бы ему хотелось поговорить в данный момент
Олимпия Бэтс
учится в Хогвартсе, капитан квиддич-команды, поддерживает разговоры об учебе, спорте и мечтах о будущем.

Йодрик

живет в далекой-далекой галактике, троюродный внук Йоды. Ментор джедаев, живущий на планете Дагоба

Капибара

Капибара, которой уже больше миллиарда лет, видела строительство пирамид и диктовала Пушкину “я помню чудное мгновение”. .



Протестируйте бота
выбирайте близкого по духу персонажа и приступайте к беседе
Руководители
  • Екатерина Чуйкова

    Куратор программы, Руководитель команды распознавания речи

    tg:@KateChuikova

  • Александр Мисевич

    Ментор, Технический лид команды распознавания речи

    tg@Armenka01

  • Иван Захаров
    Ментор, Руководитель команды распознавания речи и голосовой биометрии
    tg:@ivan_moso
Контакты
  • Илья Гринюк

    Team Lead, Data Scientist. Работал с STT и классификатором эмоций

    tg:@bolevard

  • Максим Львов

    Data Scientist, Front-end разработчик, Prompt Engineer. Работал с чат-ботом

    tg:@endtoper

  • Ульяна Козлова
    Data Scientist, Designer. Работала с классификатором эмоций и TTS
    tg:@zilibobbbka
  • Амир Габдуллин
    Data Scientist, Prompt Engineer, DevOps. Работал с чат-ботом
    tg:@GaM11906
  • Тимур Гарифулин
    Data Scientist, database Architect, любитель котиков. Работал с STT и TTS
    tg:@Murkat07