Проекты с партнерами

Курс по контент-аналитике

2023-06-17 10:49
Студентов научили готовить «топливо» для#nbsp;машинного обучения#nbsp;— то#nbsp;есть данные, на#nbsp;основе которых#nbsp;ИИ выявляет полезные закономерности и#nbsp;подбирает «математическую формулу» для#nbsp;их#nbsp;анализа.

Компания «Наносемантика» предоставляла доступ к#nbsp;платформе по#nbsp;разметке данных NlabMarker, а#nbsp;также участвовала в#nbsp;проработке учебных модулей. Лучших студентов пригласили на#nbsp;стажировку в#nbsp;компанию.

—#nbsp;Основная проблема любого разработчика искусственного интеллекта#nbsp;— где добыть такой датасет#nbsp;— массив обучающих данных#nbsp;— который будет и#nbsp;качественным, и#nbsp;большим, и#nbsp;релевантным поставленной задаче. Любой достаточно большой датасет требует огромного количества ручного труда: иногда это труд людей без специализации, а#nbsp;иногда#nbsp;— труд врачей, юристов или лингвистов. В#nbsp;любом случае, участник этого процесса#nbsp;— контент-аналитик, разметчик, асессор#nbsp;— должен понимать критерии качества, способы организации работы над разметкой, а#nbsp;также уметь работать в#nbsp;различных инструментах для#nbsp;сбора, разметки и#nbsp;аналитики данных,#nbsp;— объясняет Станислав Ашманов, глава компании «Наносемантика».

Сейчас рынок нейросетей испытывает большую нехватку контент-аналитиков, специалистов, которые умеют собирать, обрабатывать, классифицировать и#nbsp;анализировать текстовый контент для#nbsp;решения задач на#nbsp;основе#nbsp;ИИ в#nbsp;разных отраслях. Студенты ТГУ получили возможность получить эту специальность как дополнительную к#nbsp;основной, и#nbsp;уже в#nbsp;студенчестве найти работу.

—#nbsp;Мы#nbsp;и#nbsp;сами столкнулись с#nbsp;нехваткой хорошо подготовленных контент-аналитиков, когда выполняли большой проект по#nbsp;анализу мнений и#nbsp;настроений российского студенчества в#nbsp;рамках заказа Минобрнауки в#nbsp;прошлом году,#nbsp;— рассказывает Вячеслав Гойко, директор Центра прикладного анализа больших данных ТГУ. —#nbsp;Теперь мы#nbsp;готовы обучать студентов и#nbsp;трудоустраивать их#nbsp;в#nbsp;свои проекты, а#nbsp;также в#nbsp;проекты наших партнеров по#nbsp;Консорциуму исследователей больших данных в#nbsp;других вузах страны.

Благодаря программе, разработчики планируют обеспечить рынок#nbsp;ИИ достаточным количеством специалистов по#nbsp;датасетам, без которых невозможна разработка алгоритмов продвинутой автоматизации.

Михаил Мягков, председатель правления ассоциации «Университетский консорциум исследователей больших данных», заведующий лабораторией экспериментальных методов в#nbsp;общественных и#nbsp;когнитивных науках ТГУ: «Создание на#nbsp;базе ТГУ и#nbsp;Университетского консорциума исследователей больших данный программы по#nbsp;подготовке контент-аналитиков#nbsp;— это свидетельство того, насколько в#nbsp;новом быстро меняющемся мире цифровых технологий есть необходимость в#nbsp;постоянном поиске инновационных подходов к#nbsp;созданию новых образовательных программ. Действительно, любой прикладной анализ данных, да#nbsp;и#nbsp;не прикладной тоже начинается с#nbsp;анализа сырых данных, которые как правило представляют собой огромное количество замусоренного массива цифровой информации, которую нужно сортировать, которую нужно обрабатывать и#nbsp;здесь не#nbsp;обойтись без человеческих глаз, без естественного интеллекта. И#nbsp;вот для#nbsp;того, чтобы эти данные были приготовлены, для#nbsp;того чтобы они были структурированы, нам как раз необходима огромная армия, таких знаете каменщиков на#nbsp;стройке искусственного интеллекта и#nbsp;вот, собственно, ТГУ и#nbsp;Консорциум выступили с#nbsp;инициативой о#nbsp;создании централизованной подготовке большого количества специалистов по#nbsp;контент аналитике. Мы#nbsp;будем создавать механизмы верификации работы данных, будем выдавать сертификаты разных степеней. Эта профессия она со#nbsp;временем на#nbsp;самом деле станет одной из#nbsp;таких, как минимум очень популярный студенческих подработок, но#nbsp;мне кажется в#nbsp;будущем она вырастет во#nbsp;что-то гораздо большее.»