Наследили: ученый ТГУ о big data и цифровом следе

Выдать список подходящих профессий, определить самого популярного выпускника в Википедии, отличить экстраверта от интроверта – все это можно сделать с помощью big data. Что такое большие данные и где они встречаются в обычной жизни – об этом рассказал заведующий учебно-научной лабораторией компьютерных средств обучения Томского госуниверситета (ТГУ) Артем Фещенко.

Он выступил с лекцией на Youtube-канале ТГУ в рамках фестиваля "NAUKA 0+". Тезисы лекции – в обзоре РИА Томск.

Ранее сообщалось, что фестиваль проходит Томске с 4 по 8 октября. В его программе около 70 мероприятий – лектории от томских ученых, подкасты о науке, экскурсии по научным лабораториям, научные шоу, квесты, конкурсы и творческие мастерские.

Что такое big data?

"Большие данные – это когда данных больше одного терабайта, это данные, которые не помещаются в Excel, данные, которые невозможно обрабатывать на одном компьютере. Есть мнение, что big data – это вообще любые данные, а еще, что big data вообще не существует – мол, этот термин придумали маркетологи", – говорит Фещенко.

Определений этого феномена очень много, и все они зависят от контекста и сферы деятельности, рассказывает эксперт ТГУ. Он подчеркивает, что источники данных разнообразны. Благодаря цифровизации и появлению технологий, позволяющих человеку легко и быстро публиковать в интернете самую разную информацию, мировые данные удваиваются в своем объеме даже не ежесуточно, а за более короткий промежуток времени.

"Получается бездна информации, в которую человечество погружается день за днем. И в этой бездне есть данные пользователя – это все наши действия, цифровые реакции, которые мы производим, находясь в цифровом пространстве. Даже простая регистрация в социальной сети и создание полупустого аккаунта – это уже артефакт, который мы оставляем после себя в виртуальном мире", – объясняет ученый.

Большие данные под лупой

Для изучения big data, в том числе данных пользователей, в ТГУ в 2016 году был создан Центр прикладного анализа больших данных. С каждым годом он растет по навыкам и компетенциям, доступным при работе с big data, по количеству задач и проектов.

"Центр ТГУ – это не единственный пример, когда ученые пробуют извлекать пользу из огромного количества данных. Так, появился консорциум университетов, цель которого – объединять усилия, обмениваться данными, навыками и технологиями по извлечению этих данных", – говорит Фещенко.

Одно из направлений исследований ученых консорциума – проект, связанный с измерением третьей роли университета, то есть его влияния на экономику, уровень человеческого капитала и инновационный потенциал региона. В его рамках среди прочего специалисты выяснили, какие известные выпускники вуза являются наиболее "просматриваемыми" в Википедии.

"ТГУ сделал для себя интересное открытие. Оказалось, что на первом месте среди наших самых популярных выпускников находится Ким Ём Нам. Кто это? Видный политический деятель Корейской народно-демократической республики. На втором месте – Михаил Башкатов, на третьем – Андрей Бурковский", – говорит ученый ТГУ.

Еще одно исследование касалось психологического портрета благотворителя, который поддерживает эндаумент-фонды вузов.

"Ученые задались вопросом, что же подталкивает людей к тому, чтобы благодарить свои университеты и делать взносы. Здесь большие данные помогли собрать цифровой след благотворителей в социальных сетях, обобщить его и увидеть некие закономерности. <...> Все это помогает университетам улучшить методики работы с выпускниками и увеличить количество благотворителей", – рассказывает эксперт.

Личность и след – все в "цифре"

К большим данным имеет прямое отношение так называемая цифровая модель человека или личности. Как правило, для составления такой модели применяется искусственный интеллект.

Фещенко отмечает: чтобы понять, что подразумевается под цифровой моделью человека, нужно разобраться, что же такое цифровой след.

"В жизни человека есть деятельность, связанная с обучением и работой. И в этой части цифрового пространства человек генерирует цифровой след, но не очень насыщенный. Его можно использовать для прогнозирования того, что будет происходить в поведении человека, а именно для этого нужна цифровая модель личности. Но более богатым с точки зрения создания прогнозов является его цифровой след в соцсетях, видеохостингах, мессенджерах", – говорит он.

Извлекать эти данные отовсюду невозможно – ученые работают с открытыми пользовательскими данными в соцсетях, и это огромный пласт информации. Наука доказывает, что по цифровому следу можно понять, что представляет из себя человек и какие у него психологическое особенности.

Так, одно из исследований показало, что по тексту на "стене" конкретного человека в соцсетях можно определить, к какому психологическому типу он относится. Этот эксперимент проходил по следующей схеме: реальные люди выполняли тест, например, на уровень экстраверсии, затем исследовался их цифровой след в Facebook, и искусственный интеллект находил закономерности.

Оказывается, экстраверты чаще пишут тексты, связанные со спортом, отдыхом, пляжем, а интроверты чаще упоминают современную японскую культуру.

Какое прикладное применение может быть у цифрового следа? "Пример "Робот-профориентатор" ТГУ – приложение во "ВКонтакте", которое за несколько секунд подскажет одну из 10 профессиональных сфер, которая вам подходит по интересам и жизненным ценностям, отпечатанным в цифровом следе. Робот выдает прогноз, который приведет вас к списку профессий, и там вы сможете выбрать и факультет, и вуз", – объясняет Фещенко.

Цифровые модели людей используются в маркетинге, политических предвыборных кампаниях и многом-многом другом, отмечает ученый. Сфера применения растет с каждым днем – с развитием технологий и уж тем более с переходом мира в более "глубокий" дистант.

Источник: https://www.riatomsk.ru/article/big-data-tgu