Документы
Новости
Проекты
О консорциуме
Команда

Участвуйте в исследованиях Консорциума

Исследователям

Присоединиться
С помощью больших данных ученые решают глобальные проблемы. Прогнозируют тенденции развития различных сфер общества и анализируют текущие процессы. Консорциум проводит исследования по широкому спектру социально значимых направлений, включая образование, общественную безопасность, экономику и политику.

Big Data в исследованиях

Доступ к данным и инструментам

Мы предлагаем участникам Консорциума набор инструментов, которые упрощают процесс сбора и анализа данных для исследований
Платформа подходит для обработки естественного языка, лингвистического и семантического анализа, машинного обучения, прогнозной аналитики. Результаты анализа можно визуализировать и сформировать интерактивные веб-отчеты.

Доступ на 3 месяца

PolyAnalyst

Подходит для автоматизации и выгрузки данных из соцсетей. Данные выгружаются в форматах CSV и Excel.

Доступ по запросу

SN Lab

Для анализа данных и машинного обучения на базе Jupyter Notebook для языков программирования Python и R.

Доступ навсегда

Jupyterhub

Тесты на выявление признаков одаренности у школьников

Данные по профдиагностике 3000 школьников Томской области по 18 субтестам с измерением 97 параметров. «Одаренность» представлена тестами на креативность, мотивацию и интеллект. Дополнительно представлены профили в социальной сети «Вконтакте», подписки и тексты для 1600 школьников, проходивших тестирование.

Социальные графы радикальных онлайн-сообществ

Данные по связям внутри идентифицированных в ходе исследования онлайн-сообществ радикалов в социальной сети «Вконтакте». За связь принимается совместная дружба пользователей, вся информация представлена в формате graphml. Некоторые из идентифицированных сообществ закрыты по решению суда.

Страницы выпускников вузов в Wikipedia

Cписок идентифицированных выпускников 336 международных университетов в интернет-энциклопедии Wikipedia. Указаны ссылка на страницу выпускника на английском и национальном для университета языках, дата рождения выпускника и количество просмотров его страницы за 2016 год.

Поисковая выдача по благотворительности

Упоминания объектов, идентифицирующих благотворительную тематику, в русскоязычном сегменте Интернет: СМИ, блоги, социальные сети, форумы, блоги. Сообщения собираются непрерывно с апреля 2018 года, в каждом сообщении доступны текст, дата, описание платформы, где размещено сообщение, и информация об авторе сообщения.
С начала 2019-ого года с периодичностью раз в месяц собираются данные по 90 млн активных пользователей социальных сетей. Базы данных размещены на серверах суперкомпьютера Томского государственного университета СКИФ Cyberia. Возможны массовые выгрузки из наших баз по отдельному запросу.

Примеры дата-сетов

Напишите нам. Укажите инструмент, доступ к которому вы хотите получить, опишите исследования, в котором планируете использовать выбранный инструмент или дата-сет, и целей, которых хотите достичь

Получить доступ

Евгений
Петров

petrov@data.tsu.ru
Телеграм

Ближайшие мероприятия

Контакты
Томск, пр. Ленина, 36, 634050
info@opendata.university
+7 923 405 86 07
Мы используем файлы cookie, для персонализации сервисов и повышения удобства пользования сайтом. Если вы не согласны на их использование, поменяйте настройки браузера
© Университетский консорциум исследователей больших данных
Университетам
Исследователям
О Консорциуме
Новости и события
Проекты
Партнёрам
Команда
Документы
Сотрудничество
О нас