С помощью больших данных ученые решают глобальные проблемы. Прогнозируют тенденции развития различных сфер общества и анализируют текущие процессы. Консорциум проводит исследования по широкому спектру социально значимых направлений, включая образование, общественную безопасность, экономику и политику.
Оперативное выполнение стратегических задач и экспертное сопровождение
Обучение: программы повышения квалификации в области прикладного анализа больших данных
Доступ к данным и инструментам
PolyAnalyst
Платформа подходит для обработки естественного языка, лингвистического и семантического анализа, машинного обучения, прогнозной аналитики. Результаты анализа можно визуализировать и сформировать интерактивные веб-отчеты.
Доступ на 3 месяца
SN Lab
Подходит для автоматизации и выгрузки данных из соцсетей. Данные выгружаются в форматах CSV и Excel.
Доступ по запросу
Jupyterhub
Для анализа данных и машинного обучения на базе Jupyter Notebook для языков программирования Python и R.
Доступ навсегда
Мы предлагаем участникам Консорциума набор инструментов, которые упрощают процесс сбора и анализа данных для исследований
Тесты на выявление признаков одаренности у школьников
Данные по профдиагностике 3000 школьников Томской области по 18 субтестам с измерением 97 параметров. «Одаренность» представлена тестами на креативность, мотивацию и интеллект. Дополнительно представлены профили в социальной сети «Вконтакте», подписки и тексты для 1600 школьников, проходивших тестирование.
Социальные графы радикальных онлайн-сообществ
Данные по связям внутри идентифицированных в ходе исследования онлайн-сообществ радикалов в социальной сети «Вконтакте». За связь принимается совместная дружба пользователей, вся информация представлена в формате graphml. Некоторые из идентифицированных сообществ закрыты по решению суда.
Страницы выпускников вузов в Wikipedia
Cписок идентифицированных выпускников 336 международных университетов в интернет-энциклопедии Wikipedia. Указаны ссылка на страницу выпускника на английском и национальном для университета языках, дата рождения выпускника и количество просмотров его страницы за 2016 год.
Поисковая выдача по благотворительности
Упоминания объектов, идентифицирующих благотворительную тематику, в русскоязычном сегменте Интернет: СМИ, блоги, социальные сети, форумы, блоги. Сообщения собираются непрерывно с апреля 2018 года, в каждом сообщении доступны текст, дата, описание платформы, где размещено сообщение, и информация об авторе сообщения.
С начала 2019-ого года с периодичностью раз в месяц собираются данные по 90 млн активных пользователей социальных сетей. Базы данных размещены на серверах суперкомпьютера Томского государственного университета СКИФ Cyberia. Возможны массовые выгрузки из наших баз по отдельному запросу.
Примеры дата-сетов
Напишите нам. Укажите инструмент, доступ к которому вы хотите получить, опишите исследования, в котором планируете использовать выбранный инструмент или дата-сет, и целей, которых хотите достичь