О конференции

Тематика конференции

Открытый перечень предлагаемых тем организован в виде треков, список которых следует ниже. Эта классификация действует в период представления, рецензирования и отбора заявок. Структура программы конференции определяется Программным комитетом по результатам отбора докладов и не обязательно отражает структуру треков. Все треки открыты для представления заявок в виде полных статей, кратких статей, постеров, демонстраций, тьюториалов.

Треки сферы анализа данных, решения задач, организации экспериментов в DID

Особенности данных в DID (данные, методы, инструменты и инфраструктуры их сбора и накопления в различных DID): перспективные проекты, опыт сбора и накопления данных в долгоживущих проектах, сравнительный анализ проектов, обзоры их состояния, средства и способы получения и накопления данных, специфика семантики, структур и характеристик данных в DID (включая потоковые данные), представление данных, организация метаданных, качество данных, происхождение данных (в том числе из литературных источников), способы обнаружения аномалий в данных, процедуры первичной обработки и чистки данных, проблемы накопления больших данных.

Постановки и решение задач в DID: в конкретных DID обобщенно обсуждаются актуальные задачи или требующие исследования явления, проникновение в их суть на основе природы, характеристик явления и имеющихся данных, подходы к выбору методов и организации решения задач, классификация задач в различных областях, процесс решения задач и использованные инструменты.

Организация экспериментов в DID: обеспечение обоснования теорий, генерация и тестирование гипотез, методы тестирования, моделирование, исследовательские циклы, роботизация, инфраструктуры для организации экспериментов, потоки работ, воспроизводимость результатов, метаописание и повторное использование потоков работ, верификация результатов, сравнение новых результатов с ранее полученными, обзоры подходов к организации экспериментальных исследований.

Гипотезы и модели (как составная часть исследовательских экспериментов в DID): методы и средства формулирования гипотез, конструирования компьютерных моделей в процессе исследований в DID, модели как средство верификации теорий (гипотез), применение имитационного моделирования в условиях больших данных, парадигма когнитивного моделирования, опыт создания предиктивных моделей в процессе исследований.

Развитые методы и процедуры анализа данных в DID: состояние и развитие статистических методов, методов data mining, машинного обучения, оценки универсальности и специализации методов, их ориентации на определенные DID и виды данных, классификация методов, систематизация опыта применения методов при решении задач, когнитивная аналитика для принятия решений на основе массивных данных, методы мета-анализа, подходы к разномасштабному анализу, аналитика больших данных: эффективность и масштабируемость методов, развитие и создание новых методов анализа данных.

Концептуальное моделирование предметных областей в DID: формализация семантики предметных областей, развитие онтологий в конкретных DID, опыт использования различных моделей и инструментов для поддержки онтологий, семантическое аннотирование при формировании понятий, развитие онтологических моделей (например, на основе средств стека семантического Веба), применение онтологических моделей для определения схем баз данных, средства и опыт концептуального моделирования задач в различных DID на основе онтологий и декларативных средств (имеющихся, например, в составе W3C RIF), подходы к обеспечению независимости концептуальных спецификаций от данных, опыт и средства для абстрактной спецификации алгоритмов и потоков работ в концептуальных моделях, обеспечение семантической интероперабельности программ.

Применения анализа с интенсивным использованием данных в исследованиях в DID: функции и архитектуры средств поддержки исследований в условиях интенсивного использования данных (виртуальные лаборатории/обсерватории, центры данных, распределенные инфраструктуры, применение суперкомпьютерных, грид и кластерных инфраструктур, параллельных машин баз данных, и пр.), кросс-платформенная интероперабельность и совместное использование данных в междисциплинарных исследованиях.

Треки сферы управления данными в DID

Интеграция данных в DID: методы и средства разрешения сущностей и их слияния в инфраструктурах больших данных, масштабируемые методы в среде map-reduce, унификация разнообразных моделей данных (таких как графовые, NoSQL, RDF- и Array-базированные модели), канонические модели данных и их синтез, отображение схем, методы и средства виртуальной интеграции, предметные посредники, движимые приложениями, семантическая интеграция данных, хранилища данных, поддержка ETL процессов, многомерные модели данных, интеграция данных в комбинированных инфраструктурах поддержки разно-структурированных и структурированных данных, инфраструктуры систем интеграции данных, применение средств интеграции данных в DID.

Извлечение данных из текстов: лингвистические методы, NLP, многоязычие текстовых данных, декларативные языки и методы идентификации релевантных данных в текстах, инструменты анализа текстов, идентификация и извлечение структурированных данных из текстов.

Исследовательские инфраструктуры данных и их применение в DID: разнообразные инфраструктуры, основанные на платформах с интенсивным использованием данных или платформах с интенсивными вычислениями,(таких как облака, гриды, распределенные кластеры, суперкомпьютеры, и др.), примеры применений с интенсивным использованием данных в таких инфраструктурах и платформах Big data,, опыт реализации, оценки производительности таких инфраструктур новые модели программирования интенсивной работы с данными в подобных инфраструктурах, вопросы масштабирования, , моделирование и метаданные в инфраструктурах данных, технологии виртуализации, DID-приложения как виртуальные машины.

Роль Семантического Веба в DID: связанные открытые данные (linked open data), сопоставление онтологий и связанных данных для обеспечения семантической интероперабельности и кросс-идентификации ресурсов Семантического Веба, масштабируемость сопоставления, пространственно-временные связанные данные и онтологии, слияние (здесь – harvesting) связанных данных из разнородных коллекций данных, качество связанных данных, происхождение связанных данных, мультидиалектные архитектуры для декларативной концептуальной спецификации и решения задач над неоднородными коллекциями данных, опыт применения средств Семантического Веба и социальных сетей для решения задач в DID.

Предварительная программа.


Важные даты

Конференция
Тексты статей 18.06.2017
Заявки на проведение тьюториалов 04.06.2017
Уведомление о принятии доклада 20.07.2017
Финальный текст принятой статьи 15.08.2017
Диссертационный семинар
Тексты статей 23.06.2017
Уведомление о принятии доклада 20.07.2017
Финальный текст принятой статьи 15.08.2017
Ассоциированные мероприятия
Представление предложений 16.04.2017
Извещение о принятии 30.04.2017