Введение
- Теоретические основы визуализации информации
1.1 Визуализация данных и ее проблемы
1.2 Классификация методов визуализации многомерных данных
- Модель данных в визуальном анализе
2.1 Гетерогенные данные и их визуальная модель
2.2 Методика и технология интерпретации данных
2.3 Критерии выбора визуального представления
Заключение
Список использованной литературы
Проектирование технических систем опирается на использование процедур анализа и синтеза. Одним из важных этапов исследований является параметрический анализ системы. Его можно трактовать как многовариантный анализ, направленный на изучение влияния внешних и внутренних параметров системы на качество ее функционирования, определяемое с помощью прямых и косвенных критериев качества, конечной целью которого является выявление областей в пространстве параметров, обеспечивающих приемлемое качество системы. В некоторых случаях возможны аналитические подходы к решению задач определения оптимальных технических решений [1]. Однако в общем случае приходится проводить вычислительные эксперименты. При этом выдвигается требование вычислительной эффективности процедур реализации параметрического анализа.
Помимо специальных технологий исследования систем управления достаточно активно использовались технологии визуализации. Однако за последние годы визуализация многомерных данных, к которой относится и многовариантный многопараметрических анализ качества и эффективности систем управления, достигла впечатляющих успехов. Поэтому возникла потребность в анализе современных технологий с точки зрения возможности их применения в указанной предметной области.
Задача визуализации информации в широком смысле слова насчитывает десятки тысяч лет. Наскальные изображения, первые карты местности, современная картография и климатология, томографические исследования, экономика регионов, системы хранения и поиска информации в сетях, распознавание образов, навигация в мобильной робототехнике, многовариантный анализ при проектировании технических систем - вот диапазон задач, которые объединены общим понятием визуализации. В основном будем рассматривать методы визуализации применительно к обработке массивов данных в виде чисел, действительных или комплексных, на непрерывной или дискретной шкале, полученных в процессе проведения натурных или вычислительных экспериментов. Тем не менее, нельзя отрицать важность междисциплинарных связей, когда решение задачи одной предметной области плодотворно решается методами и средствами из другой области. Поэтому необходим обзор современных подходов к визуализации в широкой постановке.
Построение визуальной модели для информации, находящейся в распоряжении исследователя, может быть сформулировано как самостоятельное исследование для широкого множества задач.
Привлечение визуальных методов изучения может быть обосновано, прежде всего, требованием оптимизации затрат времени, необходимого для анализа информации и принятия решения, соответствующего целям исследования. Результативность применения визуальных моделей данных, оцениваемая как с точки зрения ресурсоемкости решений, так и с позиций использования когнитивных особенностей этого вида анализа, создала условия для появления значительного числа разных типов визуальных моделей и способов их практического использования.
Цель настоящей работы – рассмотреть аспекты проведения предварительного анализа данных и построение признаков в задачах визуализации информации.
1. Теоретические основы визуализации информации
1.1 Визуализация данных и ее проблемы
На современном этапе развития средств информационной коммуникации визуализация рассматривается как доминирующая форма информационного взаимодействия [6]. Однако, к настоящему моменту не сформирован единый подход к изучению и использованию возможностей визуализации в качестве инструмента научного исследования. Одним из затруднений в этом направлении является необходимость проведения объемных междисциплинарных исследований, для которых характерными препятствиями являются формирование общего определения объекта исследований и применимость специализированных методов, соответствующих узким предметным областям [3].
Естественным следствием становится существование двух подходов к созда нию средств визуализации, отличающихся способами представления и интерпретации данных:
- Создание универсальных систем, ориентированных на широкое практическое применение. Универсальные системы визуализации характеризуются наличием типового набора информационных объектов и соответствующих ему способов визуального представления [18]. Задачей разработчика средств визуализации является создание алгоритма перевода исследуемых данных в представление, опирающееся на библиотеку типичных объектов. nb_list = []
kn_list = []
logr_list = []
svect_list = []
for i in range(len(data_test)):
nb_list.append((nb.predict(count_vect.transform([data_test['text'][i]])))[0])
kn_list.append((kn.predict(count_vect.transform([data_test['text'][i]])))[0])
logr_list.append((logr.predict(count_vect.transform([data_test['text'][i]])))[0])
svect_list.append((svect.predict(count_vect.transform([data_test['text'][i]])))[0])
data_test['NB'] = nb_list
data_test['KN'] = kn_list
data_test['Logr'] = logr_list
data_test['SVM'] = svect_list
- Разработка узкоспециализированных систем, ориентированных на использование в ограниченной предметной области [7]. Для специализированных систем визуализации характерно создание и развитие способов визуализации, учитывающих особенности ограниченной предмет- ной области, традиционные способы представления информации и существующие методы исследований. Естественным недостатком специализированных систем является недостаточная применимость для решения задач, имеющих междисциплинарный характер или связанных с исследованием объектов, не имеющих определенного типа.
Неизбежным эффектом использования визуализации, согласно [1], является влияние на сознание наблюдателя через формирование новой информационной реальности, связанное с иллюзией объективности визуализации в процессе ее интерпретации. Для существующих систем визуализации использование указанного эффекта является резервом, привлечение которого затруднено отсутствием систематизированного подхода к использованию когнитивных аспектов визуализации. Таким образом, одним из актуальных вопросов следует считать исследование соотношения в интерпретации информативного образа объективной и субъективной составляющих. В данном случае, указано на необходимость учета как свойств интерпретируемого образа, так и условий его создания, специфики восприятия, культурной традиции и иных аспектов [12]. Следовательно, в научной визуализации возникает необходимость в согласованном использовании методов семиотики, риторики, поэтики, лингвистики, психоанализа, феноменологии, герменевтики и т.д. [11]
Для преодоления ограничений, существующих в каждом из указанных подходов, необходимо создание гибкого универсального подхода, реализующего потенциал визуализации как инструмента передачи, интерпретации и хранения данных при решении широкого круга практических задач.
%%time
history_lstm = get_fitted_model(model_lstm, checkpoint_callback_lstm)
Out [30]:
Epoch 1/5
841/844 [============================>.] - ETA: 0s - loss: 0.5093 - accuracy: 0.8243
Epoch 00001: val_accuracy improved from -inf to 0.88267, saving model to best_model_lstm.h5
844/844 [==============================] - 9s 11ms/step - loss: 0.5088 - accuracy: 0.8245 - val_loss: 0.3437 - val_accuracy: 0.8827
Epoch 2/5
842/844 [============================>.] - ETA: 0s - loss: 0.2965 - accuracy: 0.9051
Epoch 00002: val_accuracy improved from 0.88267 to 0.88900, saving model to best_model_lstm.h5
844/844 [==============================] - 9s 11ms/step - loss: 0.2966 - accuracy: 0.9051 - val_loss: 0.3181 - val_accuracy: 0.8890
Epoch 3/5
842/844 [============================>.] - ETA: 0s - loss: 0.2541 - accuracy: 0.9190
Epoch 00003: val_accuracy did not improve from 0.88900
844/844 [==============================] - 9s 11ms/step - loss: 0.2540 - accuracy: 0.9190 - val_loss: 0.3287 - val_accuracy: 0.8814
Epoch 4/5
842/844 [============================>.] - ETA: 0s - loss: 0.2267 - accuracy: 0.9269
Epoch 00004: val_accuracy did not improve from 0.88900
844/844 [==============================] - 10s 12ms/step - loss: 0.2266 - accuracy: 0.9270 - val_loss: 0.3430 - val_accuracy: 0.8808
Epoch 5/5
842/844 [============================>.] - ETA: 0s - loss: 0.2047 - accuracy: 0.9331
Epoch 00005: val_accuracy did not improve from 0.88900
844/844 [==============================] - 10s 11ms/step - loss: 0.2046 - accuracy: 0.9332 - val_loss: 0.3494 - val_accuracy: 0.8803
CPU times: user 51.4 s, sys: 17.2 s, total: 1min 8s
Wall time: 48.9 s
Известен ряд вопросов, которые препятствуют реализации потенциала визуализации в качестве инструмента для исследования данных различного типа [29]. В исследованиях [30] сформулированы положения, указывающие на необходимость учета при анализе визуальных образов нескольких уровней дополнительной информации: технологического, лингвистического, жанрового, эстетического, идеологического. Анализ примеров фактического применения визуализации, в том числе для проведении научных исследований [3], позволил выделить наиболее актуальные вопросы, ответы на которые дают основания для обоснованного практического использования визуализации. В результате системаvизации усилий, направленных на разработку средств визуального исследования данных [5], выделенные вопросы могут быть разделены на две группы:
- группа обоснования — вопросы, связанные с ошибками в понимании внутренних закономерностей визуализации;
- группа оценки — вопросы, связанные с получением количественных характеристик для сравнения между собой различных средств визуализации [2].
Таким образом, первым аспектом задачи визуализации является ее практическое назначение, а именно, облегчение восприятия данных для их последующего анализа, например, получения закономерностей влияния параметров исследуемой системы. В этом смысле визуализация по существу является поддержкой принятия решений. Поэтому имеется неразрывная связь между прикладной задачей и способом визуализации. Для визуализации могут использоваться как первичные данные, так и данные, прошедшие предварительную обработку. Эти второй аспект визуализации. Его следует отличать от третьего аспекта – разработки собственно программных алгоритмов и кодов для реализации визуализации на средствах вычислительной техники.
Визуализация данных в самом простейшем случае предполагает изображение зависимости некоторой функции от одного параметра и может быть решена даже без применения вычислительных средств. Более сложной и практически важной задачей является получение функциональных зависимостей от нескольких и даже многих параметров. В двумерном случае для визуализации достаточно построить трехмерный график, однако при большем количестве аргументов визуализация становится весьма проблематичной. Поэтому усилия современных разработчиков направлены именно на решение визуализации многомерных данных. Это можно считать четвертым аспектом проблемы визуализации данных.