Введение
Глава 1. Теоретические положения по базам информационных данных
1.1. Основные понятия процесса накопления данных
1.2. Системы управления базой данных
1.3. Распределенные технологии обработки и хранения данных
Глава 2. Организация баз данных в ФТС России
2.1. Особенности баз данных, используемых в ФТС России
2.2. Принципы построения систем поддержки принятия решения должностными лицами таможенных органов
2.3. Принципы построения систем, ориентированных на анализ данных
Заключение
Список используемой литературы
Постоянное и планомерное внедрение в повседневную практическую деятельность должностных лиц таможенных органов новых информационных технологий, с одной стороны, повышает качество выполнения ими своих функциональных обязанностей, позволяет предоставить участникам внешнеэкономической деятельности новые услуги, увеличить скорость осуществления таможенных операций, повысить достоверность циркулирующих в таможенной службе данных, обеспечить соответствующий уровень информационной безопасности и многое другое.
Базы данных таможенных органов можно условно разбить на три группы:
- базы данных нормативно-справочной информации (НСИ): системы классификации и кодирования, тарификации, ограничений, правовые и нормативные акты, системы регистрации и учета;
- базы данных оперативной информации: электронные копии документов, используемых в ходе осуществления таможенных операций и контроля (ТД, ДКД, ДТС, ТПО и др.), данные оперативного характера, обеспечивающие технологические процессы (учет, контроль, аудит и т. п.);
- базы данных статистической информации, являющиеся производными от баз данных оперативной информации.
Целью курсовой работы является изучение организации баз данных ФТС и систем управления базами данных.
Задачи курсовой работы
- рассмотреть основные понятия процесса накопления данных;
- проанализировать системы управления базой данных;
- проанализировать распределенные технологии обработки и хранения данных;
- изучить особенности баз данных, используемых в ФТС России ;
- рассмотреть принципы построения систем поддержки принятия решения должностными лицами таможенных органов.
Глава 1. Теоретические положения по базам информационных данных
1.1. Основные понятия процесса накопления данных
В ходе развития информационных систем были сформулированы принципы организации больших массивов данных:
- принцип интеграции данных, в соответствии с которым все данные накапливаются и хранятся централизованно, образуя динамически обновляемую модель предметной области;
- принцип независимости прикладных программ от данных, т. е. отделения логической модели данных от средств управления ими.
Удовлетворение этим принципам связано с созданием единого для всех задач блока данных, называемого базой данных, и разработкой единой управляющей программы для манипулирования данными, называемой системой управления базой данных — СУБД.
База данных представляет собой данные, организованные и обрабатываемые в накопителях в соответствии с определенными правилами хранения и доступа. Логическая, а часто и физическая автономность данных является существенным отличием баз данных от прочего программного обеспечения. Фиксированная, строго оговоренная структура хранения данных и их безусловная типизация отличают базу данных от текстовых и табличных процессоров, а широкая гамма допустимых операций на множествах является важным преимуществом ее перед пакетами прикладных программ и системами программирования.
Выделением базы данных как особой части программного обеспечения преследуется несколько целей:
- эффективная структуризация информации;
- сведение к минимуму повторяющихся данных;
- обеспечение быстрого доступа к информации прямо на носителе;
- удобство дополнения информации новыми сведениями;
- обеспечение целостности данных;
- предотвращение несанкционированного доступа к информации;
- облегчение автоматизации обработки данных и ведения отчетности.
Объекты, процессы, явления предметной области представляются в базах данных коллекциями записей (сущностей) определенной структуры. Отношения между записями характеризуются связями, которые могут быть бинарными и бинарными. Эти связи оформляются в виде моделей данных. Модель дает приближенное представление коллекции средствами языка, математической или логической символики. Различают иерархическую, сетевую и реляционную модели данных.
Иерархическая модель отражает структуру, аналогичную файловой системе. Это дерево с узлами, в которых хранятся данные, и ветвями, связывающими их между собой. Узел, в который не входит ни одна ветвь, называется корнем. В свою очередь, любой узел дерева — это в то же время и корень поддерева. Число таких поддеревьев именуется степенью узла. Концевой узел, имеющий нулевую степень, называется листом. Таким образом, граф иерархической модели должен удовлетворять определенным ограничениям.
Идея автоматизированной реляционной или табличной, организации данных принадлежит польскому математику 3. Я. Слонимскому, в 1845 г. удостоенному Демидовской премии Петербургской академии наук за изобретение математической машины, использующей таблицы с определенными правилами считывания. Концепция реляционной модели была разработана Э. Ф. Коддом в 1970 г. В основе ее лежит понятие бинарного отношения как двухмерной таблицы единой структуры. Значения ее элементов являются атомарными (неделимыми) величинами и не содержат других отношений. В этом заключается главное отличие реляционной модели от иерархической и сетевой. Сравнительная простота инструментальных средств поддержки реляционной модели является ее достоинством, тогда как жесткость структуры и зависимость от скорости работы, от размера базы данных относятся к недостаткам.
Разработчики реляционных СУБД никогда не ставили целью предоставление пользователю мощных функций многомерной обработки данных, их анализа и синтеза. Метод динамической аналитической обработки OLAP (On-Line Analytical Processing), предложенный тем же Э. Ф. Коддом, ускоряет решение указанных задач. Он предполагает многомерное концептуальное представление данных и их прозрачность для пользователя, доступность и высокую производительность в работе.
1.2. Системы управления базой данных
Системой управления базой данных (СУБД) называется программа, выполняющая управление и поиск в базах данных, их систематизацию и актуализацию. Под управлением данными понимается, во-первых, манипулирование записями, выполняемое пользователем, а во-вторых задание и коррекция схемы базы данных, т. е. ее логической или физической структуры, выполняемые программистом.
В наиболее полном варианте СУБД содержит свой интерфейс пользователя, дающий возможность непосредственного управления данными; язык для программирования прикладных задач обработки данных; средства для придания завершенной программе вида готового коммерческого продукта. Будучи механизмом пользователя, СУБД предусматривает систематизацию и оперативный поиск данных и имеющихся в них сведений, а также поддержание данных в актуальном состоянии — их добавление, изменение, выборку, отображение. Будучи инструментом программиста, СУБД помогает ему в проектировании, предусматривая следующие этапы:
- определение объектов — источников данных и выявление связей между ними;
- определение свойств объектов и выявление связи между свойствами;
- создание словаря данных;
- разработка операций над данными;
- назначение пользователей и разграничение их прав доступа.
Как инструмент проектирования информационных систем, СУБД поддерживает все три известных уровня представления данных: концептуальный, логический и физический. Первый определяет структуру базы данных в терминах объектов предметной области и отношений между ними. Второй уровень описывает связи между данными на языке математической логики и алгоритмических языках, а третий управляет обменом и размещением данных на внешних носителях. Для этого СУБД оснащается средствами создания и анализа структуры базы данных и механизмами работы с таблицами.
Пользователь общается с базой дачных через копии ее фрагментов. Для этого он либо осуществляет фильтрацию записей, либо обращается к базе данных с запросом. Запросы к реляционным базам данных выполняются на языках реляционного исчисления, основанных на классических операциях на множествах (объединение, пересечение, дополнение, разность) и исчислении предикатов (проекция, выбор). Язык запросов предоставляет пользователю набор правил или инструмент для формирования вопроса с информацией о желаемом результате. На основании запроса СУБД автоматически выдает ответ посредством генерации новых таблиц. Статусом стандартного языка запросов обладает сегодня реляционный структурированный процедурный язык SQL (Structured Query Language), разработанный фирмой IBM. Весьма популярен и непроцедурный язык запросов на примере QBE (Query By Example), созданный M. Злуфом в фирме IBM в 1977 г.
Более 15 лет представлен на мировом рынке пакет Oracle. Долгое время каждая третья продаваемая в мире СУБД работала под Oracle. На Oracle разработано значительное число прикладных систем для банков, промышленных предприятий, энергетических объектов, учреждений здравоохранения и таможни. Она обеспечивает целостность баз данных при выполнении распределенных запросов, автономию узлов базы и высокую производительность. Система поддерживает открытую архитектуру: в ее едином приложении могут согласованно работать компоненты СУБД различных фирм, файлы операционной системы, аппаратура (промышленные контроллеры, кассовые аппараты). Инструментарий Oracle позволяет создавать графический интерфейс пользователя со сложной логикой обработки данных. Постепенно реляционная СУБД Oracle преобразуется в объектно-ориентированную систему на основе языка SQL++, хранящую данные в виде объектов вместо таблиц.
Языки управления событиями исключают программирование как процесс формирования текста программы программистом. Генераторы интерпретируют данные, вводимые с помощью меню, диалога или пиктограмм, и генерируют соответствующий программный код на одном из процедурных языков. Генераторы освобождают разработчиков от необходимости переписывать повторяющиеся фрагменты программ и позволяют быстро создавать прототипы прикладных систем.
Интегрированные системы программирования, включающие генераторы кодов и процедурные языки, называют CASE-инструментами (Computer Aided Software Engineei ng). В таких комплексах среда проектирования не отделена от прикладной системы. Примером CASE- инструмента является система Oracle CASE. Для создания конкретной прикладной системы, например таможенной, проектировщик представляет свои знания о работе конкретного подразделения таможни в системный словарь. Настройка проектируемой системы на технологию работы таможенного подразделения закладывается уже на первоначальных стадиях проектирования средствами конструктора. Затем выполняется генерация сразу же готовой системы.
Для упорядочивания информации в таможенных БД используются языки высокого уровня, для тонких запросов — Assembler. При этом в качестве операционной системы в ГНИВЦ ФТС используется Open VMS, а для управления БД используются разработки Oracle.