Введение
1 Основные статистические пакеты: описание и возможности
1.1 Общие сведения о пакетах для статистического анализа данных
1.2 Обзор наиболее известных программных продуктов, разработанных для статистической обработки данных
- Построение регрессионной модели зависимости потребительских расходов на душу населения от денежных доходов
Заключение
Список использованных источников
Приложение
Актуальность выбранной темы исследования состоит в том, что Потребность в средствах статистического анализа данных в различных областях деятельности, особенно в науке, очень велика, что и послужило причиной развития рынка компьютерных программ для статистической обработки данных. За последние 20 лет активное развитие получили компьютерные программы, позволяющие проводить статистический анализ больших объемов данных с целью выявления закономерностей, сравнения вероятных альтернатив выбора, построения прогнозов развития событий, обнаружения связей между явлениями и процессами.
Объект исследования – потребительские расходы на душу населения и денежные доходы.
Предмет исследования – регрессионная модель зависимости потребительских расходов на душу населения от денежных доходов.
Целью данной работы является построение регрессионной модели зависимости потребительских расходов на душу населения от денежных доходов. Для достижения поставленной цели необходимо решить следующие задачи:
- изучить общие сведения о пакетах для статистического анализа данных;
- провести обзор наиболее известных программных продуктов, разработанных для статистической обработки данных;
- построить регрессионную модель зависимости потребительских расходов на душу населения от денежных доходов.
Теоретико-методологическую основу исследования составили учебники и ученые пособия таких авторов, как Бывшев В.А., Валентинов В.А., Галочкин В. Т., Гармаш А. Н., Демидова О. А., Евсеев, Е. А., Колемаев В.А. и др.
1 Основные статистические пакеты: описание и возможности
1.1 Общие сведения о пакетах для статистического анализа данных
На сегодняшний день на рынке представлено около тысячи компьютерных программ для статистической обработки данных (далее – статистические пакеты). Разнообразие статистических пакетов обусловлено многоплановостью задач обработки данных с применением различных типов статистических процедур анализа для поиска ответов на вопросы из различных областей человеческой деятельности.
При выборе оптимального статистического пакета для поиска верных ответов на существующие вопросы учитываются следующие параметры:
- соответствие характеру решаемых задач;
- объем обрабатываемых данных;
- требования, предъявляемые к квалификации пользователя (уровень знаний в области статистики);
- имеющееся в наличии компьютерное оборудование.
Статистические пакеты по признаку функциональности могут быть разделены на 3 основные группы.
- Универсальные пакеты, или пакеты общего назначения (SPSS, STATA, STATISTICA, S-PLUS, Stadia, STATGRAPHICS, SYSTAT, Minitab).
Эти пакеты могут применяться для анализа данных из различных областей деятельности. Как правило, они предлагают широкий диапазон статистических методов и имеют относительно простой интерфейс. С такими пакетами рекомендуется работать начинающим пользователям, владеющим лишь базовыми знаниями в области статистики, а также опытным пользователям на начальных этапах работы с данными, когда еще четко не определены статистические методы, которые будут применяться для решения того или иного вопроса. Многопрофильность универсального пакета позволяет провести пробный анализ различных типов данных с использованием широкого диапазона статистических методов. Большинство существующих универсальных пакетов имеют много пересечений по составу встроенных статистических процедур [5].
Для того чтобы статистический пакет считался универсальным, он должен удовлетворять ряду требований:
- содержать достаточно широкий набор стандартных статистических методов;
- быть достаточно простым для быстрого освоения и использования непрофессиональным пользователем;
- работать с достаточно большими базами данных и отвечать высоким требованиям к вводу, преобразованию и организации хранения данных;
- осуществлять обмен данными с широко распространенными пакетами и базами данных;
- иметь обширный набор средств графического представления данных и результатов их анализа;
- иметь подробное документационное сопровождение и справочную систему, позволяющую начинающему пользователю с легкостью находить ответы на вопросы, связанные с работой программы и возможностями применения средств анализа данных.
- Профессиональные пакеты (например, SAS, BMDP).
Профессиональные пакеты отличаются от универсальных тем, что позволяют работать со сверхбольшими объемами данных, применять узкоспециализированные методы анализа, создавать собственную систему обработки данных. Как правило, подобные пакеты сложны в освоении для непрофессионалов. В то же время подготовленным пользователям работа с профессиональным пакетом предоставит больше возможностей для глубокого и детального анализа данных, построения сложных моделей и адаптации системы к собственным потребностям. Профессиональные пакеты более дорогостоящи, чем универсальные. Например, стоимость покупки SAS Analytics Pro на один год для индивидуального пользования составляет 5 360 EUR. Эти факторы делают современные профессиональные статистические пакеты слишком тяжеловесными для массового применения в различных областях деятельности [5].
- Специализированные пакеты (BioStat, MESOSAUR, DATASCOPE).
В некоторых областях деятельности анализируемые данные настолько специфичны, что к ним следует применять особые методы статистического анализа, как правило, не представленные в универсальных пакетах.
Специализированные пакеты позволяют проводить анализ с использованием ограниченного числа специализированных статистических методов или применимы к использованию для решения вопросов, относящихся к отдельно взятой предметной области. Как правило, с подобными статистическими пакетами работают специалисты, хорошо знакомые с методами анализа данных в той области, на которую ориентирован пакет.