Группировка данных и построение ряда распределения. Графическое изображение вариационных рядов Что такое полигон и гистограмма
В результате обработки и систематизации первичных статистических материалов получаются ряды цифровых статистических показателей, которые характеризуют отдельные стороны изучаемых явлений. Эти ряды называются статистическими.
Статистические ряды бывают двух видов: ряды распределения и ряды динамики (рис. 1).
Статистические ряды
Ряды распределения Ряды динамики
Атрибутивные Вариационные
Дискретные Непрерывные
(Интервальные)
Рисунок 1 – Виды рядов распределения
Ряды распределения – это ряды, которые характеризуют распределение единиц совокупности по какому-либо признаку (например, распределение производственного оборудования по видам и срокам службы). Ряд распределения состоит из двух элементов: вариант – значений группировочного признака и частот – число повторений отдельных вариантов значений признака.
Ряд распределения – группировка, в которой для характеристики групп, упорядоченно расположенных по значению признака, применяется только один показатель - численность групп.
Частоты, представленные в относительном выражении, называют частостями и обозначают .
Например, вместо абсолютного числа рабочих, имеющих определённый разряд, можно установить долю рабочих этого разряда. Частости могут быть выражены в долях единицы или в процентах. Замена частот частостями позволяет сопоставить вариационные ряды с различным числом наблюдений.
По характеру вариации различают дискретные и непрерывные признаки. Дискретные признаки отличаются друг от друга на некоторую конечную величину, то есть даны в виде прерывных чисел. Например, тарифный разряд рабочих, количество детей в семье, число рабочих на предприятии. Непрерывные признаки могут отличаться один от другого на сколь угодно малую величину и в определённых границах принимать любые значения. Например, заработная плата рабочих, стоимость основных фондов предприятия.
Атрибутивный ряд распределения образуется по качественному признаку (распределение рабочих по профессиям, машин – по маркам). Вариационный ряд распределения образуется по количественному признаку. Он состоит из вариант и частот. В дискретном ряде распределения отдельные варианты имеют определённые значения (распределение рабочих по разрядам). В тех случаях, когда число вариантов дискретного признака достаточно велико, а также при анализе вариации непрерывного признака, когда значения этого признака у отдельных единиц могут вообще не повторяться, строятся интервальные ряды распределения. Интервал указывает определённые пределы значений варьирующего признака и обозначается верхней и нижней границей интервала.
Различают ряды распределения с абсолютными, относительными и накопленными частотами. Накопленные частоты называют кумулятивными.
Если приведён вариационный ряд с неравными интервалами, то для правильного представления о характере распределения необходимо рассчитать плотность распределения. Плотность распределения – это количество единиц совокупности, приходящихся на единицу величины интервала группировочного признака. Различают абсолютную () и относительную () плотность:
где – частота;
– удельный вес;
– размер интервала.
По форме ряды распределения бывают одно- двух- и многовершинными. Среди одновершинных распределений есть симметричные и асимметричные (скошенные), остро- и плосковершинные.
Графическое изображение рядов распределения облегчает их анализ и позволяет судить о форме распределения.
Для графического изображения дискретного ряда применяют полигон распределения. Полигон чаще всего используют для изображения дискретных рядов. Полигоном частот называют ломаную, отрезки которой соединяют точки с координатами (xi,mi) , где xi – варианты выборки и mi – соответствующие им частоты. Если полигон строят по данным интервального ряда, то в качестве абсцисс точек берут середины соответствующих интервалов.
Для построения полигона в прямоугольной системе координат в произвольно выбранном масштабе на оси абсцисс откладывают значения аргумента (варианты), а на оси ординат – значения частот. Масштаб выбирают такой, чтобы была обеспечена необходимая наглядность и желательный размер рисунка. Далее строят точки с координатами (xi,mi) и последовательно соединяют их отрезками прямой.
Рисунок 2 – Полигон распределения
Для графического изображения интервальных вариационных рядов применяются гистограммы. Она строится так: на оси абсцисс откладываются равные отрезки, которые в принятом масштабе соответствуют величине интервалов вариационного ряда. На отрезках строят прямоугольники, площади которых пропорциональны частотам (или частностям) интервала.
Гистограмма может быть преобразована в полигон распределения, если середины верхних сторон прямоугольников соединяются отрезками прямых. Две крайние точки прямоугольников замыкаются по оси абсцисс на середины интервалов, в которых частоты (частности) равны нулю. При построении гистограммы для вариационного ряда с неравными интервалами следует по оси ординат наносить показатели плотности интервалов (абсолютные или относительные). В этом случае высоты прямоугольников гистограммы будут соответствовать величине плотности распределения.
Рисунок 3 – Гистограмма
При увеличении числа наблюдений из одной и той же совокупности увеличивается число групп интервального ряда, что приводит к уменьшению величины интервала. При этом ломанная линия имеет тенденцию превращения в плавную кривую, которую называют кривой распределения. Кривая распределения характеризует в обобщенном виде вариацию признака и закономерности распределения частот внутри однокачественной совокупности.
Кумулята или кривая накопленных частот в отличие от полигона строится по накопленным частотам или частостям. При этом на оси абсцисс помещают значения признака, а на оси ординат – накопленные частоты или частости (рисунок 4).
Накопленной частоты, т. е. число значений, которые попали в этот интервал и все предшествующие.
Рисунок 4 – Кумулята (кривая накопленных частот)
Следует отметить, что кривая накопленных частот не убывает ни на одном участке.
Пример построения группировки рассмотрим в примерах 1 и 2.
Пример 1
Оборот и издержки обращения тридцати торговых предприятий за отчетный период составили (тыс. руб.):
Магазины, № п/п | Оборот | Издержки обращения |
Для выявления зависимости между размером оборота и издержками обращения произведите группировку магазинов по размеру оборота, образовав пять групп магазинов с равными интервалами. В каждой группе и в целом подсчитайте:
1) число магазинов;
2) размер оборота – всего и в среднем на один магазин;
3) издержки обращения – всего и в среднем на один магазин;
4) структуру товарооборота по группам и структуру издержек обращения;
5) уровень издержек обращения
У ИО = | Издержки обращения | ×100%. |
Товарооборот |
6) Решение оформите в разработочной и групповой таблицах. Сделайте выводы, укажите вид группировки. Постройте гистограмму и преобразуйте её в полигон. Постройте кумуляту (кривую накопленных частот).
Решение:
Составим вариационный ряд распределения, упорядочив магазины по товарообороту от большего к меньшему.
Магазины, № п/п | Оборот | Издержки обращения | Магазины, № п/п | Оборот | Издержки обращения |
7 | 341 | 160 | |||
11 | 456 | 242 | 19 | 1199 | 635 |
5 | 1326 | 623 | |||
Определим величину интервала:
, где
i – величина интервала;
Xmax, Xmin – максимальное и минимальное значение признака (1700 и 341 соответственно).
Величина интервала составит:
Определим границы интервалов:
Разнесем по выделенным интервалам предприятия (разработочная таблица):
Определим в каждой группе и в целом объем оборота – всего и в среднем на один магазин и издержки – всего и в среднем на один магазин, для чего составим группировочную таблицу:
Группы предприятий по величине оборота | Число предприятий в группе | Суммарный товарооборот в группе | Средний товарооборот по группе | Суммарные издержки обращения по группе | Средние издержки обращения по группе | Уровень издержек обращения по группе, % |
А | (1) | (2) | (3)=(2)/(1) | (4) | (5)=(4)/(1) | (6)=(4)/(2)*100 |
341-612,8 | 398,5 | 50,44 | ||||
612,8-884,6 | 744,5 | 345,5 | 46,41 | |||
884,6-1156,4 | 998,75 | 482,625 | 48,32 | |||
1156,4-1428,2 | 1262,5 | 49,82 | ||||
1428,2-1700 | 687,417 | 43,65 | ||||
Итого | 34679/30= 1155,97 | 15843/30= 528,1 | 528,1/1155,97*100 = 45,68 |
На основании проведенных расчетов построим гистограмму и полигон.
При построении гистограммы по оси Х откладывают значения признака (границы интервалов), а по оси Y – частоты. Для соответствующего интервала строиться прямоугольник, высота которого соответствует частоте признака (рисунок 5).
Рисунок 5 – Гистограмма
Гистограмма может быть преобразована в полигон, если середины верхних граней прямоугольника соединить прямой линией (рисунок 6).
Рисунок 6 – Полигон распределения
Также построим кумуляту или кривую накопленных частот. В этом случае по оси Х откладываем интервалы признака, а по оси Y – накопленные частоты (это количество единиц совокупности, имеющие значения признака меньше указанного) . Накопленные частоты рассчитаны в таблице.
Кривая накопленных частот представлена на рисунке 7.
Рисунок 7 – Кривая накопленных частот
Вывод: Суммарный товарооборот в первой группе 797 тыс. руб., во второй – 4467 тыс. руб., в третьей – 7990 тыс. руб., в четвертой – 2525 тыс. руб., в пятой – 18900 тыс. руб. Средний товарооборот на один магазин в первой группе 398,5 тыс. руб., во второй – 744,5 тыс. руб., в третьей – 998,75 тыс. руб., в четвертой – 1262,5 тыс. руб., в пятой – 1575 тыс. руб.
Суммарные издержки обращения в первой группе 402 тыс. руб., во второй – 2073 тыс. руб., в третьей – 3861 тыс. руб., в четвертой – 1258 тыс. руб., в пятой – 8249 тыс. руб. Средний издержки обращения в первой группе 201 тыс. руб., во второй – 345,5 тыс. руб., в третьей – 482,625 тыс. руб., в четвертой – 629 тыс. руб., в пятой – 687,417 тыс. руб.
На основании полученных значений можно сделать вывод о прямой зависимости между размером оборота и средними издержек обращения: при росте размера оборота средние издержки обращения увеличиваются. На основании анализа уровня издержек обращения можно сделать вывод, что наиболее конкурентны предприятия пятой группы, поскольку у них уровень издержек ниже среднего.
Пример 2
По данным таблицы постройте ряды распределения домохозяйств, рассчитав число домохозяйств, входящих в те или иные группы:
а) по числу совместно проживающих человек (1,2,3,4 и более)
б) по среднему размеру доходов на душу населения в месяц (образовав 5 групп с равными интервалами)
в) по статусу занятости главы семьи.
№ п/п | Число членов в семье | Статус главы семьи по месту в занятости | |
1. | Самозанятость | ||
2. | По найму | ||
3. | По найму | ||
4. | По найму | ||
5. | По найму | ||
6. | Нет работы | ||
7. | Нет работы | ||
8. | Самозанятость | ||
9. | Нет работы | ||
10. | По найму | ||
11. | По найму | ||
12. | По найму | ||
13. | Самозанятость | ||
14. | По найму | ||
15. | По найму | ||
16. | По найму | ||
17. | По найму | ||
18. | Нет работы | ||
19. | Нет работы | ||
20. | Самозанятость | ||
21. | Нет работы | ||
22. | По найму | ||
23. | По найму | ||
24. | По найму | ||
25. | По найму | ||
26. | По найму | ||
27. | Самозанятость | ||
28. | Нет работы | ||
29. | По найму | ||
30. | По найму | ||
Итого | - | - |
Решение:
Построим ряды распределения домохозяйств, рассчитав число домохозяйств, входящих в те или иные группы:
Общее число семей, имеющих разный статус глав семей по месту в занятости, представлено в таблице. В этом случае группировка строиться по качественному признаку. Число групп совпадает с числом признаков: самозанятость, по найму, нет работы.
Общее число глав семей, имеющих разный статус по месту в занятости (са Общее число семей, имеющих разный статус глав семей по месту в занятости, представлено в таблице. В этом случае группировка строиться по качественному признаку. Число групп совпадает с числом признаков: самозанятость, по найму, нет работы.
Группировка по числу совместно проживающих человек (1,2,3,4 и более), представлено в таблице. В этом случае группировка строиться по количественному дискретному признаку.
Таким образом, 33% всех обследованных семей состоят из трех человек. 13% семей состоят из 4 и более человек. Доли семей, состоящих из 1 человека – 17%, из 2 человек – 37%.
Построим группировку по среднему размеру доходов на душу населения в месяц (образовав 5 групп с равными интервалами);
На начальном этапе проранжируем ряд от меньшего к большему:
Номер домохозяйства | Среднемесячный доход на душу, руб. | Номер домохозяйства | Среднемесячный доход на душу, руб. |
Определим величину интервала по формуле:
, где
i – величина интервала;
n – число групп (в данной задаче 5 группы);
Xmax, Xmin – максимальное и минимальное значение признака.
Величина интервала составит:
Разнесем по выделенным интервалам домашние хозяйства:
Это и будет интервальный ряд распределения.
Рисунок 8 – Гистограмма распределения
Таким образом, в 50% всех обследуемых домашних хозяйствах среднедушевой доход составляет от 4800 рублей до 7460 рублей на человека. Доход от 2140 до 4800 рублей на человека наблюдается в 16% всех семей. Доход от 7460 до 10120 рублей на человека наблюдается в 20% всех обследованных семей. Доля семей, где среднедушевой доход составляет от 10120 до 12780, а также от 12780 до 15440 рублей, равна 7%.
Вопросы для самопроверки
Группировка – это разбиение совокупности на группы, однородные по какому-либо признаку.Назначение сервиса . С помощью онлайн-калькулятора Вы сможете:
- построить вариационный ряд , построить гистограмму и полигон;
- найти показатели вариации (среднюю, моду (в т.ч. и графическим способом), медиану, размах вариации, квартили, децили, квартильный коэффициент дифференциации, коэффициент вариации и другие показатели);
Инструкция . Для группировки ряда необходимо выбрать вид получаемого вариационного ряда (дискретный или интервальный) и указать количество данных (количество строк). Полученное решение сохраняется в файле Word (см. пример группировки статистических данных).
Если группировка уже осуществлена и заданы дискретный вариационный ряд или интервальный ряд , то необходимо воспользоваться онлайн-калькулятором Показатели вариации . Проверка гипотезы о виде распределения производится с помощью сервиса Изучение формы распределения .
Виды статистических группировок
Вариационный ряд . В случае наблюдений дискретной случайной величины одно и то же значение можно встретить несколько раз. Такие значения x i случайной величины записывают с указанием n i числа раз его появления в n наблюдениях, это и есть частота данного значения.В случае непрерывной случайной величины на практике применяют группировку.
- Типологическая группировка – это разделение исследуемой качественно разнородной совокупности на классы, социально–экономические типы, однородные группы единиц. Для построения данной группировки используйте параметр Дискретный вариационный ряд.
- Структурной называется группировка , в которой происходит разделение однородной совокупности на группы, характеризующие ее структуру по какому–либо варьирующему признаку. Для построения данной группировки используйте параметр Интервальный ряд.
- Группировка, выявляющая взаимосвязи между изучаемыми явлениями и их признаками, называется аналитической группировкой (см. аналитическая группировка ряда).
Пример №1 . По данным таблицы 2 постройте ряды распределения по 40 коммерческим банкам РФ. По полученным рядам распределения определите: прибыль в среднем на один коммерческий банк, кредитные вложения в среднем на один коммерческий банк, модальное и медианное значение прибыли; квартили, децили, размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, коэффициент вариации.
Решение
:
В разделе «Вид статистического ряда»
выбираем Дискретный ряд. Нажимаем Вставить из Excel . Количество групп: по формуле Стэрджесса
Принципы построения статистических группировок
Ряд наблюдений, упорядоченных по возрастанию, называется вариационным рядом . Группировочным признаком называется признак, по которому производится разбивка совокупности на отдельные группы. Его называют основанием группировки. В основание группировки могут быть положены как количественные, так и качественные признаки.После определения основания группировки следует решить вопрос о количестве групп, на которые надо разбить исследуемую совокупность.
При использовании персональных компьютеров для обработки статистических данных группировка единиц объекта производится с помощью стандартных процедур.
Одна из таких процедур основана на использовании формулы Стерджесса для определения оптимального числа групп:
k = 1+3,322*lg(N)
Где k – число групп, N – число единиц совокупности.
Длину частичных интервалов вычисляют как h=(x max -x min)/k
Затем подсчитывают числа попаданий наблюдений в эти интервалы, которые принимают за частоты n i . Малочисленные частоты, значения которых меньше 5 (n i < 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
В качестве новых значений вариант берут середины интервалов x i =(c i-1 +c i)/2.
Пример №3
.
В результате 5%-ной собственно-случайной выборки получено следующее распределение изделий по содержанию влаги. Рассчитайте:
1) средний процент влажности; 2) показатели, характеризующие вариацию влажности.
Решение получено с помощью калькулятора : Пример №1
Построить вариационный ряд. По найденному ряду построить полигон распределения, гистограмму, кумуляту. Определить моду и медиану.
Скачать решение
Пример
. По результатам выборочного наблюдения (выборка А приложение):
а) составьте вариационный ряд;
б) вычислите относительные частоты и накопленные относительные частоты;
в) постройте полигон;
г) составьте эмпирическую функцию распределения;
д) постройте график эмпирической функции распределения;
е) вычислите числовые характеристики: среднее арифметическое, дисперсию, среднее квадратическое отклонение.
Решение
На основе данных, приведенных в Таблице 4 (Приложение 1) и соответствующих Вашему варианту, выполнить:
- На основе структурной группировки построить вариационный частотный и кумулятивный ряды распределения, используя равные закрытые интервалы, приняв число групп равным 6. Результаты представить в виде таблицы и изобразить графически.
- Проанализировать вариационный ряд распределения, вычислив:
- среднее арифметическое значение признака;
- моду, медиану, 1-ый квартиль, 1-ый и 9-тый дециль;
- среднее квадратичное отклонение;
- коэффициент вариации.
- Сделать выводы.
Требуется: ранжировать ряд, построить интервальный ряд распределения, вычислить среднее значение, колеблемость среднего значения, моду и медиану для ранжированного и интервального рядов.
На основе исходных данных построить дискретный вариационный ряд ; представить его в виде статистической таблицы и статистических графиков. 2). На основе исходных данных построить интервальный вариационный ряд с равными интервалами. Число интервалов выбрать самостоятельно и объяснить этот выбор. Представить полученный вариационный ряд в виде статистической таблицы и статистических графиков. Указать виды примененных таблиц и графиков.
С целью определения средней продолжительности обслуживания клиентов в пенсионном фонде, число клиентов которого очень велико, по схеме собственно-случайной бесповторной выборки проведено обследование 100 клиентов. Результаты обследования представлены в таблице. Найти:
а) границы, в которых с вероятностью 0.9946 заключено среднее время обслуживания всех клиентов пенсионного фонда;
б) вероятность того, что доля всех клиентов фонда с продолжительностью обслуживания менее 6 минут отличается от доли таких клиентов в выборке не более чем на 10% (по абсолютной величине);
в) объем повторной выборки, при котором с вероятностью 0.9907 можно утверждать, что доля всех клиентов фонда с продолжительностью обслуживания менее 6 минут отличается от доли таких клиентов в выборке не более чем на 10% (по абсолютной величине).
2. По данным задачи 1, используя X 2 критерий Пирсона, на уровне значимости α = 0,05 проверить гипотезу о том, что случайная величина Х – время обслуживания клиентов – распределена по нормальному закону. Построить на одном чертеже гистограмму эмпирического распределения и соответствующую нормальную кривую.
Скачать решение
Дана выборка из 100 элементов. Необходимо:
- Построить ранжированный вариационный ряд;
- Найти максимальный и минимальный члены ряда;
- Найти размах вариации и количество оптимальных промежутков для построения интервального ряда. Найти длину промежутка интервального ряда;
- Построить интервальный ряд. Найти частоты попадания элементов выборки в составленные промежутки. Найти средние точки каждого промежутка;
- Построить гистограмму и полигон частот. Сравнить с нормальным распределением (аналитически и графически);
- Построить график эмпирической функции распределения;
- Рассчитать выборочные числовые характеристики: выборочное среднее и центральный выборочный момент;
- Рассчитать приближенные значения среднего квадратического отклонения, асимметрии и эксцесса (пользуясь пакетом анализа MS Excel). Сравнить приближенные расчетные значения с точными (рассчитанные по формулам MS Excel);
- Сравнить выборочные графические характеристики с соответствующими теоретическими.
Имеются следующие выборочные данные (выборка 10%-ная, механическая) о выпуске продукции и сумме прибыли, млн. руб. По исходным данным:
Задание 13.1.
13.1.1. Постройте статистический ряд распределения предприятий по сумме прибыли, образовав пять групп с равными интервалами. Постройте графики ряда распределения.
13.1.2. Рассчитайте числовые характеристики ряда распределения предприятий по сумме прибыли: среднюю арифметическую, среднее квадратическое отклонение, дисперсию, коэффициент вариации V. Сделайте выводы.
Задание 13.2.
13.2.1. Определите границы, в которых с вероятностью 0.997 заключена сумма прибыли одного предприятия в генеральной совокупности.
13.2.2. Используя x2-критерий Пирсона , при уровне значимости α проверить гипотезу о том, что случайная величина X – сумма прибыли – распределена по нормальному закону.
Задание 13.3.
13.3.1. Определите коэффициенты выборочного уравнения регрессии.
13.3.2. Установите наличие и характер корреляционной связи между стоимостью произведённой продукции (X) и суммой прибыли на одно предприятие (Y). Постройте диаграмму рассеяния и линию регрессии.
13.3.3. Рассчитайте линейный коэффициент корреляции. Используя t-критерий Стьюдента, проверьте значимость коэффициента корреляции. Сделайте вывод о тесноте связи между факторами X и Y, используя шкалу Чеддока .
Методические рекомендации
. Задание 13.3 выполняется с помощью этого сервиса .
Скачать решение
Задача . Следующие данные представляют собой затраты времени клиентов на заключение договоров. Построить интервальный вариационный ряд представленных данных, гистограмму, найти несмещенную оценку математического ожидания, смещенную и несмещенную оценку дисперсии.
Пример
. По данным таблицы 2:
1) Постройте ряды распределения по 40 коммерческим банкам РФ:
А) по величине прибыли;
Б) по величине кредитных вложений.
2) По полученным рядам распределения определите:
А) прибыль в среднем на один коммерческий банк;
Б) кредитные вложения в среднем на один коммерческий банк;
В) модальное и медианное значение прибыли; квартили, децили;
Г) модальное и медианное значение кредитных вложений.
3) По полученным в п. 1 рядам распределения рассчитайте:
а) размах вариации;
б) среднее линейное отклонение;
в) среднее квадратическое отклонение;
г) коэффициент вариации.
Необходимые расчеты оформите в табличной форме. Результаты проанализируйте. Сделайте выводы.
Постройте графики полученных рядов распределения. Графически определите моду и медиану.
Решение:
Для построения группировка с равными интервалами воспользуемся сервисом Группировка статистических данных .
Рисунок 1 – Ввод параметров
Описание параметровКоличество строк : количество исходных данных. Если размерность ряда небольшая, укажите его количество. Если выборка достаточно объемная, то нажмите кнопку Вставить из Excel .
Количество групп : 0 – число групп будет определяться по формуле Стэрджесса.
Если задано конкретное число групп, укажите его (например, 5).
Вид ряда : Дискретный ряд.
Уровень значимости : например, 0.954 . Этот параметр задается для определения доверительного интервала среднего значения.
Выборка : Например, проведена 10% -ная механическая выборка. Указываем число 10 . Для наших данных указываем 100 .
Полигон распределения вероятностей
Аналогично все указанные приемы обработки и построения могут быть распространены и на другие показатели, например на объемы поставок, интервалы между поставками, объемы суточных отпусков и суточных объемов поставок. Эти полигоны распределения описывают, как в течение отчетного года на предприятии изменялись объемы поставок, интервалы поставок и объемы суточных отпусков и т.д.
Любой полигон описывается набором средних значений интервалов (диапазонов) вариаций какого-либо одного признака и частостью появления этого среднего значения . Каждый из полигонов распределения можно выразить аналитически, например, для ряда распределения объемов поставок (Q, W), формула будет выглядеть следующим образом
Аналогично аналитически можно выразить полигоны распределения интервалов между поставками (Т, У) и объемов суточных отпусков (R, СО
Полигон распределения - ломаная линия, построенная на графике и характеризующая изменение вероятностей различных исходов событий при повторных испытаниях.
Следующей задачей является оценка возможных сочетаний значений нормообразующих факторов, которые могут иметь место в интервалах отгрузки в плановом году. Возможность получения результата вытекает из анализа данных, приведенных на рис. 5.8 и 5.9. На каждом из этих 12 графиков построены два полигона распределений вариаций значений нормообразующих факторов в целом за три года и за один год из этого же периода. Они построены по четырем предприятиям - горно-обогатительному и лесообрабатывающему комбинатам и двум машиностроительным заводам. На графиках по осям абсцисс отложены диапазоны вариаций значений нормообразующих факторов на каждом из этих предприятий, а по осям ординат - частости появления значений признаков в соответствующих периодах. Штриховые линии полигонов, проведенные на графиках, построены по результатам обработки фактических данных за один отчетный год (1), сплошные - в целом за трехлетний период (Z).
Поскольку, как уже говорилось выше, из полигона распределения легко можно получить гистограмму и наоборот, использование данного метода рассмотрим в предположении, что исходным графиком является гистограмма. В случае, если известен только полигон распределения, мы можем восстановить по нему гистограмму, тщательно его измерив и определив опорные точки (середины интервалов) этого полигона, и затем применить изложенный метод непосредственно к гистограмме. Относительно способа ее построения примем следующие допущения.
В табл. 6.3.1 показаны все необходимые исходные данные, позволяющие рассчитать эмпирическую функцию распределения , гистограмму и полигон распределения.
Ниже на рис. 6.3.10 и 6.3.11 приведены гистограмма и полигон распределения относительных частот.
II. Диаграммы 1. Диаграммы рас- а) ДГ распределения по одному полигон распределения гистограмма
Вариационные ряды могут быть изображены графически в виде полигона распределения и гистограммы.
Полигон распределения и гистограмма есть реализация распределения выборочной совокупности при ограниченном числе наблюдений (N), а предельная кривая при N - > °° является распределением генеральной совокупности . Распределение генеральной совокупности является теоретическим распределением. Отдельные распределения изучены и поддаются точному аналитическому опи-
Если уменьшить интервалы и одновременно увеличивать число наблюдений при конечной численности группы, то полигон распределения и гистограмма станут приближаться
Для изображения вариационных рядов применяются линейные и плоскостные диаграммы , построенные в прямоугольной системе координат . При дискретной вариации признака графиком вариационного ряда служит полигон распределения. Рассмотрим пример его построения по следующим данным.
Полигон распределения представляет собой замкнутый многоугольник, абсциссами вершин которого являются значения варьирующегося признака, а ординатами - соответствующие им частоты (рис. 3.8).
Наглядно ряды распределения можно представить при помощи их графического изображения, позволяющего судить о форме распределения. Наиболее часто для этой цели используют полигон и гистограмму.
На графике (рис. 4.1) представлены полигон (ломаная прямая) и гистограмма (совокупность прямоугольников) вышеуказанного распределения.
Полигон степени влияния отобранных факторов на изучаемый показатель - распределение суммы рангов влияния факторов на изучаемый показатель. Если соединить его начало и конец прямой линией, то можно видеть, насколько далека полученная ранжировка от ранжировки, соответствующей полной согласованности мнений опрашиваемых экспертов. При этом возможны три случая ранжировки
Полигон - это графическое изображение дискретного вариационного ряда в прямоугольной системе координат , при котором величины признака X откладываются на оси абсцисс, а соответствующие им частости W - на оси ординат. Эти точки соединяются отрезками прямой, полученная фигура представляет распределение совокупности по признаку X.
Для расчета специфицированных норм производственных запасов требуется перейти от аналитической записи каждого полигона к вероятностным характеристикам - плотностям распределения вариаций объемов поставок (или соответственно интервалов поставок, объемов суточных отпусков и т.п.). Построенная же по полигону плотность распределения вариаций этого признака - Р(Х X показывает, как будут изменяться вариации признака X в плановом году. Далее будет более подробно пояснено, что эти плотности распределения обладают свойством устойчивости, по ним можно рассчитать специфицированные нормы производственных запасов для планового года. Причем будет показано, что чем больше неравномерность (размах вариаций фактора), тем выше должно быть установлено значение определяемой нормы производственного запаса при прочих одинаковых или примерно одинаковых условиях (например, при одном и том же годовом объеме поступления, одинаковых частотах поставок и годовом объеме расхода и т.д.).
Разберем, как от аналитического выражения полигона вариаций признака (например, для объемов поставок - Q, W) перейти к плотности распределения вариаций этого же признака - Q, P(Q). Здесь для двух указанных выше случаев применяются разные обозначения величины вариаций объемов поставок и разные обозначения изменений частости объемов поставок и их вероятностей. В первом случае данные но отчетному
Графически вариационные ряды изображаются в форме кривой распределения или полигона частоты. Приведем пример.
Из цифрового и графического изображения рядов видно, что во втором году произошло значительное улучшение распределения долблений по уровням механических скоростей . Так, во втором году первый интервал оказался совершенно не заполненным, ряд стал короче и вершина полигона сдвинулась вправо к большим показателям скоростей.
Рис. 13. Гистограмма, полигон и плотность распределения вероятности отсчета у аналогового измерительного прибора | /info/5256">плотности распределения вероятности отсчета р (х), показанную на рис. 13, б.
Вариация данных анализируется с помощью полигона распределения, кумуляты (кривой меньше, чем) и огивы (кривой больше, чем). Все эти виды графиков рассматриваются в главе 5. Линейные графики используются в решении задач классификации данных (см. гл. 6). Применение линейных графиков в анализе динамики рассмотрено в главе 9, а использование их для анализа связей -в главе 8. В этих же главах рассмотрено использование точечных диаграмм (см., например, поле корреляции в гл. 8). Полигон распределения представляет собой многоугольник, который строится на прямоугольной) оооординатной сетке следующим образом. В выбранных масштабахша оси абсцисс наносится шкала для фактических значений случайной величины X, на оси ординат- Построим полигон, гистограмму, кумуляту и огиву (рис. 4.1) на основании следующих данных о распределении сельского населения в России на 1 января 1998 г. по возрастным группам (млн человек). Для наглядности определения закономерностей изменения признака ряд распределения целесообразно представлять вчвиде полигонов (так как все изучаемые в настоящей работе признаки характеризуются дискретными величинами). Для изображения ряда распределения графически необходимо определение размера интервала группировок исходных данных. Для графического изображения рядов распределения кроме гистограммы и полигона могут применяться также кумулятивная кривая и огива1. Физический смысл полигонов вариаций значений нормообразующих факторов, приведенных на рис. 5.8 и 5.9, состоит в следующем они показывают, как изменялись условия производства и отгрузки готовой продукции на предприятиях в отчетных периодах . Из графика, приведенного на рис. 5.8г, следует, что объемы суточного производства пиломатериалов на лесодеревообрабатывающем комбинате ЛДК-4 изменялись в диапазоне от 100 до 900 куб. м (т.е. размах вариаций их будет от Rmia = 100 до -Rmax = 900 куб. м/сутки). Объемы производства пиломатериалов 430 куб. м/сутки составляли основную долю 44% (Р(Ю - 0,44), 580 куб. м/сутки - 28%, 690 куб. м/сутки - 4% и т.д. На рис. 5.8д и 5.8е построены распределения вариаций суточных объемов отгрузок пиломатериалов и интервалов между отгрузками, которые были в отчетном периоде . Объемы суточных отгрузок менялись в диапазоне от 50 до 780 куб. м/сутки (рис. 5.8д). В основном они составляли по 200-500 куб. м/ сутки - 45% (Р(О) = 0,45 при О = 200-580 куб. м/сутки), 580 куб. м/ сутки - 13%, 640 куб. м/сутки - 4% и т.д. |
Для наглядности строят различные графики статистического распределения, в частности, полигон и гистограмму.
Определение . Полигоном частот называют ломаную, отрезки которой соединяют точки (x 1 , n 1), (x 2 , n 2), …, (x k , n k).
Для построения полигона частот на оси абсцисс откладывают варианты x i , а на оси ординат – соответствующие им частоты n i . Точки (x i , n i) соединяют отрезками прямых и получают полигон частот.
Определение. Полигоном относительных частот называют ломаную, отрезки которой соединяют точки (x 1 , w 1), (x 2 , w 2), …, (x k , w k).
Для построения полигона частот на оси абсцисс откладывают варианты x i , а на оси ординат w i . Точки (x i , w i) соединяют отрезками прямых и получают полигон относительных частот.
На рисунке изображен полигон относительных частот следующего распределения:
Рис. 6. Полигон относительных частот.
В случае непрерывного признака целесообразно строить гистограмму, для чего интервал, в котором заключены все наблюдаемые значения признака, разбивают на несколько частичных интервалов длинной h и находят для каждого частичного интервала n i – сумму частот вариант, попавших в i-ый интервал.
Определение . Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною h, а высоты равны отношению (плотность частоты).
Рис. 7. Гистограмма частот.
Для построения гистограммы частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс, на расстоянии .
Площадь i-го частичного прямоугольника равна =─ сумме частот вариантi-го интервала; следовательно, площадь гистограммы частот равна сумме всех частот, то есть объему выборки n.
На рисунке 2 изображена гистограмма частот распределения объема n=100, приведенного в таблице 1.
Частичный интервал, длиною h=5 |
Плотность частоты |
|
Определение . Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длинною h, а высоты равны отношению (плотность относительной частоты).
Для построения гистограммы относительных частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии . Площадьi-го частичного прямоугольника равна =─ относительной частоте вариант, попавших вi-й интервал. Следовательно, площадь гистограммы относительных частот равна сумме всех относительных частот, то есть единице.
В результате выборки получена следующая таблица распределения частот.
Построить полигоны частот и относительных частот распределения.
Для начала построим полигон частот.
Рис. 8. Полигон частот.
Чтобы построить полигон относительных частот найдем относительные частоты, для чего разделим частоты на объем выборки n.
n = 3 + 10 + 7 = 20.
Получаем
Построим полигон относительных частот.
Рис. 9. Полигон относительных частот.
2. Построить гистограммы частот и относительных частот распределения.
Найдем плотность частоты :
Частичный интервал, длиною h = 3 |
Сумма частот вариант частичного интервала |
Плотность частоты |
Полигональные фигуры очень напоминают оригами или ограненные драгоценные камни. Давайте разберемся, что такое полигональная графика? И почему дизайнеры так любят использовать этот прием в своих работах ?
Полигон (от греч. polýgonos – многоугольный), полигональная линия – это ломаная линия, составленная из конечного числа прямолинейных отрезков (звеньев). Под полигоном также понимают замкнутую ломаную линию, т. е. многоугольник.
Полигональная графика интеллектуальна
Это визуализация осознанной формы. Художникам и дизайнерам полигон помогает упростить, осмыслить, а значит, в дальнейшем правильно передать форму и объем объекта.
Помогает он и в трехмерной графике. Там полигон - это минимальная поверхность, элемент, из которого складываются каркасы форм любой сложности. Чем больше полигонов, тем более детализованной будет модель. В трехмерной графике в качестве полигонов обычно применяют треугольники.
Полигоны — простые, красивые, лаконичные и бесконечно многообразные вдохновляют многих современных дизайнеров. Из них можно составлять абстрактные композиции и стильные иллюстрации любой сложности
В этой статье вы узнаете много нового о полигонах и полигональной графике и увидите замечательные примеры ее использования. Также здесь собрано несколько уроков, которые помогут вам освоить эту технику.
В какой программе можно создавать полигональную графику?
Трехмерная графика. На этот вопрос нет однозначного ответа. Мастера 3D, предпочтут, несомненно, делать это в 3D max, Maya, или Cinema 4D. Последнее ПО настолько дружелюбно, что в нем может рисовать даже ребенок. В целом, полигональная графика достаточно проста в создании, особенно если сравнивать с фотореалистичной визуализацией. Она напоминает ранние дни компьютерного моделирования и анимации с налетом современных техник. Чем меньше полигонов вы используете на стадии моделирования, тем более абстрактным будет результат. Для выраженного эффекта можно отключить функцию сглаживания в настройках рендеринга, и тогда вы получите четкие грани. Здесь все зависит от эффекта, которого вы хотите достичь. Использование низкополигональной техники совсем не означает, что сцена будет простой. Вы можете использовать сложные текстуры, реалистичные настройки отражений и преломлений в окружающей среде и т. д.
2D графика. Можно создавать полигональные шедевры в таких программах как Adobe Illustrator , и даже Adobe Photoshop . Эти программы, в отличие от специфичных 3D пакетов, хорошо знакомы большинству дизайнеров. Таким методом можно создавать стилизованные, декоративные изображения с потрясающими
А еще можно дополнять полигональную графику фотографиями, создавая удивительные коллажи, напоминающие дополненную реальность и намекающие о связях между реальным и виртуальными мирами. Некоторые работы дополняются типографикой.
А еще можно попробовать онлайн-генераторы полигонов
Trianglify
Очень простой генератор, который позволит создать низкополигональные фоны с заданной палитрой цветов. Можно создать красивый фон для Вашего дизайна. Готовый полигон можно бесплатно скачать в формате SVG.
Как преобразовать растр в полигоны онлайн
Функциональный генератор для создания триангулярных изображений. Создает полигональную композицию из любого растрового изображения. Есть ряд настроек и кнопка рандомизации для получения случайных результатов. После того как изображение будет готово Вы сможете скачать его в форматах PNG и SVG.
Полигональные логотипы
На волне популярности полигональной графики стали создаваться в таком стиле
Создаем полигональный логотип в программе CorelDraw
Полигональный портрет
Эта техника позволяет создавать работы любой сложности.
В этих уроках показано, как создать полигональный портрет