Как найти функцию?

Теория штука хорошая, но на практике иногда бывают ситуации с которыми не справишься, только книжными знаниями. Давайте поможем друг другу и поделимся опытом решения тех или иных практических задач.
dop
Пользователь
Пользователь
Сообщений: 97
Зарегистрирован: 10 июл 2007 03:00

Как найти функцию?

Сообщение dop » 18 июн 2009 12:50

Вопрос такой, есть 2 числовых ряда, 1 это продажи за период, другой средняя температура воздуха за период, как найти функцию описывающую поведения продаж относительно температуры?
Сразу отвечу на наверно самый напрашивающий вопрос, я не студент, вопрос практический, надо хоть что-нибудь наваять для начальства)

Реклама
Аватар пользователя
u-shak-off

Сообщение u-shak-off » 18 июн 2009 13:09

а можно файл выложить?

dop
Пользователь
Пользователь
Сообщений: 97
Зарегистрирован: 10 июл 2007 03:00

Сообщение dop » 18 июн 2009 13:56

Не могу вставить что-то файл, пишите электронку, вышлю

RazVal
Гуру
Гуру
Сообщений: 895
Зарегистрирован: 28 май 2015 17:58
Имя: Валерий
Фамилия: Разгуляев
Должность: эксперт по управлению величиной запасов и оптимизации затрат
Откуда: http://upravlenie-zapasami.ru/

Re: Как найти функцию?

Сообщение RazVal » 18 июн 2009 14:49

dop писал(а):Вопрос такой, есть 2 числовых ряда, 1 это продажи за период, другой средняя температура воздуха за период, как найти функцию описывающую поведения продаж относительно температуры?
надо хоть что-нибудь наваять для начальства

Сначала ставите в Excel надстройку "Пакет анализа" (идёте в "Сервис" -> потом в "Надстройки" -> ставите галочки у "Analysis ToolPak - VBA" и "Пакет анализа" -> нажимаете "ОК").
Потом проверяете насколько ваш числовой ряд продаж в принципе зависит от числового ряда температуры воздуха (идёте в "Сервис" -> потом в "Анализ данных" -> там выбираете "Корреляция" -> нажимаете "ОК" -> выделяете в качестве входного интервала ваши числовые ряды - они должны быть по соседству -> выбираете как у вас заведены данные - "по строкам" или "по столбцам" -> нажимаете "ОК").
Смотрите на получившееся число между двух единичек - если оно меньше 0,40, то ваяете начальству бумажку, что по результатам анализа, продажи оказались независимыми от средней температуры воздуха за период.
Если оно от 0,41 до 0,64 - ваяете бумажку, что продажи зависят не только от средней температуры воздуха, но и ещё какого-то не известного фактора (например, осадки, влажность, скорость ветра, температура воды), и требуются дополнительные исследования по выявлению этого фактора.
Если оно больше 0,65, то пишите сюда, расскажем, что делать с вашими рядами дальше...

dop
Пользователь
Пользователь
Сообщений: 97
Зарегистрирован: 10 июл 2007 03:00

Сообщение dop » 18 июн 2009 16:56

Спасибо за ответ.
Коэфицент корреляции 0.52.
Будем считать , что почти 0,65 :-):
Раскажите дальше пожалуйста, что дальше.

RazVal
Гуру
Гуру
Сообщений: 895
Зарегистрирован: 28 май 2015 17:58
Имя: Валерий
Фамилия: Разгуляев
Должность: эксперт по управлению величиной запасов и оптимизации затрат
Откуда: http://upravlenie-zapasami.ru/

Сообщение RazVal » 18 июн 2009 22:12

dop писал(а):Спасибо за ответ.
Коэфицент корреляции 0.52.
Будем считать, что почти 0,65
На самом деле коэффициент корреляции директивным методам не подчиняется, и граница в 0,65 - не моя прихоть (большинство математиков придерживается ещё более строгого порога, равного 0,71). Вы, конечно, можете проделать дальнейшие манипуляции и с вашими данными, и даже получить некую модель, но достоверность полученных с помощью неё данных будет около 27% - то есть она будет давать корректный прогноз только в одном случае из четырёх!

dop писал(а):Раскажите дальше пожалуйста, что дальше.
А дальше вы выделяете ваш блок данных: температура в нём должна идти первым столбцом, а продажи - вторым (если данные у вас выведены в строки, то в том же Excel, можно скопировать и вставить их с транспонированием) -> затем идёте во "Вставка" -> там в "Диаграмма" -> выбираете "Точечная" -> нажимете "Далее" -> ещё раз "Далее" -> ещё раз "Далее" -> выбираете на "отдельном" листе -> нажимаете "Готово" -> нажимаете левой кнопкой мышки 1 раз на одной из точек получившегося ряда -> потом туда же 1 раз правой кнопкой мыши -> выбираете "Добавить линию тренда..." -> выбираете тип тренда (советую НЕ выбирать "Полиномиальный" и "Фильтрацию") -> переходите на вкладку "Параметры" -> выставляете галочки в полях: "показать уравнение на диаграмме" и "поместить на диаграмму величину достоверности аппроксимации (R^2)" -> нажимаете "ОК" -> видите функцию зависимости продаж от температуры и достоверность прогноза.

Если больше ничего делать не будете, то просто подставляете ожидаемую температуру вместо Х, а Y даёт вам соответствующе значение продаж.
Если хотите ещё как-то оценивать случайную величину продаж, уже очищенную от влияния температуры воздуха, то для каждого периода отнимаете от ваших данных продаж, значение Y, которое получается из Х, соответствующего тому же периоду, и работаете с получившимся рядом.
Последний раз редактировалось Anonymous 19 июн 2009 09:23, всего редактировалось 1 раз.

dop
Пользователь
Пользователь
Сообщений: 97
Зарегистрирован: 10 июл 2007 03:00

Сообщение dop » 19 июн 2009 09:16

Спасибо razval, очень помогли.

Аватар пользователя
u-shak-off

Сообщение u-shak-off » 22 июн 2009 09:06

а у меня по вашим данным коэф. получился 0,11

dop
Пользователь
Пользователь
Сообщений: 97
Зарегистрирован: 10 июл 2007 03:00

Сообщение dop » 22 июн 2009 09:46

u-shak-off писал(а):а у меня по вашим данным коэф. получился 0,11

Странно, может я не правильно считал)

Аватар пользователя
Роман Бодряков
Авторитет
Авторитет
Сообщений: 5253
Зарегистрирован: 19 апр 2004 03:00
Имя: Роман
Фамилия: Бодряков
Должность: Ген.Директор в кубе - наноолигарх
Откуда: Россия

Сообщение Роман Бодряков » 22 июн 2009 11:40

Я, в свое время, тоже внимательно изучил как работает функция корреляции.

Высокий коэффициент - если два ряда повторяют рост и падение. Линейный тренд данных почти не влияет.

Еще можно учитывать отрицательные значения. Если минус 1, то один ряд изменяется в противоположном направлении.

Основная сложность. Какую корреляцию считать значимой. 0.5 или 0.7.

Много проблем с товарами где нерегулярное наличие на складе и много заменителей.

Выявить товары-комплименты проще через чеки(накладные).
Есть такие решения, после принятия которых тараканы в голове аплодируют стоя! И просят повторить "НА БИС!!!"
Образование круче не у того, кто больше Знает, а у того, кто хоть что-то умеет.

Аватар пользователя
stanley

Сообщение stanley » 22 июн 2009 12:04

коллеги, вы там в своей математике совсем от земли оторвались???
не забудьте, что в таком анализе имеется один большой и жирный элемент волюнтаризма. задумайтесь, почему результат будет совершенно разным при измерении температуры по цельсию, фаренгейту и кельвину? при одной и той же объективной реальности.
первое, что нужно сделать - определить критическую для данного товара температуру. значимую, если угодно. и ряд писать как отклонение от этой температуры, причем уже неважно в каких масштабных градусах. если продажи действительно зависят от температуры И если мы угадаем с этой точкой отсчета, велика вероятность получить высокую корреляцию.
другой вопрос, что по жизни зависимость может быть отнюдь не линейной. можно мне тоже данные посмотреть?

RazVal
Гуру
Гуру
Сообщений: 895
Зарегистрирован: 28 май 2015 17:58
Имя: Валерий
Фамилия: Разгуляев
Должность: эксперт по управлению величиной запасов и оптимизации затрат
Откуда: http://upravlenie-zapasami.ru/

Сообщение RazVal » 22 июн 2009 12:16

stanley писал(а):коллеги, вы там в своей математике совсем от земли оторвались???
не забудьте, что в таком анализе имеется один большой и жирный элемент волюнтаризма. задумайтесь, почему результат будет совершенно разным при измерении температуры по цельсию, фаренгейту и кельвину? при одной и той же объективной реальности.
первое, что нужно сделать - определить критическую для данного товара температуру. значимую, если угодно. и ряд писать как отклонение от этой температуры, причем уже неважно в каких масштабных градусах. если продажи действительно зависят от температуры И если мы угадаем с этой точкой отсчета, велика вероятность получить высокую корреляцию.
Коэффициент корреляции (по крайней мере, в том варианте, в каком его считает Excel по предложенной методике) не будет меняться, будешь ли ты считать температуру в цельсиях, форенгейтах или кельвинах, и будешь ли отнимать от всех значений среднее (минимальное, максимальное) или делить на него. ;)

stanley писал(а):другой вопрос, что по жизни зависимость может быть отнюдь не линейной.
Здесь полностью согласен.

Аватар пользователя
Роман Бодряков
Авторитет
Авторитет
Сообщений: 5253
Зарегистрирован: 19 апр 2004 03:00
Имя: Роман
Фамилия: Бодряков
Должность: Ген.Директор в кубе - наноолигарх
Откуда: Россия

Сообщение Роман Бодряков » 22 июн 2009 12:30

Еще пару камешков до кучи.

Если продажи розницы, то они могут зависеть от текущей температуры.

Если продажи опта или производства....

То надо еще временной лаг учитывать и запасы товаропроводящей сети.

Кроме температуры есть еще влияющий фактор - осадки.

Тепло и сыро это не то что тепло и солнце.

Следующий влияющий фактор - выходные.

Жаркая пятница и вечером народ все напитки сметет на дацу, потом будет их морозить если в выходные погода испортится.

Дождливая пятница и жаркие выходные - наоборот.
Есть такие решения, после принятия которых тараканы в голове аплодируют стоя! И просят повторить "НА БИС!!!"
Образование круче не у того, кто больше Знает, а у того, кто хоть что-то умеет.

Аватар пользователя
stanley

Сообщение stanley » 23 июн 2009 14:59

RazVal писал(а):
stanley писал(а):коллеги, вы там в своей математике совсем от земли оторвались???
не забудьте, что в таком анализе имеется один большой и жирный элемент волюнтаризма. задумайтесь, почему результат будет совершенно разным при измерении температуры по цельсию, фаренгейту и кельвину? при одной и той же объективной реальности.
первое, что нужно сделать - определить критическую для данного товара температуру. значимую, если угодно. и ряд писать как отклонение от этой температуры, причем уже неважно в каких масштабных градусах. если продажи действительно зависят от температуры И если мы угадаем с этой точкой отсчета, велика вероятность получить высокую корреляцию.
Коэффициент корреляции (по крайней мере, в том варианте, в каком его считает Excel по предложенной методике) не будет меняться, будешь ли ты считать температуру в цельсиях, форенгейтах или кельвинах, и будешь ли отнимать от всех значений среднее (минимальное, максимальное) или делить на него. ;)

stanley писал(а):другой вопрос, что по жизни зависимость может быть отнюдь не линейной.
Здесь полностью согласен.


пожалуй, это я зарапортовался :)

думал уже об определении коэффициента регрессии, а писал про корреляцию. чуть вперед забежал :)

RazVal
Гуру
Гуру
Сообщений: 895
Зарегистрирован: 28 май 2015 17:58
Имя: Валерий
Фамилия: Разгуляев
Должность: эксперт по управлению величиной запасов и оптимизации затрат
Откуда: http://upravlenie-zapasami.ru/

Сообщение RazVal » 25 июн 2009 10:01

Роман Бодряков писал(а):надо еще временной лаг учитывать и запасы товаропроводящей сети.
осадки.Тепло и сыро это не то что тепло и солнце.
выходные.Жаркая пятница и вечером народ все напитки сметет, потом будет их морозить если в выходные погода испортится.Дождливая пятница и жаркие выходные - наоборот.
Я бы особенно советовал двигаться именно в этом направлении в связи с тем, что текущий коэффициент корреляции пока не дотягивает до граничного (граница 0,71 появляется не случайно, её квадрат, который даёт тот самый показатель достоверности прогноза, будет как раз равен 0,5 - то есть достоверность такого прогноза начинает превышать прогноз с помощью игры "орлянки" ;).


Вернуться в «Реальные задачи из жизни»

Кто сейчас на форуме

Количество пользователей, которые сейчас просматривают этот форум: CommonCrawl [Bot] и 0 гостей