Вопрос к знатокам корреляций

Планирование потребности, прогнозирование спроса, расчет заказа, анализ товарного запаса для всех этих каждодневных операций требуется знание математики, статистики и многого другого...
Аватар пользователя
Галиев Рустам
Пользователь
Пользователь
Сообщений: 136
Зарегистрирован: 06 дек 2010 19:18
Имя: Рустам
Фамилия: Галиев
Должность: Нет

Вопрос к знатокам корреляций

Сообщение Галиев Рустам » 09 дек 2011 12:46

Доброго дня. При увеличении стоимости закупаемых позиций, предлполагаю увеличение (в среднем) числа участников. Выгрузил данные по 36 конкурсам (подряд) одной компании, при анализе средних значений участников на 3 или 6 группах (выделяемых подряд при фильтрации по сумме среднего предложения), интуиция подтверждается. при обычной корреляции Пирсона - нет. Применил групповую, прошу знатоков пояснить, есть ли такая официально, название такой процедуры, или сходной (тогда укажите поправки к ней). Причем. групповая корреляция в таком случае может "плясать" от первого либо второго столбца, и результат очень разный. :zvez_ochki:
У вас нет необходимых прав для просмотра вложений в этом сообщении.
Последний раз редактировалось Галиев Рустам 09 дек 2011 12:56, всего редактировалось 1 раз.

Реклама
Аватар пользователя
Галиев Рустам
Пользователь
Пользователь
Сообщений: 136
Зарегистрирован: 06 дек 2010 19:18
Имя: Рустам
Фамилия: Галиев
Должность: Нет

Re: Вопрос к знатокам корреляций

Сообщение Галиев Рустам » 09 дек 2011 12:50

Вариант с предварительной фильтрацией по числу участников на 2 листе файла. Явно влияет аномально дорогой конкурс с 1 участником.

Аватар пользователя
бора-бора
Профессионал
Профессионал
Сообщений: 337
Зарегистрирован: 30 ноя 2011 11:27
Имя: Бора
Фамилия: Бора
Должность: би-ай
Откуда: Мозгва

Re: Вопрос к знатокам корреляций

Сообщение бора-бора » 09 дек 2011 13:33

2 пиковых значения сильно портят линейность корреляции в обоих рассмотрениях.
Эксель, в принципе, предлагает линии тренда экспоненциальную y = 17363*e^(0,1038x) и линейную y = -11021x + 167769 (они где-то в значении 10 пересекаются), а оно вам надо?
Про Выбросы написано более-менее тут.
У вас нет необходимых прав для просмотра вложений в этом сообщении.

Аватар пользователя
Галиев Рустам
Пользователь
Пользователь
Сообщений: 136
Зарегистрирован: 06 дек 2010 19:18
Имя: Рустам
Фамилия: Галиев
Должность: Нет

Re: Вопрос к знатокам корреляций

Сообщение Галиев Рустам » 09 дек 2011 13:50

бора-бора писал(а):2 пиковых значения сильно портят линейность корреляции в обоих рассмотрениях.
Эксель, в принципе, предлагает линии тренда экспоненциальную y = 17363*e^(0,1038x) и линейную y = -11021x + 167769 (они где-то в значении 10 пересекаются), а оно вам надо?
Про Выбросы написано более-менее тут.


Так как мне показать наличие корреляции между числом участников и средним предложением? Ведь есть зависимость, очевидно. Мой способ дает 2 противоречивых результата. "Эксель, в принципе, предлагает линии тренда экспоненциальную y = 17363*e^(0,1038x) и линейную y = -11021x + 167769 (они где-то в значении 10 пересекаются), а оно вам надо?" - к сожалению не понял этого т.к. не знаком с тем, что такое "линия тренда", и вероятно это не корреляция.

Аватар пользователя
бора-бора
Профессионал
Профессионал
Сообщений: 337
Зарегистрирован: 30 ноя 2011 11:27
Имя: Бора
Фамилия: Бора
Должность: би-ай
Откуда: Мозгва

Re: Вопрос к знатокам корреляций

Сообщение бора-бора » 09 дек 2011 14:02

Попробую типа "своими словами", прошу не "бросать камни, если что не так". Исходя из того, что <Корреляция представляет собой меру зависимости переменных>, при описании этой самой зависимости можно говорить и о некоем тренде, общем движении значений, о том, что могло бы помочь хоть как-то при прогнозировании поведения описываемой системы типа. :st_ruskiy:
"Разность результатов" вызвана редкими, но значительными числами для небольшого ряда значений, а для линейности это критично.

Аватар пользователя
market-1
Гуру
Гуру
Сообщений: 775
Зарегистрирован: 02 май 2010 09:37
Имя: Илья
Фамилия: Константинов
Должность: Директор по маркетингу
Откуда: Москва

Re: Вопрос к знатокам корреляций

Сообщение market-1 » 09 дек 2011 14:05

Галиев Рустам писал(а):при анализе средних значений участников на 3 или 6 группах (выделяемых подряд при фильтрации по сумме среднего предложения), интуиция подтверждается. при обычной корреляции Пирсона - нет.

У вас диапазон предложений по цене разделен совершенно хаотично. Вы либо делите его на равные участки (конец от начала шкалы отличается на одно и то же число, например интервалы в 50 рублей: 50, 100, 150, 200 и т.д.) либо логарифмическое деление делайте (когда конец от начала отрезка отличается в одно и то же число раз, например, 10, 100, 1000 руб. и т.д.)
А то у вас интервалы:4,3; 11,8; 29,2; 39,5; 93; 800. Естественно, что получите все, что угодно, кроме реальных зависимостей.

Аватар пользователя
Галиев Рустам
Пользователь
Пользователь
Сообщений: 136
Зарегистрирован: 06 дек 2010 19:18
Имя: Рустам
Фамилия: Галиев
Должность: Нет

Re: Вопрос к знатокам корреляций

Сообщение Галиев Рустам » 09 дек 2011 14:10

Я посмотрел что такое тренд, понял. Но он мне не нужен, нужно число (корреляция), которое характеризует связь, полученное грамотным (скажем так, признаваемым в статистике) способом.

Аватар пользователя
Галиев Рустам
Пользователь
Пользователь
Сообщений: 136
Зарегистрирован: 06 дек 2010 19:18
Имя: Рустам
Фамилия: Галиев
Должность: Нет

Re: Вопрос к знатокам корреляций

Сообщение Галиев Рустам » 09 дек 2011 14:13

market-1 писал(а):
Галиев Рустам писал(а):при анализе средних значений участников на 3 или 6 группах (выделяемых подряд при фильтрации по сумме среднего предложения), интуиция подтверждается. при обычной корреляции Пирсона - нет.

У вас диапазон предложений по цене разделен совершенно хаотично. Вы либо делите его на равные участки (конец от начала шкалы отличается на одно и то же число, например интервалы в 50 рублей: 50, 100, 150, 200 и т.д.) либо логарифмическое деление делайте (когда конец от начала отрезка отличается в одно и то же число раз, например, 10, 100, 1000 руб. и т.д.)
А то у вас интервалы:4,3; 11,8; 29,2; 39,5; 93; 800. Естественно, что получите все, что угодно, кроме реальных зависимостей.


Значит сам-по себе метод корреляции по суммам значений предварительной стратификацией существует, и как он называется? И почему вы считаете (можно ссылку), что страта по порядку хуже чем страта по равным алгебраически или логарифмически промежуткам? По крайней мере, тут получается равное число вхождений (по 6), в иных способах так не выйдет, соответственно - будет больше стохастики.

Аватар пользователя
Галиев Рустам
Пользователь
Пользователь
Сообщений: 136
Зарегистрирован: 06 дек 2010 19:18
Имя: Рустам
Фамилия: Галиев
Должность: Нет

Re: Вопрос к знатокам корреляций

Сообщение Галиев Рустам » 09 дек 2011 14:17

Да, вики указываает на и другие корреляци, кроме Пиросна (включая квадратичного) - Кендалла, Спирмена, Фехнера, коэф. конкордации. Может они подходят тут больше? Только не знаю их формул, страницы с описанием, находимые через поиск недостаточно подробны, не дают пример отражающий всю формулу целиком.

Аватар пользователя
бора-бора
Профессионал
Профессионал
Сообщений: 337
Зарегистрирован: 30 ноя 2011 11:27
Имя: Бора
Фамилия: Бора
Должность: би-ай
Откуда: Мозгва

Re: Вопрос к знатокам корреляций

Сообщение бора-бора » 09 дек 2011 14:34

Галиев Рустам писал(а):Я посмотрел что такое тренд, понял. Но он мне не нужен, нужно число (корреляция), которое характеризует связь, полученное грамотным (скажем так, признаваемым в статистике) способом.

Понятненько, гуру корреляции никогда не был (не требовалось как-то). Попробуйте в расширенный пакет SPSS залезть, хотя там вроде бы только Кендал и Спирман... дальше я не лазил... уже лет десять. :zvez_ochki:

Аватар пользователя
Галиев Рустам
Пользователь
Пользователь
Сообщений: 136
Зарегистрирован: 06 дек 2010 19:18
Имя: Рустам
Фамилия: Галиев
Должность: Нет

Re: Вопрос к знатокам корреляций

Сообщение Галиев Рустам » 09 дек 2011 22:06

Выбросы, черт бы их побрал. Как-нибудь сделаю для статьи об электронных закупках выборку из конкурсов так 100 (подряд, разных компаний), надеюсь что обычная корреляция будет корректной :)
Это же мне нужно для конкретного клиента, вложенные в топик данные с анализом.

Аватар пользователя
бора-бора
Профессионал
Профессионал
Сообщений: 337
Зарегистрирован: 30 ноя 2011 11:27
Имя: Бора
Фамилия: Бора
Должность: би-ай
Откуда: Мозгва

Re: Вопрос к знатокам корреляций

Сообщение бора-бора » 10 дек 2011 09:51

Галиев Рустам писал(а):Выбросы, черт бы их побрал. Как-нибудь сделаю для статьи об электронных закупках выборку из конкурсов так 100 (подряд, разных компаний), надеюсь что обычная корреляция будет корректной :)
Это же мне нужно для конкретного клиента, вложенные в топик данные с анализом.

Попробуйте всё-таки проанализировать однородность условий конкурсов, особенно в моменты Пиков (сами знаете, что на Больших цифрах условия конкурсов часто нарушаются, "есть соблазны у людей например"). Как результат, "ткните носом" клиента в эти Пики, сообщите, что он сам виноват в возможных "нарушениях однородности" условий.


Вернуться в «Математика закупки»

Кто сейчас на форуме

Количество пользователей, которые сейчас просматривают этот форум: CommonCrawl [Bot] и 0 гостей