Форумы-->Общий игровой форум--> <<|<|3833|3834|3835|3836|3837|3838|3839|3840|3841|3842|3843|>|>>
| Автор | [Update 4] Гильдия Лидеров |
для Korvin Fikys:
не надо | | * постановка вопроса для GPT-5 | тебе надо взять объемный срез в котором точно не будет скрытых боев и его считать
на большом объеме данных разницы нет, если вероятность в любых боях одинаковая. | для Rote Gruetze:
дано крайне маловероятное событие
выборка по 3 из 5 типов боёв, но шанс в них равновероятностный статистическая точность оценки
Опровергни мой промпт пожалуйста, буду рад быть неправым | для Korvin Fikys:
В чем разница то? А если до и после этого среза упало по леге? Нужно чтобы выполнялось три условия
1) события однородны (подчиняются одним и тем же правилам)
2) выборка действительно случайна
3) события независимы
Для таких условий даже можно рассчитать ошибку выборки — она будет равна корню из p(1-p)/n где p — истинная вероятность, а n — число событий в нашей неполной выборке. Подставь туда число боев, проанализированных омни, и поймешь, что погрешность крайне невелика | на большом объеме данных
он у нас достаточно большой по героям с 14й ГЛ чтобы
разницы нет?
ведь большим он должен быть не сам по себе, а большим относительно скрытых боев, если у тебя не участвует в подсчете 10-15% боев, то разница как раз таки есть | ведь большим он должен быть не сам по себе, а большим относительно скрытых боев, если у тебя не участвует в подсчете 10-15% боев, то разница как раз таки есть
НЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕТ
Н Е Т
ОН сам по себе должен быть большим
в этом суть ВСЕХ опросов
никто не опрашивает даже 1 миллион из страны со 100 млн людей
достаточно 1-1.5к для хорошей оценки (и сильно улучшить ее не получится) | гл 14 боев 2115515
Да, статистика достаточно большая | | хорошо, вы правы, я не прав | дано крайне маловероятное событие
выборка по 3 из 5 типов боёв, но шанс в них равновероятностный статистическая точность оценки
Опровергни мой промпт пожалуйста, буду рад быть неправым
ниже — аккуратное опровержение, строго по статистике, без риторики.
---
исходное утверждение (твой промпт, в формализованном виде)
* событие крайне редкое
* наблюдение ведется только по 3 из 5 типов боев
* вероятность события одинакова для всех типов боев
* требуется статистически точная оценка вероятности события
---
ключевой тезис для опровержения
если вероятность события действительно одинакова во всех типах боев,
то **отбор только 3 из 5 типов боев не вносит смещения в оценку вероятности**.
---
доказательство
пусть:
* p — истинная вероятность события в любом бою
* каждый бой — независимое испытание
* тип боя не влияет на вероятность события
тогда для любого подмножества боев:
p(type 1) = p(type 2) = ... = p(type 5) = p
выборка из 3 типов боев эквивалентна случайной выборке боев из всей совокупности,
с точностью до уменьшения объема данных.
математически:
оценка вероятности:
p_hat = k / n
где:
* n — число наблюдаемых боев (в выбранных типах)
* k — число событий
матожидание оценки:
E[p_hat] = p
то есть оценка **несмещенная**.
---
что реально теряется
теряется не корректность, а эффективность оценки:
* объем выборки меньше
* дисперсия оценки больше
* доверительный интервал шире
но это количественная потеря, а не логическая ошибка.
---
где промпт становится уязвимым
твой промпт не опровергается, только если выполняется сильное условие:
* вероятность события строго одинакова для всех типов боев
это условие:
* эмпирически редко проверяемо
* особенно сомнительно для крайне редких событий
* требует отдельного статистического теста или логического обоснования
без доказательства этого условия утверждение остается гипотезой, а не фактом.
---
итоговый вывод
* при равновероятностном событии по типам боев
выборка по 3 из 5 типов **статистически корректна**
* она дает несмещенную оценку вероятности
* но с большей случайной ошибкой из-за меньшего n
* следовательно, сам факт «3 из 5 типов» не опровергает оценку
---
короткая версия для чата
если вероятность события одинакова во всех типах боев,
то выборка по 3 из 5 типов не искажает оценку,
она лишь делает ее менее точной из-за меньшего объема данных.
если хочешь, дальше можем:
* разобрать, как проверить равновероятность
* или показать, насколько сильно падает точность при таком усечении | для Rote Gruetze:
Ты же сам в короткой версии указал что не прав | | Лучше бы так мою тему про мификов апали в ошибках | для Воля Мертвых:
последний раз поясню
---
ок, теперь это **реальные данные**, и они как раз позволяют строго опровергнуть гипотезу «равновероятностно, значит выборка ок».
я разберу по шагам.
---
исходные данные
выборка:
* ~7.7 млн боев
* типы боев:
* охоты
* задания воров
* задания наемников
таблица (переформатировано):
gl | drop_rate | leg_count | drop_count
8 | 0.0141% | 6 | 42469
9 | 0.0204% | 20 | 97913
10 | 0.0345% | 41 | 118969
11 | 0.0370% | 37 | 99958
12 | 0.0554% | 75 | 135346
13 | 0.0539% | 62 | 114997
14 | 0.0916% | 252 | 275040
---
1. первое и главное: равновероятности нет
если бы вероятность события была:
* одинаковой для всех условий
* и выборка была просто шумной
то оценки p:
* шатались бы вокруг общего значения
* без систематического тренда
* с разбросом, объяснимым биномиальной дисперсией
что мы видим фактически:
* вероятность растет почти монотонно с gl
* рост более чем в 6 раз:
0.0141% → 0.0916%
* это не шум, а структурная зависимость
следствие:
вероятность события **не является одинаковой** даже внутри этих 3 типов боев.
гипотеза «шанс равновероятностный» опровергнута эмпирически.
---
2. почему это критично для выборки 3 из 5 типов
если вероятность зависит от gl, то почти наверняка она зависит и от:
* типа боя
* состава игроков
* условий дропа
в этом случае:
p(type A) ≠ p(type B) ≠ p(type C)
и тогда оценка по подмножеству типов боев сходится не к глобальному p, а к:
p_observed = sum(w_i * p_i) / sum(w_i)
где:
* p_i — вероятность в типе боя i
* w_i — доля этого типа в выборке
это уже не случайная ошибка, а систематическое смещение.
---
3. размер выборки больше не спасает
важный момент:
у тебя огромная выборка (миллионы боев), но:
* она увеличивает точность оценки для этих условий
* и одновременно делает смещение более уверенным
то есть:
* доверительный интервал узкий
* но центр интервала не совпадает с искомым параметром
это худший случай: точная, но неверная оценка.
---
4. дополнительный индикатор: нестабильность относительных оценок
даже внутри близких gl:
* gl 12: 0.0554%
* gl 13: 0.0539%
формально разница мала, но:
* числа событий (62–75) все еще дают заметную относительную ошибку
* при этом общий тренд сохраняется
это означает:
* зависимость сильнее статистического шума
* модель «одна p на все» неприменима
---
5. итоговое опровержение твоего промпта
твой промпт:
«выборка по 3 из 5 типов боев, но шанс в них равновероятностный»
опровергается по факту:
1. данные показывают, что вероятность события не константа
2. она систематически зависит от gl
3. следовательно, нет оснований считать ее равной по типам боев
4. выборка по 3 типам боев дает смещенную оценку глобального шанса
5. увеличение объема данных не устраняет это смещение
---
короткий вывод для чата
вероятность дропа не равновероятна: она систематически растет с gl.
значит выборка по 3 типам боев не репрезентативна для всей совокупности,
и оценка шанса будет смещенной, даже при миллионах наблюдений.
если хочешь, дальше можем:
* проверить статистическую значимость различий между gl
* или показать, как пересчитать общий шанс через стратификацию | вероятность дропа не равновероятна: она систематически растет с gl.
значит выборка по 3 типам боев не репрезентативна для всей совокупности,
и оценка шанса будет смещенной, даже при миллионах наблюдений.
аахахах
что за бред
причем тут типы боев и ГЛ? | | Кисель, прекращай пользоваться гпт - тупеешь | когда-нибудь чат гпт поймет, что правильно так:
короткий вывод для чата
ты лох | для Жеррри2:
причем тут типы боев и ГЛ
если совсен просто при том, что отряды ГЛ выпадают после каждого боя, а не в определённых гильдиях.
Кроме того, % боёв в выранных трёх гильдиях ко всем боям не одинаков при всех уровням ГЛ.
моя оптимистическая оценка результатов omni
| gl | drop_rate | leg_count | drop_count | global_est_range (%) |
| -- | --------- | --------- | ---------- | -------------------- |
| 8 | 0.0141% | 6 | 42469 | 0.010–0.021 |
| 9 | 0.0204% | 20 | 97913 | 0.014–0.031 |
| 10 | 0.0345% | 41 | 118969 | 0.024–0.052 |
| 11 | 0.0370% | 37 | 99958 | 0.026–0.056 |
| 12 | 0.0554% | 75 | 135346 | 0.039–0.083 |
| 13 | 0.0539% | 62 | 114997 | 0.038–0.081 |
| 14 | 0.0916% | 252 | 275040 | 0.064–0.137 |
прекращай пользоваться гпт
это была просьба споцалиста, который считает, что ИИ - топчик. | | т.е. есть вероятность формулы для ГЛ с 8-ой: 0.0001*(уровень ГЛ -7) | | а был бы форум нормальным, Кисель мог бы эти выкладки прятать под спойлер, чтобы страницу не растягивать | для Rote Gruetze:
а как ты эту оценку сделал? |
<<|<|3833|3834|3835|3836|3837|3838|3839|3840|3841|3842|3843|>|>>К списку тем
|