Как выглядит двузначная шкала xvm. Расшифровка значений статистики «оленемера» для WoT

Краткое описание самы х значимых показателей «оленемера». Определяем рейтинг эффективности игрока, а также используем дополнительные возможности «мода».

После того, как процедура установки желанного многими «мода» под названием «оленемер» завершена, можно приступать к изучению значений по статистике игроков команды, прямо во время боя.

Первое заблуждение. Если Вы ставите этот мод в World Of Tanks с целью определить шанс на победу во время боя, стоит Вас огорчить: этот параметр не может работать точно в принципе. Слишком уж много факторов могут повлиять на исход сражения.

Что же полезного в «оленемере»

Опытные игроки знают все необходимые параметры, которые действительно помогают и в игре и при наборе людей в роты и кланы. Так что полезность от оленемера — это сбор информации и ничего больше.

Какую информацию предоставляет мод

В первую очередь, самая важная статистика — по отдельно взятому каждому «персонажу», которого судьба опредила к нам в одну команду. Происходит парсинг статистики игрока из общего рейтинга. На экране, во время боя, отображается усредненное значение по таким важным характеристикикам, как процент побед от общего количества проведенных боев. Получаем среднее значение коэффициента полезности игрока. Однако, данные собираются абсолютно по всей технике, по которой значится история.

Что это значит? А значит это, что нет конкретики по отдельно взятому танку, с которым игрок вошел в бой. Он может иметь 1000 фатально проигранных битв на артиллерии, но, в то же время, он виртуозно играет за .

Приведем общую таблицу значений с расшифровкой

За основу взято значение «единица эффективности».
Если показатель игрока менее 600 единиц — это бесспорно слабый игрок. Простыми словами, данный игрок проводит в среднем не более 5-6 удачных боев за сотню отыгранных.

Показатель в промежутке от 600 до 900 — игрок имеет представление об игре, тактике, но удачных боев у него мало, около 25-30 за сотню проведенных боев.

Показатель пользователя на уровне 1200-1500 очков говорит нам, что на плечо этого товарища можно смело положиться. Игрок явно имеет представление о хитростях, умеет использовать «спейшелы» любого танка, слажено работает в команде.

Если посчастливилось попасть в одну команду к пользователям со значениями в промежутке от 1500 до 1800 — это гуру. Пока не поздно, следите за каждым его движением и набирайтесь опыта.

Есть игроки с планкой выше 1800, но их, увы, вряд ли посчастливится увидеть в рендомных боях. Это, как правило, держатели серьезных кланов.

По цветовой раскраске в порядке возрастания

  • слабо — красные
  • хуже среднего — оранжевые
  • средний — жёлтые
  • хороший — зелёные
  • специалист — лазурные
  • бог — фиолетовые

WN8 является последней итерацией проекта WN* (WNx) от Praetor77.
WN8 стремится измерить наблюдаемый вклад в боях, по учетной записи, и, надеюсь, выводит некоторую информацию о скрытой переменной "мастерства". WN8 не должен рассматриваться как окончательная_и_не_подлежащая_пересмотру оценка мастерства. Он предназначен быть рассмотренным совместно с процентом побед (ПП), количеством боёв, средним уровнем техники и никогда не заменит оценку личной статистики, навыков командной игры или просмотр реплеев. Причиной этому является то, что при расчете WN8 не учитываются такие параметры как время боя, приоритет выбора целей, командная игра и способности принятия решений.

Почему WN8?

Как и во всех предыдущих рейтингах, в WN7 были некоторые недостатки и ограничения. Некоторые из них были известны на момент выпуска WN7, другие были обнаружены и обнародованы вскоре после этого. Ниже приведены основные из них, в порядке важности, по мнению команды WN*:
Оценка по соотношению урон/уровень - а именно, то, что уровень изменяется линейно от 1 до 10, а значения урона растут нелинейно. Кроме того, способность наносить урон для всех танков одного и того же уровня не одинаковая (сравните, например, T40 и А-20 или ARL V39 и M18).
Оценка по соотношению уничтожено/уровень - неопытные игроки, играют на низких уровнях, и, таким образом, уничтожать танки на 1 уровне легче, чем на 10, в предположении об одинаковом мастерстве игрока выше определенного порога.
Проблема 1-10 уровня - возникает в WN7 в связи с двумя уже рассмотренными моментами. Precambrian объяснил это очень хорошо в своем сообщении, которое хотя и несколько устарело, но очень хорошо передает суть проблемы, на небольшом, понятном примере. Ниже приведено это сообщение.

precambrian :
Что усложняет оценку, так это тот факт, что накручивать статистику на нижних уровнях легче, чем на более высоких, так как на низких уровнях, средний уровень мастерства новых игроков является крайне низким, а урон пушек низкого уровня, по отношению к прочности танков, позволяет опытным игрокам уничтожать их неопытных коллег без каких-либо затруднений. Это явление прекрасно иллюстрируется на автопушках 1-го уровня, которые могут уничтожить одноуровневого оппонента, прежде, чем новичок сможет повернуть башню и выстрелить в ответ. Такого рода разрушительный потенциал позволяет игрокам с относительно низким мастерством пробеждать при крайне малом количестве боев на уровне и раздувает их статистику. В WN7 была предпринята попытка учесть это штрафом для низких уровней; Однако его легко избежать, просто чередуя бои на более высоких уровнях с боями на низких уровнях. Рассмотрим следующий пример:

Результат

Урон нанесенный

Урон полученный

Уничтожено

Обнаружено

Очки захвата

Очки защиты

Поражение

Если вы возьмете среднее по отдельным значениям WN7 приведенных игр, то получите значение 2578. Однако, если рассчитать WN7 для этих игр вместе, то получите 3260 WN7! Есть несколько причин для этого. Одна связана с нелинейным характером изменения очков прочности по уровням - танк 8 уровня не имеет в 8 раз больше очков здоровья, чем танк 1 уровня, и, таким образом, урон значительно проще наносить в боях 8 уровня. Напротив, уничтожать танки очень легко на 1 уровне. В конечном счете средний уровень боев уменьшается значительно меньше, чем средний нанесенный урон, что вызывает огромную перекос при расчете WN7!
Теперь рассмотрим, что произойдет, если я возьму среднюю статистику танков 8 уровня, не считая игру на T1 Cunningham. Результат будет 2960 WN7. Таким образом, хотя WN7 игры T1 Cunningham, рассмотренный отдельно, был ниже 1600, он ЧРЕЗВЫЧАЙНО раздувает статистику, когда включается в общий расчет!
Очевидно, размер выборки недостаточный, но вы поняли идею.

Артиллерия и легкие танки - наконец, танки этих классов имеют статистику значительно отличающуюся от таковой для их одноуровневых собратьев. Если показатели ТТ/СТ/ПТ примерно сопоставимы, то ЛТ 8-го уровня не наносит урона или уничтожает столько танков как ИСУ-152/ИС-3/T69/АМХ 50 100. Артиллерия не должна подсвечивать врагов (и, следовательно, количество обнаруженных танков должно быть немного ниже), а значения урона могут быть очень высокими на некоторых уровнях, в частности, до их перебалансировки в патче 0.8.6 (при этом они сейчас ниже, в связи с изменением DPM)!

Отличительные особенности WN8
Урон/уровень против по-танковых рейтингов

При расчете WN1-7 и рейтинга Efficiency v1 и v2 (далее Eff) использовалась статистика, предоставляемая Wargaming(c) через Web API. К ней применялись разные веса для каждого значения в попытке вывести значимое общее значение рейтинга. Однако, проблемы перечисленные выше сохраняются для любого рейтинга, который для вычисления использует оценку "урон/уровень". Нет никакого способа, чтобы обойти ту проблему, что наносимый урон или количество уничтоженной техники не могут оцениваться одинаково на одном уровне.
Таким образом, в WN8 мы приняли совершенно иной метод. Мы не первые, кто использовал этот метод. Рейтинг эффективности г-на Noobmeter (Performance Rating, далее PR) использовал по-танковый рейтинг танка (per-tank rating) с момента его создания. Первоначально PR был принят скептически, потому что формула его расчета была неизвестной. Г-н Noobmeter опубликовал его несколько месяцев назад и объяснил принцип его расчета. По-танковый рейтинг значительно труднее развивать (требует получения хороших данных) и применять (требует гораздо больше вычислительной мощности), но позволяет учесть результаты для каждого танка в статистике учетной записи, что не может быть учтено оценкой урон/уровень. Так WN8 становится по-танковым рейтингом, вместо рейтинга урон/уровень. Именно поэтому вы не увидите в конечном уравнении средний уровень танка, поскольку эта информация учтена на более ранних этапах. Так что часть информации, содержащейся в WN8 теперь включает в себя как танки выбранные игроком, так и количество боев, сыгранных на учетной записи.

Шкала

Одна из первых вещей, которую заметит читатель то, что шкала WN8 отличается от шкалы, введенной Eff и адаптированной для WN1-7. Причины смены шкалы обусловлены некоторыми решениями, принятыми в ходе разработки WN8. Вы можете увидеть техническую сторону и обоснование в разделе Основные принципы. Но самое простое объяснение в том, что по шкале Eff не было достаточно различия между игроками с разными способностями. Верхние и нижние границы шкалы были сжаты. На графике вы можете видеть шкалу WN8, с наложенной на неё шкалой WN7 и PR.

Результатом этого изменения масштаба является то, что значения WN7 на самом деле не сопоставимы с WN8, хотя они оба четырёхзначные. Мы понимаем, что это неудобно, особенно, из-за сдвига цветовых маркеров (приведенные внизу для WN8). Однако, иногда шкалы нужно изменить или сместить центр или точку отсчета. Как пример, посмотрите на шкалу Фаренгейта / Цельсия / Кельвина. Как и прежде, очень небольшое количество игроков попадают в крайние зоны шкалы, и основная дифференциация происходит в середине графика.
Ограничения и границы применимости
Основные принципы
Основные предположения в WN8

WN8 делает основное предположение, отличающееся от любой предыдущей системы оценки. Мы установили ожидание для средних игроков, в зависимости от их способности влиять на исход боя. Это сложная концепция, и, конечно, открыта для обсуждения. Но в принципе, мы предположили, что есть количество показателей (урон / уничтожено / обнаружено / защита), которое влияет на исход боя (в плане ПП), и что существует порог, ниже которого эти показатели не влияют исход игры достаточно, чтобы определить зависимость. Точное значение этого порога была вычислена и затем вычтена (этап rSTATSc, ниже) для сравнения всех игроков с теоретическим (и, к сожалению реальным) игроком(ами), показатели игры которых не достаточны для влияния на их ПП и являющихся балластом для балансировщика. Преимущество этого предположения, заключается в том, что это делает рейтинг более значимым и для высоких и для низких значений. Были "свободные" очки в WN7, в основном для видимости, потому что фактически ни для каких учетных записей нельзя получить нулевую статистику, даже для худших из ботов. Но на многих учетных записях так мало статистики, что оценить влияние показателей на их ПП не представляется возможным. Регулируя такие базовые значения, мы получим лучшую дифференциацию на более низких уровнях, а также на верхних уровнях, потому что этим мы удаляем "шум". И, конечно, наилучшая дифференциация обеспечивается на средних уровнях. Мы вводим «нулевую» точку, ниже которой показатели статистики (урон / уничтожено / обнаружено / защита) не влияют на ПП каким-либо образом. Как отмечалось ранее, это предположение открыто для обсуждения. Все же для обсуждения, пожалуйста, кроме знания танков приготовьте уверенное знание статистики и оценки! Удобным оказывается превращение интервалов шкалы, используемой в Eff, PR и WN7 в псевдо-рейтинговую шкалу, которая обладает многочисленными преимуществами. Спорно, но самым важным из них является то, что после улучшения точности измерения и применив порог значений, мы можем теперь сказать, что игрок с 2400 WN8 вносит в два раза больший вклад в победу команды, чем игрок с 1200 WN8. Это не было верно для любого рейтинга до WN8.

Источники данных

Поскольку WN8 по-танковый рейтинг, мы нуждались в показателях танков, которые, как всегда, не доступны через веб-интерфейс Wargaming(c) API. Мы обратились к Phalynx из vBAddict.net, который любезно передал свои базы данных 17000 игроков в предоставивших свои dossier-файлы. Из базы данных были отфильтрованы игроки с менее 1000 боев и танки, с менее 50 боев. Из этой базы данных методом линейной регрессии мы определили статистически ожидаемые показатели игры среднего игрока для каждого танка. Для каждой комбинации танк/игрок, мы рассчитали рейтинги playerWN8alpha и tankWN8alpha. Рейтинг WN8alpha примерно соответствует WN7 в формулировке, показывающий, в основном, эффективность танка. Далее, (для каждого танка отдельно) мы отобрали из всего количества игроков игравшем на танке 50% игроков, которые играют именно на нем хорошо, не в целом. Полученная выборка хорошо сочетает игроков с высоким и низким ПП. Мы утверждаем, что отбор половины игроков с хорошей игрой на данном танке - хороший способ для сравнения танков друг с другом, так как они могут использовать танк максимально эффективно. В противном случае, используя и вторую половину игроков, при сравнении танков, использовались показатели игроков которые не знают основ механики игры, или не правильно используют данный танк. В итоге, для линейной регрессии я использую лучшие 50% игроков, потому что использование показателей топовых игроков будет предвзятым и не может распространятся на всех игроков..
Чтобы проверить, что ожидаемые показатели для каждого танка сбалансированы, мы смотрели на соотношение tankWN8/accountWN8. Мы проверили, что для лучших 10% игроков этот показатель соответствует примерно 1,15 для всех танков в игре.
Если, например, танк имел более низкий коэффициент, мы снижали ожидаемые показатели, используемые для линейной регрессии лучших 50% игроков, а затем проверяли, соотношение для лучших 10%. Это заняло несколько итераций пересчета tankWN8 и playerWN8 пока баланс не был достигнут, и tankWN8/accountWN8 было около 1.15.
Целью этого было попытаться, контролируя показатели мастерства игроков, определить такие значения ожидаемых показателей, которые нормализуют показатели урона / уничтожено / обнаружено / защита для каждого танка. Так мы находим, сколько урона игрок будет наносить на ARL V39 и M18 Hellcat, при прочих равных условиях.
Некоторые танки требуют более глубокий анализ распределения соотношения tankWN8/playerWN8, в связи с аномально малым числом топовых игроков, играющих на танке (А-20), или танков повергшихся сильным нерфам/бафам (как M41). Мы пытались прийти к усредненным показателям для танков, которые были серьезно понерфлены/бафнуты (как M48A1, AMX 50B или T110E5) ориентируясь на игроков игравших на нем в различное время, так что ожидаемые значения не отражают первоначальные показатели или текущее состояние (так, чтобы игроки игравшим на них после ребаланса не были несправедливо «оштрафованы») или игнорирует его (так, чтобы игроки, которые играли на нем когда он был очень мощным, а затем никогда больше, не получали несправедливые бонусы).
Примечание : Этот ручной процесс создания WN8 была, с научной точки зрения, самым слабым местом. Однако личная предвзятость создателей не была введена на этом этапе, т.к. команда людей, работающих на этом этапе, состояла из десятков помощников из WoTLabs, по-танковые таблицы комбинировались при сотрудничестве между игроками из регионов NA, EU, SEA и RU. Когда возможно использовались показатели "наиболее близкие" (“nearest possible match”) для танков со странным распределением историй игроков, как А-20, для которых никто не смог установить их точно (данные показывают это...). Если вас огорчает этот ручной процесс, пожалуйста, способствуйте дальнейшему уточнению по-танковых таблиц WN8, загружая свои dossier-файлы на http://www.vbaddict.net/wot.php
Кроме того, ожидаемые показатели для по-танковых таблиц были сопоставлены с таблицами, используемыми для рейтинга PR по Noobmeter, и таблицей лучших 1% / 100 игроков по каждому танку игроков RU-региона, любезно предоставленные Seriych (подобной той, что была использована в XVM для версии 8.6 и старше). Большая часть ожидаемых показателей урона довольно близки к используемым в Noobmeter (для уровней 3-8), и, если умножить эти значения на 1,5 (чтобы получить значения для игрока с 2400 WN8), вы получите значения весьма близкие к значениям Seriych для лучших игроков RU-региона. Кроме того, использование этого подхода для низкоуровневых танков привело к значениям, очевидно, высоким для новичков, но это на самом деле не проблема, так как у обычных игроков количество боев на 1-м уровне составляет только 3% и менее от их общего количества. Это очень удобно также работает против накручивания рейтинга. Это означает, что вы можете и дальше убивать игроков 1 уровня пачками, но теперь в этом деле вы должны быть очень хороши! Теперь показатель в 1.7 уничтожено/бой в среднем (хорошей показатель для 10 уровня) на 1-м уровне уже недостаточен для хорошего рейтинга. Это не потому, что команда WN* имеет предубеждения против игроков, которые играют на низких уровнях, но лишь то, что мы хотим определить мастерство игрока независимо от уровня боев (причины - см. раздел Почему WN8?).
Напоминание: наиболее ЗНАЧИМОЙ в по-танковой таблице является взаимосвязь между ожидаемыми показателями для различных танков. Мы могли бы разделить все эти значения на 3, и это не будет иметь значения. Важным является отношение между числами, а не фактические значения. То же самое касается соотношения 1.15, используемого в балансировке танков, мы могли бы использовать любое другое число. Мы оставили их в масштабе урона "WoT" для удобства чтения и простоты работы с исходными данными!

Проверка достоверности данных

Набор данных для игроков с более чем 10 000 боев на нескольких серверах был любезно предоставлен г-ном Noobmeter (нам нужны были бои, сыгранные на каждом танке), объемом 4 Гб, с трудом открываемом в Excel! Тем не менее, мы отобрали из него игроков регионов EU и NA, количеством 115000 так, чтобы ПК Praetor77 мог с ним справиться. С помощью этой базы данных, мы определили ожидаемые показатели, rSTATS а затем rSTATSc. Используя показатели rSTATSc, мы использовали Eureqa (очень хорошая и умная программа, которая использует итерационные генетические алгоритмы для поиска математических зависимостей между набором входных данных), чтобы определить оптимальную формулу, которая сможет установить зависимость между ПП игроков и их rSTATSc.
В результате анализа данных, мы обнаружили, что у некоторых игроков были выбивающиеся некоторые показатели rSTATSc (все, за исключением rDAMAGEc, на самом деле), что привело нас к реализации "потолка" или максимальных значений для повышения полезности WN8. Для этих (выбивающихся) показателей по отдельности наблюдалась более тесная корелляция с ПП, чем с обобщенным показателем.
Потолок значений реализован так:
rFRAGcMAX = rDAMAGEc+0.2
rSPOTcMAX = rDAMAGEc+0.1
rDEFcMAX = rDAMAGEc+0.1
Мы заново ввели обработанные rSTATS в Eureqa которая выдала практически такое же решение как и до реализации «потолка», но учитывающая большую часть ранее выбивавшихся игроков. Окончательная формула:
rWINc = 0,09 + 0,613 * rDAMAGEc + 0,131 * rFRAGc * rDAMAGEc + 0,097 * rFRAGc * rSPOTc 0,047 * rFRAGc * rDEFc
После этого мы умножаем каждый член в формуле на 1600, что близко к средневзвешенному значению WN7, что приводит к среднему значению WN8 по серверу в диапазоне 900-1000.

Матрица ожидаемых показателей

Не используя Excel, вы можете просмотреть значения показателей для танков здесь: http://www.wnefficiency.net/wnexpected
Кроме того, г-н Noobmeter любезно разместил таблицу на своем сайте, наряду с его значениями PR, для вашего сведения: http://www.noobmeter.com/tankList

Расчет WN8
Шаг 1

rDAMAGE = avgDmg / expDmg
rSPOT = avgSpot / expSpot
rFRAG = avgFrag / expFrag
rDEF = avgDef / expDef
rWIN = avgWinRate / expWinRate
На 1 шаге рассчитываются показатели игры как отношение средних показателей к ожидаемым для всех танков сыгранных на аккаунте и перемножаются между собой. (Step 1 takes the counts of tanks played on account, and multiplies them by the expected stats to get the account total expected values. Then the actual account totals (your total dmg, frags, spots, def, win-rate) are divided by the total expected values to give the ratios.)

Шаг 2

rWINc = max(0, (rWIN - 0.71) / (1 - 0.71))
rDAMAGEc = max(0, (rDAMAGE - 0.22) / (1 - 0.22))
rFRAGc = max(0, min(rDAMAGEc + 0.2, (rFRAG - 0.12) / (1 - 0.12)))
rSPOTc = max(0, min(rDAMAGEc + 0.1, (rSPOT - 0.38) / (1 - 0.38)))
rDEFc = max(0, min(rDAMAGEc + 0.1, (rDEF - 0.10) / (1 - 0.10)))

Шаг 2 устанавливает нулевую точку для полученных показателей игры. См. раздел Предположения для получения дополнительной информации о том, почему это произошло. Функции min и max использованы для того чтобы показатели не выходили за границы применимости. Константы рассчитываются в виде
(rSTAT – constant) / (1 – constant)
для нормализации, чтобы, игрок с общим показателем rSTATSc = 1 получал 1565 WN8. Игрок со всеми rSTATS = 1 также будет иметь rSTATSc = 1, поскольку (1-с) / (1-с) = 1.

Шаг 3

WN8 = 980*rDAMAGEc + 210*rDAMAGEc*rFRAGc + 155*rFRAGc*rSPOTc + 75*rDEFc*rFRAGc + 145*MIN(1.8,rWINc)

На шаге 3 к взвешенным (на шаге 1) и нормализованным (на шаге 2) показателям игры применяются коэффициенты, определенные для окончательной формулы, о чем говорилось ранее. Полученное значение находится в пределах 0-5000, и дает относительную оценку урона и отражает взаимодействие между уничтожено*засвечено, защита*уничтожено и урон*уничтожено.

Примечание по взаимодействиям Если вы сыграли 5000 игр на Т-50, и ожидаемый показатель 4 обнаруженных за бой, и вы в среднем обнаруживали 4 танка за игру, ваш rSPOTc=1. Если вы играли только на E100, и ожидаемый показатель обнаружено 0.88 за бой, если у вас в среднем обнаружено 0.88 бой, также ваш rSPOTc=1.
Таким образом rSPOTc НЕ измеряет, сколько вы обнаружили за бой, он измеряет, сколько вы обнаружили по сравнению со средним игроком, играющем на том же танке.
Показатель rSPOTc значительно лучше кореллируется с ПП показатель засвечено/бой (см. графики):

Также, rSPOTc и rDEFc умноженные на rFRAGc в формуле WN8, хорошо коррелируют с ПП (представленным как rWINc) ...

Таким образом показатель, rSPOTс*rFRAGс, похоже, является что-то важным для победы. Это взаимодействие, кажется, правильно оценивает игроков, которые могут решать несколько задач в бою и создают условия для победы, в противовес игрокам, которые играют максимально безопасным образом и просто наносят урон (только rDMGc).
Индивидуальный анализ игрока (и Eureqa соглашается с этим) показывает, что rFRAGc*rSPOTc может много рассказать вам о том, как игрок добивается победы. Авторы верят, что её можно добиться активными действиями по созданию благоприятных условий для команды. Если вы стабильно показываете высокие результаты rSPOTSc то, значит, вы используете более рискованные позиции на карте, а если вы делаете это еще и при высоких показателях по урону, уничтоженным, защите и ПП, IMHO вы являетесь лучшим игроком, чем тот, который показывает те же показатели по урону и уничтоженным сидя в тылу и стреляя по чужому засвету. Показатели rSTATc явно поддерживают наиболее часто повторяемый совет в игре "get your gun in the game and stay alive to keep it there".

Периодические обновления

Поскольку и танки, и игроки меняются с течением времени, WN8 был разработан с возможностью периодического обновления ожидаемых показателей, для того, чтобы относительная эффективность танков, и измеряемая эффективность игроков, которые играют на них, оставалась точной.
Методика обновления была разработана спустя 6 месяцев после того как WN8 впервые был представлен, и осуществляется программой на R для того, чтобы процесс был повторяемый для более чем 95% танков, которые не требуют корректировок на основе субъективного мнения.
Извлеченные из dossier-файлов vBAddict показатели игры фильтруют, как было описано выше, и для каждого танка, и каждого показателя rSTAT (rDAMAGE/rFRAG/rDEF/rSPOT/rWIN) R наносит на график "точку" для каждого пользователя, отражающую отношение его показателя rSTAT на этом танке, к показателю rSTAT для всех танков для всех игроков. Вот, например, пример графика для rDAMAGE для Type 59:

Линия регрессии методом наименьших квадратов (красная линия) – дает для user_rDAMAGE=1 значение rDAMAGE= 0,953. (The least squares line of best fit - the red line - crosses the user account rDAMAGE at a value of 0.953) Это и есть "поправочный коэффициент", который должен быть применен к ожидаемому значению урона для Type 59 в обновлении.Эти факторы автоматически генерируются и применяется для всех 5 показателей для всех 350 танков в Wargaming(c) API. Для горстки танков, для которых данных для получения приемлемой линий наилучшего соответствия недостаточно, применяются значения, рассчитанные для танков того же уровня и типа.
(Gryphon, июнь 2014 г./перевод на русский kt133a)
Цветная шкала

Новая цветовая шкала используемая XVM и была расчитана на основе данных о всех игроках РУ сервера. Сбор статистики проиводил Edrard, а анализ seriych

График распределения процента игроков в зависимости от рейтинга

Формула пересчета в шкалу XVM

XWN8 = ЕСЛИ(WN8>3250; 100; МАКС(МИН(WN8*(WN8*(WN8*(WN8*(WN8*(0,0000000000000000000812*WN8 + 0,0000000000000001616) - 0,000000000006736) + 0,000000028057) - 0,00004536) + 0,06563) - 0,01; 100); 0))

» на официальном форуме поддержки XVM.

Шкала XVM — универсальная двузначная шкала для отображения рейтингов, основанная на проценте игроков, которые имеют данный рейтинг.

Шкала XVM была задумана и реализована, когда в XVM впервые появилось возможность отображения более одного рейтинга. Встал вопрос, как человек может сравнить значения одного рейтинга со значением другого? Например, с ходу не скажешь, что лучше 1200 по рейтингу эффективности (EFF), или 1400 по WN8, или 7000 по личному рейтингу игрока (WGR), или 52% побед. При сравнении любой пары показателей возникает такой вопрос. Плюс при переходе с одного рейтинга на другой неудобно привыкать к значениям нового рейтинга. Более того даже значения одного и того же рейтинга со временем могут менять смысл, так как многие аспекты игры со временем меняются, а иногда изменяются и резко. Например, при ребалансе артиллерии (когда арту с 8 уровня перенесли на 10-й и т.п.) изменился средний уровень танков у большинства игроков, соответственно численные значения рейтингов изменились.

Задумка шкалы в том, чтобы было так: если при создании шкалы число X по рейтингу A — это хорошо, а число Y- плохо, то и через 5 лет число X по любому рейтингу B — это столь же хорошо, а Y — столь же плохо. Таким образом можно хоть на пару лет отлучиться от игры, потом вернуться во времена популярности других рейтингов, но шкала XVM покажет любой современный рейтинг в том же виде, как старый 2 года назад.

За основу шкалы был взят так называемый процент превосходства (%SUP). Берем всех игроков и считаем их рейтинги. Сортируем игроков по выбранному рейтингу от самого высокого к самому низкому. Процент превосходства- это процент игроков, которые имеют рейтинг ниже данного. Пример графиков процента превосходства для разных рейтингов:

Каждому проценту превосходства соответствует определенное значение числа от 0 до 100. Соответствие подобрано таким образом, чтобы в привычные диапазоны окраски попадало примерно равное количество значений шкалы. График соответствия процента превосходства и значений по шкале XVM:

Почему бы не использовать непосредственно процент превосходства?
- Тогда во-первых, придется использовать как минимум 4 знака для отображения рейтинга (даже 6 знаков, если учесть точку и символ процента), во вторых значимость прибавки в разных диапазонах будет совершенно несоизмерима.
Фиолетовые игроки начинаются и 99.9% превосходства. Их между собой надо тоже как-то разделить и выделить еще одну цифру, то есть отображать от 0,00% до 100.00%. При этом скажем %SUP(EFF=750) = 41.50%, %SUP(EFF=800) = 49.45% — прибавили 50 баллов рейтинга и получили весьма существенную разницу 7.95%, а теперь возьмем те же 50 баллов разницы для других значений рейтинга: %SUP(EFF=1750) = 99.80%, %SUP(EFF=1800) = 99.86% и получили какие-то 0,06% разницы (в 130 раз меньше, чем в первом случае). В этом было бы весьма трудно ориентироваться. Для сравнения то же самое по шкале XVM: XEFF(EFF=750) = 26, XEFF(EFF=800) = 29 и XEFF(EFF=1750) = 88, XEFF(EFF=1800) = 90. Во всём значимом диапазоне 15-25 баллов исходного рейтинга соответствуют 1 баллу шкалы XVM.

Для того чтобы реализовать главную задумку шкалы — неизменность смысла значений, нужно было определиться с критериями отбора игроков, который попадают в список, по которому строится %SUP. И этот критерий должен быть по возможности неизменным. Так как в то время API стабильно работал только на РУ кластере, игроки для шкалы отбираются только РУ сервера. Дабы отбросить начинающих игроков, учитываются только игроки от 1000 боев и выше. Дабы отбросить уже не играющих игроков, которых мы не можем встретить в бою, учитываются только игроки, которые были в бою хотя бы один раз за последние 90 дней. Формула соответствия значений шкалы и процента превосходства (по MS Excel):
%Sup = ГАММА.РАСП(19 + Xrating/100*(100-19); 11; 4; ИСТИНА)+0.0005
%Sup = GAMMA.DIST(19 + Xrating/100*(100-19); 11; 4; TRUE)+0.0005

Цветовая шкала.

Красный: %SUP < 20%
Оранжевый: 60% > %SUP >= 20%
Желтый: 90% > %SUP >= 60%
Зеленый: 99% > %SUP >= 90%
Бирюзовый: 99.9% > %SUP >= 99%
Фиолетовый: %SUP >= 99.9%

Текущая (патч 0.9.15) таблица цветовой шкалы:

Формулы перевода в шкалу XVM.

Текущие (патч 0.9.10) формулы перевода значений рейтингов в шкалу XVM:

XEFF = if(EFF>2250; 100; max(min(EFF*(EFF*(EFF*(EFF*(EFF*(0.000000000000000013172*EFF — 0.000000000000092286) + 0.00000000023692) — 0.00000027377) + 0.00012983) + 0.05935) — 31.684; 100); 0))
XWN6 = if(WN6>2350; 100; max(min(WN6*(WN6*(WN6*(WN6*(WN6*(0.000000000000000001225*WN6 — 0.000000000000007167) + 0.000000000005501) + 0.00000002368) — 0.00003668) + 0.05965) — 5.297; 100); 0))
XWN8 = if(WN8>3650; 100; max(min(WN8*(WN8*(WN8*(WN8*(WN8*(-0.00000000000000000007656*WN8 + 0.0000000000000014848) — 0.0000000000099633) + 0.00000002858) — 0.00003836) + 0.0575) — 0.99; 100); 0))
XWGR = if(WGR>11100; 100; max(min(WGR*(WGR*(WGR*(WGR*(WGR*(-0.0000000000000000000013018*WGR + 0.00000000000000004812) — 0.00000000000071831) + 0.0000000055583) — 0.000023362) + 0.059054) — 47.85; 100); 0))
Актуальные формулы в исходном коде XVM: xvm_scale.py

Наглядные графики:

В WoT развелось огромное количество формул для оценки крутости игрока. Ну и картошка решила последовать тренду. Как мы знаем ЛР ver.1.0 был .
Надо признаться, что ЛР ver.2.0 (есть инфа, что на самом деле 3.0) выглядит гораздо лучше. Прежде чем рассмотреть рейтинг от WG надо разобраться, что же картошка хотела нам этим показать.
На сколько я понимаю, по задумке WG личный рейтинг показывает не скилл игрока , а прошаренность или степень освоения игры игроком. Сравнивать ЛР с РЭ или WN7 не совсем корректно. ЛР по своему духу больше похож на рейтинг бронесайта. ЛР оценивает ожидаемою профпригодность игрока для кланов, КБ и т.д. Теперь уяснив, что ЛР не показатель скилла, а показатель опытности игрока, приступим к разбору формулы ЛР.

Формула от WG:


Входные параметры:
win - доля побед (действительное число от 0 до 1)
surv - доля боев, в которых игрок выжил (действительное число от 0 до 1)
dmg - средний урон за бой
bc - общее количество боев на аккаунте
bc8.8 - общее количество боев на аккаунте с момента выпуска версии 0.8.8
xp8.8 - средний опыт (без учета премиум-аккаунта, 0.8.8+)
radio8.8 - средний урон за счет засвета по рации (radio assist, 0.8.8+)
track8.8 - средний урон за счет удержания на гусле (track assist, 0.8.8+)

ЛР не равен RBR! ЛР = RBR + КР, где КР - киберспортивный рейтинг.

Хорошо, формула у нас в руках, но она выглядит удручающе. Что же делать?

После описанных в видео действий, получаем следующее выражение личного рейтинга (для игроков у которых после 0.8.8 больше 1500 боёв):


Уже намного понятнее, т.е. ЛР есть произведение коэффициента К на некую функцию. Коэффициент К , в первом приближении, зависит только от количества боёв. С лёгкой руки legolegs назовём его "антитвиковый" коэффициент.
Вот так он выглядит:

По сравнению со старой версией ЛР этот коэффициент выглядит гораздо лучше. Теперь ЛР игроков с 2000 боёв и 10000 боёв отличается всего в 1,16 раза, раньше отличие было в 4 раза ! Ай да картошка, а да молодец. Но называть идеалом это ещё рано. Посмотрим на сколько хорошо ЛР справляется со своей функцией, а именно показателем профпригодности.

Обычно при приёме в не ГК ориентированный взводный клан берут игроков с 3к+ боёв (для ГК ориентированного 10к+, для топового 15к+), следовательно, на это требование и должна была ориентироваться картошка. ИМХО хотелось бы видеть следующие коэффициенты:

1к+ - 0.4
3k+ - 0.6
5k+ - 0.8
10k+ - 0,9

Теперь рассмотрим загадочную функцию от параметра F , вот так она выглядит:

Мы видим простую сумму неких функций одного аргумента, в качестве аргумента выступают, главные по мнению WG, характеристики игрока. В формуле ЛР используется хитрая тригонометрическая функция от суммы этих функций, поэтому построение графиков отдельно для F 1 , F 2 ... не совсем корректно покажет их влияние на ЛР.


Вот тут, я категорически против! И это грубая ошибка практически всех рейтингов на сегодняшний день (WN8 продвинулся вперёд в этом плане, но как всегда фэйл, ибо аксиомы используемые при выводе формулы были не верны). Чем мне не нравится сумма функций одного аргумента? А тем, что влияние практически всех параметров не аддитивное (не выражается простой суммой). В последующих статьях цикла, я расскажу об этом подробнее.

Чтобы выйти из этого положения возьмём условного хорошего игрока со следующими параметрами:
win - 0.52
surv - 0.33
dmg - 1100
bc - 10000
bc8.8 - 1500
xp8.8 - 600
radio8.8 - 300
track8.8 - 300

Теперь, фиксируя все характеристики игрока кроме одной, найдём как ЛР будет меняться от каждой характеристики по отдельности.

Влияние процента побед и выживаемости.
Вот такой график влияния процента побед и выживаемости присутствует в новом ЛР:

Накрутить ЛР как раньше за счёт выживаемости теперь не удастся. Это хорошо. В целом как видно из графиков, влияние процента побед примерно в 2,2 раза выше влияния выживаемости.

Влияние урона и опыта.
Вот так выглядят зависимости среднего урона и среднего опыта в новом ЛР:



Зависимость представляет из себя монотонно растущую с замедлением функцию. Правильно это или нет, для меня не очевидно. В целом, влияние опыта сопоставима с влиянием урона. Это тоже хорошо. Есть стимул делать другие действия на поле боя кроме нанесения урона и засвета, т.к. опыт также даётся за активные действия и фраги.

Влияние засвета и гусления.

Тут всё видно из графиков, гусли свети и будет тебе большая цифра рейтинга. Засвет больше влияет на ЛР, чем гусление, вроде логично.
Напоследок выясним относительное влияние засвета и дамага. Для этого построим контурную карту влияния урона и засвета.


Теперь видно, что дамаг сильнее влияет на ЛР чем засвет. Например при 500 засвета и 1500 урона ЛР=8050, а при 1500 засвета и 500 урона ЛР=7750. Но в целом, влияния сопостовимы, и святляков WG уважает.

Для полного счастья нам не хватает, увидеть приоритет каждого параметра в % на рейтинг. После небольшого шаманства получим:
Влияние средного урона - 21%
Влияние среднего опыта - 21%
Влияние процента побед - 19%
Влияние среднего засвета - 17%
Влияние среднего гусления - 14%
Влияние процента выживаний - 8%
Цифры приблизительные. О том, как их получал, расскажу позже.

Выводы.
Картошка приблизилась к созданию хорошего рейтига для своей области применения. Т.к. учитывается количество боёв и не учитывается средний уровень техники, то можно предположить, что рейтинг показывает не скилл, а то на сколько игрок "прошёл эту игру". Не совсем понятно почему она не учитывает количество фрагов на прямую. Может кто из поняш знает?

UPD: Просили линейку для ЛР, держите!

Ранг Диапазон ЛР Диапазон XVM Процент превосходства.
Очень плохой : 0 - 2450 0-16 0-20%
Плохой : 2450 - 4120 17-33 20-60%
Средний: 4120 - 5980 34-52 60-90%
Хороший: 5980 - 8240 53-75 90-99%
Отличный: 8240 - 9910 76-92 99-99,9%
Уникум:
9910+ 93-100 99,9-100%

Т.к. у меня нет большой репрезентативной выборки ЦА Wot с показателями ЛР, то эти результаты получил не напрямую, следовательно, они приблизительные. Цифры получил корреляцией ЛР со шкалой XVM, хотя выборка маленькая, корреляция хорошая. График с уравнением перевода шкалы XVM в ЛР ниже.

P.S. Это первый пост Понюха здесь, вероятность сомов повышена. Сейчас я болею, поэтому не смог написать всё, что планировал. Дальше проведём аналитику других рейтингов WoT и их сравнение. Потом расскажу про методику оценки процента взводных боёв у игрока. И наконец, рассмотрим путь к получению рейтинга реально отражающего скилл игрока (из -за математичности скорей всего не напишу, ибо читать пост про численные методы, математическую статистику и ген. алгоритмы никто не захочет).

Уже больше пол года, как к WN8 в World of Tanks появилось много вопросов, устарел ли он и пора ли обращать внимание только на рейтинг WG?!. Дошло до того, что у многих сайтов появились свои рейтинги. И вот, что решила команда XVM.

Вероятно вы уже заметили значительные изменения своего рейтинга WN8 при игре в WoT. В этой статье мы расскажем вам о причинах этих изменений, а также нововведениях рейтинга.

WN8 - это не только статичная формула, но и набор ожидаемых значений, которые основываются на общей серверной статистике всех активных игроков. Поэтому даже если вы не играете, ваш рейтинг может немного изменяться с течением времени в связи с изменениями общей серверной статистики и пересчётом ожидаемых значений.

Однако, в течение длительного времени (в последние полгода) ожидаемые значения для WN8 не обновлялись в World of Tanks. Подробнее мы писали об этой проблеме ранее, и поскольку разработчики формулы WN8 прекратили полноценный пересчёт ожидаемых значений, мы решили исправить проблему своими силами, и сегодня готовы представить вам экспериментальное решение.

На сегодняшний день мы полностью автоматизировали расчёт ожидаемых значений для WN8, сохранив изначальную методику авторов рейтинга.

При этом есть несколько отличий, значительно влияющих на качество расчёта:
1. Ранее пересчёт таблиц производился довольно редко(раз в несколько месяцев), что приводило к резким скачкам рейтинга после пересчёта. Безусловно, неприятная и непонятная ситуация для простых игроков. Мы же будем пересчитывать ожидаемые значения ежедневно, что решает как проблему резких изменений рейтинга, так и устаревших данных.
2. Мы используем гораздо большую базу статистики игроков, чем та, которая использовалась при расчётах авторами WN8, благодаря чему можем проводить более достоверные расчёты.
3. К сожалению, ранее авторы таблиц позволяли себе некоторые вольности с ожидаемыми значениями - ручные искажения с целью троллинга аудитории. Мы считаем это недопустимым и при расчётах таблиц под полным нашим контролем мы можем быть уверены в отсутствии ручных манипуляций. Наш приоритет - корректные данные.

Актуальная таблица ожидаемых значений теперь доступна на этой странице .

Если в World of Tanks вы все еще видите старый WN8, просто подождите. Обновление статистики всех игроков WoT может занять некоторое время.

Сторонним разработчикам:

Если вы хотите использовать актуальные таблицы ожидаемых значений WN8 от XVM в своём проекте, вы можете запрашивать их по следующим адресам:

JSON: https://stat.modxvm.com/wn8-data-exp/json/wn8exp.json
CSV: https://stat.modxvm.com/wn8-data-exp/csv/wn8exp.csv

Обратите внимание на обязательное использование защищенного протокола https в ваших запросах.

При этом останутся неизменными способы поднять свою статистику в World of Tanks, о том как это сделать