В начало
«Кидо: Искусство игры Го» :: Форум

Предыдущая страницаСледующая страница


История российского рейтинга

Сергей Павлов

Первоисточник статьи находится на форуме Кидо: http://forum.kido.com.ru


Не зная историю, невозможно ни понять настоящее,
ни прогнозировать будущее...


Введение


Начало пути

Поскольку РС Эло была уже у всех "на слуху", то первым стремлением тех, кто интересовался проблемами рейтинга, было непосредственно перенести ее в го практически ничего не меняя. Так и поступили некоторые национальные федерации го в Европе. Но нам в России (т.е. тогда еще в СССР) предварительно нужно было как-то согласовать ранги игроков из разных регионов, т.к. в каждой новой "точке роста" стихийно образовывались свои шкалы рангов, сильно разбалансированные в целом по необъятному Союзу. В этих целях по инициативе ленинградцев, прежде всего Асташкина как лидера в союзном масштабе, в 1978 году был создан "Всесоюзный рейтинг-клуб" (ВРК), членами которого являлись клубы отдельных городов СССР. Идея создания такого клуба впервые была высказана В.Асташкиным на "Межзональном турнире" первого розыгрыша соревнований на звание "Сильнейший игрок го" (СИГО) в Краснодаре осенью 1977 года, а потом обсуждалась в следующем году на самом представительном форуме - Всесоюзном отборочном турнире к финалу СИГО-78 (ВОГТ-78), проходившем в Казани в октябре.

Главная идея ВРК состояла в проведении игр на форе, строго соответствуюшей разнице рангов в парах игроков из разных городов. Саму шкалу рангов локально перед включением в ВРК каждый клуб, представляющий город, определял самостоятельно на основе ЭО, ранее проведенных встреч, контактов с японскими игроками и т.п. Для проведения межклубных встреч организовывались турниры и специальные двусторонние форовые матчи городов, и даже отдельные поезки (в командировки например) использовались для проведения рейтинг-партий. Ежеквартально правлением ВРК выпускался "Рейтинг-лист ВРК", в котором учитывались все проведенные за квартал партии: интегрально для каждого клуба определялся процент побед и клубный сдвиг рейтинга, сначала как изменение на целое число рангов (повышение всех игроков регионального клуба на 1 ранг при примерно 60% побед, снижение - при 40% и менее), а с конца 1979 года уже стали вводиться дробные доли рангов.

Кстати, в структуре ВРК были выделены игроки-анкеры, к которым должны были привязываться все игроки из ВРК, в том числе и все региональные шкалы. Эти игроки обязаны были проводить не менее определенного числа форовых игр в год между собой - для подтверждения своего статуса и обеспечения статистики форовых игр "анкеров". Всего в группу "ВК" - игроков всесоюзной квалификации - входило не более 10 человек, включая ведущих ленинградских мастеров и некоторых активно выступающих лидеров из Москвы, Казани, Украины, Сибири и других регионов - с рангом не ниже 1-го кю.

Как уже упоминалось, первое серьезное обсуждение проблем всесоюзного рейтинга состоялось в Казани в 1978 году. Так как основная масса игроков была занята выяснением отношений за го-баном, то первая "рабочая группа по рейтингу" возникла почти стихийно в основном из членов оргкомитета и судейской коллегии. В нее вошли: В.Асташкин и Г.Нилов (члены оргкомитета СИГО-78 и судейской коллегии ВОГТ-78), П.Игнатьев - гл. секретарь (все - из Ленингарада), Н.Михайловский (Днепропетровск) - гл. судья СИГО-78, автор этих строк (Новосибирск) - гл. судья ВОГТ-78. Несколько позже состоялся финальный турнир претендентов на матч с В.Асташкиным (обладатель титула "СИГО-77"). Турнир проходил по круговой системе с разъездами, и во время одной такой поездки в Москву (партия с Ю.Беляевым) и Ленинград я получил от В.Асташкина голландский го-журнал с описанием их РС типа Эло и перевод статьи из японской "Энциклопедии го", посвященной ежегодному форовому квалификационному турниру профессионалов "Оотэаи" (несколько лет назад был ликвидирован из-за малого притока туда спонсорких средств, в результате чего в нем стали отказываться играть многие профессионалы). Статья содержала подробное описание соотношений форы и начисляемых очков в партиях, правила присвоения следующих про-данов и пр.

Анализ таблиц распределения зачетных очков турнира ООтэаи и всей системы присвоения про-данов показал, что в основу шкалы про-данов положена вероятность победы старшего при разнице в 1 про-дан - 75%. Такая же "процентная ставка" положена в основу традиционной системы разрядов и званий в шахматах и других играх. Поэтому естественно было попытаться как-то увязать тот же процент побед с любительской шкалой. Для этого необходимо было иметь статистику результатов партий (побед/поражений или даже в очковых итогах партий) достаточного объема. Но можно было и просто постулировать такой или некоторый иной процент для определенной разницы рангов, выбранной в качестве шага разрядной лестницы, а потом набирать статистику. Были проведены также опросы по ЭО ожидаемых максимальных разностей рангов, т.е. ставился вопрос: "какова та фора, при которой в партии равных игроков дающий фору проигрывает почти гарантированно, или какова разница рангов, при которой более старший побеждает без форы в подавляющем большинстве случаев". Ведущие игроки оценивали эту разницу примерно в 4 камня (или 4 ранга), естественно на своем уровне - тогда еще никто серьезно не задумывался над тем, что вероятности зависят не только от разницы рангов, но и от уровней обоих соперников, т.к. в применявшихся в те времена вариантах РС Эло все коэффициенты были константами. Результаты опроса наводили на мысль, что шаг разрядной лестницы в го по крайней мере в два раза должен превосходить традиционную разницу между соседними рангами.

Вся эта информация привела к появлению первой таблицы, основанной на нормальном распределении вероятностей в зависимости от разницы рейтингов - интеграл Гаусса был затабулирован при соответствующем выборе параметров, при этом почти 100%-ная вероятность победы достигалась при разнице примерно в 4 ранга, а вероятность 75% соответствовала примерно 2 рангам (200 пунктов рейтинга). На тот момент к работе по созданию рейтинг-системы уже подключился С.Межов, и я выслал ему и остальным членам рабочей группы письмо с таблицей вероятностей и описанием "очкового принципа ранжирования" (см. книгу "Го и основы систем ранжирования"), который связывал понятие пункта рейтинга с территориальными очками результата в партии.

На тот момент (начало 1979 года) была актуальной проблема официального признания игры го в спортивных кругах, которую никак не удавалось решить. Собственно, поэтому и был создан чисто общественный ВРК - чиновники не давали добро на создание "Федерации го СССР" (здесь за подробностями отсылаю к С.Межову). Из-за задержки в официальном признании го как вида спорта энтузиазм первых лет, порожденный публикациями в "НиЖ", стал спадать, особенно в регионах. Но в Москве и Ленинграде среди любителей го сохранялась достаточно высокая активность и усилиями С.Межова и других московских игроков была создана сначала секция при ЦСКА (здесь уточнить детали может опять же Сергей Александрович), а потом - в конце 1984 года - "Всероссийская секция го". Еще в секции при ЦСКА в 1983 году стал выпускаться рейтинг-лист на основе системы Эло с таблицей вероятностей, близкой к предложенной мной, а затем эта РС в 1985 году была перенесена и на всероссийский уровень, когда стали проводиться первые официальные Чемпионаты и Кубки России.

Первый этап развития. РС Эло

Так возникшая система Эло применялась в российском го практически без изменений вплоть до 1990 года и даже несколько позже - до введения РС-90. В этот период рейтингом занималась квалификационная комиссия, которой руководил Р.Сахабутдинов, все расчеты делались "на руках", статистика не велась и мониторинг не осуществлялся. Положительным моментом было то, что на основании рейтинга и аналогии с шахматами в РСФСР были введены разряды и звания, что было определенным стимулом для занятий игрой го - в то время спортивные звания играли более существенную роль в социальном статусе. Поскольку недовольных рейтингом игроков го всегда хватало, то оставался актуальным вопрос обоснования РС, статистической проверки заложенных в нее коэффициентов, и главное - корректировки тех недостатков РС Эло, которые уже были выявлены шахматистами. В частности представляла интерес проблема растущих игроков.

После активизации в 1985 году всероссийской деятельности, при общении на турнирах обсуждение проблем рейтинга проходило в основном в кругу уже нынешнего состава рейтинг-комиссии (кроме автора этих строк еще - С.Межов и Ю.Беляев). К моменту создания Федерации го СССР в конце 1989 года уже был разработан один из первых вариантов РС-90 и была написана программа на Фортране, которую я использовал в методических расчетах. Проведение первого Чемпионата СССР в Ленинграде было удобным поводом для обсуждения проблем рейтинга в широком кругу заинтересованных лиц. К этому моменту, в целях обоснования РС и прежде всего уточнения параметров функции вероятностей, была проведена статистическая обработка 20 крупных российских турниров 1985-1989 годов. Расчитывались частоты побед в партиях при разнице в рангах 1 и 2, что вполне было достаточно для указанных выше целей, т.к. считалось, и это реально было близко к истине, что шкала рангов не имеет существенных деформаций, потому что она формировалась в первые годы почти исключительно на основе форового принципа.

На чемпионате в Ленинграде был сделан доклад по проекту РС-90, в котором впервые был сформулирован принцип аномальной коррекции как основной вероятностный метод противодействия оттоку рейтинга от стабильных игроков к растущим. Тогда же было впервые предложено применять переменные по уровню игры коэффициенты динамичности (совпадают при умножении на коэффициент 1.5 с нынешними коэффициентами РС ЕГФ в пределах 2-3%) и увеличивать эти коэффициенты для нестабильных игроков (в т.ч. аномалов и новичков). В докладе были изложены результаты статистического анализа и предложена уточненная таблица вероятностей. Удивительным в этой "статистической истории", предшествовавшей созданию РС-90, оказалось в последствии то, что проценты побед были определены настолько точно для интервала 1-5 дан в среднем, что и сейчас, спустя почти 20 лет, они соответствуют усредненной по тому же интервалу функции вероятностей из нового проекта РС-2005 с точностью около 1%. И это несмотря на имевшуюся тогда достаточно малую выборку - всего около 400 партий на равных между игроками от 1-го до 5-го дана. Для сравнения: новая функция вероятностей выбиралась на основе обработки статистики ЕГФ, которая на сегодня уже содержит результаты более чем 150 000 партий.

Спустя некоторое время Ю.Беляев создал прикладную программу по алгоритму РС-90 и передал ее Панюкову. Так начался новый период развития российской РС - с аномалками и переменными коэффициентами динамичности. Алгоритм РС-90 был тогда же, т.е. еще в 1990 году, передан через А.Явича украинским друзьям, которые написали по нему программу, вставив в нее потом, правда, коэффициенты и формулу вероятностей из РС ЕГФ. Проект РС-90 рассматривался и в ЕГФ как один из вариантов новой европейской РС (кстати, описание его передали туда не по моей инициативе и без моего ведома; жаль, что в ЕГФ так и не оценили основные идеи нового подхода). Спустя годы в ЕГФ была внедрена чехословацкая РС Алеша Чеплы (или Чипли - Cieply), которая практически является классической РС типа Эло, но с переменными по уровням коэффициентами динамичности.

РС-90. Принцип аномальной коррекции

Про период 1991-2002гг. стоит поговорить подробнее. РС приобрела четкое описание, алгоритм был реализован в виде программы, пересчет рейтинга и ведение РЛ были наконец автоматизированы и стали осуществляться централизовано, на единой методической основе. Во многом в решении организационных проблем рейтинга существенную роль сыграл Е.Панюков, с которым я познакомился на турнире "Каменный цветок" в Миассе в 1992 году. Он тогда тесно сотрудничал с В.Кайдаловым, который уже начал выпускать журнал "Интеллектуальные игры", поэтому ведение рейтинг-листа РФГ(Б) было интересно Евгению Леонидовичу (как я это понимаю спустя годы) и в плане развития издательской деятельности. В последствии бюллетень "Игра Го в России" фактически и начался с выпуска первых печатных официальных РЛ федерации.

В самом начале своей деятельности по выпуску рейтинг-листов Е.Панюков приезжал в Новосибирск в командировку, жил у меня пару дней и мы много говорили о рейтинге и методиках его расчета. К сожалению, те рекомендации, которые я высказывал и как автор РС, и как просто специалист в области прикладной математики, не принимались как правило во внимание. Например, РС разрабатывалась с расчетом, что ведение РЛ будет раздельным по игрокам уровня данов и кю (последние должны были пересчитываться в регионах). Однако централизованный расчет всех игроков дан-уровня был расширен сначала до границы 3 кю (1800), а потом и вообще до 20-го. При этом никаких изменений в алгоритм не вносилось. Но все параметры РС, которые были рассчитаны на основе статистики игр данов, не могли быть корректными во всей области, включая игроков самых нижних кю-уровней.

Аналогично, метод аномальной коррекции по своему смыслу и назначению призван обеспечивать быструю реакцию РС на "аномальный рост" игроков, но никак не для аномальной коррекции неудачных выступлений ("отрицательная аномалка"), которые могут быть иногда практически у любого, даже очень стабильного игрока в силу различных чисто случайных факторов, влияющих на физическое состояние, спортивную форму игрока как спортсмена. Именно в компенсации прогнозируемого оттока рейтинга от стабильных игроков к растущим суть "аномалок", и это согласуется с тем, что в РС нет симметрии - большинство игроков входят с низкими рейтингами, а стабилизируются они, в соответствии с известной "логистической кривой развития", на дростаточно высоком уровне, отнимая в процессе роста иногда тысячи очков рейтинга от основной стабильной массы игроков. Однако, вопреки здравому смыслу и рекомендациям, в программе убрали "заглушку" на отрицательную аномалку и в итоге некоторые игроки незаслуженно пострадали от этого некорректного подхода к ведению РС. Потом, после многочисленных жалоб игроков и возражений со стороны разработчиков, эта методическая ошибка была устранена.

Но "отрицательными аномалками" и необоснованным расширением шкалы расчета ошибки этого периода не ограничились. После введения в ЕГФ в 1998 году новой РС в алгоритме изменили коэффициенты динамичности, взяв их из РС ЕГФ и не поменяв при этом параметры настройки аномалок. Но ведь программа Ю.Беляева содержала упрощенный расчет аномалок по критерию перебора очков рейтинга (а не очков результата в турнире), а эти очки пропорциональны коэффициентам динамичности (так и сейчас считается аномалка на Украине). Т.е. необходимо было скорректировать и критерий аномальности, который, таким образом, оказался нарушенным - старые настройки аномалки были корректными при других коэффициентах.

Как же повлияли методические ошибки на состояние шкалы рейтинга? Во-первых, отрицательные аномалки компенсировали эффект правильной аномальной коррекции, "испортили" ее предназначение как корректирующего отток механизма. Во-вторых, необоснованные для нижней части шкалы параметры функции вероятностей работали в ту же сторону, что и "отток рейтинга": они снижали средний рейтинг стабильных игроков, особенно в нижней части шкалы. Как это происходило? Рассмотрим пару игроков с разницей в уровне в 1 ранг. По правильной формуле вероятностей при среднем уровне в 11 кю вероятность победы более сильного равна 55%, а формула, "заточенная" под дан-уровень, давала 66%. Таким образом, при победе более слабого он отнимал больше очков рейтинга (11% от коэффицента динамичности), чем положено, и хотя его рост ускорялся, более сильные игроки необоснованно теряли дополнительные очки. Это не страшно в середине шкалы, если игрок равномерно встречается то с более слабыми, то с более сильными, выигрывает около 50% партий и ошибки взаимно гасятся за счет симметричности, хотя и увеличивают дисперсию рейтингов. Но растущий игрок реально отнимает больше очков за счет описанного механизма, т.к. чаще встречается с более сильными и постоянно недооценивается системой. Т.е. механизм оттока усиливается такой ошибкой формулы вероятностей и шкала растягивается вниз тем больше, чем ниже уровень растущих игроков.

В защиту пользователей программы по РС-90 следует отметить, что они не могли знать всех нюансов алгоритма и многое не понимали в силу недостаточной компетенции в сложных вопросах прикладной матстатистики. Всегда целесообразно ведение рейтинга осуществлять под руководством специалистов, а еще лучше - авторов РС, как это и было изначально организовано в ЕГФ при переходе на новую РС в 1998 году. Некоторые отрицательные явления, деформировавшие шкалу рейтинга, не зависели от пользователей программы и определялись недостаточной проработкой алгоритма ввиду отсутствия необходимой статистической базы. Например, отрыв в рейтинге верхушки рейтинг-листа от ближайшей группы стабильных игроков превысил к 2003 году 100 пунктов, и это объясняется тем, что формула вероятностей была только "осредненно справедливой" для интервала 1-5 дан. Однако реально вероятности победы более сильного при одной и той же разнице в рейтинге резко возрастают при приближении к отметке 3000 - к рейтингу идеального игрока (ИИ). Это означает, что, например, Динерштейн (2800), встречаясь со средним 6-м даном (2600) имел вероятность победы 100% (0.5 + 200/300 > 1), а формула РС-90 давала только 80%, и при коэффициенте динамичности 10 старший по рейтингу зарабатывал незаслуженно 2 пункта рейтинга в каждой такой партии. Сыграл 50 партий - вот и отрыв на 1 ранг.

Нельза не отметить и еще одну особенность этого периода развития РС в России. Если до 1985 года шкала рейтинга формировалась почти исключительно за счет применения форового принципа ранжирования и тем самым получалась автоматически линейной, недеформированной, для нее имелось правильное соотношение форы и разницы рангов (или несколько позже - рейтингов), то потом, и особенно в 90-е годы, все реже и реже стали проводиться форовые турниры, партии с гандикапом перестали фактически учитываться в рейтинге и как следствие - стало нарушаться упомянутое соотношение рангов и форы. А ведь форовый принцип - один из мощнейших стабилизаторов РС, даже если в ней какие-то формулы не совсем точны. Действительно, так как фора выбирается по принципу "1 камень на один ранг", то соответствие "1 ранг = 100 пунктов" стабилизируется при достаточном количестве форовых игр независимо от ошибок формулы вероятностей, т.к. правильная фора приводит все вороятности примерно к 50% при любой ошибке самой формулы и при любых больших разностях рейтингов. То есть ошибки, неточности формулы вероятностей подавляются форовым принципом.

У читающего эту историю, наверное, может возникнуть вопрос: "Хорошо, Вы понимали и знали лучше других как устроена РС, как работает программа, что можно делать, а что нельзя. Почему же Вы не взяли обсчет рейтинга в начале 90-х в свои руки?". И это будет резонный вопрос. Действительно, как так получилось, что главные разработчики алгоритмов РС были отстранены от своего продукта, или вернее этот продукт был отчужден от авторов и разработчиков? Тут следует сразу оговориться, что никто не предлагал авторам "взять рейтинг в свои руки". Уже была сложившаяся система отношений (своя бюрократия в го), управляющие структуры, включая квалификационную комиссию, к компетенции которой и относились вопросы рейтинга. Парадоксально, но факт: тот, кто должен заниматься рейтингом по положению, оказался самым ръяным противником реформы РС. Еще в 1990 году на Чемпионате СССР длительная беседа с председателем (Р.Сахабутдинов) убедила меня в его непрошибаемом пессимизме насчет внедрения проекта РС-90. Таким образом, проект был реализован не благодаря, а вопреки руководству квалификационной комиссии, и это - заслуга энтузиастов: один разработал алгоритм, другой сделал программу, третьи взялись за практическую организацию расчетов.

Конечно, моя отстраненность в тот период от практической реализации проекта была в какой-то мере связана со смутным временем перемен: развал Союза, переход к рынку и нестабильность в экономике, плохое финансирование науки, где я в то время работал. Жизнь была непростая, практически никто из Сибири не выезжал на турниры в европейскую часть России в период с 1992 по 2001 год и мое общение с игроками го из других регионов было существенно ограничено. Ну и сыграло свою роль то обстоятельство, что Новосибирск территориально удален от основных центров Го, трудно было представить, без сегодняшних возможностей интернета и пр., как организовать учет турниров и обсчет рейтинга по всей стране, находясь на ее периферии.

Итак, я длительное время не был на турнирах в европейской части России и не имел возможности обсуждать проблемы рейтинга в широком кругу. Но при первом же выезде на "Кубок LG" в Москву в 2001 году я ощутил большую озабоченность со стороны игроков накопившимися проблемами в РС, прежде всего явным сползанием рейтинга в средней части шкалы, хотя именно там находилась наиболее многочисленная прослойка стабильных в течение десятилетий игроков. Вернувшись с турнира, я стал анализировать ситуацию с рейтингом, попытался воздействовать на тех, кто имел отношение к ведению рейтинга и принятию решений, но бесполезно. На конференции РФГ(Б) 2002 года моя попытка выступить и привлечь внимание общественности к проблемам рейтинга была просто сорвана обструкционистскими выкриками бывшего председателя квалификационной комиссии. Забегая вперед, следует сказать, что до сих пор продолжаются нападки на меня лично и на РС, и складывается впечатление, что тут какие-то личных мотивы, поскольку имеет место резко отрицательное отношение ко всем моим проектам, а никаких серьезных аргументов против так до сих пор и не было предъявлено, кроме голословных клеветнических измышлений и оскорблений. Даже дошло дело до прямого обвинения в "подлоге рейтинга", как всегда клеветническом и неподтвержденном ничем (я ведь тогда даже еще не вел рейтинг вообще!), прямо во время расширенного заседания прошлого состава президиума в декабре 2004 года - в моем присутствии и при обсуждении введения в действие проекта РС-2005. И это несмотря на то, что новый проект РС уже был в целом одобрен президиумом еще в 2003 году, когда я был назначен председателем РК. Удивительно, но против моих предложений постоянно выступал только один из всего состава президиума - Р.Сахабутдинов, и один молча воздерживался - Е.Панюков. Что это? Ревность к рейтингу со стороны тех, кто им когда-то занимался?

Вот как развивалась история российского рейтинга до 2002 года - с поворотами и вывертами. Изложение исторических деталей по некоторым принципиальным моментам реформирования РС будет продолжено...

РС-2005. Подготовка реформы

Очередной "Кубок LG" планировался в начале ноября 2002 года, а тут еще и подошел срок проведения (раз в 5 лет) отчетно-выборной конференции РФГ(Б). Поэтому нет ничего удивительного в том, что было решено совместить эти два мероприятия - все потенциальные делегаты были еще и участниками турнира, т.е. спонсоры оплачивали им все расходы. Замечу, что накануне турнира (26 октября) произошел теракт на Дубровке и корейцы в Москву не поехали. Турнир был отменен, но спонсорские деньги уже были частично переданы и оставлены организаторам в качестве компенсации за отмену мероприятия, поэтому делегаты приехали в Москву и конференция состоялась несмотря ни на что.

Можно считать, что 2002 год оказался поворотным в нынешней истории РС, т.к. именно тогда, на конференции, я осознал, что без моего активного вмешательства ситуация с рейтингом будет только ухудшаться. Выступление на конференции было скомкано - под давлением некоторых ръяных крикунов вопрос по рейтингу быстро "сплавили" на какое-нибудь (в будущем) заседание президиума. И тут определенная цепь случайностей, как оказалось впоследствии, сыграла на руку реформе РС. Во-первых, я достаточно неожиданно получил приглашение на предыдущий Кубок LG от Горжалцана, и даже не знаю как он вышел на меня - ведь я "не светился" в российском го уже почти 10 лет. Во-вторых, на конференции тоже довольно случайно я попал в члены президиума: уже почти решенный вопрос о составе вдруг был снова актуализирован некоторыми региональными представителями, настаивавшими на расширении состава президиума за их счет - для повышения статусности в регионах. В последний момент кто-то (по-моему С.Межов) напомнил и о моем присутствии как единственного регионального представителя из Сибири. Ну и, наконец, обструкция при выступлении на конференции придала мне хороший запал "спортивной злости": сколько же еще можно терпеть "надругательства над рейтингом"? Кстати, именно там было впервые озвучено Гольцманом, что Е.Панюков больше не хотел бы заниматься обсчетом рейтинга и просит освободить его от этого бремени...

Приняв решение "ввязаться в драку", я начал последовательно и методично готовить реформу РС. Для начала нужно было инициировать обсуждение накопившихся проблем в широком кругу игроков. Этот процесс запустил Ю.Беляев, выступив на форуме "Восхождения" (Форум И.Гришина) в конце 2002 года. К весне, благодаря активно проходившим обсуждениям, уже сформировался круг проблем, наметились пути возможного решения, был проведен анализ состояния российского рейтинга, получены и изучены некоторые дополнительные материалы (описание РС ЕГФ, статистика ЕГФ по более чем 100 000 партий). Уже к лету 2003 года, когда планировался очередной Кубок LG, был подготовлен "Проект РС", разосланный большинству членов президиума, и вопрос о рейтинге был включен в повестку запланированного во время Кубка заседания президиума. Итог - проект был принят за основу, я был назначен председателем рейтинг-комиссии (РК), а введение в действие новой РС было отложено до завершения программы, которую опять же взялся написать Ю.Беляев (планировалось первый рабочий вариант сделать уже к следующему году). Панюков также согласился подождать завершения этой работы и пока не покидать свой "рейтинг-пост".

В чем же заключались основные моменты реформы РС по новому проекту ("РС-2003")? Во-первых, анализ статистики показал, что формула вероятностей имеет вид, близкий к линейному по разнице рейтингов и гиперболическому по расстоянию игроков от рейтинга ИИ (3000). Новая формула настолько точно вписывалась в статистику ЕГФ (более 100 000 партий), что и спустя 5 лет, при увеличении статистики в полтора раза (более 150 000 партий), это согласие не было нарушено. Для сравнения: расхождение частот побед и вероятностей на обновленной статистике (2007 г.) при разнице рейтингов в среднем в 1 ранг по формуле ЕГФ составляло 6.4% достаточно равномерно по всей шкале, а по нашей формуле - всего 0.64%. Во-вторых, получила дальнейшее развитие идея аномальной коррекции - был введен коэффициент аномальности и поправки к стартовому рейтингу предполагалось интерполировать по нему для плавного перехода от "нормальных" поправок к "аномальным". В-третьих, были уточнены зависимости коэффициентов динамичности от уровней и вводилась плавная корректировка этих коэффициентов в сторону увеличения - по времени неучастия и для нестабильных игроков (аномалов и новичков) - с последующим снижением к общему уровню при постоянных выступлениях в турнирах. При этом на тот момент я еще не был знаком с результатами М.Гликмана (1993-98гг.) и его "РС Глико".

Интересна и сама история появления линейно-гиперболической вероятностной формулы РС-2003. Изучив статистику ЕГФ, я обнаружил, как в свое время и А.Чипли, характерное гиперболическое поведение частот при фиксированной разнице в 1, 2, 3 или 4 ранга - как функций от средних уровней игроков. Общаясь со своими друзьями-физиками (Н.Немов и В.Наумов), я показал им экспериментальные кривые частот и тут же получил "элементарное замечание": такое поведение действительно предполагает гиперболическую зависимость, но для проверки этой гипотезы нужно сделать преобразование зависимой переменной (частоты) Z = 1/Y. "Перевернув" частоты, мы тут же увидели явно выраженные "экспериментальные прямые", сходящиеся примерно в одной точке. Физический смысл такой точки пересечения был ясен - это та самая точка на оси рейтинга, которая соответствует идеальному игроку или "Го-Богу", т.к. при фиксированной разнице в рангах вероятность становится тем больше, чем ближе по рангу (рейтингу) встречающиеся игроки находятся к ИИ, а ИИ выигрывает всегда и у любого реального игрока, какой бы уровень у него не был, и должен соответствовать только одной точке на оси рейтинга.

Тут же была вытащена на свет программа обработки экспериментальных данных, одна ночь трудов - и результат был потрясающим: оказалось, что на данной статистике рейтинг "Го-Бога" должен быть 3000 очков (10 дан по любительской шкале, 12-13 про-дан) с точностью до сотых долей процента, а коэффициент наклона (по приращению рейтинга, отнесенному к среднему расстоянию до 3000) в формуле вероятностей должет быть близок к 1! К слову сказать, еще до этого момента, во время обсуждений статистики ЕГФ на форуме, я обратил внимание на то, что приращения частот при переходе от разницы в 1 ранг к двум, а потом к трем и четырем, для любого фиксированного уровня ведут себя очень линейно: они одинаковы в пределах статистической погрешности. Теперь гипотеза о линейном приращении частот при увеличении разницы рейтингов, в результате анализа полученных экспериментальных прямых для обращенных частот 1/Y, полностью подтвердилась. Так и возникла столь простая формула вероятностей в новом проекте РС-2003 (и потом в доработанном варианте РС-2005), не содержащая ни экспонент, ни интегралов.

Здесь резонно возникает вопрос, а почему у Чипли не получилось столь же простой формулы? Дело в том, что ему тоже помогали обрабатывать статистику специалисты, но они не рассматривали обращенные частоты и более того - относили функциональные зависимости не к средним рангам (рейтингам) встречающихся игроков, а к рангам более слабого в паре. в таком рассмотрении никаких прямых обнаружить нельзя, и можно только статистически определять общую (предположительно) асимптоту у нескольких гипербол. Естественно, несколько нелинейных (гиперболических) зависимостей при прямой статистической обработке дали общую асимптоту, не попавшую в точку 3000 - методом наименьших квадратов для двупараметрического семейства гипербол (дробно-экспоненциальная формула вероятностей из статистической модели парных сравнений Брэдли-Терри, 1952) было получено значение рейтинга "Го-Бога" в 3300 пунктов. Однако, рассмотрев все облако экспериментальных частот, Чипли решил сдвинуть полученную усредняющую кривую вверх, якобы делая запас "на вырост", и получил для рейтинга "Го-Бога" еще более завышенное значение в 4100 пунктов (12 камней форы для сильнейших профи), которое и заложил в дробно-экспоненциальную формулу вероятностей, приняв сам вид вероятностной функции (модель Брэдли-Терри) за аксиому. Мы же не постулировали вид кривой, а он сам "вылез" из анализа статистики партий.

Кстати, линейно-гиперболический вид зависимости вероятностей от разницы рейтингов и средних расстояний от ИИ получается и эвристическим путем, если предположить независимость ошибок в очках, совершаемых игроками при отдельных ходах в партии. В этом случае результат партии в очках можно приближенно считать асимптотически нормально распределенной случайной величиной и при некоторых дополнительных предположениях (в частности, об однопараметрической зависимости средней величины ошибок и стандарных отклонений от расстояния до ИИ) формула РС-2003 получается из интеграла Гаусса как разложение в ряд Тейлора по разнице рейтингов в окрестности нуля с оставлением членов не выше второго порядка. Все три кривые - дробно-экспоненциальная (РС ЕГФ), наша линейно-гиперболическая и нормальная гауссова (РС-90) при надлежащем согласованном выборе параметров имеют в точке 0 касание второго порядка. Т.е. и нашу формулу, и формулу ЕГФ можно рассматривать как аппроксимацию нормального распределения вероятностей со вторым порядком точности. Отсюда следует еще один интересный вывод: так как в нашей РС более общие формулы для коэффициентов динамичности, дополнительно включена аномалка (которую можно в принципе и отключать), а формула вероятностей аппроксимирует формулу ЕГФ (и УФГО тоже) при надлежащем выборе параметров, то РС ЕГФ и РС УФГО можно с достаточной точностью рассматривать как частные случаи нашей РС-2005, которая отличается от первоначального проекта РС-2003 только более точными формулами Гликмана для индивидуальных коэффициентов динамичности и введением стандарных отклонений вместо "коэффициентов стабильности" (РС-2003).

Вот мы и подошли к описанию завершающего этапа этой истории. В следующий раз рассказ пойдет о внедрении нового, доработанного на основе результатов М.Гликмана, проекта РС-2005 в практику.

Внедрение нового проекта в практику

Итак, подготовительный период реформы РС к концу 2004 года был практически завершен. Хотя и не удалось закончить программу в первоначально установленный срок (начало 2004 года), но полученный запас по времени позволил более детально проработать проект в теоретическом плане и даже провести ряд турниров с прицелом на введение в действие нового проекта. Так, были проведены форовые турниры - "Драгониада" на пошаговом го-сервере "Дракон", Кубок генконсула Японии во Владивстоке и два турнира в Москве, на примере которых отрабатывалась методика расчетов рейтинга. В этот период кто-то из участников обсуждений на форуме прислал мне ссылку на РС "Глико" и я ознакомился с результатами американского профессора М.Гликмана, которые идейно очень близки были моим представлениям о том, какой должна быть "почти идеальная РС". Оказалось, что все идеи РС-90 о переменности коэффициентов динамичности имеют математическое обоснование (я в этом не сомневался: интуитивно было ясно, что более стабильный игрок, достоверность рейтинга которого выше, должен больше влиять на изменение рейтинга других, а его собственный коэффициент динамичности должен быть ниже). У Гликмана были приведены более точные формулы для всех коэффициентов и они были перенесены в новый проект РС, чем фактически и завершилось оформление проекта РС-2005.

Итоговый проект РС-2005 был предложен на рассмотрение расширенного заседания президиума, состоявшегося 18-23 декабря в Москве. На этом заседании было решено ввести в действие новый проект РС с 01.01.2005, было рассмотрено и утверждено "Положение о рейтинг-комиссии", на основании которого и осуществляется вся работа РК по обсчету рейтинга и ведению РЛ вот уже более 3-х лет. Поскольку анализ российского рейтинга, проведенный в 2002-2004 годах, показал наличие деформаций шкалы, то решено было сформировать новый стартовый РЛ, в котором частично компенсировать наиболее существенные дефомации рейтинга у ряда игроков. Для этих целей РК обратилась к региональным организациям и получила от них экспертные оценки, с которыми предполагалось включать некоторых игроков в стартовый РЛ, Были учтены также методические расчеты рейтинга, проведенные по упоминавшимся выше четырем форовым турнирам. В общей сложности новые ЭО получили около 30 игроков в диапазоне 1 - 4 дан (все - на повышение рейтинга от текущего уровня по последнему РЛ Панюкова). Остальные игроки должны были включаться в новый РЛ по мере выступления в турнирах, а их стартовые рейтинги основывались на данных старых РЛ - по последнему выступлению в предшествовавший период, или допускалось давать иногда новые ЭО для игроков кю-уровня. Эта практика ЭО продолжалась вплоть до настоящего времени. Как показали последние оценки суммарных массовых объемов оттока рейтинга к растущим игрокам за 1990-2004гг., эти корректировки компенсировали только незначительную часть суммарных потерь рейтинга стабильными игроками. Поэтому в пересчетах рейтинга с конца февраля 2008 года была учтена общая разовая коррекция шкалы, основанная на данных статистического анализа турниров 2007 года, включая форовые, утвержденная президиумом РФГ(Б) во время "Интеллиады" в Перми.

В заключение хотелось бы сделать пару замечаний. Во-первых, внедрение нового проекта не проходило гладко, некоторые параметры пришлось уточнять уже по ходу дела - ведь опыта широкого использования новой методики еще не было. Так, динамичность аномалок регулируется заданием порога аномальности и в первом варианте настроек этот порог был задан довольно низким - около стандартного отклонения схемы Бернулли, что давало "заброс рейтинга" растущих игроков выше субъективно ожидаемого уровня. В частности, И.Немлий одним из первых получил аномалку в начале 2005 года, стартовав с 2361 и получив в итоге турнира 2549. Почти 200 очков на уровне средних данов! Это было неслыханно! Сразу был поднят шум: как так, за что и т.д. И хотя было ясно, что даже завышенная аномалка в единичных случаях не нарушает баланса рейтинга, скорее наоборот - еще и лучше работает на компенсацию оттока, но психологический фактор довлеет над многими тренерами и игроками: они предпочитают пусть умеренную прибавку с постоянным ростом, а не скачок с последующим снижением, даже если снижение будет невелико. В последствии Немлий потерял немного в рейтинге и стабилизировался около 2500, затем продолжил медленный рост, который не прекратился и сейчас. Но это уже было с новыми настройками аномалки. Летом 2005 года критерий аномальности был ужесточен до 1.5 стандартных отклонений и с тех пор вплоть до конца 2007 года никаких изменений в код программы и настройки алгоритма не вносилось. Однако за счет постепенного снижения у всех параметра "отклонение" общая динамика РС уменьшалась и концу 2007 года было решено сделать новую редакцию алгоритма, которая позволила повысить динамику (параметр S* - максимальная "неопределенность рейтинга" - был радикально уменьшен в среднем в 2.5 раза), отделить расчет игроков верхней части шкалы ("федералы") от остальных ("регионалы"), ввести еще несколько новых алгоритмических элементов, улучшающих корректировку быстро растущих игроков. Была включена и коррекция отклонений по времени, отключенная в первоначальном варианте программы.

Во-вторых, благополучие РС опирается не только на хорошо разработанную методику, но и на практику применения тех или иных турнирных схем. Не секрет, что засилие системы ММ в сочетании с полным отсутствием форовых рейтинг-турниров, наряду с некоторыми методическими ошибками и недоработками алгоритма, привели к печальным последствиям в старой РС-90. Поэтому одной из первых задач меня как председателя РК, отвечающего за весь комплекс мер по обеспечению корректного ведения РС, было добиться возрождения на практике форовых турниров. Еще с 2003 года я стал пропагандировать на форуме различные новые схемы форовых турниров, пытаясь привлечь к ним внимание организаторов. В какой-то мере это дало свои результаты - сейчас ежегодно и систематически проводятся форовые турниры в Сибири, в Москве, Санкт-Петербурге, и не систематически - в некоторых других городах. Однако по прежнему считаю количество форовых турниров недостаточным. Предагаю всем на местах активнее подойти к этой проблеме: чем чаще мы будем проводить такие турниры, тем крепче будет наш рейтинг, тем устойчивее будет РС. В перспективе нужно добиваться введения еще одной спортивной дисциплины - "Форовое го". Тогда будет и система отборочных соревнований, и Чемпионат России по форовому го, и проблема недостатка форовых турниров исчезнет. А методическая база для этого уже создана - имеется несколько хорошо зарекомендовавших себя форовых схем, позволяющих совместить принцип гандикапа и спортивный принцип выявления сильнейших в рамках одного турнира.





Статьи о Го, опубликованные в разное время и в разных местах, собранные для удобства в будущем