Больше чем просто DX Новости

CQ WW Контест Комитет открывает технику анализа логов

Наверное все заметили,что в последнее время CQ WW Контест Комитет становится все более и более открытым и ведет открытый диалог с контест сообществом

Один из ярких примеров этого недавнее интервью,которое дал Doug KR2Q во время вебинар проводимого PVRC в интернете
Приводим выдержку из данного интервью и думаем это поможет лучше понять методику судейства соревнований:

Каждый год мы работаем над улучшением нашего судейского программного обеспечения. Все присланные логи проходят одну и ту же процедуру компьютерной проверки. Каждое QSO в каждом логе сравнивается с QSO в логе корреспондента и сравнивается с базой кластерных спотов. В результате создаются несколько файлов, несколько из них (но не все):

1. BAD-file: в этом файле позывные тех, в чьих логах Ваш позывной записан неправильно. Цифра в процентном отношении считается как [сколько раз Ваш позывной был принят неправильно] деленное на [количество проверенных QSO в Вашем логе] и умноженное на 100 процентов. Например: KR2Q приняли неправильно 4 раза, проверенных QSO - 1081, итого (4/1081)*100=3.2%. Или: IZ5EKV - 48 раз принят неправильно, проверенных QSO в его логе - 1487 = 3.2%.

2. CROSS-Check file: величина обратная BAD-file - сколько раз (и процентов) Ваш позывной был принят ПРАВИЛЬНО.

3. CROSS BAND QSO file, сортируется по позывным: сколько раз для проверенных QSO была сделана запись "неправильный диапазон".

4. ERROR file: Список "невозможных" позывных в логе и где в логе эта ошибка появляется. Например это позывные в логе вида "4JEE", "T88", или "7Q1".

5. MM File: Показывает /MM станции и их правильную зону.

6. NIL file: Показывает количество связей, присутствующих в Вашем логе, но отсутствующих в логах корреспондентов. Процент показывает отношение таких связей из Вашего лога к общему проверенному количеству связей Вашего лога.

7. OBT (Off By Two) file (ошибка в 2-х знаках): Показывает вероятные позывные с вероятной ошибкой в 2-х знаках позывного корреспондента (в отличие от ошибки в одном знаке).

8. Reverse log file (Обратный лог): Список всех позывных из лога, также встречающихся в логах других станций, с указанием количества QSO с этой станцией в этих логах. Мы поговорим об этом позднее.

9. SPOT file (общий файл): Файл табличного вида по каждому участнику. Включает в себя: позывной, континент, префикс, зону, район, заявленную категорию, количество очков, количество связей, количество связей по дням, количество связей с проспоченной в кластере станцией всего и в процентах, то же самое по дням, количество связей с проспоченным в кластере мультом всего и в процентах, то же самое по дням, а также 89 других параметров. Прекрасный инструмент для сравнения 2-х выбранных станций.

10. TAB file (Общая таблица): Список всех участников: позывной, страна, континент, зона, заявленная категория, вероятный диплом, заявленный результат, первично вычисленный результат, окончательно вычисленный результат, величина в процентах, на которую был уменьшен заявленный результат, всего связей, зон и стран, то же самое по диапазонам (18 колонок), повторы, связи, в которых Ваш позывной был записан с ошибкой, связи, отсутствующие в логе корреспондента, уникальные позывные, связи с ошибкой в диапазоне, связи, присутствующие в чужом логе, но отсутствующие в Вашем, и все перечисленные данные в процентном отношении. Также отличный инструмент для сверки результатов участников.

11. UNIQUE file (файл уникальных позывных): список для каждого участника всех уникальных позывных со списком вероятных позывных, основанный на логах других участников. Например, KR2Q сработал с YL2OO, который оказывается уникальным позывным. Подсписок вероятных позывных включает: YL2AO, с которым работал только 1 корреспондент, YL2CO с 2-мя корреспондентами, YL2KO в логах 2478 корреспондентов и похоже именно это и есть реальный позывной, YL2LO - 1 корреспондент, и YL2PO - тоже только 1 корреспондент.

12. MONOBAND ENTRY file (список однодиапазонников): список заявленных связей с однодиапазонниками, но только те связи, в которых заявленный диапазон НЕ СОВПАДАЕТ с диапазоном, заявленным этим однодиапазонным корреспондентом.

13. Zone 2 file (2-ая зона): список только РЕАЛЬНЫХ станций из 2-ой зоны.

14. LOG file: оригинальный присланный Cabrillo-файл.

15. Output Log-file: Log-файл каждого участника ПОСЛЕ проведения компьютерного судейства.

16. NIL folder (папка с файлами NIL): список NIL, с QRG и временем.

17. Reverse Log folder (папка с "обратными логами"): просматриваются все полученные логи и на их основе создается файл. Если KR2Q работает с 1000 станций и 900 из них присылают логи, в этом файле будет 900 QSO. Файл содержит все данные из "других" логов, включая время и QRG.

18. SPOT folder (папка со SPOT файлами): содержит данный файл для каждого участника. Обьединяет данные из присланных логов с данными из "обратных" логов и с данными файла CLUSTER. Распознаются ошибки во времени связи, разница значений частоты, уникальные связи, (не)подтверждение связи после перекрестной проверки логов, проводилась ли связь на общий вызов или на поиск, частота из лога корреспондента, было ли QSO мультом, совпадает ли QSO с данными из кластера, и другие полезные и поддающиеся учету параметры.

Такие очень подробные файлы и данные позволяют нам сравнивать логи друг с другом. Если один или более из таких параметров оказываются очень высокими, программа может присвоить логу статус (флаг) выделяющегося из общего ряда для более внимательного изучения комитетом. Иногда такие логи оказываются "действительными" и отметка программы является результатом ложного срабатывания при честной работе участника. Должен сказать что только очень немногие логи вызывают сразу несколько срабатываний программы и требуют дальнейшего внимательного изучения. Подавляющее большинство участников играет честно.

Подробная статистика также требует внимательного изучения, независимо от флагов, присвоенных программой. Ни один из логов не дисквалифицируется либо переводится в другую подгруппу без ручной, строка за строкой, проверки исходного лога.

Иногда лог проходит компьютернуя проверку не получая флагов, но ручная проверка находит что-то стоящее дальнейшего расследования. Опытные контестмены могут заметить что-то сосвем необычное в логе, поскольку программа ограничена теми алгоритмами, которые в нее заложены.

К тому же, CQWWCC призывает к сотрудничеству всех заинтересованных. Если у Вас есть подозрения относительно какого-либо лога, дайте нам знать. Все мнения только приветствуются. Иногда такие мнения являются "выстрелом наудачу" и указанный лог оказывается вполне нормальным. Но иногда такие мнения имеют большую ценность и заставляют нас сделать проверку проблемного лога с самого начала.

Не так давно мы получили такое мнение о тех, кто, как тогда казалось, не вполне честно пользуется кластером. Иногда честная и напряженная работа в контесте приводит к мысли что участник пользовался кластером, заявившись в Unassisted. В большинстве случаев такой вывод оказывается статистически неподтвержденным.

В таких случаях мы пользуемся подходом "Спотят всех и всегда". Если Вы проследите за перемещением практически любого востребованного мульта (такие как HC8 или 3V8, или даже менее интересные мульты), Вы обнаружите что их спотят уже через 5 минут после их включения или смены частоты либо диапазона. Иногда их спотят сразу же! И еще, их спотят так часто, что подозрения теряют смысл. В таких случаях практически невозможно сработать такую станцию и не попасть под подозрение в использовании кластера. В некоторых случаях DX'a спотят так часто и так долго, что любой из нас мог их сработать в течение 4-х с половиной часов и тем не менее попасть в список подозреваемых в использовании кластера.

В общем случае чтобы поймать "кластерного обманщика" нужно анализировать эти данные, но одновременно нужно видеть и общую картину. Простых совпадений проведенных QSO и кластерных спотов на сработанную станцию недостаточно, и поэтому CQWWCC постоянно совершенствует и тестирует новые статистические методы.

Но пожалуйста, не дайте нам разубедить Вас в полезности Ваших попыток помочь. Нам нужна Ваша помощь - и чем раньше тем лучше. Не ждите пока результаты будут опубликованы чтобы воскликнуть "Эй, посмотрите-ка на это!"
Doug KR2Q