Понятия кодов Хемминга, их возникновение, сфера применения. Понятие и назначение самоконтролирующихся и самокорректирующихся кодов. Принципы построения самокорректирующихся кодов. Обнаружение наличия и места нахождения ошибок с помощью кодов Хэмминга.
Коды Хемминга являются самоконтролирующимся кодами, то есть коды, позволяющие автоматически обнаруживать наиболее вероятные ошибки при передаче данных Для построения их достаточно приписать к каждому слову один добавочный (контрольный) двоичный разряд и выбрать цифру такого разряда так, чтобы общее количество единиц в изображении любого числа было, например, четным. Одиночная ошибка в каком-либо разряде, передаваемого слова (в том числе, может быть, и в контрольном разряде) изменит четность общего количества единиц. При этом, разумеется, мы не получаем никаких указаний о том, в каком именно разряде произошла ошибка, и, следовательно, не имеем возможности исправить ее. Предположим далее, что все разрядов кода разбиты на контрольные группы, которые частично перекрываются, причем так, что единицы в двоичном представлении номера разряда указывают на его принадлежность к определенным контрольным группам. Среди разрядов кода при этом имеется k разрядов, каждый из которых принадлежит только к одной контрольной группе: Разряд № 1: 110 = …0000012 принадлежит только к 1-й контрольной группе.Предложенные Хэммингом регулярные методы построения кодов, корректирующих ошибки, имеют фундаментальное значение. Они демонстрируют инженерам практическую возможность достижения пределов, на которую указывали законы теории информации.
План
Содержание
Введение
Самоконтролирующиеся коды
Самокорректирующиеся коды
Код Хэмминга
Принцип построения кодов Хемминга
Заключение
Список литературы
Введение
Коды Хемминга - наиболее известные и, вероятно, первые из самоконтролирующихся и самокорректирующихся кодов. Построены они применительно к двоичной системе счисления.
Код Хэмминга используется в некоторых прикладных программах в области хранения данных, особенно в RAID 2 (избыточный массив независимых/недорогих дисков для ПЭВМ); кроме того, метод Хемминга давно применяется в памяти типа ECC и позволяет "на лету" исправлять однократные и обнаруживать двукратные ошибки.
В середине 40-х годов Ричард Хемминг работал в знаменитых Лабораториях Белла на счетной машине Bell Model V. Это была электромеханическая машина, использующая релейные блоки, скорость которых была очень медленной: один оборот за несколько секунд. Данные вводились в машине с помощью перфокарт, и поэтому в процессе чтения часто происходили ошибки. В рабочие дни использовались специальные коды, чтобы обнаруживать и исправлять найденные ошибки, при этом оператор узнавал об ошибке по свечению лампочек, исправлял и запускал машину. В выходные дни, когда не было операторов, при возникновении ошибки машина автоматически выходила из программы и запускала другую.
Хемминг часто работал в выходные дни, и все больше и больше раздражался, потому что часто был должен перегружать свою программу изза ненадежности перфокарт. На протяжении нескольких лет он проводил много времени над построением эффективных алгоритмов исправления ошибок. В 1950 году он опубликовал способ, который на сегодняшний день мы знаем, как код Хемминга.
Самоконтролирующиеся коды
Коды Хемминга являются самоконтролирующимся кодами, то есть коды, позволяющие автоматически обнаруживать наиболее вероятные ошибки при передаче данных Для построения их достаточно приписать к каждому слову один добавочный (контрольный) двоичный разряд и выбрать цифру такого разряда так, чтобы общее количество единиц в изображении любого числа было, например, четным. Одиночная ошибка в каком-либо разряде, передаваемого слова (в том числе, может быть, и в контрольном разряде) изменит четность общего количества единиц. Счетчики по модулю 2, подсчитывающий количество единиц, которые содержатся среди двоичных цифр числа, могут давать сигнал о наличии ошибок.
При этом, разумеется, мы не получаем никаких указаний о том, в каком именно разряде произошла ошибка, и, следовательно, не имеем возможности исправить ее. Остаются незамеченными также ошибки, возникающие одновременно в двух, в четырех или вообще в четном количестве разрядов. Впрочем, двойные, а тем более четырехкратные ошибки полагаются маловероятными.
Самокорректирующиеся коды
Коды, в которых возможно автоматическое исправление ошибок, называются самокорректирующимися. Для построения самокорректирующегося кода, рассчитанного на исправление одиночных ошибок, одного контрольного разряда недостаточно. Как видно из дальнейшего, количество контрольных разрядов k должно быть выбрано так, чтобы удовлетворялось неравенству или , где m - количество основных двоичных разрядов кодового слова. Минимальные значения k при заданных значениях m, найденные в соответствии с этим неравенством, приведены в таблице № 1.
Таблица 1
Диапазон, m Диапазон, m Диапазон, m
1 2 2-4 3 - -
5-11 4 12-26 5 27-40 6
Имея разрядов, самокорректирующийся код можно построить следующим образом. Присвоим каждому из разрядов свой номер - от 1 до ; запишем эти номера в двоичной системе счисления. Поскольку , каждый номер можно представить, очевидно, k-разрядным двоичным числом.
Предположим далее, что все разрядов кода разбиты на контрольные группы, которые частично перекрываются, причем так, что единицы в двоичном представлении номера разряда указывают на его принадлежность к определенным контрольным группам. Например, разряд № 5 принадлежит к 1-й и 3-й контрольным группам, потому что в двоичном представлении его номера 510 = …0001012. Можно видеть, что 1-й и 3-й разряды содержат единицы.
Среди разрядов кода при этом имеется k разрядов, каждый из которых принадлежит только к одной контрольной группе: Разряд № 1: 110 = …0000012 принадлежит только к 1-й контрольной группе.
Разряд № 2: 210 = …0000102 принадлежит только к 2-й контрольной группе.
Разряд № 4: 410 = …0001002 принадлежит только к 3-й контрольной группе.
Разряд № 2k ? 1 принадлежит только к k-й контрольной группе.
Эти k разрядов мы и будем считать контрольными. Остальные m разрядов, каждый из которых принадлежит по меньшей мере к двум контрольным группам, будут информационными разрядами.
В каждом из k контрольных групп будем иметь по одному контрольному разряду. В каждый из контрольных разрядов поместим такую цифру (0 или 1), чтобы общее количество единиц в его контрольной группе было четным.
Например, довольно распространен код Хемминга с m=7 и k=4.
Пусть исходное слово (кодовое слово без контрольных разрядов) - 01101012.
Обозначим - контрольный разряд №i; а - информационый разряд №i, где i = 1,2,3,4…
Распределение контрольных и информационных разрядов
Информационное кодовое слово: 0 1 1 0 1 0 1
1 0 1 0 1 1
0 0 1 0 0 1
0 1 1 0
0 1 0 1
Кодовое слово с контрольными разрядами: 1 0 0 0 1 1 0 0 1 0 1
Интересно посмотреть, как перекрываются контрольные группы в данном случае (Рис №1). Первая группа контролирует разряды № 3,7,5 исходного кода, вторая - 3,7,6… (№ группы = № контрольного разряда). Очевидно, что они частично перекрываются.
Рис.№1. Первая группа контролирует разряды № 3,7,5 исходного кода, вторая - 3,7,6…. Очевидно, что они частично перекрываются
Предположим теперь, для примера, что при передаче данного кодового слова 10001100101 произошла ошибка в 11-м разряде, так, что было принято новое кодовое слово 10001100100. Произведя в принятом коде проверку четности внутри контрольных групп, мы обнаружили бы, что количество единиц нечетно в 1-й,2-й и 4-й контрольных группах, и четно в 3-й контрольной группе. Это указывает, во-первых, на наличие ошибки, во-вторых, означает, что номер ошибочно принятого разряда в двоичном представлении содержит единицы на первом, втором и четвертом местах и нуль - на третьем месте, так как ошибка только одна, и 3-я контрольная сумма оказалась верной.
Распределение контрольных и информационных разрядов Контроль по четности в группе Контрольный бит
Переданное кодовое слово: 1 0 0 0 1 1 0 0 1 0 1
Принятое кодовое слово: 1 0 0 0 1 1 0 0 1 0 0
1 0 1 0 1 0 Fail 1
0 0 1 0 0 0 Fail 1
0 1 1 0 Pass 0
0 1 0 0 Fail 1
Из таблицы следует, что ошибка произошла в 11-м разряде и ее можно исправить. Построенный код, разумеется, не рассчитан на возможность одновременной ошибки в двух разрядах.
Например (Рис №2), когда ошибки одновременно прошли в 3-м и 7-м разрядах исходного кода, первый и второй контрольные биты даже не замечают подмены.
Рис.№2 Когда ошибки прошли в 3-м и 7-м разрядах исходного кода, первый и второй контрольные биты даже не замечают ошибки
Когда в принятом коде производится проверка четности внутри контрольных групп, случай двойной ошибки ничем внешне не отличается от случая одиночной ошибки.
Например, предположим теперь, что при передаче данного кодового слова 10001100101 произошли ошибки в 3-м и 6-м разрядах, так, что принято кодовое слово 10101000101.
Распред. контр и информационных разрядов Контроль по четности в группе Контр.бит
Переданное кодовое слово: 1 0 0 0 1 1 0 0 1 0 1
Принятое кодовое слово: 1 0 1 0 1 0 0 0 1 0 1
1 1 1 0 1 1 Fail 1
0 1 0 0 0 1 Pass 0
0 1 0 0 Fail 1
0 1 0 1 Pass 0
Вывод: ошибка произошла в 5-м разряде Истинное кодовое слово: 1 0 0 0 1 1 0 0 1 0 1 Ошибочное кодовое слово: 1 0 1 0 1 0 0 0 1 0 1 Исправленное кодовое слово: 1 0 1 0 0 0 0 0 1 0 1 Результат получается еще более отдаленным от правильного, чем принятый код. Исправление кода по общему правилу не только не улучшило, но даже ухудшило бы дело.
Код Хэмминга
Можно построить и такой код, который обнаруживал бы двойные ошибки и исправлял одиночные. Для этого к самокорректирующемуся коду, рассчитанному на исправление одиночных ошибок, нужно приписать еще один контрольный разряд (разряд двойного контроля). Полное количество разрядов кода при этом будет m k 1. Цифра в разряде двойного контроля устанавливается такой, чтобы общее количество единиц во всех m k 1 разрядах кода было четным. Этот разряд не включается в общую нумерацию и не входит ни в одну контрольную группу.
Например, код Хемминга с m=7 и k=4 Пусть информационное кодовое слово - 0110101 код хемминг ошибка самокорректирующийся
Распределение контрольных и информационных разрядов
Информационное кодовое слово: 0 1 1 0 1 0 1
1 0 1 0 1 1
0 0 1 0 0 1
0 1 1 0
0 1 0 1
Кодовое слово с контрольными разрядами: 1 0 0 0 1 1 0 0 1 0 1 1
При этом могут быть следующие случаи.
1. В принятом коде в целом и по всем контрольным группам количество единиц четно. Если тройные ошибки и ошибки в большем количестве разрядов исключаются, то первый случай соответствует безошибочному приему кода. Например, Таблица 6
№ разряда: 0001 0010 0011 0100 0101 0110 0111 1000 1001 1010 1011 Контроль по четности в группе Контрольный бит Контроль по четности в целом Контрольный бит в целом
Распределение контрольных и информационных разрядов
Переданное кодовое слово: 1 0 0 0 1 1 0 0 1 0 1
Принятое кодовое слово: 1 0 0 0 1 1 0 0 1 0 1
1 0 1 0 1 1 Pass 0
0 0 1 0 0 1 Pass 0
0 1 1 0 Pass 0
0 1 0 1 Pass 0 1 Pass
2. В принятом коде в целом количество единиц нечетно, но во всех контрольных группах количество единиц четно. Второй случай - ошибки только в разряде двойного контроля. Например,
Таблица 7
№ разряда: 0001 0010 0011 0100 0101 0110 0111 1000 1001 1010 1011 Контроль по четности в группе Контрольный бит Контроль по четности в целом Контрольный бит в целом
Распределение контрольных и информационных разрядов
Переданное кодовое слово: 1 0 0 0 1 1 0 0 1 0 1
Принятое кодовое слово: 1 0 0 0 1 1 0 0 1 0 1
1 0 1 0 1 1 Pass 0
0 0 1 0 0 1 Pass 0
0 1 1 0 Pass 0
0 1 0 1 Pass 0 0 Pass
3. В принятом коде в целом и в некоторых из контрольных групп количество единиц нечетно. Третий случай - одиночной ошибки в каком-либо из остальных разрядов (можно исправить в соответствии с приведенными выше правилами).
Таблица 8
№ разряда: 0001 0010 0011 0100 0101 0110 0111 1000 1001 1010 1011 Контроль по четности в группе Контрольный бит Контроль по четности в целом Контрольный бит в целом
Распределение контрольных и информационных разрядов
Переданное кодовое слово: 1 0 0 0 1 1 0 0 1 0 1
Принятое кодовое слово: 1 0 0 0 1 1 0 0 1 0 0
1 0 1 0 1 0 Fail 0
0 0 1 0 0 0 Fail 0
0 1 1 0 Pass 0
0 1 0 0 Fail 1 1 Fail
Из таблицы следует, что ошибка произошла в 11-м разряде и что ее можно исправить.
4. В принятом коде в целом количество единиц четно, но в некоторых контрольных группах имеется нечетное количество единиц - двойная ошибка
Таблица 9
№ разряда: 0001 0010 0011 0100 0101 0110 0111 1000 1001 1010 1011 Контроль по четности в группе Контрольный бит Контроль по четности в целом Контрольный бит в целом
Распределение контрольных и информационных разрядов
Увеличивая дальше количество контрольных разрядов, можно было бы построить коды, рассчитанные на исправление двойных ошибок и обнаружение тройных и т.д. Однако методы построения этих кодов не вполне разработаны.
Принцип построения кодов Хемминга
Построение кодов Хемминга базируется на принципе проверки на четность веса W (числа единичных символов) в информационной группе кодового блока. Поясним идею проверки на четность на примере простейшего корректирующего кода, который так и называется кодом с проверкой на четность или кодом с проверкой по паритету (равенству). В таком коде к кодовым комбинациям без избыточного первичного двоичного k-разрядного кода добавляется один дополнительный разряд (символ проверки на четность, называемый проверочным, или контрольным). Если число символов 1 исходной кодовой комбинации четное, то в дополнительном разряде формируют контрольный символ 0, а если число символов 1 нечетное, то в дополнительном разряде формируют символ 1. В результате общее число символов 1 в любой передаваемой кодовой комбинации всегда будет четным. Таким образом, правило формирования проверочного символа сводится к следующему: r1 = i1 ? i2 ? ... ? i*k, где i - соответствующий информационный символ (0 или 1); k - общее их число а под операцией "?" здесь и далее понимается сложение по mod 2. Очевидно, что добавление дополнительного разряда увеличивает общее число возможных комбинаций вдвое по сравнению с числом комбинаций исходного первичного кода, а условие четности разделяет все комбинации на разрешенные и неразрешенные. Код с проверкой на четность позволяет обнаруживать одиночную ошибку при приеме кодовой комбинации, так как такая ошибка нарушает условие четности, переводя разрешенную комбинацию в запрещенную. Критерием правильности принятой комбинации является равенство нулю результата S суммирования по mod 2 всех n символов кода, включая проверочный символ r1. При наличии одиночной ошибки S принимает значение 1: S = r1 ? i1 ? i2 ? ... ? i*k =? 0 - ошибки нет, = ?1 - однократная ошибка. Этот код является (k 1, k) - кодом, или (n, n-1) - кодом. Минимальное расстояние кода равно двум (d*min = 2), и, следовательно, никакие ошибки не могут быть исправлены. Простой код с проверкой на четность может использоваться только для обнаружения (но не исправления) однократных ошибок. Увеличивая число дополнительных проверочных разрядов и формируя по определенным правилам проверочные символы r, равные 0 или1, можно усилить корректирующие свойства кода так, чтобы он позволял не только обнаруживать, но и исправлять ошибки. На этом и основано построение кодов Хемминга. Коды Хемминга позволяют исправлять одиночную ошибку, с помощью непосредственного описания. Для каждого числа проверочных символов r = 3, 4, 5… существует классический код Хемминга с маркировкой (n, k) = (2r-1, 2r-1 - r), (3.20) т. е. (7,4), (15,11), (31,26) … При других значениях числа информационных символов k получаются так называемые усеченные (укороченные) коды Хемминга. Так, для Международного телеграфного кода МТК-2, имеющего5 информационных символов, потребуется использование корректирующего кода (9,5), являющегося усеченным от классического кода Хемминга (15,11), так как число символов в этом коде уменьшается(укорачивается) на 6.
Вывод
Предложенные Хэммингом регулярные методы построения кодов, корректирующих ошибки, имеют фундаментальное значение. Они демонстрируют инженерам практическую возможность достижения пределов, на которую указывали законы теории информации. Эти коды нашли практическое применение при создании компьютерных систем. Работа Хэмминга привела к решению проблемы более плотной упаковки для конечных полей. Он ввел в научный обиход важнейшие понятия теории кодирования. Работа Хэмминга сыграла ключевую роль в последующем развитии теории кодирования и стимулировала обширные исследования, выполненные в последующие годы.
Коды Хэмминга позволяют не только обнаружить наличие ошибки, но и место ее нахождения и, следовательно, дают возможность ее исправить.
Список литературы
1. Питерсон У., Уэлдон Э. Коды, исправляющие ошибки: Пер. с англ. М.: Мир, 1976, 600 c.
2. Кларк Д., Кейн Д. Кодирование с исправлением ошибок в системах цифровой связи: Пер. с англ. М.: Радио и Связь,1987, 300 с.