Разное

Parity error что это: Parity (чётность) и ECС — База полезных знаний

Parity (чётность) и ECС — База полезных знаний

Проверка чётности (Parity) и ЕСС для определения ошибок оперативной памяти компьютера.

Содержание:

Parity Checking (Проверка четности)

Один из установленных для отрасли стандартов IBM заключается в том, что в банке чипа памяти находятся девять бит данных: 8 бит на символ плюс 1 дополнительный бит, называемый бит чётности.

Бит чётности позволяет схеме управления памятью следить за другими 8 битами — встроенной перекрёстной проверкой целостности каждого байта в системе.

Первоначально все ПК-системы, для обеспечения точности, использовали память с проверкой чётности. Но, начиная с 1994 года, большинство поставщиков стали продавать системы без проверки на чётность и любые другие способы обнаружения или исправления ошибок «на лету». В этих системах использовались более дешёвые nonparity модули, которые экономили на стоимости памяти для системы около 10% -15%.

Parity память приводит к увеличению первоначальной стоимости системы, в первую очередь из-за дополнительных бит памяти. Parity не может исправить системные ошибки, но поскольку чётность может обнаруживать ошибки, она может информировать пользователя об этих ошибках памяти, когда они происходят.

С тех пор Intel, AMD и другие производители поставляют поддержку памяти ECC, в основном на серверных чипсетах и процессорах. Чипсеты и процессоры для систем стандартного рабочего стола или ноутбука обычно не поддерживают parity или ECC.

Как работает Parity Checking Works

IBM, для проверки ошибок, первоначально установила стандарт чётности. Попробуем объяснить, что подразумевается под нечётным паритетом.

Поскольку в памяти, в байте хранятся 8 отдельных бит, генератор проверки чётности, который является либо частью ЦП, либо расположен в специальном чипе на материнской плате, оценивает биты данных способом суммирования числа в 1 байте.

Если найдено чётное число, генератор проверки чётности создаёт 1 и сохраняет его как девятый бит (бит чётности) в чипе памяти чётности. Сумма для всех 9 бит (включая бит чётности), даёт нечётное число.

Если исходная сумма из 8 бит данных — нечётное число, созданный бит чётности будет 0, сохраняя сумму для всех 9 бит нечётным числом. Основное правило заключается в том, что значение бит чётности всегда выбирается так, чтобы сумма всех 9 бит (8 бит данных плюс 1 бит чётности) хранилась как нечётное число.

Если бы система использовала чётность, пример был бы таким же, за исключением того, что бит чётности был бы создан для обеспечения чётной суммы. Не имеет значения, используется ли чётное или нечётное соотношение. Система использует то или другое и полностью прозрачна для чипов памяти.

Помните, что 8 бит данных в байте нумеруются 0 1 2 3 4 5 6 7.

Для понимания приведём следующие примеры:

Бит данных: 0 1 2 3 4 5 6 7 Бит чётности

Значение бита данных: 1 0 1 1 0 0 1 1 0

В этом примере, поскольку общее количество бит данных со значением 1 — нечётное число (5), чтобы обеспечить нечётную сумму для всех 9 бит, бит чётности должен иметь значение 0.

Вот другой пример:

Бит данных: 0 1 2 3 4 5 6 7 Бит чётности

Значение бита данных: 1 1 1 1 0 0 1 1 1

В этом примере потому что общее количество битов данных со значением 1 — чётное число (6), бит чётности для создания нечётной суммы всех 9 битов, должен иметь значение 1.

Когда система считывает память обратно из хранилища, он проверяет информацию о чётности. Если байт (9-бит) имеет чётное количество бит, байт должен иметь сообщение об ошибке.

Система не может определить какой бит изменился и изменился ли только один бит. Например, если было изменено 3 бита, байт по-прежнему отметит ошибку проверки чётности. Однако, если изменились 2 бита, плохой байт может пройти незамеченным. Поскольку множественные битовые ошибки (в одном байте) редки, эта схема даёт разумное и недорогое указание на состояние памяти.

ECC

ECC — большой шаг за пределы обнаружения простых ошибок чётности. Вместо простого обнаружения ошибок, ECC позволяет исправлять одну битовую ошибку, что означает, система может продолжать работать без перерыва и без искажения данных.

Реализованное в большинстве ПК — ECC, может только обнаружить, не правильные, двухбитовые ошибки. Так как исследования показали, что примерно 98% ошибок памяти однобитовые, наиболее часто используемый тип ECC — это тот, в котором контроллер памяти обнаруживает и исправляет в доступных данных однобитовые ошибки. (Двухбитовые ошибки могут быть обнаружены, но не скорректированы.)

Этот тип ECC известен как исправление однобитовых ошибок с обнаружением двухбитовых ошибкой (SEC-DED) и требует дополнительных 7 проверочных бит над 32 битами в 4- байтовую систему и ещё 8 контрольных битов на 64 бита в 8-байтовой системе

Если в системе используется SIMM, для каждого банка добавляются два 36-битных (чётность) SIMM, которые составляют 72 бита, и ECC — на уровне банка. Если система использует DIMM, в качестве банка используется один 72-разрядный DIMM с контролем чётности/ECC и предоставляет дополнительные биты.

RIMM, в зависимости от чипсета и материнской платы, устанавливаются в одиночку или в парах. Если требуется чётность/ECC, они должны быть 18-битными версиями.

ECC предполагает, что контроллер памяти вычисляет контрольные биты в операции записи в память. Выполняет сравнение между считываемыми и вычисленными контрольными битами в операции чтения и, при необходимости, исправляя неправильные биты.

Дополнительная логика ECC в контроллере памяти не очень значительна в этой недорогой высокопроизводительной логике VLSI, но ECC фактически влияет на производительность памяти при записи.

Это связано с тем, что операция должна быть рассчитана на ожидание вычисления контрольных битов и, когда система дожидается исправленных данных, чтения. При написании части слова все слово должно быть сначала прочитано, пострадавший байт(ы) переписан, а затем вычислены новые контрольные биты. Это превращает операции замещения части слова в более медленную чтение-изменение записи. К счастью, удар по производительности небольшой, порядка нескольких процентов, поэтому компромисс для повышения надёжности хороший.

Большинство ошибок памяти имеют однобитовый характер, который ECC может исправить. Включение этого отказоустойчивого метода обеспечивает высокую надёжность системы и доступность обслуживания.

Система на базе ECC хороший выбор для серверов, рабочих станций или критически важных приложений, в которых стоимость потенциальной ошибки памяти перевешивает дополнительную память и стоимость исправления системы, а также гарантирует, что она не будет снижать надёжность системы.

К сожалению, большинство стандартных настольных и переносных ПК, материнских плат (чипсетов) и модулей памяти не поддерживают ECC.

Если вы хотите поддерживающую ECC систему, убедитесь, что все задействованные компоненты поддерживают ECC. Обычно это означает покупку более дорогих процессоров, материнских плат и оперативной памяти, предназначенных для серверных или высокопроизводительных приложений для рабочих станций.

Сообщения о ошибках BIOS (часть третья)

Здравствуйте, уважаемые читатели блога Help начинающему пользователю компьютера. Сегодня я предлагаю Вашему вниманию заключительную статью  из рубрики “сообщения о ошибках BIOS”. Сообщения БИОС, которые мы будем рассматривать, могут появляться на экране монитора во время загрузки системы.

Parallel Port Resource Conflict

Параллельный порт не работает, поскольку запрашиваемый им ресурс занят другим устройством. Проверьте исправность устройств и параметры распределение ресурсов в БИОС.

Parity Error

Ошибка контроля четности одного из устройств. Дополнительно должно указываться адрес ошибки.

PCI I/O Port Conflict

Устройства на шине PCI пытаются использовать один и тот же порт ввода/вывода. Проверьте исправность устройств и параметры распределение ресурсов в БИОС.

PCI IRQ Port Conflict

Устройства на шине PCI пытаются использовать одно и то же аппаратное прерывание. Проверьте исправность устройств и параметры распределение ресурсов в БИОС.

PCI Memory Conflict

Устройства на шине PCI пытаются использовать одну и ту же область оперативной памяти. Проверьте исправность устройств и параметры распределение ресурсов в БИОС.

Press A Key To Reboot

Возникла критическая ошибка в процессе загрузки. Для перезагрузки нажмите любую клавишу. Частое появление сообщения означает неисправность материнской платы.

Press ESC to skip Memory Test

Нажмите ESC для выполнения быстрого тестирования оперативной памяти.  

Press F1 To Disable NMI, F2 To Reboot

Система не может определить устройство, которое подало запрос на немаскируемое прерывание NMI. F1 – заблокировать NMI. F2 – выполнить перезагрузку системы.

Press TAB to show POST Screen

Нажмите ТАВ, чтобы увидеть экран с сообщениями процедуры POST.

Primary Boot Device Not Found

Система не обнаружила первый загрузочный диск. Проблема решается путем установки в BIOS Setup первым устройства, с которого будет загружаться операционная система.

Primary IDE channel no conductor cable installed

Устройство IDE использует для передачи данных 40-жильный кабель вместо 80-жильного. Это может отрицательно повлиять на скорость обмена данными.

Primary Master Hard Disk Fail

Тестирование жесткого диска, установленного как Primary Master (подключенного к IDE каналу Primary Master), завершилось неудачей. Необходимо проверить джампера на винчестере, правильность установки опций в BIOS Setup для винчестера. Также попробуйте использовать другой шлейф передачи данных. Если проблема не исчезла – возможно, неисправен НЖМД или IDE-контроллер.

Primary Master Hard Disk S.M.A.R.T Status Bad

Программа самотестирования жестких дисков предупреждает о возможной неисправности НЖМД, подключенных по каналу Primary.

Ошибка в BIOS также может иметь название:

Primary Slave Hard Disk S.M.A.R.T Status Bad

Primary/Secondary IDE Controller Resource Conflict

IDE-контроллер пытается использовать прерывание, которое уже занято, чем вызывает конфликт устройств. Необходимо вручную настроить прерывание для устройства.

Primary Slave Hard Disk Fail

Тестирование жесткого диска, установленного как Primary Slave (подключенного к IDE каналу Primary Slave), завершилось неудачей. Необходимо проверить джампера на винчестере, правильность установки опций в BIOS Setup для винчестера. Также попробуйте использовать другой шлейф передачи данных. Если проблема не исчезла – возможно, неисправен НЖМД или IDE-контроллер.

PS/2 Keyboard not found

Система не обнаружила клавиатуры, подключенной к порту PS/2 системной платы. Проверьте качество соединения.

PS/2 Mouse not found

Система не обнаружила мыши, подключенной к порту PS/2 системной платы. Проверьте качество соединения.

Secondary Master Hard Disk S.M.A.R.T Status Bad

Программа самотестирования жестких дисков предупреждает о возможной неисправности НЖМД, подключенных по каналу Secondary.

Ошибка в BIOS также может иметь название:

Secondary Slave Hard Disk S.M.A.R.T Status Bad

Secondary Master Hard Disk Fail

Тестирование жесткого диска, установленного как Secondary Master (подключенного к IDE каналу Secondary Master), завершилось неудачей. Необходимо проверить джампера на винчестере, правильность установки опций в BIOS Setup для винчестера. Также попробуйте использовать другой шлейф передачи данных. Если проблема не исчезла – возможно, неисправен НЖМД или IDE-контроллер.

Secondary Slave Hard Disk Fail

Тестирование жесткого диска, установленного как Secondary Slave (подключенного к IDE каналу Secondary Slave), завершилось неудачей. Необходимо проверить джампера на винчестере, правильность установки опций в BIOS Setup для винчестера. Также попробуйте использовать другой шлейф передачи данных. Если проблема не исчезла – возможно, неисправен НЖМД или IDE-контроллер.

Serial Port 1 Resource Conflict

Последовательный порт 1 не работает, поскольку запрашиваемый им ресурс занят другим устройством. Проверьте исправность устройств и параметры распределение ресурсов в БИОС.

Serial Port 2 Resource Conflict

Последовательный порт 2 не работает, поскольку запрашиваемый им ресурс занят другим устройством. Проверьте исправность устройств и параметры распределение ресурсов в БИОС.

Should Be Empty But EISA Board Found

Характеристики платы расширения EISA, которая используется системой, не совпадают с параметрами платы, выставленными в BIOS Setup. Необходимо обновить конфигурацию оборудования или выставить необходимые значения опций в БИОС, относящихся к данной плате.

Should Have EISA Board But Not Found

Плата расширения EISA не отвечает на запросы системы. Необходимо обновить конфигурацию оборудования или выставить необходимые значения опций в БИОС, относящихся к данной плате. Возможно, плата неисправна.

Slot Not Empty

Система не может обнаружить плату расширения.

Software Port NMI

Проблема с программным портом немаскируемого прерывания NMI.

Ошибка в BIOS также может иметь название:

Software Port NMI In operational

SPD Toler Error Serial Presence Detect (SPD)

Ошибка чтения данных из микросхемы SPD, которая хранит информацию о конфигурации оперативной памяти.

Static Device Resource Conflict

Плата расширения ISA (или другое устройство, которое не поддерживает технологию Plug and Play) пытается использовать прерывание, которое уже занято, чем вызывает конфликт ресурсов. Необходимо вручную настроить прерывание для платы.

System Device Resource Conflict

Системное устройство вызвало конфликт ресурсов

System halted, (Ctrl-Alt-Del) to reboot

Загрузка системы остановлена из-за критической ошибки. Для перезагрузки системы нажмите Ctrl—Alt—Del.

System RAM Failed At Offset: XXXX

Ошибка инициализации блоков оперативной памяти. Возможно, ошибка вызвана заменой модулей ОЗУ. В обратном случае, скорее всего, один из модулей неисправен. Также проверьте настройки оперативной памяти в BIOS Setup.

Unknown PCI Error

Ошибка на шине PCI, которую не возможно идентифицировать. Ошибку может вызвать неисправная PCI-плата, системная плата.

Warning! CPU has Been changed or Overclock fail

Попытка разгона системы завершилась неудачей. Компьютер будет загружен в безопасном режиме.

Сообщение в BIOS также может иметь название:

Warning! Now System is in Safe Mode. Please reset overclocking Features in the Setup Menu

Wrong Board In Slot

Плата расширения EISA некорректно отвечает на запросы системы.

VIRUS: Continue (Y/N)?

Возможно, обнаружен вирус. Продолжить?

Your computer case had been opened. Pres SPACE to continue.

Было произведено открытие корпуса системного блока. Для продолжения нажмите ПРОБЕЛ.

Сообщение в BIOS также может иметь название:

Intruder Detection Error

3.7 Проверка на ошибки четности — Mobile CSP Lucas

1- Объясните, как трюк с картами ошибок из урока 3.6 использует схему четности. Была ли это схема с четным или нечетным паритетом?

    Последняя карта в каждой строке и столбце была битом четности, который объяснял, сколько перевернутых карт было в строке/столбце. Если мы рассматриваем каждую перевернутую карту как 0, а каждую открытую карту как 1, схема в уроке 3.6 была схемой нечетной четности: последняя карта переворачивалась, если количество неперевернутых карт было четным.

2- Каковы некоторые ограничения использования битов четности для обнаружения ошибок?

    Биты четности могут только помочь нам идентифицировать наличие ошибки, и только примерно в половине возможных ошибок в строке битов. Если такая строка не проходит проверку на четность, может быть перевернуто любое нечетное количество битов. Даже если строка проходит тест, это может быть случай, когда четное количество битов было перевернуто, что приведет к тому, что количество единиц будет продолжать иметь то же значение четности, что и изначально, в результате чего строка битов пройдет тест. проверка четности с ошибкой. Наконец, даже если мы обнаруживаем ошибку, мы не можем знать только по битам четности, какие биты были перевернуты.

3- Другим типом обнаружения ошибок является контрольная сумма. Изучите, что такое контрольная сумма, а затем опишите ее своими словами. Может ли контрольная сумма определить, где произошла ошибка?

    Контрольная сумма — это дополнительное целое число в конце строки байтов. Он получается путем сложения всех целых значений байтов в строке и взятия модуля суммы с помощью делителя по вашему выбору. Если тот же расчет дает число, которое отличается от контрольной суммы, мы знаем, что произошла ошибка при передаче указанной строки байтов. Теперь строка байтов может пройти проверку контрольной суммы, если ошибка в байтах приводит к тому, что сумма их десятичного представления будет отличаться от исходной суммы, кратной делителю. Другими словами, есть одна возможная контрольная сумма, которая позволила бы избежать обнаружения ошибки: сама контрольная сумма. Однако чем больше выбранный вами делитель, тем больше возможных значений может иметь ваша контрольная сумма. Чем больше возможных значений контрольной суммы, тем меньше вероятность того, что проверка контрольной суммы вернет контрольную сумму для ошибки, совпадающей с последним байтом.

    Несмотря на то, что контрольная сумма (с большим делителем) с большой вероятностью обнаружит наличие ошибки, она не может сказать нам, какие байты содержат ошибку.

4- (Необязательно) Объясните своими словами разницу между обнаружением ошибок и их исправлением. Опишите, как процесс исправления ошибок, используемый в видео, позволяет компьютеру исправлять ошибки.

    Обнаружение ошибок — это практика, связанная с доказательством существования  ошибки где-то в строке битов, где исправление ошибок — это практика, связанная с 0024 на самом деле   найти  бит(ы), байт(ы) и т. д., содержащие ошибку, и найти способ вернуть их к исходному значению.

    Процесс исправления ошибок в видео касается сообщения из 4 бит. Он связывает каждый бит данных с двумя битами четности, а четвертый со всеми тремя битами четности. Если какой-либо из битов данных перевернут, соответствующие ему два бита четности не совпадут. Поскольку мы точно знаем, какие два бита четности не совпадают и с каким именно битом связаны эти два бита четности, мы можем безопасно инвертировать бит данных, чтобы исправить ошибку.

    Есть одна загвоздка: если биты четности сами по себе имеют ошибку, мы не сможем обнаружить ошибку в битах четности, а это означает, что вместо этого мы предположим наличие ошибки в битах данных и вызовем алгоритм исправления генерировать ошибку в битах данных.

E-Series E28xx или более новая платформа сообщает «Постоянная ошибка четности памяти контроллера»

  1. Последнее обновление
  2. Сохранить как PDF
Views:
264
Visibility:
Public
Votes:
0
Category:
e-series-systems
Specialty:
esg
Последнее обновление:
Применяется к
  • NetApp E2800
  • NetApp E5700
  • NetApp EF600
  • NetApp EF300
Проблема
  • Заявка AutoSupport открыта с ESDIAG:E-Series Уведомление от узла 1 (постоянная ошибка четности памяти контроллера) КРИТИЧЕСКАЯ
  • Журнал основных событий указывает, что контроллер обнаружил ошибку четности памяти.
    • П:20.06.22, 20:10:22 (20:10:22) 12592604 Постоянная ошибка четности памяти контроллера — Полка 99, отсек B <--CRITICAL
    • B:6/20/22, 20:10:22 (20:10:22) 1260 3101 Оповещение об асинхронном событии (AEN) для недавно зарегистрированного события — полка 99, отсек B
    • ----> Sense 6/40/81 = Внимание устройства — отказ компонента — буфер RAID
    • Дата/время: 20.06.22, 20:10:22

      Порядковый номер: 1259
      Тип события: 2604

      Категория события: Ошибка
      Приоритет: Критический
      Событие требует внимания: истина
      Предупреждение об отправке события: истина
      Видимость события: истина
      Описание: Постоянная ошибка четности памяти контроллера
      Коды события: 0/0/0
      Тип компонента: Контроллер
      Расположение компонента: Полка 99, отсек B
      Регистрируется: Контроллер в отсеке B

      Исходные данные:
      4d 45 4c 48 03 00 00 00 eb 04 00 00 00 00 00 00
      04 26 18 11 2e d4 b0 62 00 00 00 00 01 00 00 00
      00 00 00 00 01 00 00 00 22 00 00 00 22 00 00 00
      08 00 00 00 63 00 00 00 02 00 00 00 01 00 00 00
      0a 00 00 00 01 00 00 00 00 00 00 00 00 00 00 00
      00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
      01 00 00 00 42 00 00 00 00 00 00 00 00 00 00 00
      01 00 00 00 00 00 01 00 00 00 00 00

  • excLogShow и hwLogShow , если они доступны, указывают на
    неисправимую ошибку памяти
    на определенном модуле DIMM или модулях DIMM.

    -- Запись журнала № 2 (ядро 0) 20 июня 2022 г. 20:10:16 ----
    Неисправимая ошибка памяти по адресу 0x8481e0080 (DIMM 1, устройство 0) sec_bank:10.


    ---- Запись журнала № 0 (ядро 0) 20 июня 2022 г. 20:10:16 ----
    Неисправимая ошибка памяти на 0x8481e0080 (DIMM 1, устройство 0) sec_bank:10.

Войдите, чтобы просмотреть все содержимое этой статьи базы знаний.

Впервые в NetApp?

Узнайте больше о нашей удостоенной наград поддержке

NetApp не дает никаких заверений или гарантий в отношении точности, надежности или пригодности к использованию какой-либо информации или рекомендаций, представленных в данной публикации, или в отношении любых результатов, которые могут быть получены при использовании информации или соблюдении каких-либо рекомендаций, представленных в данной публикации. Информация в этом документе распространяется КАК ЕСТЬ, и использование этой информации или реализация любых рекомендаций или методов, изложенных в данном документе, является обязанностью заказчика и зависит от способности заказчика оценить и интегрировать их в операционную среду заказчика.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *