ГОСТ Р 54995-2012
НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ
ТЕЛЕВИДЕНИЕ ВЕЩАТЕЛЬНОЕ ЦИФРОВОЕ. ТРЕБОВАНИЯ К КОДИРОВАНИЮ АУДИО И ВИДЕОСИГНАЛОВ ДЛЯ ПРИЛОЖЕНИЙ ВЕЩАНИЯ, ОСНОВАННЫХ НА ТРАНСПОРТНЫХ ПОТОКАХ MPEG-2
Общие технические требования
Digital broadcast television. Requirements to the coding of audio and video signals for broadcasting applications, based on the transport streams of MPEG-2. General technical requirements
ОКС 33.170
ОКП 657400
Дата введения 2013-04-01
Предисловие
Цели и принципы стандартизации в Российской Федерации установлены Федеральным законом от 27 декабря 2002 г. N 184-ФЗ "О техническом регулировании", а правила применения национальных стандартов Российской Федерации - ГОСТ Р 1.0-2004 "Стандартизация в Российской Федерации. Основные положения"
Сведения о стандарте
1 РАЗРАБОТАН Федеральным государственным унитарным предприятием "Ордена Трудового Красного Знамени научно-исследовательский институт радио", Самарский филиал "Самарское отделение научно-исследовательского института радио" (филиал ФГУП "НИИР-СОНИИР")
2 ВНЕСЕН Управлением технического регулирования и стандартизации Федерального агентства по техническому регулированию и метрологии
3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 19 сентября 2012 г. N 359-ст
4 Настоящий стандарт разработан с учетом основных нормативных положений стандарта Европейского института по стандартизации в области телекоммуникаций (ETSI) ЕТСИ "Телевидение вещательное цифровое. Техническая спецификация. Технические характеристики кодирования сигналов изображения и звукового сопровождения для приложений вещания транспортного потока MPEG-2"* (ETSI TS 101 154 V1.9.1 (2009-09) "Technical Specification. Digital Video Broadcasting (DVB); Specification for the Use of Video and Audio Coding in Broadcasting Applications based on the MPEG-2 Transport Stream")
________________
* Доступ к международным и зарубежным документам, упомянутым в тексте, можно получить, обратившись в Службу поддержки пользователей. - .
5 ВВЕДЕН ВПЕРВЫЕ
Информация об изменениях к настоящему стандарту публикуется в ежегодно издаваемом информационном указателе "Национальные стандарты", а текст изменений и поправок - в ежемесячно издаваемых информационных указателях "Национальные стандарты". В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ежемесячно издаваемом информационном указателе "Национальные стандарты". Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет
1 Область применения
Настоящий стандарт устанавливает требования и рекомендации к кодерам и интегрированным приемникам-декодерам [приемникам-декодерам] (Integrated Receiver-Decoder; IRD) для спутниковых, кабельных и наземных радиовещательных систем распределения, использующих стандарты MPEG-2 и H.264/AVC.
Эти требования обеспечивают минимально необходимую совместимость приемников-декодеров с параметрами потоков цифрового телевизионного вещания.
Правила работы для кодеров, содержащиеся в настоящем стандарте, включают в себя функции и ограничения, которых разработчики системы кодирования должны придерживаться для того, чтобы гарантировать правильное декодирование передач существующими приемниками-декодерами. Эти ограничения могут носить обязательный или рекомендательный характер.
В стандарте приемники-декодеры классифицируются по следующим группам параметров:
- по четкости изображения:
- стандартная четкость (Standard Definition Television; SDTV);
- высокая четкость (High Definition Television; HDTV);
- по стандарту кодирования изображения:
- MPEG-2;
- H.264/AVC;
- по частоте видеокадров:
- 25 Гц;
- 50 Гц;
- по объему функций декодирования потоков битов:
- приемники-декодеры базового уровня;
- приемники-декодеры с цифровым интерфейсом;
- по профилю кодирования звука (потоков битов аудио профилей) (в соответствии с разделом 6 настоящего стандарта).
Параметры полноэкранных разрешений яркости для профилей SDTV приведены в приложении А.
Параметры вспомогательных данных, связанных с изображением и передаваемых в элементарном потоке видеоданных, представлены в приложении Б.
В настоящем стандарте функциональность приемника-декодера определена в форме ограничений на обработку видеоформатов и аудиоформатов и формирования потоков битов, которые приемники-декодеры базового уровня должны декодировать в соответствии с установленными нормами. Требования к функциям приемников-декодеров базового уровня не накладывают ограничений на состав дополнительных функций, которые могут выполнять приемники-декодеры, и не должны быть интерпретированы как верхний предел их возможностей.
Рекомендации для приемников-декодеров в настоящем стандарте выполнены на основе следующих принципов:
- приемники-декодеры целесообразно разрабатывать с учетом возможности появления в будущем совместимых расширений синтаксиса потока битов;
- все "зарезервированные" и "частные" биты в видеоформатах и аудиоформатах транспортного потока MPEG-2 должны игнорироваться приемниками-декодерами, при разработке которых не предполагалось использование этих форматов.
Разделы 4, 5, 6 и приложения настоящего стандарта содержат требования и рекомендации к характеристикам системного уровня DVB, к параметрам кодирования потоков битов видео и аудио контента и к параметрам декодирования этих потоков битов.
2 Нормативные ссылки
В настоящем стандарте использованы нормативные ссылки на следующие стандарты:
ГОСТ Р 52210-2004 Телевидение вещательное цифровое. Термины и определения
ГОСТ Р 52591-2006 Система передачи данных пользователя в цифровом телевизионном формате. Основные параметры
ГОСТ Р 53528-2009 Телевидение вещательное цифровое. Требования к реализации протокола высокоскоростной передачи информации DSM-CC. Основные параметры
Примечание - При пользовании настоящим стандартом целесообразно проверить действие ссылочных стандартов в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет или по ежегодно издаваемому информационному указателю "Национальные стандарты", который опубликован по состоянию на 1 января текущего года, и по соответствующим ежемесячно издаваемым информационным указателям, опубликованным в текущем году. Если ссылочный стандарт заменен (изменен), то при пользовании настоящим стандартом следует руководствоваться заменяющим (измененным) стандартом. Если ссылочный стандарт отменен без замены, то положение, в котором дана ссылка на него, применяется в части, не затрагивающей эту ссылку.
3 Термины, определения и сокращения
3.1 В настоящем стандарте применены термины по ГОСТ Р 52210, ГОСТ Р 52591, ГОСТ Р 53528, а также следующие термины с определениями:
3.1.1 аудио (audio): Термин, относящийся к сигналам, используемым в системах кодирования, передачи, приема, декодирования и воспроизведения звука.
3.1.2 вектор панорамирования (Pan Vector): Горизонтальное смещение в видеокадре от центральной позиции, определенное ненулевым значением поля frame_centre_horizontal_offset в потоке видео MPEG.
3.1.3 вещатель (broadcaster): Организация, которая собирает последовательность событий или программ для доставки.
3.1.4 видео (video): Термин, относящийся к сигналам, используемым в системах кодирования, передачи, приема, декодирования и воспроизведения изображений.
3.1.5 дескриптор (descriptor): Кодовое слово, служащее для описания типа передаваемых данных.
3.1.6 интегрированный приемник-декодер [приемник-декодер] (Integrated Receiver-Decoder; IRD): Приемник-декодер, выполняющий прием и декодирование потока битов соответствующего стандарта (формата, профиля) кодирования.
3.1.7 идентификатор типа пакета (packet identifier; PID): Тринадцатибитовый указатель в заголовке транспортного пакета, определяющий принадлежность пакета тому или иному потоку данных.
3.1.8 интероперабельность [функциональная совместимость] (interoperability): Способность устройств, систем или сетей устанавливать соединения друг с другом и обмениваться информацией независимо от применяемых ими протоколов и используемых программно-аппаратных средств.
3.1.9 интерфейс: Семантическая и синтаксическая конструкция в коде программы, используемая для специфицирования услуг, предоставляемых классом или компонентом. Интерфейс определяет:
- границу взаимодействия между классами или компонентами, специфицируя определенную абстракцию, которую осуществляет реализующая сторона;
- перечень возможных вычислений, которые может выполнить та или иная часть программы, включая описание того, какие аргументы и в каком порядке требуется передавать на вход алгоритмам из этого перечня.
3.1.10 информация о службах (Service Information, SI): Совокупность таблиц, которые передаются в составе транспортных потоков MPEG-2, предназначенных для вещания. К основным таблицам информации о службах относятся таблицы, характеризующие параметры сети передачи, компоненты служб: таблица объединения букета программ (Bouquet Association Table; BAT), таблица информации о событиях (Event Information Table; EIT), таблица состава программы (Program Map Table; PMT), таблица состояния событий (Running Status Table; RST), таблица описания служб (Service Description Table; SDT), таблица времени и даты (Time and Date Table; TDT), таблица смещения времени (Time Offset Table; TOT).
3.1.11 контекст (context): Состояние системы; окружение системы, среда выполнения программы; текущая ситуация.
3.1.12 контент (content): Содержание, мультимедийный продукт (например, телевизионная программа).
3.1.13 медиа (media): В контексте стандарта - информационные сообщения, передаваемые по каналам вещания (кадры звука MPEG, кадры изображения MPEG, кадры изображения JPEG, файлы текста, субтитров, загружаемых шрифтов, графическая информация в формате PNG).
3.1.14 пакетированный элементарный поток; ПЭП (Packetized Elementary Stream; PES): Пакетированный элементарный поток, в котором данные разбиты на пакеты и снабжены заголовками.
3.1.15 пользователь (user): Оконечная система, которая может передавать или принимать информацию от других таких же оконечных систем с использованием сети и которая может функционировать как клиент, сервер или как клиент и сервер одновременно.
3.1.16 поток битов DVB: Собирательный термин, относящийся к потокам, формируемым кодерами, совместимыми со стандартами DVB.
3.1.17 поток битов АС-3 или АС-3 улучшенный: Собирательный термин, относящийся к потокам битов, формируемых кодерами аудио стандартов АС-3 или АС-3 улучшенный, соответствует ETSI [2].
3.1.18 поток битов DTS: Собирательный термин, относящийся к потокам битов, формируемых кодером аудио в соответствии с ETSI [3].
3.1.19 поток битов H.264/AVC: Собирательный термин, относящийся к потокам битов видео, формируемых кодером стандарта H.264/AVC с разрешениями SDTV и HDTV и с частотой кадров 25 Гц и 50 Гц.
3.1.20 поток битов H.264/AVC/HDTV: Собирательный термин, относящийся к потокам битов видео, формируемых кодером стандарта H.264/AVC с разрешением HDTV и с частотой кадров 25 Гц и 50 Гц.
3.1.21 поток битов H.264/AVC/25: Собирательный термин, относящийся к потокам битов видео, формируемых кодером стандарта H.264/AVC с частотой кадров 25 Гц.
3.1.22 поток битов H.264/AVC/HDTV/25: Собирательный термин, относящийся к потокам битов видео, формируемых кодером стандарта H.264/AVC с разрешением HDTV и с частотой кадров 25 Гц.
3.1.23 поток битов H.264/AVC/HDTV/50: Собирательный термин, относящийся к потокам битов видео, формируемых кодером стандарта H.264/AVC с разрешением HDTV и с частотой кадров 50 Гц.
3.1.24 поток битов H.264/AVC/SDTV/25: Собирательный термин, относящийся к потокам битов видео, формируемых кодером стандарта H.264/AVC с разрешением SDTV и с частотой кадров 25 Гц.
3.1.25 поток битов HDTV/25: Собирательный термин, относящийся к потокам битов видео, формируемых кодерами стандартов MPEG-2, H.264/AVC с частотой кадров изображения 25 Гц.
3.1.26 поток битов HDTV: Собирательный термин, относящийся к потокам битов видео, формируемых кодерами стандартов MPEG-2, H.264/AVC с частотой кадров изображения 25 Гц и 50 Гц.
3.1.27 поток битов НР@L3: Собирательный термин, относящийся к потокам битов видео, формируемых кодером с профилем и уровнем кодирования HP@L3.
3.1.28 поток битов НР@L4: Собирательный термин, относящийся к потокам битов видео, формируемых кодером с профилем и уровнем кодирования HP@L4.
3.1.29 поток битов MPEG-1: Собирательный термин, относящийся к потокам битов аудио, формируемых кодером MPEG-1 Layer I или Layer II в соответствии с ISO/IEC [4] или [5].
3.1.30 поток битов MPEG-2/HDTV/25: Собирательный термин, относящийся к потокам битов видео, формируемых кодером стандарта MPEG-2 с разрешением HDTV и с частотой кадров 25 Гц.
3.1.31 поток битов MPEG-2 Layer II с обратной совместимостью: Собирательный термин, относящийся к потокам битов аудио, формируемых кодером аудио стандарта MPEG-2 Layer II с обратной совместимостью в соответствии с ISO/IEC [4] или [5].
3.1.32 поток битов MPEG-2/SDTV/25: Собирательный термин, относящийся к потокам битов видео, формируемых кодером стандарта MPEG-2 с разрешением SDTV и с частотой кадров 25 Гц.
3.1.33 поток битов MPEG-4 ААС: Собирательный термин, относящийся к потокам битов аудио, формируемых кодером аудио стандарта MPEG-4 ААС.
3.1.34 поток битов MPEG-4 НЕ ААС: Собирательный термин, относящийся к потокам битов аудио, формируемых кодером аудио стандарта MPEG-4 НЕ ААС.
3.1.35 поток битов MPEG-4 НЕ ААС v2: Собирательный термин, относящийся к потокам битов аудио, формируемых кодером аудио стандарта MPEG-4 НЕ ААС v2.
3.1.36 поток битов MPEG Surround: Собирательный термин, относящийся к потокам битов аудио, формируемых кодером стандарта MPEG Surround, использующим потоки битов от кодера стандарта MPEG-1 Layer II и от кодеров стандартов MPEG-4 ААС или MPEG-4 НЕ ААС или MPEG-4 НЕ ААС v2.
3.1.37 поток битов МР@НL: Собирательный термин, относящийся к потокам битов видео, формируемых кодером с профилем и уровнем кодирования MP@L3.
3.1.38 поток битов МР@L3: Собирательный термин, относящийся к потокам битов видео, формируемых кодером с профилем и уровнем кодирования MP@L3.
3.1.39 поток битов MP@ML: Собирательный термин, относящийся к потокам битов видео, формируемых кодером стандарта MPEG-2, использующим профиль и уровень кодирования MP@ML.
3.1.40 приемник-декодер базового уровня (Baseline IRD): Приемник-декодер, который обеспечивает выполнение минимального объема функций декодирования потоков битов, рекомендованных в настоящем стандарте. В этот объем функций не должна входить функция декодирования частичных транспортных потоков, поступающих от цифровых устройств хранения потока битов.
3.1.41 приемник-декодер с цифровым интерфейсом (IRD with Digital Interface): Приемник-декодер, выполняющий функции декодирования приемника-декодера базового уровня и имеющий возможность декодировать частичные транспортные потоки, полученные от цифрового интерфейса, соединенного с цифровым устройством хранения потока битов.
3.1.42 приложение (application): 1 Программное обеспечение, предоставляющее клиенту возможность решения определенной задачи и реализуемое в среде клиента. 2 Функциональная реализация программного обеспечения, обслуживающего один или несколько взаимодействующих аппаратных объектов.
3.1.43 программный поток данных (Program Stream; PS): Поток данных, образованный путем мультиплексирования элементарных потоков видеоданных и звукоданных цифрового вещательного телевидения, имеющих одну общую тактовую частоту, и сформированный из программных пакетов вещательного телевидения переменной длины.
3.1.44 протокол UECP (Universal Encoder Communications Protocol): Универсальный протокол связи кодера по стандарту [6].
3.1.45 профиль (profile): 1 Описание группы минимальных конфигураций, определяющих параметры потока битов, формируемого одной из совокупностей рассматриваемых систем кодирования (или параметры приемников-декодеров этих потоков) и отображающих функции, которые характеризуют контекст опций службы. 2 Набор средств и инструментов обработки видеосигнала (видео) или аудиосигнала (аудио), использующий предусмотренную стандартом кодирования технологию и формирующий кодированный поток битов.
3.1.46 профили стандарта кодирования MPEG-4: Профили, основанные на типах объекта и поддерживающие различные списки типов объекта. У каждого профиля может быть несколько уровней, которые ограничивают значения некоторых параметров инструментов, существующих в профиле.
3.1.47 секция (section): Синтаксическая структура, используемая для отображения всей сервисной информации в пакетах транспортного потока.
3.1.48 семантика (semantics): Система правил, предназначенная для определения смысловых значений отдельных конструкций алгоритмического языка.
3.1.49 сервис [служба, услуга] (service): 1 Последовательность программ, которая под управлением вещателя может быть в режиме вещания передана как часть расписания. 2 Логический объект в системе предоставляемых функций и интерфейсов, поддерживающий одно или множество приложений, отличие которого от других объектов заключается в доступе конечного пользователя к управлению шлюзом сервисов.
3.1.50 синтаксис (syntax): Часть языка программирования, которая описывает структуру программ как наборов символов.
3.1.51 ссылка на программные часы (Program Clock Reference; PCR): Тридцатитрехбитовое число, оцениваемое в периодах частоты 90 кГц, вводимое на программном уровне индивидуально для каждой передаваемой телевизионной программы.
3.1.52 стандарт АС-3: Стандарт кодирования цифровых аудиосигналов в соответствии c ETSI [2].
3.1.53 стандарт АС-3 улучшенный: Стандарт кодирования цифровых аудиосигналов в соответствии с ETSI [2].
3.1.54 стандарт H.264/AVC: Стандарт кодирования визуальных объектов в соответствии с Рекомендацией ITU-T/ISO/IEC [7].
3.1.55 стандарт MPEG-1: Стандарт кодирования видео и связанного с ним аудио в соответствии с ISO/IEC [8].
3.1.56 стандарт MPEG-2: Стандарт кодирования видео и связанного с ним аудио в соответствии с Рекомендацией ITU-T/ISO/IEC [9].
3.1.57 стандарты MPEG-4 AAC; MPEG-4 HE AAC; MPEG-4 HE AAC v2 [MPEG-4 AAC; MPEG-4 НЕ AAC; MPEG-4 HE AAC v2]: Стандарты кодирования аудио в соответствии с ISO/IEC [10].
3.1.58 стандарт MPEG Surround: Стандарт кодирования аудио в соответствии с ISO/IEC [11], [12].
3.1.59 стандарт DTS: Стандарт кодирования аудио в соответствии с ETSI [3].
3.1.60 транспортный поток; ТП (transport stream; TS): Набор из нескольких программных потоков данных цифрового вещательного телевидения, сформированный из программных пакетов постоянной длины с коррекцией ошибок и независимым тактированием от своих источников синхронизации. Параметры транспортного потока определяются ISO/IEC [14] (подраздел 2.4).
3.1.61 "цифровой интерфейс" (Digital Interface; DI): Тип интерфейса, обеспечивающего использование приемника-декодера совместно с цифровым устройством хранения потока битов, например, цифровым видеомагнитофоном (VCR).
3.1.62 частичный транспортный поток (Partial Transport Streams): Поток, полученный селекцией пакетов транспортного потока, которые не относятся к одной или к нескольким отдельным программам, включая пакеты PSI. Параметры частичного транспортного потока определяются IEC [25].
3.1.63 частные данные (private data): Любые пользовательские данные, которые не кодированы, соответствуют Рекомендации ITU-T/ ISO/IEC [14].
3.1.64 Broadcast-mixed: Наименование механизма предоставления дополнительной аудио службы в соответствии со стандартами ETSI [16] (приложение Е), [17] (приложение J).
3.1.65 Clean audio (чистое аудио): Дополнительная служба аудио (например, для пользователей с ослабленным слухом).
3.1.66 H.264/AVC/HDTV: Собирательный термин, относящийся к потокам битов видео, формируемых кодером стандарта H.264/AVC с разрешением HDTV и с частотой кадров 25 Гц или 50 Гц.
3.1.67 H.264/AVC/HDTV/25: Собирательный термин, относящийся к потокам битов видео, формируемых кодером H.264/AVC с разрешением HDTV и с частотой кадров 25 Гц.
3.1.68 H.264/AVC/HDTV/50: Собирательный термин, относящийся к потокам битов видео, формируемых кодером H.264/AVC с разрешением HDTV и с частотой кадров 50 Гц.
3.1.69 H.264/AVC/SDTV: Собирательный термин, относящийся к потокам битов видео, формируемых кодером H.264/AVC с разрешением SDTV и с частотами кадров 25 Гц или 50 Гц.
3.1.70 H.264/AVC/SDTV/25: Собирательный термин, относящийся к потокам битов видео, формируемых кодером H.264/AVC с разрешением SDTV и с частотой кадров 25 Гц.
3.1.71 HDTV/25: Собирательный термин, относящийся к потокам битов видео, формируемых кодерами стандартов MPEG-2 или H.264/AVC с разрешением HDTV и с частотой кадров 25 Гц, а также кодерами стандартов H.264/AVC с частотой кадров 50 Гц.
3.1.72 I-кадр [l-псевдокадр] (l-frame): Видеокадр, сформированный при внутрикадровом кодировании потока данных.
3.1.73 MPEG-2/SDTV/25: Собирательный термин, относящийся к потокам битов видео, формируемых кодером MPEG-2 с разрешением SDTV и с частотой кадров изображения 25 Гц.
3.1.74 MPEG-2/HDTV/25: Собирательный термин, относящийся к потокам битов видео, формируемых кодером MPEG-2 с разрешением HDTV и с частотой кадров изображения 25 Гц.
3.1.75 MPEG Surround: Собирательный термин, относящийся к правилам кодирования потоков битов аудио и декодирования этих потоков битов аудио в соответствии с ISO/IEC [11], [12].
3.1.76 Receiver-mixed: Наименование механизма предоставления дополнительной аудио службы в соответствии со стандартами ETSI [16] (приложение Е), [17] (приложение J).
3.1.77 Trick play: Режим быстрого проигрывания мультимедиа (получение быстрого доступа к проигрыванию в произвольной точке), быстрый доступ к объектам среды мультимедиа.
3.2 В настоящем стандарте применены следующие сокращения:
МСЭ (International Telecommunication Union, ITU) - Международный союз электросвязи;
МЭК (International Electrotechnical Commission / Committee, IEC) - Международная электротехническая комиссия;
ПЭП (Packetized Elementary Stream, PES) - пакетированный элементарный поток;
ТП (transport stream, TS) - транспортный поток (цифрового вещательного телевидения);
УКВ - ультра короткие волны;
AAC (Advanced Audio Coding) - усовершенствованное звуковое кодирование;
АС-3 (Dolby АС-3 audio coding system) - система кодирования аудио Dolby;
AD (Audio description) - аудио описание (сцены);
AFD (Active Format Description) - активное описание формата;
АОТ (Audio Object Type) - тип аудио объекта;
ВАТ (Bouquet Association Table) - таблица объединения букета программ;
СА (Conditional Access) - условный доступ;
DAB (Digital Audio Broadcasting) - цифровое звуковое радиовещание;
Dl (Digital Interface) - "цифровой интерфейс";
DTS (Digital Theater Systems) - системы цифровых (домашних) кинотеатров;
DTS (DTS audio coding system) - система кодирования звука систем цифровых (домашних) кинотеатров;
DTS (Decoding Time Stamp) - отметка времени декодирования;
DVB (Digital Video Broadcasting) - цифровое телевизионное вещание;
DVD (Digital Versatile Disc) - универсальный цифровой диск;
EIT (Event Information Table) - таблица информации о событиях;
FM (Frequency Modulation) - частотная модуляция;
ES (Elementary Stream) - элементарный поток;
ESCR (Elementary Stream Clock Reference) - метка времени в потоке PES, по которой декодеры потоков PES могут установить синхронизацию;
H.264/AVC (Advanced Video Coding for Generic Audiovisual Services) - усовершенствованное кодирование видео для универсальных аудиовизуальных служб;
HDTV (High Definition Television) - телевидение с высоким разрешением (стандартной четкостью);
НЕ-ААС (high efficiency AAC) - высокоэффективное AAC;
HP (High Profile) - высокий профиль;
HP@L3 (High Profile Level 3) - высокий профиль, уровень 3;
HP@L4 (High Profile Level 4) - высокий профиль, уровень 4;
[email protected] (High Profile Level 4.2) - высокий профиль, уровень 4.1;
[email protected] (High Profile Level 4.2) - высокий профиль, уровень 4.2;
IDR (Instantaneous Decoding Refresh) - мгновенное обновление декодирования;
IEC (International Electrotechnical Commission/Committee) - Международная электротехническая комиссия; МЭК;
IRD (Integrated Receiver-Decoder) - интегрированный приемник-декодер [приемник-декодер];
ISO (International Standards Organizations) - Международная организация по стандартизации;
ITU (International Telecommunications Union) - Международный союз электросвязи; МСЭ;
ITU-T (International Telecommunications Union - Telecommunication Standardization Sector) - Сектор стандартизации электросвязи МСЭ;
JPEG (Joint Picture Expert Group) - группа экспертов по кодированию фотографических изображений (название группы и разработанного ею стандарта сжатия фотографических (неподвижных) изображений);
Layer I, Layer II - уровни кодирования аудио в соответствии с ISO/IEC [4];
LATM/LOAS (Low overhead Audio Transport Multiplex/Low overhead Audio Stream) - низкий служебный транспортный мультиплекс аудио / низкий служебный аудиопоток;
level 2, level 3, level 4 - уровни кодирования профилей MPEG-4 HE AAC, MPEG-4 HE AAC v2 и базового профиля MPEG Surround;
level 3, level 4 - уровни кодирования базового профиля MPEG Surround;
MPEG (Motion Pictures Expert Group) - группа экспертов по движущимся изображениям;
MP@HL (Main Profile@High Level) - основной профиль, высокий уровень;
MP@L3 (Main Profile@Level 3) - основной профиль, уровень 3;
MP@ML (Main Profile@Main Level) - основной профиль, основной уровень;
NIT (Network Information Table) - таблица сетевой информации;
PCR (Program Clock Reference) - ссылка на программные часы;
PES (Packetized Elementary Stream) - пакетированный элементарный поток; ПЭП;
PID (Packet Identifier) - идентификатор типа пакета;
PNG (Portable Network Graphics) - переносимая сетевая графика, формат графических файлов для работы в сети;
РМТ (Program Map Table) - таблица состава программы;
PPS (Picture Parameter Set) - набор параметров изображения;
PS (Program Stream) - программный поток данных;
PS (Parametric Stereo) - параметрическое стерео;
PSI (Program Specific Information) - программно-зависимая информация;
PTS (Presentation TimeStamp) - метка времени представления;
RAP (Random Access Point) - точка случайного (произвольного) доступа;
RDS (Radio Data System) - система радиопередачи данных;
RST (Running Status Table) - таблица состояния событий;
SA (Supplementary audio) - дополнительная аудио служба;
SBR (Spectral Band Replication) - дублирование (копирование) полосы спектра;
SDT (Service Description Table) - таблица описания служб;
SDTV (Standard Definition Television) - телевидение со стандартным разрешением (стандартной четкостью);
SEI (Supplemental Enhancement Information) - дополнительная расширенная информация;
SI (Service Information) - информация о службах;
SPS (Sequence Parameter Set) - набор параметров последовательности;
STD (System Target Decoder) - системный целевой декодер;
SVC (Scalable Video Coding) - масштабированное кодирование видео;
TDT (Time and Date Table) - таблица времени и даты;
ТОТ (Time Offset Table) - таблица смещения времени;
TS (Transport Stream) - транспортный поток (цифрового вещательного телевидения); ТП;
TSDT (Transport Stream Description Table) - таблица описания транспортного потока;
T-STD (The Transport Stream System Target Decoder) - эталонная модель процесса декодирования транспортного потока;
UECP (Universal Encoder Communication Protocol) - универсальный протокол связи кодера;
VC-1 (Advanced Video Coding) - улучшенное видеокодирование;
VCR (Video Cassette Recorder) - цифровой (телевизионный) видеомагнитофон;
VUI (Video Usability Information) - удобная для использования визуальная информация;
WSS (Wide Screen Signalling) - сигнализация широкого экрана.
4 Системный уровень
4.1 Введение
Раздел содержит требования и рекомендации к параметрам потоков битов приложений вещания DVB на системном уровне MPEG-2 и к приемникам-декодерам, выполняющим декодирование этих потоков.
Подраздел 4.2 содержит требования к параметрам потоков битов вещания и приемников-декодеров базового уровня этих потоков битов.
Подраздел 4.3 содержит требования к параметрам потоков битов приложений хранения, переданных через цифровой интерфейс, и приемников-декодеров с цифровым интерфейсом этих потоков битов.
4.2 Параметры потоков битов вещания и приемников-декодеров базового уровня потоков битов вещания
4.2.1 Параметры и поля мультиплексированных сигналов потоков битов и связанных с ними данных определяются Рекомендацией ITU-T/ISO/IEC [14]. Ограничения применения некоторых из этих параметров и полей в системе DVB представлены ниже. Приемник-декодер должен игнорировать структуры данных, которые в настоящий момент зарезервированы или их обработка конкретным приемником-декодером не предусмотрена. Приемники-декодеры должны проектироваться в предположении, что любая структура, предусмотренная Рекомендацией ITU-T/ISO/IEC [14], может быть включена в состав транспортного потока вещания, даже если она в настоящее время зарезервирована и не используется.
В настоящем стандарте приняты следующие общие требования, относящиеся ко всем потокам битов и приемникам-декодерам:
- в зарезервированных полях потоков битов должно устанавливаться значение 0FF;
- заполнение потока битов должно выполняться с использованием нормального механизма стаффинга; использование зарезервированных полей не допускается;
- частные данные должны обрабатывать только те приемники-декодеры, в которых предусмотрена функция обработки этих данных.
4.2.2 В соответствии с Рекомендацией ITU-T/ISO/IEC [14] мультиплексированные потоки данных стандарта MPEG-2 могут быть двух типов: транспортный поток и программный поток.
Поток битов передаваемого мультиплекса должен формироваться в виде транспортного потока.
Приемники-декодеры базового уровня должны обеспечивать демультиплексирование транспортных потоков MPEG-2.
Функция демультиплексирования программных потоков приемниками-декодерами, в соответствии с Рекомендацией ITU-T/ ISO/IEC [14] (введение, пункт 2 и пункт 3), является опциональной.
4.2.3 Поток битов транспортного потока для T-STD, определенный в Рекомендации ITU-T/ISO/IEC [14] (пункт 2.4.2), должен удовлетворять следующим требованиям к частоте системной синхронизации:
- частота системной синхронизации потока битов должна соответствовать нормам, определенным в Рекомендации ITU-T/ISO/IEC [14] (пункт 2.4.2.1);
- рекомендуется обеспечивать в потоке битов допустимое отклонение частоты системной синхронизации не более 510.
4.2.4 IRD должен сохранять работоспособность во всем диапазоне значений допустимых отклонений частоты системной синхронизации, предусмотренных Рекомендацией ITU-T/ISO/IEC [14] (пункт 2.4.2.1).
4.2.5 Требования к параметрам кодирования и декодирования транспортного потока на уровне транспортных пакетов должны быть следующими.
4.2.5.1 Параметры кодирования и декодирования нулевых пакетов (значение РID 01FFF) должны быть в соответствии с Рекомендацией ITU-T/ISO/IEC [14] (пункт 2.4.3.2).
4.2.5.2 Параметры заголовка транспортного пакета
4.2.5.2.1 Рекомендуется, чтобы любые устройства, находящиеся в тракте передачи, при обнаружении некорректируемых ошибок устанавливали в заголовке транспортного пакета флаг transport_error_indicator в соответствии с Рекомендацией ITU-T/ISO/IEC [14] (пункт 2.4.3.2).
При декодировании рекомендуется, чтобы при появлении в переданном потоке флага transport_error_indicator приемник-декодер инициировал механизмы маскирования ошибки или восстановления дефектного пакета.
4.2.5.2.2 Допускается игнорирование приемником-декодером в транспортном потоке флага transport_priority, так как этот флаг не определяет режим работы приемника-декодера.
4.2.5.2.3 Кодирование битов transport_scrambling_control должно выполняться согласно таблице 1 в соответствии с ETSI [1].
Таблица 1 - Кодирование битов transport_scrambling_control
Значение | Комментарии |
00 | Полезная нагрузка пакетов транспортного потока не скремблируется |
01 | Зарезервировано для будущих применений |
10 | Пакеты транспортного потока скремблируются четным ключом |
11 | Пакеты транспортного потока скремблируются нечетным ключом |
При декодировании потока битов IRD должен считывать биты поля transport_scrambling_control и реагировать на них в соответствии с комментариями таблицы 1.
4.2.5.2.4 При кодировании потока битов присвоение значений РID для данных, содержащихся в таблицах SI, должно выполняться в соответствии с ETSI [17] (раздел 6).
4.2.6 Поле адаптации должно определяться в соответствии с Рекомендацией ITU-T/ ISO/IEC [14] (пункт 2.4.3.4). Для обработки полей, входящих в состав поля адаптации, устанавливаются следующие правила:
4.2.6.1 Поле random_access_indicator должно устанавливаться при формировании потоков битов в следующих случаях:
- стандарт MPEG-2: поле гаndom_access_iindicator рекомендуется устанавливать всякий раз, когда в потоках битов видео встречается точка произвольного доступа (в заголовке видео последовательности непосредственно за I-кадром);
- стандарт H.264/AVC: поле random_access_indicator должно устанавливаться всякий раз, когда в потоках битов видео H.264/AVC встречается точка произвольного доступа; при декодировании допускается игнорирование поля random_access_indicator приемником-декодером;
4.2.6.2 Обработка поля elementary_stream_priority_indicator выполняется по следующим правилам:
- для потока битов стандарта MPEG-2: при декодировании приемник-декодер может игнорировать поле elementary_stream_priority_indicator;
- для потока битов стандарта H.264/AVC:
- при кодировании:
- поле elementary_stream_priority_indicator должно устанавливаться только тогда, когда в потоках битов видео стандарта H264/AVC присутствует модуль, содержащий l-кадр или IDR (поле slice_type принимает значения 002 или 007 соответственно);
- флаг elementary_stream_priority_indicator должен быть установлен в заголовке адаптации транспортного пакета в соответствии с ISO/IEC [14];
- при декодировании приемник-декодер может игнорировать поле elementary_stream_priority_indicator.
4.2.6.3 При кодировании и декодировании потоков битов требования к передаче полей ссылок на программные часы (PCR) должны быть следующими:
- временной интервал между двумя последовательными значениями PCR одной программы не должен превышать 100 мс;
- IRD должен сохранять работоспособность при интервалах времени между приемом PCR одной программы, не превышающих 100 мс.
4.2.6.4 Функции кодирования полей, перечисленных ниже, являются опциональными:
- original_program_clock_reference_base;
- original_program_clock_reference_extension;
- splice_countdown;
- private_data_byte;
- adaptation_field_extension (including fields within).
В потоке битов DVB должны устанавливаться флаги, которые указывают на присутствие или отсутствие этих полей. Правила использования поля private_data_byte должны определяться в соответствии с ETSI [16] (приложение D).
При декодировании полей, перечисленных выше, приемники-декодеры должны быть в состоянии принять потоки битов, содержащие эти поля. Допускается игнорирование приемниками-декодерами данных в этих полях.
4.2.7 Требования к параметрам кодирования и декодирования пакетированного элементарного потока устанавливаются следующими:
4.2.7.1 Элементарные потоки должны быть идентифицированы полями stream_id и stream_type в соответствии с Рекомендацией ITU-T/ISO/IEC [14] (таблицы 2-22 и 2-24).
Правила кодирования и декодирования полей stream_id и stream_type для потоков битов стандартов MPEG-4 AAC; MPEG-4 НЕ ААС и MPEG-4 НЕ AAC v2; АС-3; АС-3 улучшенный и для аудиопотоков DTS должны быть в соответствии с ETSI [16] (пункт 4.1.6.1).
4.2.7.2 PES_scrambling_control: при кодировании в полях PES_scrambling_control должны быть установлены значения согласно таблице 2 в соответствии с ETSI [1].
Таблица 2 - Значения битов поля PES_scrambling_control
Значение | Комментарии |
00 | Полезная нагрузка PES не скремблируется |
01 | Зарезервировано для применений в будущем |
10 | Пакеты PES скремблируются четным ключом |
11 | Пакеты PES скремблируются нечетным ключом |
IRD должен декодировать биты PES_scrambling_control и реагировать на них в соответствии с таблицей 2.
4.2.7.3 Поле PES_priority: приемник-декодер может игнорировать это поле.
4.2.7.4 Поля copyright и original_or_copy:
- при кодировании эти поля устанавливаются в потоках битов в случае необходимости;
- при декодировании IRD не должен интерпретировать биты этих полей. Значения этих полей на цифровых выходах приемника-декодера не должны изменяться.
4.2.7.5 Поля режима Trick Play: trick_mode_control; field_id; intra_slice_refresh; frequency_truncation; field_rep_cntrl не должны передаваться в потоке битов приложений вещания. Эти поля могут использоваться для других приложений (интерактивные службы, службы приложения хранения).
При декодировании приемники-декодеры могут игнорировать любые данные, которые относятся к этим полям. При наличии в приемнике-декодере цифрового интерфейса для цифровых приложений VCR рекомендуется обеспечивать поддержку декодирования режимов приема в соответствии с ETSI [16] (пункт 4.2.2).
4.2.7.6 Поле additional_copy_info:
- при кодировании: в случае необходимости допускается передача этого поля в потоке битов приложений вещания;
- при декодировании: IRD не должен интерпретировать это поле и не должен изменять значения этого поля на своих цифровых выходах.
4.2.7.7 Функция кодирования полей: ESCR; ESCR_extension; ES_rate; previous_PES_packet_CRC; PES_private_data; pack_header (); program_packet_sequence_counter; MPEG1_MPEG2_identifier; original_stuff_length; P-STD_buffer_scale; P-STD_buffer_size является опциональной. В потоке битов должны устанавливаться флаги, которые указывают на их присутствие или отсутствие.
IRD должен обеспечивать декодирование битов этих полей. IRD может игнорировать данные, содержащиеся в этих полях.
4.2.7.8 Поле PES_extension_field для потоков битов стандартов MPEG-2 и H.264/AVC в настоящий момент зарезервировано. Поле PES_extension_field не должно устанавливаться в потоки битов, если не определена возможность его использования в будущем.
IRD должен обеспечивать декодирование потоков битов, которые содержат поле PES_extension_field. IRD может игнорировать данные в этом поле.
4.2.7.9 Кодирование и декодирование многократных видеоизображений в пакетах PES для потоков битов стандартов MPEG-2 и H.264/AVC должно выполняться в соответствии с ETSI [16] (пункт 4.1.6.9).
4.2.7.10 Кодирование и декодирование отметок времени представления (PTS) и отметки времени декодирования (DTS) для потоков битов стандарта H.264/AVC должно выполняться в соответствии с ETSI [16] (пункт 4.1.6.10).
4.2.8 Форматы данных, передаваемых в таблицах TSDT и NIT, должны быть в соответствии с ETSI [17]. В настоящем стандарте дополнительно устанавливаются требования к таблицам программно-зависимой информации (PSI), передаваемым в составе транспортного потока, которые должны быть в соответствии с Рекомендацией ITU-T/ISO/IEC [14] (пункт 2.4.4). Рекомендуется, чтобы таблица ассоциации программы (PAT) и таблица состава программы (РМТ) в составе ТП повторялись в потоке битов с временным интервалом не менее 100 мс.
Рекомендуется обеспечивать повторение таблиц TSDT в составе транспортного потока с временным интервалом не менее 10 с.
4.2.9 Параметры дескрипторов элементарного потока, определяемых в соответствии с Рекомендацией ITU-T / ISO/IEC [14] (пункт 2.6), должны быть в соответствии с ETSI [16] (пункты 4.1.8.1-4.1.8.19, 4.1.8.21-4.1.8.27). Требования к размеру буфера должны быть в соответствии с ETSI [16] (пункт 4.1.8.20).
4.2.10 Требование совместимости декодеров транспортного потока, определяемого в соответствии с Рекомендацией ITU-T/ISO/IEC [14] (пункт 2.8), с параметрами транспортного потока стандарта MPEG-1, определяемыми в соответствии с ISO/IEC [8], является опциональным.
4.2.11 С целью обеспечения функциональной совместимости в режиме записи служб рекомендуется:
- для служб с разрешением SDTV устанавливать полную скорость передачи набора компонентов, содержащих пакеты РМТ и PCR, не более 9 Мбит/с;
- для служб с разрешением HDTV устанавливать полную скорость передачи набора компонентов, содержащих пакеты РМТ и PCR, не более 28 Мбит/с.
Рекомендуется параметры полей sb_size и sb_leak_rate в поле дескриптора smoothing_buffer_descriptor сохранять постоянными на интервале события. Поле sb_leak_rate должно иметь максимальное значение, достигнутое за время события. Параметры дескриптора short_smoothing_buffer_descriptor определены в ETSI [17], рекомендации для его использования представлены в ETSI [19].
4.3 Параметры потоков битов приложений хранения и приемников-декодеров с цифровыми интерфейсами потоков битов приложений хранения
4.3.1 В этом подразделе определяются параметры обработки частичных транспортных потоков, которые формируются при селекции пакетов одной программы или нескольких программ. Условия использования таблиц PSI MPEG-2 и SI DVB в приложениях хранения определены в ETSI [17].
4.3.2 Частичные транспортные потоки могут быть созданы селекцией пакетов транспортных потоков одной или нескольких программ, включая пакеты PSI .
Частичный транспортный поток должен соответствовать рекомендации ISO/IEC [15] к интерфейсу реального времени системных декодеров.
Приемники-декодеры с цифровыми интерфейсами, предназначенными для цифровых приложений VCR, должны обеспечивать прием частичного транспортного потока с прерываниями при интервалах переменной длины между пакетами транспортного потока.
4.3.3 Требования к параметрам кодирования и декодирования данных режима Trick Play должны быть в соответствии с Рекомендацией ITU-T/ISO/IEC [14] (пункт 2.4.3.7) при следующих уточнениях параметров кодирования потока битов данных Trick Play:
- работа в режиме Trick Play должна сигнализироваться в заголовке пакета PES флагом DSM_trick_mode;
- в режиме Trick Play поток битов, воспроизводимый устройством хранения, должен быть синтаксически и семантически корректным за исключениями, указанными в примечании;
- рекомендуется обеспечивать декодирование приемниками-декодерами поля DSM_trick_mode_flag и восемь битов поля режима trick;
- приемники-декодеры при декодировании данных режима Trick Play должны соответствовать требованиям, детализированным в Рекомендации ITU-T / ISO/IEC [14] (раздел 2) для всех значений поля trick_mode_control.
Примечание - В режиме Trick Play применяются следующие семантические исключения: поток битов на входе приемника-декодера должен иметь синтаксис, определенный в стандарте MPEG-2, согласно Рекомендации ITU-T/ SO/IEC [14] (пункт 2.4.3.7). В присутствии поля DSM_trick_mode должны применяться семантические ограничения для следующих элементов синтаксиса потока битов: bit_rate; vbv_delay; repeat_first_field; v_axis_positive; field_sequence; subcarrier; burst_amplitude; subcarrier_phase. В режиме Trick Play декодер не должен использовать значения, закодированные в этих полях.
На системном уровне в присутствии поля DSM_trick_mode применяются следующие семантические ограничения:
- величина максимального интервала времени между пакетами PSI может превышать 400 мс;
- величина максимального интервала между отметками PTS или DTS может превышать 700 мс;
- в пакетах PES могут отсутствовать видеоданные, указывающие на изменение в байте режима Trick Play;
- пакет PES, лишенный видеоданных, может содержать отметку времени представления, чтобы указать эффективное время представления управления новым режимом Trick Play;
- в том случае, когда состояние trick_mode является истинным, буферы элементарного потока для T-STD могут потерять значимость.
5 Параметры потоков битов стандартов MPEG-2 и H.264/AVC. Параметры приемников-декодеров
5.1 Параметры потоков битов MPEG-2/SDTV/25. Параметры приемников-декодеров
5.1.1 Кодирование видео должно выполняться в соответствии с Рекомендацией ITU-T/ISO/IEC [9]. Некоторые параметры и поля, указанные в Рекомендации ITU-T/ ISO/IEC [9], в системе DVB не используются. Эти случаи описаны ниже.
IRD должен проектироваться в предположении, что в потоке битов вещания может встретиться любая структура, разрешенная Рекомендацией ITU-T/ISO/IEC [9], даже если она относится к зарезервированным или к не используемым в настоящее время.
5.1.2 Кодирование потоков битов должно выполняться в соответствии с ограничениями основного профиля и основного уровня MP@ML, установленными Рекомендацией ITU-T/ISO/IEC [9] (пункт 8.2). Указание на более простой профиль или уровень, чем MP@ML, должно обеспечиваться использованием индикации: profile_and_level_indication "01001000".
Приемник-декодер потоков битов MPEG-2/SDTV/25 должен поддерживать декодирование потоков битов MP@ML Функция поддержки профилей и уровней, отличающихся от MP@ML, для приемника-декодера является опциональной. При появлении в транспортном потоке расширений, которые IRD не может декодировать, таких как "Reserved", "Picture Sequence Scaleable", "Picture Spatial Scaleable" или "Picture Temporal Scaleable", он должен игнорировать данные, следующие за этими полями.
5.1.3 Частота кадров изображения потоков битов MPEG-2/SDTV/25 должна быть 25 Гц, что соответствует значению поля frame_rate_code "0011". Стоп-кадры (фотографии) могут быть закодированы в форме видео последовательности, состоящей из кадров с внутренним кодированием (определение стоп-кадра с внутренним кодированием должно быть в соответствии с Рекомендацией ITU-T/ SO/IEC [14] (пункт 2.1.70)).
Все приемники-декодеры потоков битов MPEG-2/SDTV/25 должны поддерживать декодирование и отображение видео материала с частотой кадров 25 Гц (frame_rate_code "0011"). Функция поддержки других частот кадров является опциональной. Все приемники-декодеры должны обеспечивать декодирование и отображение стоп-кадров.
5.1.4 Исходный формат кадров изображения в потоках битов MPEG-2/SDTV/25 должен быть 4:3, 16:9 или 2.21:1. Функция декодирования формата изображения 2.21:1 для приемников-декодеров потоков битов MPEG-2/SDTV/25 является опциональной. В заголовке последовательности aspect_ratio_information должно устанавливаться одно из следующих значений для исходных форматов изображений: 4:3 - "0010"; 16:9 - "0011"; 2.21:1 - "0100".
Рекомендуется включать в переданный поток битов векторы панорамирования для формата 4:3, когда исходный формат кадров изображения был 16:9 или 2.21:1. Значение вертикального компонента переданного вектора панорамирования должно быть "0".
При передаче в потоке битов векторов панорамирования в этом потоке должно присутствовать поле sequence_display_extension, значение поля aspect_ratio_information должно быть установлено "0010" (формат кадров изображения 4:3). Значение поля display_vertical_size должно быть равно значению поля vertical_size. Поле display_horizontal_size должно содержать данные о величине разрешения изображения 4:3. Значение поля display_horizontal_size может быть вычислено в соответствии со следующим уравнением:
.
В таблице 3 приведены примеры типичных значений полей horizontal_sizevertical_size, исходных форматов изображения и поля display_horizontal_size.
Таблица 3 - Значения битов поля PES_scrambling_control
horizontal_sizevertical_size | Исходный формат кадров изображения | Display_horizontal_size |
720576 | 16:9 | 540 |
544576 | 16:9 | 408 |
480576 | 16:9 | 360 |
352576 | 16:9 | 264 |
352288 | 16:9 | 264 |
Приемники-декодеры потоков битов MPEG-2/SDTV/25 должны быть в состоянии декодировать потоки битов со значениями поля aspect_ratio_information "0010" и "0011" для форматов кадра изображения 4:3 и 16:9 соответственно. При наличии у приемников-декодеров цифровых интерфейсов должен обеспечиваться вывод потоков битов с форматами кадра изображения, которые непосредственно могут ими и не поддерживаться, с целью декодирования и отображения этих потоков при использовании внешних модулей.
Все приемники-декодеры потоков битов MPEG-2/SDTV/25 должны поддерживать использование векторов панорамирования и повышающей передискретизации, чтобы обеспечивать на мониторе 4:3 полноэкранное изображение выбранной части кодированного изображения 16:9 с корректным форматом изображения. Все реализации приемников-декодеров, поддерживающие формат кадров изображения 2.21:1, должны обеспечить использование векторов панорамирования и отсчетов, чтобы обеспечить на мониторе 4:3 полноэкранное изображение выбранной части изображения 2.21:1 с корректным форматом изображения. Функция поддержки векторов панорамирования с ненулевыми вертикальными компонентами является опциональной. При отсутствии в переданном потоке битов векторов панорамирования на мониторе должна быть показана центральная часть широкоэкранного изображения. Функция поддержки вертикальной передискретизации для получения корректного формата изображения добавлением черных полос сверху и снизу кодированного изображения 16:9 или 2.21:1 на мониторе 4:3 является опциональной.
5.1.5 Закодированные потоки битов должны иметь одно из следующих полноэкранных разрешений яркости изображения (горизонтальвертикаль) в пикселях:
- 720576;
- 544576;
- 480576;
- 352576;
- 352288.
Неполноэкранные изображения могут быть закодированы для отображения в меньшем размере, чем полноразмерное (при использовании одного из стандартных отношений повышающего преобразования в приемнике-декодере).
IRD потоков битов MPEG-2/SDTV/25 должен обеспечивать декодирование с передискретизацией изображений с разрешениями яркости, показанными в ETSI [16] (таблица 5), позволяющей изображения отображать в полноэкранной форме.
Приемники-декодеры потоков битов MPEG-2/SDTV/25 должны обеспечивать декодирование более низких разрешений яркости изображения и должны обеспечивать их отображение в меньшем, чем в полноразмерном изображении, после использования одного из стандартных повышающих преобразований, например, горизонтальное разрешение 704 элементов в пределах 720 элементов полноэкранного изображения.
5.1.6 Рекомендуется координаты цветности идеального изображения, оптоэлектронную характеристику передачи идеального изображения и матричные коэффициенты, используемые в порождаемой яркости и сигналах цветности от первичного красного, зеленого и синего цветов, передавать в потоке битов SDTV с установлением соответствующих значений для каждого из следующих трех параметров:
- sequence_display_extension (): colour_primaries;
- transfer_characteristics;
- matrix_coefficients.
Если в потоке битов MPEG-2/SDTV/25 поле sequence_display_extension () не присутствует или поле colour_description имеет значение "0", то должны выполняться следующие правила:
- цветность должна быть определена не явно, исходя из значения colour_primaries "5",
- характеристики передачи должны быть определены не явно, исходя из значения transfer_characteristics "5";
- матричные коэффициенты должны быть определены не явно, исходя из значения matrix_coefficients "5".
5.1.7 В потоке битов изменение соотношения частот дискретизации сигнала яркости и цветоразностных сигналов от 4:2:2 до 4:2:0 в расширении кодирования изображения должно обозначаться параметром поля chroma_420_type. Интерпретация параметра chroma_420_type должна быть в соответствии с ETSI [16] (подраздел 5.1.6).
5.1.8 Кодирование заголовка последовательности битов видео, следующего за l-кадром, рекомендуется выполнять через каждые 500 мс, не менее. Если матрицы квантователя, в дополнение к значению по умолчанию, используют поля appropriateintra_quantizer_matrix и/или non_intra_quantizer_matrix, то рекомендуется включать их в каждый заголовок последовательности битов.
5.2 Параметры потоков битов MPEG-2/HDTV/25. Параметры приемников-декодеров
5.2.1 Кодирование потоков битов MPEG-2/HDTV/25 должно выполняться в соответствии с Рекомендацией ITU-T/ISO/IEC [9]. Некоторые из параметров и полей, указанные в Рекомендации ITU-T/ISO/IEC [9], в системе DVB не используются. Эти случаи описаны ниже.
IRD должен проектироваться в предположении, что любая структура, разрешенная Рекомендацией ITU-T/ISO/IEC [9], может встретиться в потоке битов, даже если она относится к зарезервированным или неиспользуемым в настоящее время.
5.2.2 Кодирование потоков битов должно выполняться в соответствии с ограничениями профиля и уровня MP@HL по Рекомендации ITU-T/ISO/IEC [9] (пункт 8.2). В случае использования более простого профиля или уровня, чем MP@HL, в поле profile_and_level_indication должно устанавливаться значение "01000100".
IRD потоков битов MPEG-2/HDTV/25 должен поддерживать декодирование потоков битов MP@HL Должна обеспечиваться поддержка более простых профилей и уровней, включая MP@ML, в соответствии с Рекомендацией ITU-T/ISO/IEC [9] (таблица 8-15). Функция поддержки приемниками-декодерами профилей и уровней, отличающихся от MP@HL и MP@ML, является опциональной. При появлении в потоке битов расширений, которые IRD не может декодировать, таких как "Reserved", "Picture Sequence Scaleable", "Picture Spatial Scaleable" или "Picture Temporal Scaleable", IRD должен игнорировать данные, следующие за этими полями.
5.2.3 Частота кадров изображения потоков битов MPEG-2/HDTV/25 должна быть 25 Гц (значение кода frame_rate_code "0011") или 50 Гц (значение кода frame_rate_code "0110"). Исходный формат видеоматериала с частотой кадров 50 Гц должен быть с прогрессивной разверткой. Исходный формат для видеоматериала с частотой кадров 25 Гц может быть с чересстрочной или с прогрессивной разверткой.
Стоп-кадры (фотографии) могут быть закодированы в форме видео последовательности, состоящей из кадров с внутренним кодированием (определение стоп-кадра с внутренним кодированием должно быть в соответствии с Рекомендацией ITU-/ISO/IEC [14] (пункт 2.1.70)).
Все приемники-декодеры потоков битов MPEG-2/HDTV/25 должны поддерживать декодирование и отображение видеоматериала с частотой кадров 25 Гц при чересстрочной или прогрессивной развертке или с частотой кадров 50 Гц при прогрессивной развертке (frame_rate_code "0011" или "0110"). Функция поддержки других частот кадра является опциональной.
Приемники-декодеры потока битов MPEG-2/HDTV/25 должны обеспечивать декодирование и отображение стоп-кадров видеопоследовательностей, состоящих из кадров с внутренним кодированием (определение стоп-кадра с внутренним кодированием в соответствии с Рекомендацией ITU-T/ISO/IEC [14] (пункт 2.1.70)).
5.2.4 Исходный формат кадров изображения в потоках битов MPEG-2/HDTV/25 должен быть 16:9 или 2.21:1. В заголовке последовательности aspect_ratio_information должно устанавливаться одно из следующих значений: "0011" (формат кадров изображения 16:9) или "0100" (формат кадров изображения 2.21:1).
Функция декодирования и поддержки приемником-декодером потока битов MPEG-2/HDTV/25 при формате кадров изображения 2.21:1 является опциональной. При наличии у приемника-декодера цифрового интерфейса должен обеспечиваться вывод потоков битов с форматами кадров изображения, непосредственно не поддерживаемых приемником-декодером, для их декодирования и отображения с помощью внешнего модуля.
5.2.5 В закодированных изображениях должны обеспечиваться параметры полноэкранного разрешения яркости в пределах требований, установленных для MP@HL. Должно обеспечиваться не более чем:
- 1088 строк на кадр;
- 1920 отсчетов яркости на строку;
- 62668800 отсчетов яркости в секунду.
Рекомендуется, чтобы у исходного изображения потоков битов видео MPEG-2/HDTV/25 были следующие параметры разрешения яркости:
- 1080 строк на кадр;
- 1920 отсчетов яркости на строку;
- два чересстрочных поля на кадр (при частоте кадров 25 Гц).
Допускается субдискретизация исходного видео до кодирования. Допускается использование исходного видео с другими разрешениями в пределах требований, установленных для MP@HL. Допускается кодирование неполноэкранных изображений для отображения в меньшем размере относительно полноразмерного. Параметры поддерживаемых полноэкранных разрешений яркости приведены в приложении А.
Примечания:
1 В случае MP@HL при предельном значении количества отсчетов яркости в секунду, равном 62668800 отсчетам, не допускается использование максимального допустимого разрешения изображения при частоте кадров 50 Гц.
2 Если исходный видеоформат закодирован без применения субдискретизации, то это позволяет получить 51840000 отсчетов яркости в секунду. Это значение находится в пределах допустимых значений для MP@HL.
IRD потоков битов MPEG-2/HDTV/25 должен быть способен к декодированию и визуализации изображений с разрешениями яркости в пределах ограничений, установленных для MP@HL.
5.2.6 Рекомендуется координаты цветности идеального изображения, оптоэлектронную характеристику передачи идеального изображения и матричные коэффициенты, используемые в порождаемых сигналах яркости и цветности первичных красного, зеленого и синего цветов, передавать в закодированном потоке битов HDTV с установлением соответствующих значений для каждого из следующих параметров:
- sequence_display_extension (): colour_primaries;
- transfer_characteristics;
- matrix_coefficients.
Рекомендуется использовать колориметрию в потоке битов HDTV/25, устанавливая значения:
- colour_primaries "1";
- transfer_characteristics "1";
- matrix_coefficients "1" в соответствии с Рекомендацией ITU-R [20].
IRD потока битов MPEG-2/HDTV/25 должен обеспечивать декодирование потоков битов с любыми разрешенными значениями полей colour_primaries, transfer_characterstics и matrix_coefficients.
Рекомендуется предусматривать в приемнике-декодере обработку потока битов, обеспечивающую точное представление колориметрии изображений в соответствии с Рекомендацией ITU-R [20].
5.2.7 В потоке битов изменение соотношения частот дискретизации сигнала яркости и цветоразностных сигналов от 4:2:2 до 4:2:0 в расширении кодирования изображения должно обозначаться параметром chroma_420_type. Интерпретация параметра chroma_420_type должна выполняться в соответствии с ETSI [16] (пункт 5.2.6).
5.2.8 Кодирование заголовка видеопоследовательности битов, сопровождаемого l-кадром, рекомендуется выполнять через каждые 500 мс, не менее. Если матрицы квантователя используют поля appropriateintra_quantizer_matrix и/или non_intra_quantizer_matrix, рекомендуется включать эти поля в каждый заголовок последовательности битов.
5.2.9 IRD потоков битов MPEG-2/HDTV/25 должен обеспечивать декодирование любых потоков битов, декодируемых приемником-декодером MPEG-2/SDTV/25 и перечисленных в 5.1 настоящего стандарта.
5.3 Общие параметры потоков битов H.264/AVC. Общие параметры приемников-декодеров
5.3.1 В этом подразделе представлены общие требования к параметрам потоков битов H.264/AVC/SDTV/25; H.264/AVC/HDTV/25; H.264/AVC/HDTV/50 и к приемникам-декодерам этих потоков.
5.3.2 Кодирование потоков битов, перечисленных в 5.3.1, должно выполняться в соответствии с Рекомендацией ITU-T/ISO/IEC [7]. Некоторые из параметров и полей, предусмотренных этой Рекомендацией, в системе DVB не используются. Эти случаи описаны ниже.
Потоки битов H.264/AVC должны содержать структуры, включающие элементы синтаксиса отдельных частей "Supplemental Enhancement Information (SEI)" и "Video usability information (VUI)" в соответствии с Рекомендацией ITU-T/ISO/IEC [7] (приложения D и Е).
Приемники-декодеры потоков битов H.264/AVC должны обеспечивать обработку структур с элементами синтаксиса отдельных частей "Supplemental Enhancement Information (SEI)" и "Video usability information (VUI)" в соответствии с Рекомендацией ITU-T/ISO/IEC [7] (приложения D и Е).
Проектирование приемников-декодеров потока битов H.264/AVC должно выполняться с учетом того, что любая структура в потоке битов, разрешенная Рекомендацией ITU-T/ISO/IEC [7], может встретиться в потоке битов вещания, даже если эти структуры относятся к зарезервированным или к неиспользуемым.
5.3.3 При кодировании потока битов H.264/AVC в потоке битов между двумя точками RAP может устанавливаться не менее одного набора параметра изображения (PPS). Контент, соответствующий набору параметра изображения с конкретным значением поля pic_parameter_set_id, не должен изменяться между двумя точками RAP в потоке битов H.264/AVC. Это означает, что если в потоке битов H.264/AVC присутствует более одного PPS и что если эти наборы параметра изображения отличаются друг от друга, то каждому PPS должен соответствовать конкретный pic_parameter_set_id.
5.3.3.1 Интервал времени между двумя последовательными изменениями в парах полей pic_width_in_mbs_minus1 и pic_height_in_map_units_minus1 должен быть не менее 1 с. Ограничение частоты этих последовательных изменений должно обеспечивать программное обеспечение приемника-декодера, выполняющее необходимую поддержку изменения формата кадра изображения.
Примечание - Различие между полями пары pic_width_in_mbs_minus1 и pic_height_in_map_units_minus1 фиксируется, если различны значения одного или обоих элементов синтаксиса.
Рекомендуемые правила дополнения отсчетов яркости до целочисленных значений, кратных 16, должны быть в соответствии с ETSI [16] (пункт 5.5.2.1).
5.3.4 Приемник-декодер должен поддерживать использование следующих элементов синтаксиса информации VUI:
- информация о формате кадра изображения (aspect_ratio_idc);
- информация о параметрах цвета (colour_primaries, transfer_characteristics, matrix_coefficients);
- информация о цветности (chroma_sample_loc_type_top_field и chroma_sample_loc_type_bottom_field);
- информация о синхронизации (time_scale, num_units_in_tick и fixed_frame_rate_flag);
- информация о структуре изображения (pic_struct_present_flag).
5.3.4.1 Кодеры потоков битов H.264/AVC/SDTV/25 и H.264/AVC/HDTV и приемники-декодеры этих потоков должны поддерживать параметры значений полей aspect_ratio_idc информации о формате кадра изображения в соответствии с 5.4.1.3 и 5.5.1.2 настоящего стандарта соответственно.
5.3.4.2 Кодеры потоков битов H.264/AVC/SDTV/25 и H.264/AVC/HDTV и приемники-декодеры этих потоков битов должны поддерживать параметры полей colour_primaries, transfer_characteristics и matrix_coefficients в соответствии с 5.4.2.2 и 5.5.1.3 настоящего стандарта соответственно.
5.3.4.3 При кодировании потока битов рекомендуется предусматривать локацию структур в потоках битов, определяющих цветность, использованием элементов синтаксиса chroma_sample_loc_type_top_field и chroma_sample_loc_type_bottom_field в VUI. Рекомендуется использовать тип отсчета цветности для обоих полей, имеющих значение "0".
Приемник-декодер должен поддерживать декодирование любых разрешенных значений полей chroma_sample_loc_type_top_field и chroma_sample_loc_type_bottom _field. Рекомендуется, чтобы в приемнике-декодере была предусмотрена необходимая обработка потока битов для визуализации изображений.
5.3.4.4 При кодировании потоков битов H.264/AVC/SDTV/25 значения полей time_scale и num_units_in_tick и параметры IRD этих потоков должны быть в соответствии с 5.4.2.3 настоящего стандарта.
При кодировании потоков битов H.264/AVC/HDTV/50 значения полей time_scale и num_units_in_tick и параметры IRD этих потоков определены в 5.5.2.2 настоящего стандарта.
При кодировании потоков битов H.264/AVC/HDTV/50 значения полей time_scale и num_units_in_tick и параметры IRD этих потоков определены в 5.5.2.2 настоящего стандарта.
При кодировании и декодировании потоков битов H.264/AVC поддержка флага pic_struct_present_fIag, связанного с использованием информации о структуре изображения в сообщении о синхронизации изображения SEI, должна выполняться в соответствии с ETSI [16] (пункты 5.5.3.5 и 5.5.4.1). В потоках битов, переносящих информацию о структуре изображения для режима фильма, рекомендуется в VUI и в сообщении синхронизации изображения SEI каждого модуля доступа в кодированной последовательности в флаге pic_struct_present_flag устанавливать "1". По умолчанию в VUI в флаге pic_struct_present_flag должен быть установлен "0".
5.3.5 IRD должен поддерживать использование сообщений дополнительной расширенной информации (SEI) в соответствии с ETSI [16] (пункт 5.5.4).
5.3.6 Параметры кодирования и декодирования точки произвольного доступа должны быть в соответствии с ETSI [16] (пункт 5.5.5).
Параметры кодирования и декодирования временного интервала между точками RAP должны быть в соответствии с ETSI [16] (пункт 5.5.5.1).
5.4 Параметры потоков битов H.264/AVC/SDTV/25. Параметры приемников-декодеров
5.4.1 Общие требования к потокам битов H.264/AVC/SDTV/25 и к приемнику-декодеру этих потоков
5.4.1.1 Набор параметров последовательности и набор параметров изображения
При кодировании, в дополнение к условиям, сформулированным в Рекомендации ITU-T/ISO/IEC [7], используются следующие параметры полей в наборе параметра последовательности:
- profile_idc = 77 (Main Profile (MP));
- profile_idc =100 (High Profile (HP)). Детализация применения профиля HP представлена в ETSI [16] (подпункт 5.6.1.2);
- constraint_set0_flag = 0;
- constraint_set1_flag = 1(если profile_idc = 77);
- constraint_set1_flag = 0 (если profile_idc = 100);
- constraint_set2_flag = 0;
- constraint_set3_flag = 0 (если profile_idc = 100);
- gaps_in_frame_num_value_allowed_flag = 0 (пробелы не разрешены);
- vui_parameters_present_flag = 1.
5.4.1.2 Профиль и уровень обработки видеосигнала
Кодирование параметров профиля и уровня в потоках битов H.264/AVC/SDTV/25 должно соответствовать основным ограничениям MP@L3 в соответствии с Рекомендацией ITU-T/ISO/IEC [7].
Допускается соответствие потока битов ограничениям (нормам) для профиля HP для тех приложений, в которых декодеры поддерживают профиль HP. Значение поля level_idc должно быть равно 30.
Приемники-декодеры потоков битов H.264/AVC/SDTV/25 должны поддерживать декодирование и отображение потоков битов MP@L3. Допускается поддержка профиля HP. Функция поддержки уровней, отличающихся от уровня L3, является опциональной. Если IRD потока битов H.264/AVC/SDTV/25 получает поток битов с расширением, которое он не может декодировать, то данные, следующие за этим расширением, приемник-декодер должен игнорировать.
5.4.1.3 Формат кадра изображения
При кодировании потоков битов H.264/AVC/SDTV/25 исходный формат кадра изображения должен быть 4:3 или 16:9.
В наборе параметра последовательности допускается использование информации об обрезке кадра.
IRD потоков битов H.264/AVC/SDTV/25 должен поддерживать декодирование потоков, исходя из значений aspect_ratio_idc и других ограничений, которые определены в ETSI [16] (пункт 5.4.2) для приемника-декодера потока битов H.264/AVC/SDTV/25 и должны обеспечивать формирование изображения, соответствующего этому потоку.
Исходная информация о формате кадра изображения должна быть получена из полей pic_height_in_map_units_minus1 и pic_width_in_mbs_minus1 и информации об обрезке кадра, кодированной в наборе параметра последовательности, так же как в образце формата кадра изображения, закодированного со значением поля aspect_ratio_idc в VUI (значения aspect_ratio_idc должны быть в соответствии с Рекомендацией ITU-T/ISO/IEC [7] (таблица Е-1). IRD потока битов формата кодирования H.264/AVC/SDTV/25 должен поддерживать режим обрезки кадра.
5.4.2 Требования к потоку битов H.264/AVC/SDTV/25 и к приемнику-декодеру этого потока битов
5.4.2.1 Требования к потоку битов H.264/AVC/SDTV/25 и к приемнику-декодеру этого потока битов должны быть в соответствии с 5.3 и 5.4.1 настоящего стандарта.
5.4.2.2 Рекомендуется координаты цветности идеального изображения, оптоэлектронную характеристику передачи исходного изображения и матричные коэффициенты, используемые в порождаемой яркости и сигналах цветности основных цветов красного, зеленого и синего, передавать в потоке битов H.264/AVC/SDTV/25 с установлением необходимых значений для каждого из следующих параметров в VUI:
- colour_primaries "5";
- transfer_characteristics "5";
- matrix_coefficients "5"
в соответствии с Рекомендацией ITU-R [22] (часть В).
При декодировании потока битов H.264/AVC/SDTV/25 IRD должен поддерживать декодирование этого потока с любыми разрешенными значениями полей colour_primaries, transfer_characterstics и matrix_coefficients.
Рекомендуется предусматривать в приемнике-декодере обработку потока битов, обеспечивающую точное представление колориметрии изображений в соответствии с Рекомендацией ITU-R [22] (часть В).
5.4.2.3 При кодировании потоков битов H.264/AVC/25 частота кадров должна составлять 25 Гц. Значения полей в VUI должны устанавливаться равными: time_scale "50" и num_units_in_tick "1" как для прогрессивной, так и для чересстрочной развертки.
Приемники-декодеры должны поддерживать декодирование потоков битов H.264/AVC/SDTV/25 и отображение видео с частотой кадров 25 Гц в пределах ограничений MP@L3. Поддержка других частот кадров является опциональной функцией.
5.4.2.4 При кодировании потоков битов H.264/AVC/SDTV/25 должны обеспечиваться разрешения яркости, представленные в таблице 4. Неполноэкранные изображения могут быть закодированы для отображения в меньшем размере, чем полноразмерное (при использовании одного из стандартных отношений повышающего преобразования (передискретизации)) в приемнике-декодере потоков битов H.264/AVC/SDTV/25 и приемников-декодеров потоков битов H.264/AVC/HDTV/25, H.264/AVC/HDTV/50 в соответствии с ETSI [16] (таблица 9, примечание 3).
Таблица 4 - Разрешения яркости для полноэкранного изображения приемника-декодера потоков битов H.264/AVC/SDTV/25 и приемников-декодеров потоков битов H.264/AVC/HDTV/25, H.264/AVC/HDTV/50
Кодированное изображение | Отображаемое изображение (в числителе - по горизонтали) | |||
Разрешение яркости (горизонталь вертикаль) | Исходный формат кадров изображения | Aspect_ratio_idc | Мониторы формата кадра изображения 4:3 | Мониторы формата кадра изображения 16:9 |
720576 | 4:3 | 2 | 1 | 3/4 (Примечание 2) |
16:9 | 4 | 4/3 (Примечание 1) | 1 | |
544576 | 4:3 | 4 | 4/3 | 1 (Примечание 2) |
16:9 | 12 | 16/9 (Примечание 1) | 4/3 | |
480576 | 4:3 | 10 | 3/2 | 9/8 (Примечание 2) |
16:9 | 6 | 2 (Примечание 1) | 3/2 | |
352576 | 4:3 | 6 | 2 | 3/2 (Примечание 2) |
16:9 | 8 | 8/3 (Примечание 1) | 2 | |
352288 | 4:3 | 2 | 2 | 3/2 (Примечание 2) |
16:9 | 4 | 8/3 (Примечание 1) | 2 (и передискретизация по вертикали 2) | |
Примечания: 1 Функция передискретизации изображения с этим значением применена к элементам изображения формата кадра изображения 16:9, которое будет показано на мониторе формата кадра изображения 4:3. 2 Функция передискретизации изображения формата кадра 4:3 для отображения на мониторе формата кадра 16:9 для приемника-декодера является опциональной, позволяющей переключать мониторы формата кадра 16:9 для работы в режиме формата кадра 4:3. |
IRD потока битов H.264/AVC/SDTV/25 должен обеспечивать декодирование изображений с разрешениями яркости, показанными в таблице 4, и с отображением декодируемых изображений в полноэкранной форме. IRD потока битов H.264/AVC/SDTV/25 должен обеспечивать декодирование при более низких разрешениях изображения и отображение их в меньшем формате кадра изображения, чем полноразмерный формат в соответствии с ETSI [16] (таблица 9, примечание 3).
5.5 Параметры потоков битов H.264/AVC/HDTV. Параметры приемников-декодеров
5.5.1 В подразделе установлены требования к потокам битов и приемникам-декодерам потоков битов H.264/AVC/HDTV/25 и H.264/AVC/HDTV/50.
5.5.1.1 Набор параметра последовательности и набор параметра изображения
При кодировании потока битов в дополнение к условиям, сформулированным в Рекомендации ITU-T/ISO/IEC [7], применяются следующие параметры полей в наборе параметра последовательности:
- profile_idc = 100 (High Profile в Рекомендации ITU-T/ISO/IEC [7]);
- constraint_set0_flag = 0;
- constraint_set1_flag = 0;
- constraint_set2_flag = 0;
- constraint_set3_flag = 0;
- gaps_in_frame_num_value_allowed_flag = 0 (пробелы не разрешены);
- vui_parameters_present_flag = 1.
5.5.1.2 Формат кадра изображения
При кодировании потока битов H.264/AVC/HDTV исходный формат кадра изображения должен быть 16:9. Исходная информация о формате кадра изображения должна определяться значением поля aspect_ratio_idc в VUI (в соответствии с Рекомендацией ITU-T/ISO/IEC [7] (таблица Е-1)). Допускается использование информации об обрезке кадра в наборе параметра последовательности.
IRD потока битов H.264/AVC/HDTV должен поддерживать декодирование потоков битов этого профиля со значениями поля aspect_ratio_idc в соответствии с таблицей 5 и формирование изображения, соответствующего этому потоку битов.
Таблица 5 - Значения поля aspect_ratio_idc для разрешения яркости полноэкранного изображения потока битов H.264/AVC/HDTV
Кодированное изображение | |||
Разрешение яркости (горизонтальвертикаль) | Исходный формат кадра изображения | aspect_ratio_idc | Мониторы 16:9 |
19201080 | 16:9 | 1 | 1 |
14401080 | 16:9 | 14 | 4/3 |
12801080 | 16:9 | 15 | 3/2 |
9601080 | 16:9 | 16 | 2 |
1280720 | 16:9 | 1 | 1 |
960720 | 16:9 | 14 | 4/3 |
640720 | 16:9 | 16 | 2 |
Исходная информация о формате кадра изображения должна быть получена из полей pic_height_in_map_units_minus1 и pic_width_in_mbs_minus1 и информации об обрезке кадра, кодированной в наборе параметра последовательности, так же как в образце формата кадра изображения, закодированного со значением поля aspect_ratio_idc в VUI в соответствии со значениями поля aspect_ratio_idc в Рекомендации ITU-T/ISO/IEC [7] (таблица Е-1). IRD потока битов H.264/AVC/HDTV должен поддерживать режим обрезки кадра.
5.5.1.3 Рекомендуется при кодировании координаты цветности идеального изображения, опто-электронную характеристику передачи исходного изображения и матричные коэффициенты, используемые в порождаемой яркости и сигналах цветности основных цветов красного, зеленого и синего, передавать в потоках битов H.264/AVC/HDTV с установлением соответствующих значений для каждого из следующих параметров в VUI:
- colour_primaries "1";
- transfer_characteristics "1";
- matrix_coefficients "1"
в соответствии с Рекомендацией ITU-R [22] (часть В).
IRD потока битов H.264/AVC/HDTV должен поддерживать декодирование потоков битов с любыми разрешенными значениями полей colour_primaries, transfer_characterstics и matrix_coefficients.
Рекомендуется предусматривать в приемнике-декодере обработку потока битов, обеспечивающую точное представление колориметрии изображений в соответствии с Рекомендацией ITU-R [20].
5.5.1.4 При кодировании потоков битов H.264/AVC/HDTV должно обеспечиваться представление видео с разрешениями яркости, как показано в таблице 5. Неполноэкранные изображения могут быть закодированы для отображения с меньшим разрешением, чем полноразмерные (при использовании одного из стандартных отношений повышающего преобразования в приемнике-декодере потока битов H.264/AVC/HDTV).
IRD потоков битов H.264/AVC/HDTV должен обеспечивать декодирование изображений с разрешениями яркости, как показано в таблице 5, и с отображением декодируемых изображений в полноэкранной форме.
5.5.2 Требования к потоку битов H.264/AVC/HDTV/25 и к приемникам-декодерам потока битов H.264/AVC/HDTV/25
5.5.2.1 Профили и уровни. Потоки битов H.264/AVC/HDTV должны соответствовать ограничениям профиля и уровня HP@L3 в соответствии с Рекомендацией ITU-T/ISO/IEC [7]. Значение поля level_idc должно быть равно 30, 31, 32 или 40.
IRD потоков битов H.264/AVC/HDTV/25 должен поддерживать декодирование потоков битов профилей и уровней HP@L3 и HP@L4. Рекомендуется поддержка профилей и уровней, отличающихся от HP@L3 и HP@L4. Если IRD потока битов H.264/AVC /HDTV встречается с расширением, которое он не может декодировать, то он должен игнорировать данные, следующие за этим расширением.
5.5.2.2 Частота кадров. В потоках битов H.264/AVC/HDTV/25 и H.264/AVC/HDTV/50 частота кадров должна составлять 25 Гц или 50 Гц. Значение частоты кадров должно записываться в VUI при установке величин time_scale и num_units_in_tick в соответствии с таблицей 6. Исходный формат для видеоматериала с частотой кадров 50 Гц должен быть с прогрессивной разверткой. Исходный видеоматериал с частотой кадров 25 Гц должен быть с чересстрочной или с прогрессивной разверткой.
Таблица 6 - Значения полей time_scal и num_units_in_tick для прогрессивной и чересстрочной развертки для потоков битов H.264/AVC/HDTV/25, H.264/AVC/HDTV/50
Частота кадров, Гц | Тип развертки | time_scale | num_units_in_tick |
25 | прогрессивная | 50 | 1 |
25 | чересстрочная | 50 | 1 |
50 | прогрессивная | 100 | 1 |
IRD потоков битов H.264/AVC/HDTV/25 должен поддерживать декодирование и отображение видеоматериала с частотой кадров 25 Гц при чересстрочной или прогрессивной развертке, или с частотой кадров 50 Гц при прогрессивной развертке в пределах ограничений профиля и уровня HP@L4. Функция поддержки других частот кадров является опциональной.
5.5.2.3 IRD потоков битов H.264/AVC/HDTV/25 должны обеспечивать декодирование любых потоков битов, которые должен декодировать IRD потока битов H.264/AVC/SDTV/25, и обеспечивать отображение видеоматериала в соответствии с 5.4.2.1 настоящего стандарта.
5.5.3 Поток битов H.264/AVC/HDTV/50 и IRD потока битов 264/AVC/HDTV/50
Требования к потоку битов H.264/AVC/SDTV/50 и к IRD этого потока должны быть в соответствии с 5.3 и 5.5.1 настоящего стандарта. Кроме того, должны выполняться требования к потоку битов H.264/AVC/HDTV/50 и к IRD этого потока:
5.5.3.1 При кодировании потоки битов H.264/AVC/HDTV/50 должны соответствовать ограничениям профиля и уровня [email protected] в соответствии с Рекомендацией ITU-T/ISO/IEC [7]. Значение поля level_idc должно быть равно 41 или 42.
IRD потоков битов H.264/AVC/HDTV/50 должен поддерживать декодирование профилей и уровней НР@L4.1 и [email protected]. Функция поддержки профилей и уровней, отличающихся от НР@L4.1 и [email protected], является опциональной. Если IRD потока битов H.264/AVC/HDTV/50 встречает в потоке битов расширение, которое он не может декодировать, то он должен игнорировать данные, следующие за этим расширением.
5.5.3.2 При кодировании потоков битов частота кадров должна составлять 25 Гц или 50 Гц. Частота кадров должна записываться в VUI при установке величин полей time_scale и num_units_in_tick согласно таблице 6. Развертка исходного видеоматериала с частотой кадров 50 Гц должна быть прогрессивной. Развертка исходного видеоматериала с частотой кадров 25 Гц должна быть чересстрочной или прогрессивной.
IRD потоков битов H.264/AVC/HDTV/50 должны поддерживать декодирование и отображение видеоматериала с частотой кадров 25 Гц при чересстрочной или прогрессивной развертке или с частотой кадров 50 Гц при прогрессивной развертке в пределах ограничений профиля и уровня НР@L4.2. Функция поддержки других частот кадров является опциональной.
5.5.4 IRD потоков битов H.264/AVC/HDTV/50 должен обеспечивать декодирование любого потока битов, которые должен декодировать IRD потока битов H.264/AVC/HDTV/25 и обеспечивать отображение видеоматериала в соответствии с 5.5.2 настоящего стандарта.
6 Параметры кодирования потоков битов аудио профилей и приемников-декодеров потоков битов аудио профилей
6.1 Введение
Раздел нормирует параметры кодирования и декодирования следующих потоков битов аудио:
- MPEG-1 и MPEG-2 Layer II с обратной совместимостью;
- АС-3 или АС-3 улучшенный;
- DTS;
- MPEG-4AAC;
- MPEG-4 НЕ ААС;
- MPEG-4 НЕ ААС v2;
- стандарта MPEG Surround: комбинация потока битов аудио MPEG-1 Layer II с потоком битов аудио MPEG-4 ААС или MPEG-4 НЕ ААС или MPEG-4 НЕ ААС v2.
6.2 Параметры кодирования потоков битов MPEG-1 и MPEG-2 с обратной совместимостью и приемников-декодеров потоков битов MPEG-1 и MPEG-2 с обратной совместимостью
6.2.1 Параметры аудиокодеров стандартов MPEG-1 и MPEG-2 с обратной совместимостью должны соответствовать требованиям ISO/IEC [4] или [5]. Некоторые из параметров и полей, нормируемых ISO/IEC [4], [5], в системе DVB не используются. Эти ограничения описаны ниже.
Проектирование приемников-декодеров потоков битов аудио стандартов MPEG-1 и/или MPEG-2 с обратной совместимостью должно выполняться в предположении, что любая структура потока битов, разрешенная ISO/IEC [4] или [5], может встретиться в потоке вещания, даже если она в настоящее время зарезервирована или не используется. Приемник-декодер должен быть в состоянии игнорировать структуры данных, которые в настоящий момент "зарезервированы", или которые не соответствуют функциям, реализованным в приемнике-декодере. Функция обработки потоков битов, образованных сочетанием технологий кодирования звука по стандарту MPEG-1 Layer II и по стандарту MPEG Surround, является опциональной.
6.2.2 Кодирование и декодирование потока битов MPEG Surround выполняется в соответствии с ISO/IEC [11], [12]. При кодировании потока битов MPEG Surround выполняется понижающее микширование (моно или стерео) многоканального входного аудиосигнала. При понижающем микшировании используется базовый аудиокодер MPEG-1 Layer II. Опционально допускается формирование кодером MPEG Surround параметра пространственного отображения многоканального аудиосигнала, который добавляется как вспомогательный поток данных к потоку данных базового аудиокодера. Существующие моно или стерео декодеры игнорируют вспомогательные данные и воспроизводят моно или стерео аудиосигнал. Декодеры, совместимые с MPEG Surround, будут сначала декодировать моно или стерео базовый аудиосигнал кодека и затем использовать пространственные параметры отображения, извлеченные из потока данных, для формирования высококачественного многоканального аудиосигнала. Принципы кодирования и декодирования потоков битов MPEG Surround при понижающем микшировании с использованием кодера MPEG-1 Layer II представлены на рисунке 1.
Рисунок 1 - Принцип MPEG Surround с понижающим микшированием с применением кодирования MPEG-1 Layer II
Допускается кодирование аудио выполнять в двухканальном режиме в соответствии с Рекомендацией ISO/IEC [4], в котором два аудио канала с независимым содержанием программ (например, двуязычных) кодируются в одном потоке битов. Детализированные условия применения такого режима должны быть в соответствии с ETSI [16] (пункт 6.1.1).
IRD должен обеспечивать декодирование потоков битов MPEG-1 и/или MPEG-2 с обратной совместимостью следующих режимов:
- одиночный канал (моно) канал в соответствии с ISO/IEC [4];
- объединенное стерео в соответствии с ISO/IEC [4];
- стерео в соответствии с ISO/IEC [4].
Функция приемника-декодера полного декодирования в соответствии с ISO/IEC [5] многоканального аудио потока битов является опциональной.
Функция приемника-декодера декодирования потока битов в соответствии с ISO/IEC [4] является опциональной.
6.2.3 Уровни кодирования. Кодер потока битов в соответствии с ISO/IEC [4] использует уровни кодирования Layer I или Layer II (в поле layer устанавливаются значения "11" или "10" соответственно). Использование уровня кодирования Layer II является рекомендательным. Поток битов многоканального звука, в соответствии с ISO/IEC [5], должен использовать уровень кодирования Layer II.
Приемники-декодеры должны обеспечивать декодирование потоков, сформированных при уровнях кодирования Layer I или Layer II. В том случае, если IRD поддерживает декодирование потока битов по стандарту MPEG Surround, то должно поддерживаться сочетание технологий декодирования профиля MPEG-1 Layer II и MPEG Surround. IRD должен интерпретировать эти форматы в соответствии с синтаксисом, определяемым по стандартам MPEG-1 и MPEG Surround.
6.2.4 Скорость передачи. Поле bitrate_index в потоке битов должно принимать одно из 14 значений от "0001" до "1110" (включительно).
Для уровня кодирования Layer I они соответствуют скоростям передачи: 32 кбит/с, 64 кбит/с, 96 кбит/с, 128 кбит/с, 160 кбит/с, 192 кбит/с, 224 кбит/с, 256 кбит/с, 288 кбит/с, 320 кбит/с, 352 кбит/с, 384 кбит/с, 416 кбит/с или 448 кбит/с.
Для уровня кодирования Layer II они соответствуют скоростям передачи: 32 кбит/с, 48 кбит/с, 56 кбит/с, 64 кбит/с, 80 кбит/с, 96 кбит/с, 112 кбит/с, 128 кбит/с, 160 кбит/с, 192 кбит/с, 224 кбит/с, 256 кбит/с, 320 кбит/с, 384 кбит/с.
При кодировании должна обеспечиваться возможность увеличения скорости потока (расширения потока) битов, предусмотренная ISO/IEC [5], до 682 кбит/с.
Приемники-декодеры должны обеспечивать декодирование потоков битов со значением bitrate_index от "0001" до "1110" (включительно). Функция поддержки приемником-декодером свободного формата скорости передачи (bitrate_index ="0000") является опциональной.
6.2.5 Частота дискретизации. При кодировании основных звуковых служб частота дискретизации должна составлять 32 кГц или 44,1 кГц или 48 кГц. Для кодирования вторичных звуковых служб могут использоваться частоты дискретизации 16 кГц, 22,05 кГц, 24 кГц, 32 кГц, 44,1 кГц или 48 кГц.
IRD должен обеспечивать декодирование потоков битов аудио с частотами дискретизации 32 кГц, 44,1 кГц или 48 кГц. Функция поддержки IRD частот дискретизации 16 кГц, 22,05 кГц и 24 кГц является опциональной.
6.2.6 Предыскажения. В кодированный поток битов предыскажения вноситься не должны (в поле emphasis устанавливается значение "00").
IRD должен обеспечивать декодирование потока битов аудио без предыскажений. Функция поддержки компенсации предыскажений 50 мкс или 15 мкс в соответствии с Рекомендацией ITU-T [23] является опциональной (в поле emphasis устанавливаются значения "01" или "11" соответственно).
6.2.7 Циклический избыточный код. При кодировании в закодированный поток битов должно быть включено слово проверки четности (crc_check).
Рекомендуется в приемнике-декодере использовать слово проверки четности crc_check для обнаружения ошибок и последующего применения необходимых механизмов для маскирования ошибок или отключения звука.
6.2.8 Предсказание. При кодировании в многоканальных потоках битов аудио по ISO/IEC [5] не должно использоваться поле mc_prediction (в поле mc_prediction_on устанавливается значение "0").
IRD должен обеспечивать декодирование многоканальных потоков битов аудио в соответствии с ISO/IEC [5], в которых в поле mc_prediction установлено значение "0".
6.2.9 Многоканальные аудио потоки битов по ISO/IEC [5] не должны содержать многоязычные каналы (в поле no_of_multilingual_channels устанавливается "0").
IRD должен обеспечивать декодирование многоканальных потоков битов, соответствующих ISO/IEC [5]), которые не содержат многоязычные каналы.
6.2.10 Расширение потока. С целью предотвращения нежелательных перезагрузок аудио декодера рекомендуется, чтобы поток битов, кодированный по ISO/IEC [5] и содержащий расширение потока, сохранял кадры расширения потока на интервале программы, даже если бы полная скорость передачи была меньше 384 кбит/с и обеспечивала бы кодирование индивидуальных кадров.
6.2.11 Вспомогательные данные. Кодированные потоки битов режима стерео по ISO/IEC [5] или многоканальные закодированные потоки битов могут содержать вспомогательные данные в соответствии с приложением В.
Рекомендуется включать вспомогательные данные в поток битов в следующих случаях:
- для поддержки режима вещания вспомогательное поле данных может встроить в поток DAB вспомогательное поле данных ETSI [24];
- для поддержки передачи данных RDS к приемникам DVB и аналоговым передатчикам УКВ/FM вспомогательное поле данных может встраиваться в данные RDS при использовании протокола UECP.
Использование потоков битов для передачи видео DVD и данных DAB не допускается.
IRD может интерпретировать вспомогательное поле данных в потоке битов стерео, соответствующего рекомендации ISO/IEC [5], или в многоканальном потоке битов в соответствии с приложением В и может содействовать использованию этих данных.
6.2.12 Профили и уровни стандарта MPEG Surround (далее MPEG Surround). Параметры базового профиля MPEG Surround определены в Рекомендациях ISO/IEC [11], [12]. Поскольку профиль MPEG Surround используется в комбинации с базовым профилем MPEG-1 Layer II, на профиль MPEG Surround должны распространяться ограничения, установленные в 6.2.2-6.2.12 настоящего стандарта.
Полезная нагрузка потока битов MPEG Surround будет соответствовать правилам кодирования уровней level 3 или level 4 базового профиля MPEG Surround.
Кодирование: в случае комбинации профилей MPEG-1 Layer II и MPEG Surround поток битов MPEG Surround должен встраиваться во вспомогательные данные потока битов MPEG-1 Layer II с использованием элемента потока битов AncDataElement () в соответствии с ISO/IEC [11].
Для профиля MPEG-1 Layer II пространственная длина кадра, обозначенная параметром bsFrameLength, должна соответствовать длине кадра профиля MPEG-1 Layer II. Следовательно, величина bsFrameLength должна иметь одно из двух значений {17, 35}, соответствующих длине кадра MPEG Surround и содержащей 1152 или 2304 отсчета соответственно.
IRD, совместимый с потоком битов MPEG-1 Layer II и обеспечивающий декодирование потока битов MPEG Surround в версии 7.1 или с большим количеством каналов выводов, должен быть способен к обеспечению вывода в соответствии с параметрами базового профиля MPEG Surround Layer II.
IRD, совместимый с потоком битов MPEG-1 Layer II и обеспечивающий декодирование потока битов MPEG Surround, обеспечивающий от двух до 5.1 каналов вывода, должен быть способен к обеспечению вывода в соответствии с уровнем 3 базового MPEG Surround.
IRD, совместимый с потоком битов MPEG-1 Layer II и обеспечивающий декодирование потока битов MPEG Surround и 2.0-каналов вывода, должен быть способен к обеспечению вывода декодера в соответствии с параметрами базового профиля MPEG Surround Layer I.
6.3 Параметры кодирования потоков битов АС-3 и АС-3 улучшенный и приемников-декодеров потоков битов АС-3 и АС-3 улучшенный
6.3.1 Кодирование и декодирование элементарных потоков АС-3 и АС-3 улучшенный
Кодирование и декодирование элементарных потоков АС-3 и АС-3 улучшенный выполняются в соответствии с ETSI [2].
IRD, поддерживающий профиль АС-3, должен декодировать все элементарные потоки со скоростями передачи и типовыми коэффициентами, перечисленными в ETSI [2] (исключая приложение Е).
Приемники-декодеры, поддерживающие стандарт АС-3 улучшенный, должны декодировать поток битов АС-3 улучшенный со скоростями передачи данных от 32 кбит/с до 3024 кбит/с и поддерживать все частоты отсчетов, перечисленные в ETSI [2] (включая приложение Е). Поток битов АС-3 улучшенный подобен потоку битов АС-3, но он не является обратносовместимым.
Ограничения возможностей кодирования и декодирования многократных аудиопотоков при воспроизведении в случае точной синхронизации отсчетов должны быть в соответствии с ETSI [16] (пункты 6.2.1.1, 6.2.1.2).
6.3.2 Ограничения PES стандартов АС-3 и АС-3 улучшенный
6.3.2.1 Кодирование
В некоторых приложениях аудио декодер может одновременно декодировать два элементарных потока, содержащих элементы других программ, с последующим комбинированием элементов программы в общую программу. Большинство элементов программы находится в базовой аудио службе. В связанной аудио службе могут находиться такие элементы программы, как:
разговорное повествование, сопровождающее контент изображения и предназначенное для слушателя со слабым зрением, специально создаваемый диалог базовой аудио службы для слушателя с ослабленным слухом или дополнительные аудио службы, такие как устные комментарии режиссера или аудио службы с альтернативными языками.
При формировании двух элементарных аудио потоков для воспроизведения при точном синхронизме отсчетов необходимо в элементарных потоках обеспечивать синхронное кодирование двух аудио кадров в элементах программы: если в аудио потоке "1" есть отсчет "0" из кадра "n", выполненный во время "t 0", то у аудиопотока "2" также должен быть кадр "n", начинающийся с отсчета "0" и выполненный в момент времени "t 0".
Если кодирование многократных аудио служб выполнено с синхронными кадрами и отсчетами для декодирования синхронных кадров и отсчетов, то пакеты PES этих аудио служб должны содержать идентичные значения меток PTS, которые относятся к аудио модулям доступа, предназначенным для синхронного декодирования. Аудио службы, предназначенные для объединения при воспроизведении, в соответствии с ETSI [2] (приложение Е), должны подчиняться следующим ограничениям:
- аудио службы, предназначенные для объединения при воспроизведении, должны быть закодированы с идентичными частотами отсчетов;
- элементарный поток основной аудио программы должен быть закодирован или в соответствии со стандартом АС-3, или АС-3 улучшенный. Элементарный поток связанной аудио службы должен быть закодирован в соответствии со стандартом АС-3 улучшенный;
- элементарный поток связанной службы, закодированный в соответствии со стандартом АС-3 улучшенный, должен содержать смешанные метаданные, обеспечивающие декодеру возможность управления процессом смешивания;
- дескриптор AD_Descriptor не должен инкапсулироваться в PES элементарного потока аудио, закодированного в соответствии со стандартом АС-3 улучшенный и содержащего смешанные метаданные. Параметры дескриптора AD_Descriptor в соответствии с приложением Г, Г.1;
- основная аудио программа должна содержать от 1 до 7.1 каналов аудио. Элементарный поток по стандарту АС-3 улучшенный, который переносит связанные аудио службы, не должен содержать больше двух звуковых каналов и больше звуковых каналов, чем основная аудио программа;
- режим двойного моно кодирования не должен поддерживаться ни для основной программы, ни для связанной аудио службы;
- кодирование связанной аудио службы и последующее создание элементарного потока связанной аудио службы должно выполняться с учетом параметров кодирования основного потока программы;
- в поле pgmscl в потоке битов связанной аудио службы должно устанавливаться положительное значение параметра. Рекомендуется устанавливать величину, равную 12 дБ, что соответствует установке громкости в декодере пользователя "по умолчанию".
6.3.2.2 Декодирование
При синхронном декодировании соответствующие аудио кадры (модули доступа) потоков битов от двух аудио служб должны декодироваться одновременно. Они должны иметь идентичные значения меток PTS, присутствующих в соответствующих заголовках потоков PES. Если значения PTS потоков битов от двух аудио служб не совпадают (это означает, что аудио кодирование не синхронное), то аудио кадры основной аудио службы могут быть представлены аудио декодеру для декодирования и представления в то время, которое обозначено в метках PTS.
Поток битов связанной аудио службы, который декодируется одновременно с потоком битов основной службы, может иметь свои аудио кадры (модули доступа), которые близки по времени (по значениям PTS) аудио кадрам основной службы, представленные аудио декодеру. В этом случае при одновременном декодировании допускается воспроизведение связанной службы при несинфазности кадров двух потоков, не превышающей 1/2 времени кадра. Такая величина несинфазности для пользователей со слабым зрением является допустимой. Требования к процессу смешивания основных и связанных аудио служб представлены в ETSI [2] (приложение Е.4).
6.3.2.3 Синхронизация байтов
Элементарные потоки битов АС-3 и АС-3 улучшенный в потоке данных MPEG-2 должны быть байт-синхронизированы. Это означает, что исходные 8 битов кадра потока битов АС-3 или АС-3 улучшенный должны находиться в отдельном байте транспортного потока MPEG-2.
6.3.3 Ограничения потока PES с многократными независимыми субпотоками битов профиля АС-3 улучшенный должны быть в соответствии с ETSI [16] (пункт 6.2.2).
6.4 Параметры кодирования потоков битов аудио DTS и приемников-декодеров потоков битов аудио DTS
Кодирование и декодирование элементарных аудио потоков битов DTS должно выполняться в соответствии с ETSI [3]. Приемники-декодеры, совместимые с аудио потоками битов DTS, должны декодировать эти потоки битов со скоростями передачи и частотами отсчетов, перечисленными в ETSI [3]. Уточнения требований к параметрам кодирования и декодирования PES для случая многократных аудио потоков, предназначенных для воспроизведения при точном синхронизме, должны быть в соответствии с ETSI [16] (пункт 6.3.1).
6.5 Параметры кодирования потоков битов аудио MPEG-4 AAC, MPEG-4 НЕ ААС и MPEG-4 НЕ ААС v2 и приемников-декодеров потоков битов аудио MPEG-4 AAC, MPEG-4 НЕ ААС и MPEG-4 HE AAC v2
6.5.1 Кодирование и декодирование элементарных аудио потоков MPEG-4 AAC, MPEG-4 НЕ ААС и MPEG-4 HE AAC v2 выполняется в соответствии с ISO/IEC [10]. Каждый из упомянутых стандартов кодирования характеризуется профилем кодирования, определяемым перечнем типов объектов. Список типов объекта определяет синтаксис потока битов конкретного объекта. Соответствие профилей типам объектов показано в таблице 7.
Таблица 7 - Соответствие профилей типам объектов
Наименование аудио профиля | Типы объектов |
Профиль ААС | AAC LC |
Профиль НЕ ААС | ААС LC, SBR |
Профиль НЕ ААС v2 | ААС LC, SBR, PS |
Профили ААС и НЕ ААС являются подмножествами профиля НЕ AAC v2. Технология профиля НЕ ААС использует технологию профиля ААС при одновременном использовании технологии АОТ SBR. Технология профиля НЕ ААС v2 использует технологию профиля ААС с использованием технологии параметрического стерео (PS) и АОТ.
Приемник-декодер потока битов профиля НЕ ААС может декодировать поток битов профиля НЕ ААС v2, но он не сможет использовать параметрическую информацию стерео и поэтому воспроизведет сигнал в режиме моно.
Опционально допускается поддержка комбинации профиля MPEG Surround с профилями кодирования MPEG-4 ААС, MPEG-4 НЕ ААС и MPEG-4 НЕ ААС v2. Технология кодирования профиля MPEG Surround предусматривает понижающее микширование аудио сигнала (моно или стерео) при использовании многоканального входного аудиосигнала. Для понижающего микширования используется один из аудиокодеров MPEG-4 AAC, MPEG-4 НЕ ААС или MPEG-4 HE AAC v2. Опционально: кодер профиля MPEG Surround генерирует пространственное описание параметра образа множества каналов аудиосигнала, которое добавляется в виде вспомогательного потока данных к данным от базового аудиокодера. Находящиеся в эксплуатации моно или стерео аудиодекодеры могут игнорировать вспомогательные данные и воспроизводить стерео или моно аудиосигнал. Декодеры, совместимые с профилем MPEG Surround, декодируют потоки битов моно или стерео базовых аудиосигналов и используют пространственные параметры, извлеченные из вспомогательного потока данных, для формирования высококачественного многоканального аудиосигнала. Принципы кодирования и декодирования потоков битов MPEG Surround при понижающем микшировании с использованием кодеров профилей MPEG-4 ААС или MPEG-4 НЕ ААС или MPEG-4 HE AAC v2 показаны на рисунке 2.
Рисунок 2 - Принцип MPEG Surround с понижающим микшированием с применением кодирования MPEG-4 АСС, НЕ АСС или НЕ ACCv2
6.5.2 При формировании кадров элементарных потоков битов аудио профилей MPEG-4 ААС, MPEG-4 НЕ ААС или MPEG-4 HE AAC v2 данные этих элементарных потоков должны инкапсулироваться в мультиплексном формате LATM согласно ISO/IEC [10].
При использовании профиля MPEG Surround, в соответствии с ISO/IEC [11] и [12], в комбинации с профилями MPEG-4 AAC, MPEG-4 НЕ ААС или MPEG-4 HE AAC v2 (в соответствии с ISO/IEC [10]) элементарный поток передается в форматах LOAS/LATM (определенных в ISO/IEC [10]) с применением формата элемента мультиплекса AudioMuxElement ().
Отформатированные данные элементарного потока MPEG-4 НЕ ААС или MPEG-4 HE AAC v2 в соответствии с технологией LATM должны инкапсулироваться в формате передачи LOAS согласно ISO/IEC [10] с использованием версии AudioSyncStream (). AudioSyncStream () добавляет к аудиопотоку синхронизирующее слово. Семантика форматирования AudioMuxElement () и AudioSyncStream () должна быть в соответствии с ISO/IEC [10]. Детализированные процедуры формирования кадров потоков битов аудио для профилей MPEG-4 AAC, MPEG-4 НЕ ААС или MPEG-4 HE AAC v2 в формате LATM/LOAS и требования к приемникам-декодерам, поддерживающим декодирование потоков битов аудио MPEG Surround, должны быть в соответствии с ETSI [16] (пункт 6.4.1).
6.5.3 Профили и уровни
6.5.3.1 Профили и уровни для ААС, НЕ ААС и НЕ ААС 2
6.5.3.1.1 Кодеры аудио должны использовать профили кодирования MPEG-4 LC AAC, MPEG-4 НЕ ААС или MPEG-4 HE AAC v2. Использование профиля MPEG-4 НЕ ААС является рекомендательным.
Потоки битов, в которых обеспечивается поддержка профиля MPEG-4 HE AAC v2 в монофоническом, параметрическом стерео и стерео режимах, должны соответствовать ограничениям level 2 этого профиля.
Потоки битов, в которых обеспечивается поддержка профиля MPEG-4 НЕ ААС в монофоническом и стерео режимах, должны соответствовать ограничениям профиля MPEG-4 HE AAC level 2.
Потоки битов, в которых обеспечивается поддержка профиля MPEG-4 НЕ ААС или НЕ ААС v2 в многоканальном режиме, должны соответствовать ограничениям level 4 профилей MPEG-4 НЕ ААС, MPEG-4 HE AAC v2 соответственно.
IRD, совместимый с потоком битов профиля MPEG-4 ААС, должен обеспечивать декодирование потоков битов профиля MPEG-4 НЕ ААС или MPEG-4 HE AAC v2.
IRD, поддерживающий декодирование потоков битов профиля MPEG-4 HE AAC v2 в монофоническом, параметрическом стерео и стерео режимах, должен поддерживать декодирование потоков битов level 2 этого профиля. При этом допускается поддержка более низких уровней (только профиля MPEG-4 HE AAC v2). Функция поддержки приемником-декодером других профилей и уровней (кроме level 2) является опциональной.
IRD, совместимый с потоком битов профиля MPEG-4 НЕ ААС в монофоническом и стерео режимах, должен поддерживать потоки битов профиля MPEG-4 НЕ ААС уровень 2. Это требование включает поддержку более низких уровней (кроме level 2). Функция поддержки других профилей и уровней (кроме level 2) является опциональной.
IRD, совместимый с потоком битов профилей MPEG-4 НЕ ААС или НЕ ААС v2 в многоканальном режиме, должен поддерживать потоки битов профиля MPEG-4 HE AAC level 4 или MPEG-4 HE AAC v2 level 4 соответственно. Это требование включает поддержку более низких уровней, но не профили MPEG-4 НЕ ААС или MPEG-4 HE AAC v2. Функция поддержки других профилей и уровней (кроме level 4) является опциональной.
6.5.3.1.2 Параметры и условия применения базового профиля MPEG Surround определены в ISO/IEC [11], [12]. Детализированные параметры и условия применения профилей и уровней сочетания профиля кодирования MPEG Surround с профилями кодирования MPEG-4 AAC, MPEG-4 НЕ ААС и MPEG-4 HE AAC v2 должны быть в соответствии с ETSI [16] (пункт 6.4.2.2).
6.5.4 Управление динамическим диапазоном
Механизм управления динамическим диапазоном для профиля MPEG-4 ААС должен быть в соответствии с ISO/IEC [10] (пункт 4.5.2.7). По умолчанию должен устанавливаться контрольный уровень программы минус 31,75 дБ, которому соответствует значение поля prog_ref_level "127".
Все приемники-декодеры должны поддерживать управление динамическим диапазоном для профиля MPEG-4 ААС. В тех случаях, когда кодером не передаются данные управления динамическим диапазоном, приемник-декодер не должен использовать механизм управления динамическим диапазоном.
Приложение А
(справочное)
Примеры полноэкранных разрешений яркости для профилей SDTV
Примеры полноэкранных разрешений яркости для профилей SDTV приведены в таблице А.1 и в таблице А.2.
Таблица А.1 - Параметры полноэкранных разрешений яркости для профиля MPEG-2
Значение разрешения по вертикали | Значение разрешения по горизонтали | Формат кадра изображения | Частота кадров, Гц | Тип развертки | IRD MPEG-2/SDTV. Оценка возможности обработки |
1080 | 1920 | 16:9 | 25 | прогрессивная | нет |
1080 | 1920 | 16:9 | 25 | чересстрочная | нет |
720 | 1280 | 16:9 | 25, 50 | прогрессивная | нет |
576 | 720 | 16:9 | 50 | прогрессивная | нет |
576 | 720 | 4:3, 16:9 | 25 | прогрессивная | нет |
576 | 720 | 4:3, 16:9 | 25 | чересстрочная | да |
576 | 544 | 4:3, 16:9 | 25 | прогрессивная | да |
576 | 544 | 4:3, 16:9 | 25 | чересстрочная | да |
576 | 480 | 4:3, 16:9 | 25 | прогрессивная | да |
576 | 480 | 4:3, 16:9 | 25 | чересстрочная | да |
576 | 352 | 4:3, 16:9 | 25 | прогрессивная | да |
576 | 352 | 4:3, 16:9 | 25 | чересстрочная | да |
288 | 352 | 4:3, 16:9 | 25 | прогрессивная | да |
Таблица А.2 - Параметры полноэкранных разрешений яркости для профиля H.264/AVC
Значение разрешения по вертикали | Значение разрешения по горизонтали | Формат кадра изображения | Частота кадров, Гц | Тип развертки | IRD H.264/AVC/SDTV. Оценка возможности обработки |
1080 | 1920, 1440, 1280, 960 | 16:9 | 25 | чересстрочная | нет |
прогрессивная | нет | ||||
720 | 1280, 960, 640 | 16:9 | 25, 50 | прогрессивная | нет |
576 | 720 | 4:3, 16:9 | 25 | прогрессивная | нет |
чересстрочная | нет | ||||
544, 480, 352 | 4:3, 16:9 | 25 | прогрессивная | нет | |
чересстрочная | нет | ||||
288 | 352 | 4:3 | 25, 50 | прогрессивная | нет |
25 | чересстрочная | нет |
Приложение Б
(обязательное)
Вспомогательные данные в потоке видеоданных
Б.1 В элементарном потоке могут передаваться вспомогательные данные, связанные с изображениями. Эти данные включают AFD, данные строки и заголовки. Функции передачи и декодирования этих данных являются опциональными.
Б.2 Общие параметры синтаксиса и семантики вспомогательных данных, связанных с параметрами изображения и передаваемых в элементарном потоке, должны быть в соответствии с ETSI [16] (приложение В.2).
Б.З Параметры синтаксиса и семантики AFD для профилей кодирования MPEG-2, H264/AVC и взаимосвязь с векторами панорамирования должны быть в соответствии с ETSI [16] (приложение В.3).
Б.4 Параметры и семантика панели (строки) данных и взаимосвязь панели данных с AFD должны быть в соответствии с ETSI [16] (приложение В.4).
Б.5 Параметры, синтаксис и семантика субтитров должны быть в соответствии с ETSI [16] (приложение В.5).
Б.6 Параметры, синтаксис и семантика вспомогательных данных в потоке битов MPEG-2 должны быть в соответствии с ETSI [16] (приложение В.6).
Б.7 Параметры, синтаксис и семантика вспомогательных данных в потоках битов стандарта H264/AVC должны быть в соответствии с ETSI [16] (приложение В.7).
Б.8 Параметры взаимосвязи AFD и панели данных с сигнализацией WSS должны быть в соответствии с ETSI [16] (приложение В.9).
Б.9 Параметры форматов изображения, используемых в AFD, должны быть в соответствии с ETSI [16] (приложение В.10).
Приложение В
(обязательное)
Вспомогательные данные для профилей кодирования аудио MPEG
В.1 Приложение описывает технологии, обеспечивающие включение вспомогательных данных в элементарный поток профиля кодирования аудио MPEG. Приемники-декодеры должны проектироваться с учетом того, что любая структура, предусмотренная этим приложением, может появиться в потоке битов вещания. Функция использования этих вспомогательных данных приемником-декодером является опциональной.
В.2 Формат вспомогательных данных, описанный в этом приложении, не создает дополнительных элементов в транспортном потоке DVB. Формат вспомогательных данных совместим с настоящей спецификацией и совместим со всеми декодерами потоков битов аудио профиля MPEG. Наличие и тип вспомогательных данных в аудио элементарных потоках содержатся в таблице РМТ информации о службах DVB в соответствии с ETSI [17] (пункт 6.2.2).
В.3 Детализированные требования к реализации вспомогательных данных для профилей аудиокодирования MPEG-1, MPEG-2 должны быть в соответствии с ETSI [16] (приложение С.4). Требования к реализации вспомогательных данных для профилей аудиокодирования MPEG-4 должны быть в соответствии с ETSI [16] (приложение С.5).
Приложение Г
(обязательное)
Дополнительные аудио службы
Г.1 Дополнительные аудио службы (SA) предоставляют пользователю возможность наряду с основным аудио каналом использовать дополнительный аудио канал. Эти каналы смешиваются на стороне вещателя (механизм смешивания "Broadcast-mixed") или в приемнике-декодере (механизм смешивания "Receiver-mixed"). В настоящем приложении рассматриваются параметры только механизма "Receiver-mixed". Примерами дополнительных аудио служб являются:
- аудио описание (сцены) для пользователей со слабым зрением (Audio description);
- аудио для пользователей с ослабленным слухом (Clean Audio);
- комментарии режиссера.
Г.2 Синтаксис и семантика дополнительной аудио службы
Информация управления SA кодирована в поле PES_private_data с инкапсуляцией PES кодированного компонента SA в соответствии с Рекомендацией ITU-T/ISO/IEC [14].
Синтаксис дескриптора AD_descriptor представлен в таблице Г.1.
Таблица Г.1 - Синтаксис дескриптора AD_descriptor
Синтаксис | Значение | Количество битов | Идентификатор |
AD_descriptor { | |||
Reserved | 1111 | 4 | bslbf |
AD_descriptor_length | 4 | bslbf | |
AD_text_tag | 04454474144 | 40 | bslbf |
version_text_tag | 8 | bslbf | |
AD_fade_byte | 0XX | 8 | bslbf |
if (version_text_tag == 031) { | 0YY | 8 | bslbf |
Reserved | 0FFFFFF | 24 | bslbf |
} | |||
if (version_text_tag == 032) { | |||
AD_gain_byte center | 0UU | 8 | bslbf |
AD_gain_byte front | 0VV | 8 | bslbf |
AD_gain_byte surround | 0WW | 8 | bslbf |
} | |||
Reserved | 0FFFFFFFF | 32 | bslbf |
} |
Семантика дескриптора AD_descriptor и параметры потоков AD и Clean Audio должны быть в соответствии с ETSI [16] (приложение Е.1).
Г.3 Кодирование для служб AD SA
Контент AD только для речи передается как моно сигнал, кодированный в соответствии с ISO/IEC [4] или [10] или ETSI [2]. Схема кодирования AD определяется схемой кодирования основной аудио службы (стандарты кодирования и частота дискретизации для основной и дополнительной служб должны совпадать). Принципы обработки сигналов в декодере SA для случая AD, когда основное аудио передается в формате стерео, показаны схематически на рисунке Г.1.
Г.4 Кодирование для Clean Audio дополнительной аудио службы
Если при наличии в потоке битов дескриптора AD_descriptor присутствует сообщение audio_type 000 ("неопределенный"), то это означает, что AD descriptor индицирует предоставление услуги Clean Audio. Величина ослабления уровня основной аудио службы определена в поле PES_private_data при инкапсуляции PES компонентов основной аудио программы в соответствии с Рекомендацией ITU-T/ISO/IEC [14]. В этом случае оцениваются поля AD_gain_byte_center, AD_gain_byte_front и AD_gain_byte_surround. Это позволяет учитывать динамические изменения уровня групп канала при установке объемного звука.
Рисунок Г.1 - Принципы обработки сигналов в декодере SA для случая AD
Принципы обработки сигналов в приемнике-декодере SA для случая Clean Audio, когда основное аудио передается в формате стерео, показаны схематически на рисунке Г.2.
Рисунок Г.2 - Принципы обработки сигналов в декодере SA для случая "чистого аудио"
Функции кодирования и декодирования потоков битов служб Clean Audio SA являются опциональными.
Г.5 Режим работы декодера
Параметры режима работы декодера должны быть в соответствии с ETSI [16] (приложение Е.5).
Г.6 Индикаторы пользователя декодера
Рекомендации по функциям декодера, обеспечивающим удобство пользования декодером при использовании дополнительных аудио служб, должны быть в соответствии с ETSI [16] (приложение Е.6).
Библиография
[1] | ETSI ETR 289 | Digital Video Broadcasting (DVB); Support for use of scrambling and Conditional Access (CA) within digital broadcasting systems | |
[2] | ETSI TS 102 366 | Digital Audio Compression (AC-3, Enhanced AC-3) Standard | |
[3] | ETSI TS 102 114 | DTS Coherent Acoustics; Core and Extensions | |
[4] | ISO/IEC 11172-3 | Information technology; coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/s, part 3: audio | |
[5] | ISO/IEC 13818-3 | Information technology. Generic coding of moving pictures and associated audio information. Part 3. Audio | |
[6] | RDS-Forum SPB 490 | RDS Universal Encoder Communication Protocol, Final Version 6.01, June 2003. | |
[7] | ITU-T Recommendation H.264/ISO/IEC 14496-10:2008 | Information technology - Coding of audio-visual objects- Part 10: Advanced Video Coding | |
[8] | ISO/IEC 11172-1 | Information technology; coding of moving pictures and associated audio for digital storage media up to about 1,5 Mbit/s; part 1: systems | |
[9] | ITU-T Recommendation H.262/ ISO/IEC 13818-2 | Information Technology - Generic Coding of moving pictures and associated audio information: video | |
[10] | ISO/IEC 14496-3:2005 | Information technology - Coding of audio-visual objects - Part 3: Audio, including ISO/IEC 14496-3:2005/Amd.2:2006: "Audio Lossless Coding (ALS), new audio profiles and BSAC extensions" and ISO/IEC 14496-3:2005/Amd.5:2007: BSAC extensions and transport of MPEG Surround" and all relevant Corrigenda | |
[11] | ISO/IEC 23003-1:2007 | Information technology - MPEG audio technologies - Part 1: MPEG Surround | |
[12] | ISO/IEC 23003-1:2007/Cor:2008 | MPEG audio technologies - Part 1: MPEG Surround, technical corrigendum 1 | |
[13] | SMPTE 421M | VC-1 Compressed Video Bitstream Format and Decoding Process | |
[14] | ITU-T Recommendation H.222.0 (2006)/ISO/IEC 13818-1:2007 | Information technology - Generic coding of moving pictures and associated audio information: Systems - and ITU-T Recommendation H.222.0 (2006)/Amendment 3/ISO/IEC 13818-1: 2007/Amendment 3: "Transport of Scalable Video over ITU-T Rec. H.222.0/ISO/IEC 13818-1" | |
[15] | ISO/IEC 13818-9 | Information technology - Generic coding of moving pictures and associated audio information - Part 9: Extension for real time interface for systems decoders | |
[16] | ETSI TS 101 154 V1.9.1 (2009-09) | Technical Specification. Digital Video Broadcasting (DVB); Specification for the use of Video and Audio Coding in Broadcasting Applications based on the MPEG-2 Transport Stream | |
[17] | ETSI EN 300 468 | Digital Video Broadcasting (DVB); Specification for Service Information (SI) in DVB systems | |
[18] | SMPTE RP 227 | VC-1 Bitstream Transport Encodings | |
[19] | ETSI ETR 211 | Digital Video Broadcasting (DVB); Guidelines on implementation and usage of Service Information (SI) | |
[20] | ITU-R Recommendation BT.709 | Parameter values for the HDTV standards for production and international programme exchange | |
[21] | ITU-T Recommendation T.35 | Procedure for the allocation of ITU-T defined codes for non-standard facilities | |
[22] | ITU-R Recommendation ВТ. 1700 | Characteristics of composite video signals for conventional analogue television systems | |
[23] | ITU-T Recommendation J.17 | Pre-emphasis used on sound-programme circuits | |
[24] | ETSI EN 300 401 | Radio Broadcasting Systems; Digital Audio Broadcasting (DAB) to mobile, portable and fixed receivers | |
[25] | IEC CD-100C/1883 | Parts 1 and 4 |
Электронный текст документа
и сверен по:
, 2013