Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Активная зрительская позиция




Как было замечено выше, BIFS позволяет задавать реакцию объектов сцены на действия пользователя. Потенциально возможно удаление, добавление или перемещение объектов, ввод команд с клавиатуры. Событийная модель заимствована из развивавшегося уже долгое время языка моделирования виртуальной реальности VRML. Для тех, кто играл в написанные на VRML игры, очевидно, что в MPEG-4 будет совершенно реально создавать "квест"-подобные (и не только) игры. Широчайший простор открывается для создания обучающих и развлекательных программ. Представляете, скачиваете из Интернета один файл, который сразу в себе содержит все, что необходимо для небольшого курса лекций, причем вы можете прослушать его, видя говорящую голову преподавателя, или, отключив его, увеличить фрагменты (спрайты) с материалами. А в конце - пройти короткий тест на понимание предмета. Кстати, в стандарте предусмотрена обработка команд на стороне сервера, т. е. программа-просмотрщик может отослать данные на сервер и получить оттуда оценку. Отличие от предыдущих стандартов революционное.

Синтезатор лиц и фигур. В стандарт заложен интерфейс к модулю синтеза лиц и фигур. Например, в файле сохраняются ключевые данные о профиле лица и текстуры лица, а при записи фильма сохраняются только коэффициенты изменения формы. Для передач типа новостей этот прием позволяет в десятки раз сократить размер файла при замечательном качестве.

Синтезатор звуков и речи. Помимо синтеза лиц в стандарт MPEG-4 также заложены алгоритмы синтеза звуков, и даже речи.

Улучшенные алгоритмы сжатия видео. В стандарте предусмотрены блоки, отвечающие за потоки 4.8-65 Кбит/с с прогрессивной разверткой и большие потоки с поддержкой чересстрочной развертки. Для передачи по ненадежным каналам возможно использование помехоустойчивых методов кодирования (за счет незначительного увеличения объема передаваемых данных резко снижается вероятность искажения изображения). При передаче видео с одновременным просмотром заложена возможность огрубить изображение, если декодер из-за ограничений канала связи не успевает получить всю информацию. Всего в стандарт заложено 3 уровня детализации. Эта возможность позволит легко адаптировать алгоритм для трансляций видео по сети.

Поддержка профилей на уровне стандарта. Понятно, что реализация всех возможностей стандарта превращает декодер в весьма сложную и большую конструкцию. При этом далеко не для всех приложений необходимы какие-то сложные специфические функции (например, синтез речи). Создатели стандарта поступили просто: они оговорили наборы профилей, каждый из которых включает в себя набор обязательных функции. Если в фильме записано, что ему для проигрывания необходим такой-то профиль и декодер этот профиль поддерживает, то стандарт гарантирует, что фильм будет проигран правильно.

Выше кратко перечислены некоторые отличия MPEG-4 от предыдущих стандартов. Надо отметить, что на момент создания стандарта острой потребности в описанных выше вещах еще не было. Иначе говоря, мы имеем дело с хорошо продуманной работой по формированию стандарта, которая была закончена к тому времени, когда в нем возникла первая необходимость.

Создателями MPEG-4 учтен опыт предшественников (в частности, VRML), когда слишком раннее появление стандарта и отсутствие в нем механизма профилей серьезно подорвало его массовое применение. Будем надеяться, что массовому применению MPEG-4 такие проблемы не грозят.

 

 

Выводы по главе 2

MPEG-4 – это международный стандарт, используемый, преимущественно для сжатия цифрового аудио и видео. Он появился в 1998 году, и включает в себя группу стандартов сжатия аудио и видео и смежные технологии, одобренные ISO – Международной организацией по стандартизации/IEC Moving Picture Experts Group (MPEG). Стандарт MPEG-4 в основном используется для вещания (потоковое видео), записи фильмов на компакт-диски, видеотелефонии (видеотелефон) и широковещания, в которых активно используется сжатие цифровых видео и звука.

MPEG-4 включает в себя многие функции MPEG-1, MPEG-2 и других подобных стандартов, добавляя такие функции, как поддержка языка виртуальной разметки VRML для показа 3D объектов, объектно-ориентированные файлы, поддержка управления правами и разные типы интерактивного медиа. AAC (Advanced Audio Codec — или Улучшенный Аудио Кодек) был стандартизован как дополнение к MPEG-2 (часть 3), был также расширен и включен в MPEG-4.

MPEG-4 всё ещё находится на стадии разработки и делится на несколько частей. Ключевыми частями стандарта MPEG-4 являются часть 2 (MPEG-4 part 2, включая Advanced Simple Profile, используемый такими кодеками как DivX, Xvid, Nero Digital и 3ivx, а также Quicktime 6) и часть 10 (MPEG-4 part 10/MPEG-4 AVC/H.264 или Advanced Video Coding, используемый такими кодеками, как x264, Nero Digital AVC, Quicktime 7 а также используемый в цифровых дисках следующего поколения, таких, как HD DVD и Blu-ray Disc).

 

Глава 3. Формат MPEG-7 и MPEG-J

Формат MPEG-7

MPEG-7 - стандарт ISO/IEC, разработанный Moving Picture Experts Group (MPEG) - автором всех известных MPEG- стандартов (MPEG-1, MPEG-2, MPEG-4).

MPEG-7 стандартизирует описание различных типов мультимедиа-информации. Описания ассоциированы с мультимедиа-контентом, тем самым позволяя производить удобный ассоциативный поиск. Формально MPEG-7 называется Интерфейсом Описания Мультимедиа-Контента (Multimedia Content Description Interface).

Кроме стандартизации описаний предопределенных типов контента, MPEG-7 стандартизует механизм создания подобных описаний. Изначально предполагается, что мультимедиа-контент может содержать следующие типы информации: изображения (растровые статические изображения, векторную графику), 3D-модели, аудио, речь, видео, а также информацию о комбинации элементов этих типов в едином мультимедиа-потоке или презентации (в виде своеобразных сценариев).

Главной областью применения и позиционирования MPEG-7 является сеть интернет - как основное скопище совершенно разрозненной информации с весьма затрудненным поиском и навигацией в ней.

В последнее время возникла тенденция к объединению информации, представленной в разных видах, в единый медиа-контент, более удобный для восприятия конечным потребителем, нежели поставляемый в разрозненном виде (например, текст - отдельно, музыка - отдельно). Кроме того, с связи с лавинообразным ростом объема информации, ориентация в нем требует все больших усилий.

Особенно проблематичным представляется поиск в информационном контенте, представленном различными носителями. И если с поиском в текстовых массивах еще худо-бедно справляются различные поисковые машины, то осуществлять поиск в аудио-видео-контенте на сегодняшний день практически невозможно.

Наиболее распространенные поисковые онлайн сервисы (типа Yandex, Google, Lycos) предоставляют возможность производить поиск графической информации, однако такой поиск ограничивается поиском в подписях к картинкам.

На сайте MPEG представлен такой пример поисковых запросов:

1. Музыка. Вы играете несколько нот на клавиатуре (мультимедийной) и получаете список музыкальных фрагментов, содержащих эти ноты (или очень близких по звучанию), или изображения, каким-либо образом сочетающиеся с этими нотами (например, в эмоциональном плане).

2. Графика. Вы рисуете несколько линий на экране и получаете набор картинок, содержащих похожие линии.

3. Изображение. Вы определяете набор объектов, включающих световые схемы или текстуры, и получаете некоторые примеры или шаблоны, которые вы можете использовать для построения своего изображения.

4. Анимация. На определенном множестве объектов вы задаете их движения и отношения между ними и получаете набор анимационных роликов, в которых присутствуют заданные временные и пространственные отношения.

5. Сценарии. На некотором контенте вы задаете некоторые действия и получаете список сценариев, в которых имеются схожие действия.

6. Голосовая информация. Имея звуковые отрывки с голосом Паваротти, вы получаете список записей, видеоклипов, в которых поет Паваротти, или видеоклипов, в которых Паваротти присутствует.

MPEG-7 не стандартизирует сами методы распознавания речи (или контента другого типа), а лишь специфицирует принципы создания описания такого контента. Создание самих средств распознавания отводится фирмам, которые будут создавать продукты, базирующиеся на технологии MPEG-7.

 

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...